听了这么多,AI智能体到底是什么?
2025-07-27 13:30
如果你想点一杯咖啡外卖到家,使用传统的手机App,你的操作流程大概率是这样的:点开外卖App,输入咖啡(或咖啡品牌),找到一家满意的店铺,选择想喝的品类,选择是否去冰、是否减糖,输入或选择送到的地址,点击下单,输入密码或人脸识别付费……
但如果手机搭载了AI Agent(AI智能体或AI代理),你只需对着手机说一句“帮我点一杯咖啡尽快送到家”,不用再进行任何操作,它便能主动识别你所处的位置,打开外卖App,准确猜测你的喜好选择咖啡品牌、品类,并自动完成付款……
2025世界人工智能大会(WAIC 2025)7月26日在上海开幕,AI智能体成为与会者热议的话题。事实上,自大模型开始比拼落地应用后,AI智能体便反复被提及。那听了这么多,AI智能体到底是什么?目前发展到哪个阶段了?
和传统智能助手有何区别?
“你可以将其理解为一个‘全方位的秘书’。”高通公司AI产品技术中国区负责人万卫星用一句通俗易懂的话向中新经纬解释何为AI智能体。他提到,AI智能体的“全方位”,是指它不仅能帮你完成简单的垂类任务,而且能处理覆盖生活、工作等方方面面的复杂任务。
“AI智能体会让生活和工作更简单、更美好。”万卫星表示,用户只需说一句话,Agent就能自动完成任务,让工作生活都变得更轻松,而它的感知性和专属化,能真正做到“想你所想”。
据中国银河证券6月发布的研报,摩根士丹利发布的深度研究报告《AI Agents Knocking at the Door》提到,AI Agents不再仅仅是辅助人类的工具,它们将越来越多地成为执行任务和做出决策的主体,从简单的自动化工具进化为具备自主理解、行动和学习能力的“数字劳动力”。该篇报告将AI Agents视为能够感知环境、规划任务、调用工具,并灵活迭代的自主软件。
AI智能体不仅是一个简单的应用程序,也是一个完整的系统。“完成一个看似简单的任务,AI智能体往往需要至少4个步骤。”万卫星以AI智能体“点咖啡”举例,当用户发布语音指令时,智能体首先要通过语音转文字模块,将指令转成文字信息;然后调用相当于“大脑”的大模型,理解指令意图;接着搜寻个性化记忆,自主了解用户习惯在哪个App点咖啡、喜欢什么口味的咖啡、家庭地址等信息;最后查询数据库把信息补齐后生成提示词,调用点咖啡的软件接口或者在App里点击完成相关操作。
万卫星介绍,模拟点击是目前AI智能体的运行方式之一。简单言之,就是AI智能体模仿人的点击操作,但人不用亲自动手,只需下达指令就行。这种模式下,智能体完成整个任务耗时多少主要取决于操作步骤的多少,比如需要翻几个页面。“目前能看到一些指标显示,单步操作已经大概能控制在2秒以内了。”
在万卫星看来,和“我说一句,它回一句”的传统智能助手相比,AI智能体扮演的更像是一个统筹决策者的角色。他介绍,聊天机器人和语音助手比较依赖于专业且明确的指令,完成的任务是单一清晰的,并且在解决任务时仍旧以人的决策为主。
在“人为主、AI 为辅”的任务解决模式下,AI只负责执行。但像个“小秘书”的AI智能体改变了这一模式,它要帮用户解决复杂问题,而不是一步一步和用户交互着完成。万卫星称,真正的AI智能体应该以“AI为主、人为辅”的方式解决问题,即人只需要发布任务,或者最后验收结果就行,尽量让机器和AI承担更多主体工作。
在现实世界如何应用?
荣耀手机AI产品专家白晨对中新经纬表示,过去的应用程序(App)将被具备执行力的AI智能体所替代,手机将成为用户的助理和伙伴,把“能听你说”变成“替你去做”。比如,你下班回家时已经不需要再打开打车软件,查看路况、选择车型、根据预估车费和时间下单叫车,而只需对手机说“我要回家”,它会自动完成这一切,然后告诉你:10分钟后在公司门前,乘坐车牌尾号888的网约车,预计7点到家。
在WAIC 2025腾讯展台,智能座舱服务Agent正化身出行服务助手,演示了在餐饮点单、取号订座、机酒预订等场景下,如何“懂你所说、知你所想、代你操作”。比如,用户在驾车路上仅需说一句“帮我下单一杯少冰的冰椰拿铁”,Agent即可协助在微信小程序上选择顺路的咖啡店,用户确认即可基于微信车端小额免密支付完成下单,取餐信息会自动推送到手机微信上,用户到店取餐时可以直接用手机亮出二维码核销。
从实际应用场景来看,目前AI智能体主要用于客户服务、个人助理、管理电子邮件并充当生产力工具。万卫星提到,一些厂商正合作推出“做行程规划”的Agent,在该领域Agent能不错地完成任务,而点咖啡、点餐类Agent小应用,目前发展也不错。“相对不太复杂、对整合协调能力要求不过高,也不特别涉及多领域执行的通用任务,加上用户指令很明确的话,Agent是能胜任的。”
DCCI互联网研究院院长刘兴亮告诉中新经纬,Agent能跨平台、跨领域、多步骤整合行程安排与提醒。用户手机内置的Agent可以读取日程中的会议变动、自动发邮件申请时间调整、通过外卖平台订早饭、根据出行路线推荐顺路菜市场并生成购物清单……未来“智能日程+生活助理”Agent,极具爆发潜力。
目前发展到什么阶段?
AI技术演进的速度可以说是“人间一天,AI一年”。万卫星认为,Agent的底层技术及上层应用,从2024年开始发展就非常快。他认为,在Agent领域,“过一天就可能有全新的变化”。
业内人士普遍认为,2025年将成为“智能体元年”。AI智能体凭借着深度思考、自主规划、做出决策并深度执行的能力,AI在发展路径上正实现一次范式突变。“我说AI答”正转向“我说AI做”,并被逐渐应用到各类商业场景中。
智能终端Agent是阶跃星辰重点布局的领域。据该公司相关人士向中新经纬介绍,过去两年,阶跃星辰自研的Step系列大模型,已搭载至汽车、具身智能、物联网等头部企业的旗舰产品中,50%以上头部国产手机品牌与阶跃合作AI智能体。7月25日,2025世界人工智能大会前夕,阶跃星辰在上海发布了新一代基础大模型——Step 3。
阶跃星辰相关人士介绍,Agent爆发需要两个必要条件,一个是多模态的能力,另外一个是慢思考的能力,这两个能力恰好在2024年取得了突破性的进展。所以,2025年Agent将会大规模爆发,将成为“智能体元年”。
万卫星也表示,OpenAI发布的O1、O3模型、Deepseek R1模型相继出现,说明大模型在多模态支持、思维链(COT)能力上越来越成熟,这为Agent的落地提供了可行性。最近OpenAI、Manus等都推出了自己的Agent相关应用,落地场景越来越多。此外,Token(在信息技术领域是一种用于身份验证、安全访问控制或数据完整性保护的数字标识符)成本变低,各个App也在推出自己功能的核心API(应用程序编程接口),开放给第三方调用。这些都会给Agent带来体验上的进步。
“今年我们看到很多Agent相关产品落地,大家能明显感受到Agentic AI(智能体AI,比AI Agent更自主)产品带来的交互变革,以及对工作效率和便利性的提升。”在万卫星看来,今年端侧在Agent领域的机会很大,因为感知性和个性化的优势,行业或多或少会把一些模块、方案部署到端侧。
“虽然现在模型能力越来越强,支持多模态、有思维链能力,但在解决复杂问题上,确实还有差距。”万卫星提到,在AI智能体“点咖啡”的实际场景中也可能出错,比如点错口味,或者卡在某个步骤。
万卫星表示,现阶段AI Agent在应用时还未彻底实现全自动化。“主要是在某些垂直领域的特定应用中,智能体可以实现大多数任务的自动化,但最后还需要加入人工干预。”他解释,这种人工干预可能是进行一些纠错工作,也可能是在点餐的过程中完成最后的付款操作。具体来说,智能体在“完成任务的可靠性和准确性”“提高通用性”以及“打通生态”方面还有进步空间。
AI智能体未来还会在哪出现?
对于AI智能体的理想样态,万卫星称,让“人工干预彻底消失”确实比较复杂。但单从应用场景和消费者便利性来看,让AI智能体或者机器人独立完成复杂任务是大家追求的目标。这实际上是朝着Agentic AI的方向发展——即完全高度自主,能够独立行动,强调自主性的AI类型。
未来,AI智能体是否只会出现在手机上?还有哪些类型的终端设备可能会成为它的搭载平台?
万卫星认为,手机无疑还是AI智能体最大的入口,因其算力中心、交互中心和感知中心的地位,手机仍会在Agentic AI中处于中心位置,但它可能不再是唯一入口。PC、AI眼镜、耳机、智能座舱,甚至智能家居、IoT设备等,都有可能成为搭载AI Agent的重要平台。
万卫星还提到,如今用户已经习惯直接和“小爱”“YoYo”这类助手对话了,交互路径已经逐渐从“人找App”变成“人找Agent来统一调度App”,流量流向也随之改变,未来AI智能体成为新的流量入口是毋庸置疑的,而这还可能催生出应用商店3.0、4.0 类的全新商业模式。
凡注明来源重庆日报的作品,版权均属重庆日报所有,未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:重庆日报网”。违反上述声明者,本网将追究其相关法律责任。
除来源署名为重庆日报稿件外,其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考并自行核实。