来自24个国家和地区的270项科技成果中,共有20项成果入选领先科学技术奖。
作为AI领域的重要代表,此次获奖的百度文心智能代理技术尤为引人注目。

最近,法律理论碰壁成为热门话题。大模型是新技术泡沫吗?
跨越多个互联网时代的巨头百度告诉我们:所谓“AI应用很难落地”、“没办法商业化”,是因为看的不够远。
正如国家杰出工程师、百度首席技术官王海峰所说,智能化是最能激发大模型潜力的应用方向。
随着智能代理技术的突破,将激发更多的创新。智能体给社会经济发展带来的巨大价值指日可待。
AI代理,像人类一样“缓慢思考”
百度智能代理背后的技术原理是什么?这要从人类的认知系统说起。
在心理学研究中,人类认知系统分为两种类型:系统1和系统2。
系统1反应快但容易出错;系统2思考速度较慢,但更准确、更理性。
基于这种认知特征,百度开发了突破性的慢思维机制——系统2,其核心是“思维模型”。

“思维模型”包含四个关键要素:理解、规划、反思和演化。
在这四个环节的紧密配合下,AI系统能够可靠地执行任务,不断自我进化,并在一定程度上实现思维过程的白盒化。
为了实现真正的智能思维,百度在基础大模型上进行了三个层面的突破性强化训练。
首先是对思维过程的监督微调,使模型能够像人类一样分解任务并自主计划。
假设您想计划去苏州园林旅行。 “思维模型”不仅能了解您的需求,还能综合考虑景点分布、开放时间等因素,为您规划最优路线,就像人类导游一样。
其次,行为决策的偏好学习使模型能够学习使用工具并做出决策。
例如,统计《说》中“是”字的出现频率时,模型会主动调用搜索工具获取全文,然后调用代码解释器精确计算出现次数。
最后,通过结果反射进行增强学习,使模型能够学习检查工具的结果并动态调整其行为。
这个过程就像人类质疑信息的真实性一样,AI也学会了检验数据的准确性。
例如,在计算国庆档电影票房排名数据时,存在两个不同来源的差异:一个是2.15亿元,另一个是2.35亿元。
这时,模型会主动分析可能的原因(数据更新时间不同、统计来源不同等),然后进一步搜索验证,最终保证信息的可靠性。
那么,训练“思维模型”的数据从哪里来呢?毕竟,人类的思维过程往往只发生在每个人的脑海中,很难数字化展示,因此迫切需要获取相应的数据。
对此,百度创造性地构建了“数据合成”的虚拟环境。
在提示构建阶段,基于领域知识自动合成业务逻辑,通过工具模拟器灵活模拟业务所需的工具,通过用户模拟器生成可能的用户问题或指令,用户与代理进行交互。
然后,思维模型根据输入提示,自动探索不同的思维和行动路径,并通过逐步执行来模拟智能体的行动过程,最终生成高质量的合成数据。
此外,基于这些合成数据,强化学习被用来优化“思维模型”。
最终,机器将能够像人类一样思考和行动,自主完成复杂的任务,同时在环境中继续自主学习和进化。
代理工作流程
斯坦福计算机科学系的一位客座教授曾指出,AI代理工作流程今年将取得巨大进步,甚至超越下一代基础模型。
我们都有过询问/等待模型但没有得到满意输出的经历。
但代理的关键功能之一是提供反馈,帮助LLM改进输出,最终获得更好的响应。
事实上,一个基本的智能代理架构应该包括四个主要方面:内存、规划、工具和动作。

前研究员翁——法学硕士
而且,在具体的工作流程中,代理有四种不同的设计模式。
第一个是 (),大型模型能够自行检查其工作并提出改进方法。
二是工具的使用,可以主动利用网络搜索、函数调用等任何功能来完成信息收集和数据处理,或者采取行动。
接下来是 (),它提出一个多步骤计划并实现目标。
最后,还有多智能体协作,多个人工智能智能体一起工作来分配任务并讨论想法。
综上所述,AI智能体的出现并不能让LLM直接生成最终的输出,而是多次促使大型模型最终构建出更高质量的输出。
从模型开始,但不要止于模型
百度智能代理背后的文信大模型技术为其实际应用奠定了坚实的基础。
自去年3月16日发布问心一言以来,百度问心大模型不断升级,知识增强、检索增强、智能代理等技术也不断演进。
今年9月以来,百度文信大模型日均API调用量飙升至15亿次,短短六个月内增长了7.5倍。
原因是它极大地改善了幻觉问题。
依托搜索引擎的技术积累,百度推出了搜索增强机制。通过在互联网上搜索现有的知识,大模型可以给出更准确的答案。
百度研发的“理解-检索-生成”协同优化的检索增强技术,极大提升了大模型技术和应用效果。
在文本生成领域,检索增强的应用已经成熟。下一步是解决文森图画的错觉问题。
为此,百度研究团队将百度搜索的数亿图像资源与强大的基础模型能力相结合,开发了检索增强词典技术iRAG,使图像生成效果更加真实。
现在,iRAG 可以生成精确图像和广义图像。
具体来说,大模型会首先分析理解用户需求,自动规划精准或泛化的解决方案,比如要增强哪些实体;然后在增强阶段,它为需要增强的实体检索并选择相应的参考图。
最后,在生成阶段,自主开发的多模态可控大规模图像生成模型通过局部注意力实现高度泛化的图像生成。此外,它还可以通过整体注意力计算来进行高精度图像生成。
正如李彦宏所说——
过去24个月,AI行业最大的变化是什么?正是大模型基本上消除了这种错觉。
从此,大型AI模型可以快速走向智能代理,迎来原生应用的爆发。
智能代理开启AI应用新时代
如今,进入门槛低、天花板高,人人都可以上手,做出复杂而强大的应用,智能代理正在成为人工智能应用最主流的形态。
就连首席执行官 Sam 也表示,“下一个关键突破是人工智能代理。”

放眼全球,各大科技巨头、独角兽们在AI领域掀起了人工智能技术的竞争浪潮。
不过,鲜为人知的是,在这波智能代理浪潮之前,百度就已经完成了重点布局。
百度已经领先
互联网时代,以百度搜索为核心应用,在人类发展史上首次实现了知识的普及。
进入下一个周期——大模型时代,人工智能将让无数普通人成为超级个体。这个推动者无疑是一个智能代理。
李彦宏表示,大型模特大战中所谓的“提前12个月”和“落后18个月”其实并不那么重要。在这个完全竞争的市场环境下,无论选择哪个方向,都会有很多竞争对手。
大模型热潮已进入第三个年头,我们已经经历了大模型应用开发所必需的几个阶段。
过去一年,多模态备受关注,但事实上,智能体才是目前最能激发大模型潜力的应用方向。
原因是它的门槛确实很低。
将大型模型转化为应用存在很多不确定性,但智能代理是一种非常直接、高效、简单的方式。基础模型需要应用才能体现其价值,而智能代理则是几乎“一刀切”的大型模型应用。
因为门槛足够低,甚至不需要编程。你只需要用“人类语言”解释清楚工作流程即可。这比互联网时代制作网页还要容易。
智能代理呈爆炸式增长,但现在基数还比较小,大家的经验也没有那么强。让更多的人进来,发挥他们的才能和才能,你可能不知道哪条路会走得通,那将是一个超级APP。打造智能身体新生态系统
如今,百度已经构建了强大的智能座席生态系统。
百度智能代理技术充分释放文信大模型潜力,成为引领行业变革的新引擎。
IDC、沙利文、中国软件评测中心等权威评测表明,文信大模型超过国际领先大模型的平均性能,位居国内第一、全球第一梯队。

资料来源:IDC《2024年中国大机型市场主流产品评估》
如今,在营销、客户服务、企业办公、代码编程等领域,智能座席正在重塑各行各业升级的新范式。
另一方面,百度基于代理技术打造的“问心代理平台”进一步降低了开发门槛,让AI赋能变得触手可及。

开发者可以根据自身行业特点和应用场景需求,利用平台提供的多样化能力和工具,打造大模型时代的AI原生应用。
基于易开发、可分发、可赚钱三大特点,该平台实现了价值闭环。

百度搜索AI问答
例如,38岁失业女受访者创建了“情感咨询导师潇潇”经纪人,不仅带来了意想不到的收入,还获得了新的职业机会。

目前,文信智能平台已吸引超过80万开发者和15万家企业入驻。
无需编写代码即可实现任何想法
目前,百度的智能技术正在加速LLM深度融入社会各行业的方方面面,帮助企业和社会服务智能化升级。
在政务领域,人工智能法律咨询助手可以为工作者提供及时、准确的法律指导。
在农业领域,“农民院士智慧”让科技助力农业更加便捷高效。

在教育领域,能够给教师和学生带来更加智能化、个性化的全新教学体验。
在辅助编程开发方面,代理降低了普通人开发应用的门槛,提高了专业程序员的编码效率。
这里特别值得一提的是百度在“多智能体协同”领域的最新成果——无代码开发工具“妙打达”。
用李彦宏的话来说,它是“迄今为止人类历史上最复杂的多智能体协作工具”。

多Agent协作基于文心大模型的思维和规划能力,实现了不同Agent的调度和编排。
在策划、内容、开发等工作中,有五个智能代理:组长、策划员、编辑、程序员和质检员,他们相互配合,甚至可以自动识别bug并调用各种工具。
演讲现场,李彦宏以络博快跑新技术发布会为例,直接搭建了活动报名系统。
用中文描述需求,并以会议时间和地点为主题补充文档,然后就可以指挥妙达的多个座席进行协作。

其中,组长Agent将进行规划调度,分解任务并召集各Agent完成任务。
规划代理负责将规划和设计解决方案拆分为四个子任务:核心需求、内容结构、开发需求和数据收集。
编辑代理人将编辑邀请函中的所有文字和媒体内容,包括发布前景、时间和地点信息、封面图片等。
程序员代理编写代码来创建和部署网页。

在此过程中,通过场景知识的增强,提高复杂代码生成的质量和稳定性,高效实现用户所需的功能。
最后,质检员将检查代码错误,修复它们,并进行代码测试。
经过一系列程序后,活动邀请立即生成。

与此同时,百度另一款多代理应用——代码助手“文信快马”已升级至3.0版本,全面进入代理时代。

具体来说,在整个开发过程中,多个代理将在管道中进行协作,从而大大提高程序员的工作质量和效率。


百度智能技术在推动传统产业转型升级的同时,也催生了智能家居、智能电商等新兴产业的发展。
更重要的是,还打造智能工程师、培训师等新职业,推动人才培养模式创新,为产业结构升级提供源源不断的人才支撑。
站在新的历史节点,百度问心智能体正在重新定义AI的发展方向。
在全球科技巨头还在为智能车身技术摩拳擦掌的同时,他们用扎实的技术积累和丰富的实践经验验证了智能车身技术的巨大潜力。
荣获多项奖项是整个行业的认可
仔细回想,其实不仅是今年,百度在世界互联网大会乌镇峰会上已经五次获得这一奖项。获奖理由为百度大脑、小度助手、飞桨、知识增强大语言模型技术。
今年的百度问信智能代理已是第六次获奖。
不仅如此,百度大模型相关技术还荣获国家技术发明二等奖、中国专利金奖、吴文俊人工智能科技进步特等奖、中国人工智能科学技术进步奖一等奖等。电子学会科学技术进步奖。

首届世界互联网大会11年来,百度率先预测了下一个技术突破方向。同时,也不忘记将技术与实践紧密结合,快速抓住当前市场的痛点。
百度大脑、小度助手()、自动驾驶平台、飞票开源深度学习平台等都是百度在行业的开创性探索,并且都取得了成功。
这些领域的前沿技术不仅带动了百度的发展,也作为引领者推动了整个行业的技术进步,让整个行业的技术发展搭上了快车。
更重要的是,百度并不局限于单一技术的发展,而是拓展了版图,致力于构建包括硬件、软件、服务和平台在内的完整生态系统。
人工智能的未来在哪里?答案或许就在于百度智能技术的突破。
从去年10月的前瞻布局到如今智能代理的蓬勃成长;从系统2思维模式创新到智能代理赋能万千企业的实践。
百度正在利用持续创新的技术力量,为各个领域带来智能化变革。


