在来自 24 个国家和地区的 270 项科技成果中,共有 20 项成果入选“领军科学技术奖”。
作为 AI 领域的重要代表,获得该奖项的百度文信智能双胞胎技术尤为引人注目。
近来,Law 撞墙理论成为热门话题,大模型是新的科技泡沫吗?
横跨互联网几个时代的巨头百度告诉我们,所谓“AI 应用难落地”和“没有办法商业化”,还是因为它看得不够远。
正如国家杰出工程师、百度首席技术官王海峰所说,智能孪生是最能激发大模型潜能的应用方向。
随着代理技术的突破,将激发更多的创新。智能代理为社会和经济发展带来的巨大价值也正在接近。
AI 代理和人类一样,“思考缓慢”。
百度智能双胞胎背后的技术原理是什么?这要从人类的认知系统说起。
在心理学研究中,人类认知系统分为两种类型:系统 1 和系统 2。
第一代系统响应迅速,但容易出错;另一方面,系统 2 的思考速度较慢,但更准确、更理性。
基于这一认知特性,百度研发出了突破性的慢思维机制—— 2,其核心是“思维模型”。
这
“思维模式”由四个关键要素组成:理解、规划、反思和进化。
这四个组件共同使 AI 系统能够可靠地执行任务,不断进化自己,并在一定程度上将思维过程白盒化。
为了实现真正的智能思维,百度在基础大模型的基础上,进行了三个层次的突破性增强训练。
首先是对思维过程进行监督微调,以便模型可以像人类一样分解任务并自主计划。
例如,如果你正在计划去苏州园林旅行,“思维模型”不仅会了解你的需求,还会考虑到景点分布和开放时间等因素,为你规划最佳路线,就像一个人工导游一样。
第二种是行为决策的偏好学习,以便模型学习使用工具和做出决策。
例如,要统计“师”一词在“师”中出现的频率,模型会主动调用搜索工具获取全文,然后调用代码解释器准确计算出现次数。
最后,用于结果反射的强化学习使模型能够学习检查工具的结果并动态调整行为。
就像人类质疑信息的准确性一样,AI 已经学会了检查数据的准确性。

比如,在计算国庆电影的票房排名数据时,不同的数据有两个不同的来源:一个是 2.15 亿元,一个是 2.35 亿元。
此时,模型主动分析可能的原因(数据更新时间不同、统计来源不同等),然后搜索进一步验证,保证信息的可靠性。
那么,训练 Model 的数据来自哪里呢?毕竟,人类的思维过程往往只发生在每个人的脑海中,很难表现出数字化,因此很难获得相应的数据。
对此,百度创造性地构建了“数据合成”的虚拟环境。
在提示构建阶段,基于领域知识自动合成业务逻辑,通过工具模拟器灵活模拟业务所需的工具,通过用户模拟器生成用户可能的问题或指令,机器人与机器人交互。
然后,根据输入提示,思维模型自动探索思维和行动的不同路径,并通过逐步执行来模拟智能体的行动过程,最终生成高质量的合成数据。
此外,基于这些合成数据,RL 用于优化 “思维模型”。
最终,机器可以像人类一样思考和行动,自主完成复杂的任务,同时在环境中不断学习和进化。
代理的工作流
一个
斯坦福大学计算机科学系的客座教授指出,AI 代理工作流今年将取得长足进步,甚至超过下一代基本模型。
我们都有过询问/等待模型但没有得到令人满意的结果的经历。
但代理的关键作用之一是提供反馈,以帮助 LLM 改进输出并最终获得更好的响应。
事实上,一个基本的代理架构应该包括四个方面:内存、规划、工具和操作。
前研究员 Weng – 法学硕士
此外,特定工作流中的代理有四种不同的设计模式。
第一种是反射 (),其中大型模型能够自行检查工作并提出改进方法。
二是工具使用,可以主动使用 Web 搜索和函数调用等任何功能来完成信息收集、数据处理或采取行动。
接下来是 (),它提出一个多步骤计划并实现目标。
最后是多代理协作,其中多个 AI 代理协同工作以分配任务和讨论想法。
综上所述,AI 代理的出现并不允许 LLM 直接生成最终输出,但也多次提示大型模型,最终构建更高质量的输出。
它从模型开始,但并不止于此以

百度智能双胞胎为后盾的文信大模型技术为其落地应用奠定了坚实的基础。
自去年 3 月 16 日文心医言发布以来,百度的文心模型不断升级,知识增强、检索增强、代理等技术也在不断进化。
自今年 9 月以来,百度文心模型的日均 API 调用量飙升至 15 亿次,短短半年时间就增长了 7.5 倍。
这样做的原因是它大大改善了幻觉问题。
随着搜索引擎的技术积累,百度引入了搜索增强机制。通过搜索 上已有的知识,大型模型可以给出更准确的答案。
百度的“理解-搜索-生成”协同优化检索增强技术,大大提升了大模型的技术和应用效果。
在文本生成领域,检索增强的应用已经成熟。下一步是解决文生图的错觉问题。
为此,百度研究团队将百度对数亿图像资源的搜索与强大的基础模型能力相结合,开发了基于检索增强的文生图技术 iRAG,使图像生成的效果更加真实。
现在,iRAG 可以生成准确的图像和广义的生物图谱。
具体来说,大型模型将首先分析和了解用户需求,并自动规划精确或泛化的方案,例如要增强哪些实体。然后,在增强阶段,搜索并选择需要增强的实体的相应参考图。
最后,在生成阶段,自主研发的多模型可控地图模型通过局部注意力实现图像的高泛化生成,还可以通过整体注意力计算进行高精度图像生成。
正如李彦宏所说
过去 24 个月 AI 行业最大的变化是什么?基本上消除错觉的是大型模型。
从那时起,大型 AI 模型可以迅速转向智能孪生,并迎接原生应用程序的爆炸式增长。
代理商,开启 AI 应用新时代
如今,智能孪生具有低门槛、高天花板的特点,不仅可以让大家上手,还可以做出复杂而强大的应用,正在成为最主流的 AI 应用形式。
就连首席执行官 Sam 也表示,“下一个关键突破是 AI 代理。
全球各大科技巨头和独角兽在 AI 领域掀起了一波智能体技术竞争。
不过,鲜为人知的是,在这波代理热潮之前,百度已经完成了重点布局。
百度已经领先
在互联网时代,百度搜索是核心应用,实现了人类发展史上第一次知识包容。
进入下一个周期,大模型时代,AI 将让无数普通人期待成为超级个体。这个推动者无疑是一个代理。
李彦宏表示,大规模模型大战中所谓的“12 个月前”和“18 个月后”,其实并不那么重要。在这个竞争完美的市场环境中,无论你选择哪个方向,都会有很多竞争者。
在大型模型热潮的第三年,我们经历了大型模型应用程序开发的几个阶段。
在过去的一年里,很多人都关注多模态,但实际上,它是最能激发大型模型潜力的代理。
这样做的原因是它的阈值非常低。
将大型模型转换为应用程序存在许多不确定性,但代理是一种非常简单、高效且简单的方法。需要应用基本模型来显示价值,而代理几乎是一个 “一刀切” 的大型模型应用程序。
因为门槛足够低,所以不需要甚至编程,只要用 “人话” 把工作流程讲清楚,这比互联网时代制作网页还容易。
特工们都在爆炸,但现在的基数还是比较小的,大家的感知也不是那么强。让更多的人进来,发挥他们的聪明才智,也许哪条路都会贯穿始终,就是一个超级APP。
创建新的代理生态系统
如今,百度已经建立了一个强大的代理生态系统。
百度的智能双胞胎技术充分释放了文心模式的潜力,成为引领行业变革的新引擎。
根据 IDC、、中国软件测评中心等权威评估,文信大模型性能超过国际领先大模型的平均表现,位居国内第一、世界第一梯队。
来源:IDC,中国大型车型市场主流产品评测,2024 年
如今,在市场营销、客户服务、企业办公和代码编程领域,代理商正在重塑各行各业升级的新范式。
另一方面,百度基于智能双胞胎技术的“文心智能双胞胎平台”进一步降低了发展门槛,让 AI 赋能触手可及。
开发者可以根据自身的行业特点和应用场景需求,利用平台提供的多样化能力和工具,打造大模型时代的 AI 原生应用。
基于易开发、易分发、易赚钱三大特点,该平台实现了价值闭环。
百度搜索 AI Q&A
例如,一位 38 岁的失业女性创建了“情绪咨商导师小小”经纪人,不仅获得了意外之财,还获得了新的职业机会。
目前,文信智能双胞胎平台已吸引超过 80 万开发者和 15 万家企业。

无需编写代码即可实现任何想法
目前,百度的智能孪生技术正在加速将 LLM 深度融入社会各行业的各个方面,帮助企业和社会服务智能化升级。
在政府事务领域,AI 法律咨询助理可以为工作人员提供及时、准确的法律指导。
在农业领域,“农家院士智能双胞胎”让科技助力农业更加便捷高效。
在教育领域,它可以为教师和学生带来更加智能化和个性化的教学体验。
在辅助编程的开发中,代理降低了普通人开发应用的门槛,也提高了专业程序员的编码效率。
这里,特别值得一提的是百度在“多智能体协同”领域的最新成果——无代码开发工具“秒大”。
用 Li 的话来说,它是“迄今为止人类历史上最复杂的多智能体协作工具”。
多智能体协同是基于文心大模型的思考和规划能力,实现了不同智能体的调度和编排。
在策划、内容、开发等工作中,有五个机器人:团队负责人、策划师、编辑、程序员和质检员,他们相互配合,甚至可以自动识别错误和调用各种工具。
在演讲现场,李彦宏以萝卜润新技术发布会为例,直接搭建了活动报名系统。
用中文描述需求,以会议时间、地点为主题补充文档,即可在第二场指挥多个座席的协作。

其中,队长情报会进行计划调度、拆解任务并召唤每个特工完成任务。
规划代理负责将规划设计方案拆分为四个子任务:核心需求、内容结构、开发需求和数据收集。
小编智能编辑邀请函中的所有文字和媒体内容,包括发布展望、时间地点信息、封面图片等。
程序员代理编写代码、制作和部署网页。

在此过程中,通过场景知识的增强,提高了复杂代码生成的质量和稳定性,可以高效实现用户所需的功能。
最后,质量检查员智能将检查代码错误、修复它们并测试代码。
在一组流程之后,将立即生成事件邀请。

同时,百度的另一款多智能体应用——代码助手“文心快代码”已经升级到 3.0 版本,全面进入智能孪生时代。
具体来说,在整个开发过程中,多个智能体会在管道中协同工作,这将大大提高程序员的工作质量和效率。


在推动传统产业转型升级的同时,百度的智能双胞胎技术也催生了智能家居、智能电商等新兴产业的发展。
更重要的是,它还创造了智能体工、培训师等新职业,推动人才培养模式的创新,为产业结构升级提供源源不断的人才支撑。
站在新的历史节点,百度文心智能体正在重新定义人工智能的发展方向。
虽然全球科技巨头仍在为代理技术做准备,但他们已经凭借扎实的技术积累和丰富的实践经验验证了代理技术的巨大潜力。
它获得了许多奖项,这是整个行业的认可
仔细回顾,其实不仅今年,百度在世界互联网大会乌镇峰会之前已经五次获得该奖项,获奖的原因分别是百度大脑、小度助手、、以及知识增强的大语言模型技术。
今年的百度文心智能双胞胎已是第六次获奖。
不仅如此,百度的大规模模型相关技术还获得了国家技术发明奖二等奖、中国专利金奖、吴文军人工智能科技进步奖、中国电子学会科技进步奖一等奖等多项殊荣。
自首届世界互联网大会以来的11年里,百度率先预测了下一个技术突破方向,同时也不忘将技术与实践紧密结合,快速抓住当前市场的痛点。
百度大脑、小度助手()、自动驾驶平台、 开源深度学习平台等,都是百度在行业内的开创性探索,并且都取得了成功。
这些领域的前沿技术不仅带动了百度的发展,也作为引领者推动了整个行业的技术进步,使整个行业的技术发展走上了快车。
更重要的是,百度不仅限于开发单一的技术,而是不断扩大格局,构建一个完整的硬件、软件、服务和平台生态系统。
AI 的未来是什么?这个答案,或许就藏在百度智能twink技术的突破中。
从去年10月的前瞻性布局,到如今代理商的蓬勃发展;从系统 2 思维模式创新到智能孪生实践赋能千家企业。
百度正在利用持续创新的力量,为每一个领域带来智能蝴蝶的变化。


