大模式是新革命还是新泡沫?李彦宏认为,百度有资格回答这个问题。截至11月12日,文信模式日均调用量突破15亿次。他也承认,万众期待的AI超级应用还没有出现。 “PC时代的应用是软件和网站,移动时代是APP,大规模模型时代是代理。”他多次强调,代理商还不够。那天,李彦宏将经纪人的重要性提升到了一个新的高度。
基本解决幻觉问题
“如果要开发基于大模型的应用,就要消除幻想”,李彦宏一语道破。 “如果这个模型总是一本正经的胡说八道,那么没有人会相信你,也不会有应用。”
事实上,大机型爆火后的两年里,在不同的使用场景下,幻觉现象的改善程度有所不同。
在李彦宏看来,“大模型是概率模型,生成的内容是不确定的。使用RAG(检索增强生成)技术后,大模型将利用检索到的信息来指导文本或答案的生成,提高内容的质量。质量和准确性。文本层面的RAG做得很好,但图像等多模态内容与RAG的结合还不够。”
他以两张天坛的照片为例。大模型生成的天坛有四层,但真正的天坛实际上只有三层。这是文生幻觉的典型现象。回到应用层面,这种幻觉现象还是很常见的。 “所以今天的多模态大模型还没有大规模应用,只是幻觉还没有解决,至少没有像 RAG解决得那么好。”李彦宏解释道。
基于此,百度开发了iRAG技术,即检索增强的图技术。该技术将百度搜索图像资源与基础模型能力相结合,生成各种超逼真图像。
百度CTO王海峰详细表示,“百度基于大模型分析理解用户需求,自动规划精准或泛化的解决方案;然后在增强阶段,针对需要增强的实体检索并选择相应的参考图像;最后现阶段我们自主开发了一个大型的多模式可控图像生成模型,在实际应用中,该方法也支持用户上传参考图像并根据用户期望生成。”
部分商品可立即取货
无论是大众化的新能源汽车还是大型车型,技术、应用、商业模式都是渐进的过程。正如中欧人工智能与管理创新研究中心秘书长钱文英所说,“人工智能目前处于早期阶段,更注重实验室创新。随着技术的成熟,企业需要应用这些新技术以满足实际需求并逐步实现商业化。”
当天,李彦宏演示了iRAG的应用场景:品牌推广。 “想象一下,如果为大众制作的海报看起来像丰田,”他开玩笑说。 “以前拍摄一套汽车海报要花一二十万元,甚至几十万元。现在创作成本接近于0。iRAG的商业价值是:没有幻觉、超真实、无成本、立即可用。”
在55分钟的演讲中,他两次提到“立即可用”一词。第二次是在谈论“免费画布”时,百度文库和百度网盘联合开发的一款工具类代理。其核心功能体现在输入、编辑、创作、分享阶段。

以创作为例。标记完要点后,用户可以选择所有需要的材料并一键生成。根据现场分享的视频,输入一张孩子的照片,添加故事背景等,免费画布就可以生成漫画。
“Free 可以帮助你完成从查找信息、到编辑、到生成和分享的所有任务。每个人都可以成为漫画家或短视频导演。”此时,李彦宏的声音明显增大,“这不是未来,是立即有货。”
和Free 一样零门槛的还有无代码工具“”,一款多智能体协作工具。以萝卜跑新技术发布会邀请函的设计为例,包括海报生成、文案生成、嘉宾登记、地图信息展示等,工作人员无需懂代码即可完成。用李彦宏的话来说,“你不需要招聘项目经理、设计师、开发人员、测试人员等,你可以指挥多个代理协同完成任务。”

该应用程序看起来不同
一个是座席,一个是座席协作工具。李彦宏看好的代理商出现在2024年百度世界大会官宣前的C位、预热期间、主论坛演讲和展区。
北京商报记者在展区体验了农民院士AI。 “您好,我是农民院士朱有勇的智能代理人,您可以向我提问,了解优质旱稻问题的具体解答。” “院士”将回答所有问题。截至北京商报记者发稿,该智能坐席在问心智能平台的浏览量已达11.3万次,已帮助2.9万人次。整个文信智能平台吸引了15万家企业、80万开发者参与。
11月12日,李彦宏大部分时间都在给经纪人打电话。他将百度的代理商分为四类:公司代理商、角色代理商、工具代理商、行业代理商。
“智能体是人工智能最主流的应用形式,即将迎来爆发点。”他再次强调。 “未来,公司的官方代理很可能会取代官网。”并追溯到PC时代至今,“在人类信息技术的变革中,在不同的历史时期,应用的出现也有所不同:在PC时代,是软件、网站;移动时代,是可以关注的应用和账号;在AI时代,应用主要表现形式是智能体。”
为什么应用程序和代理被多次提及?从另一个角度可能更容易理解,“正常健康的生态应用是:应用创造的价值>云厂商>芯片GPU(图形处理器)”,零一万物创始人兼CEO李开复表示。
北京商报记者 魏巍


