当今科技界,没有比AI搜索更强大的新共识。
过去几十年,以阿里巴巴、百度为代表的“搜索引擎”,以抖音、快手为代表的“推荐引擎”,轮番引领信息经济发展。
如今,大型语言模型(LLM)的出现有望进一步提升搜索引擎的地位和价值,让其以AI搜索的新身份再次引领人工智能应用浪潮。
1.保守还是激进?AI搜索的三大趋势
人工智能正在成为“干掉”传统搜索引擎业务的最大变量,但人工智能搜索如何落地仍存在争议。目前,涌入人工智能搜索的众多玩家已经分裂成三大主要阵营,各自以自己的方式前进:保守派、中间派、本土派。
保守派以人工智能和国内搜索“AI智能答案”为代表,即在现有搜索引擎中加入AI功能模块,以增强传统搜索性能。
以New Bing为代表的中间派,通过AI对搜索进行了更为深入的改变,但保留了传统搜索引擎的“基础设施”,也有人称之为“答案引擎”。
最为激进的,则是以360人工智能搜索为代表的“原生派”——从0到1,打造AI原生搜索引擎,因其答案质量更高、信息结构更强,又被称为“知识引擎”。
业内人士认为,在人工智能时代,如果按照搜索引擎所蕴含的AI量的多少,将搜索引擎划分为不同的代,那么:
保守派仅仅对搜索引擎做了“插件式”修改,其AI含量最低,只能算是搜索引擎1.0。
中学对传统搜索引擎进行了深度变革,AI内容大幅增加,答案生成能力增强,可以称之为搜索引擎2.0。
“为AI而生”的原生搜索引擎,将AI视为系统不可分割的一部分,蕴含的AI量最高,被称为搜索引擎3.0。
如果用户只需要URL导航,传统搜索引擎和搜索引擎1.0已经完全够用,一旦搜索需求变得复杂,包括推理、计算等要求,不同代搜索引擎之间的性能差距就会立刻显现出来。
举个例子,先问一句,为什么《里斯本丸沉没》豆瓣评分9.3,口碑极佳,但票房却只有1000万?
结果,面对这个相对复杂的问题,AI却无力回答,甚至无从下手。

即使对于人工智能似乎能够回答的一些简单问题,它也可能会失败:
“如何吃石头?——把石头磨成小块然后吃掉。如果你吞咽困难,可以用水送服。石头很有营养。”
如何防止奶酪从披萨上滑落? - 在酱汁中加入 1/8 杯无毒胶水
“怀孕期间吸烟怎么办?——医生建议怀孕期间每天吸烟 2-3 支”
当然,这并不意味着该公司的AI技术不如其他公司,问题的根源在于AI系统仅仅充当了传统搜索引擎的插件,被内容不准确但用户点击率很高的网页搜索结果误导。
传统搜索引擎往往以 CTR(点击率)为导向,与广告收入直接相关。因此返回的内容往往是点击率高的网页(往往是一些 UGC 网站,比如论坛、知识问答网站,或者“内容农场”、“AI 内容网站”),而不是最准确的答案。一旦遇到诱饵标题、误导甚至错误的答案,大模型也会失效。
对于同样的问题,新Bing的答案要好得多,但仍然受到传统搜索引擎根据点击率对网页进行排名的影响。

作为人工智能时代搜索引擎3.0的代表,360AI搜索被称为“知识引擎”,因为当你提出问题时,你得到的不仅仅是答案,还有结构化的知识。
对于同一个问题,AI原生搜索引擎提供的答案质量明显更好。

除了答案平均长度超过700字(其他或AI搜索答案一般只有200多字)外,360AI搜索返回的结果能从更多角度分析同一个问题,信息量丰富。最重要的是,几乎每句话都会有引用,就像学术论文必须注明引用来源一样,引用数量也相当可观。
除此之外,结果还包括图像、思维导图和所有参考文章的链接。


为了进一步明确AI搜索不同流派、不同路径在效果上的差异,以及背后的原因,我们决定用新的问题做进一步的测试。
尽管有些心理预期,但当被问到“如何评价17岁中专生蒋平入围2024年阿里巴巴全球数学大赛总决赛?”并选择“深度解答”模式时,360AI搜索的表现还是让人惊喜。
在查阅了网上46834条相关资料,精选出39篇文章后,迅速整理出一篇不仅篇幅可观、内容也十分丰富的短文,除了总结社会各界对蒋萍进入决赛的评价外,还谈到了她在预赛中的表现和个人特点,最后“升华”到探讨中专生参加此类比赛的优势与挑战。
在严谨性方面,几乎每一个论据都标注了相关证据的出处,方便读者进一步查证。全文引用25处,并附上全部39篇文章的链接。
在呈现方式上,除文字外,还有江平、入围名单等相关新闻图片、思维导图等。
与“保守派”的答案相比,优势显而易见。

这是百度“AI智能问答”返回的结果。

这是 Bing 返回的结果。
我们熟悉的AI产品中,涉及RAG调用的情况很少,因此生成的答案中参考链接较少,难免会出现幻听问题。

从搜索结果质量来看,在三代搜索引擎中,激进的“原生”搜索引擎3.0无疑占据上风,但商业世界看的不仅仅是“效果”,还有“成本”等诸多因素。

如果AI原生搜索引擎投入大,回报低,那么无论搜索质量有多好,也无法帮助其完成商业闭环。
2. AI原生虽好,但“三足鼎立”门槛高
要打造一个真正的AI搜索引擎,门槛和投入都非常高。
360集团副总裁、AI产品负责人梁志辉估计,打造一个通用搜索引擎,至少需要20亿到40亿元的预算,这还不包括网页排名的服务器费用、终端厂商合作费用、人力资源费用,这也是为什么全球通用搜索引擎只有少数几家的原因。
从技术架构来看,一个可以称之为“知识引擎”的AI原生通用搜索引擎包括三大支柱:“智能索引库+专属知识库+混合大模型智能调度系统”。
1.智能索引库
对于搜索引擎来说,建立自己的索引也很重要,但成本也很高,即使是传统搜索引擎,抓取1000万个网页也需要数百万的预算,而这还只是冰山一角。
因此,除了极少数创业公司选择自行搭建小规模垂直索引库外,市面上大部分所谓的AI搜索产品实际上都依赖于购买或者使用微软Bing的API服务,这带来两个显著的问题。
首先,价格昂贵,使用Bing的索引库需要购买昂贵的第三方服务,这可能会吞噬企业所有的利润,让项目难以维护。
其次,知识理解能力有限,如果选择接入现有的索引库服务(比如AI),通常只能获取到与查询相关的100字左右的信息,这种限制导致大型模型无法读懂并深入分析全部内容,导致对很多知识的理解比较零散和肤浅。
作为一家成立于2012年的老牌搜索引擎,360搜索已建立起由约1000亿个网页组成的动态更新的索引库,这也为360AI搜索奠定了基础。
但对于AI搜索来说,索引技术和索引库同样重要,除了传统的关键词索引,360AI搜索还利用向量索引、KV索引等技术重构索引库,大幅提升索引效率。
2. 独家知识库
知识库是知识引擎的“优质内容原料”,更多用于复杂推理、深度学习等任务。但目前公有领域内容质量整体下滑,优质内容逐渐被内容丰富的APP抢走。通过自建、购买、合作等方式,360AI搜索知识库汇集了大量优质内容源,包括但不限于论文、知识视频、访谈节目、课堂录音、专业网站等。
此外,通过在知识库中引入知识图谱,可以更轻松地处理复杂查询,从而以最容易被大型模型理解和计算的方式捕获、索引和调用专属知识库内容,让高质量的知识真正“可计算”和“可理解”。
3.混合大模型智能调度系统
生成式大型语言模型是AI搜索能够输出结构化优质内容的关键,但直接接入大型模型的AI搜索不够高效、不够智能,因为每个大型模型都有其不足之处。360AI搜索的解决方案是构建CoE(专家协作)技术架构,实现了对360智脑等16家国内主流大型模型厂商、54个大型模型以及大量专家模型的智能调度。
CoE架构的技术原理和近期发布的o1-big模型相同,方法也类似,均基于强化学习和“思维链”,大大优化了记忆、检索、推理机制,提升了大模型解决复杂问题的能力。
唯一的不同是,o1 可能遵循“双系统理论(Dual)”,即 GPT 与 o 系列结合思维链的融合系统,前者用于“快思考”,后者实现“慢思考”。CoE(-of-,专家协作)架构汇集了数量更多的大模型和专家模型,通过思维链和“多系统协作”实现“快思考”和“慢思考”。另一个不同是,CoE 架构的发布时间比 o1 早了近两个月。
这种分工协作的模式使得CoE架构在推理任务上更加灵活和准确,特别是在处理复杂问题时,可以和o1媲美,甚至在某些场景下表现更佳。
由技术前瞻性的CoE架构支撑的混合大模型智能调度系统是AI搜索的第三大支柱。
在 CoE 架构推出之前,国际上主流的大模型调度系统是 MoE(-of-mixed of )架构,但 MoE 架构每次只能让一个专家模型回答问题,而由于单个模型的能力有限,无法及时辨别网页内容的真假,答案难免带有虚幻和噪声。
在 CoE 工作流中,人们输入的问题首先交给一个可以识别超过 1 亿种意图分类的专家模型;在完成意图识别后,交给任务路由模型进行复杂任务的分解,决定由哪个模型来处理这个任务,或者由哪些模型来配合。通过任务的精细分解和不同模型能力的调度,答案的准确性、及时性和严谨性得到极大提升。
“今天大家看到的AI搜索背后,一个简单的搜索至少涉及7个模型调用,一个深度解答至少涉及15个大型模型调研。背后不仅有意图识别,还有多种能力调度、阅读分析、任务编排等等”,梁志辉说。
高门槛、高投入的AI搜索确实取得了较好的效果,越来越多的用户也选择“用脚投票”。
8月份的数据显示,1月底上线的360AI搜索用户访问量已超过2亿,是AI的3倍多,且每月仍以113%的速度增长,不仅是全球最大的AI原生搜索引擎,也是全球增长最快的主流AI搜索引擎。
从用户行为来看,AI搜索与传统搜索引擎也有很大的不同。在AI搜索中,超过70%的用户是在寻找信息,寻找地址的用户数量下降到了10%。在寻找信息的用户中,有将近20%的需求是直接用于文档创作,而这正是AI搜索的优势所在。从用户使用时间来看,360AI搜索用户平均搜索次数增长了2-6倍,平均停留时间突破了500秒。

从用户画像来看,目前AI搜索的用户群体已经覆盖两端,一方面是从事内容生产的知识群体,对内容品质要求较高;另一方面,随着语音输入、结果复制等能力的使用门槛不断降低,中小学生占据了很大比例的用户。
我们来看一下当前的搜索引擎市场,一方面,传统搜索引擎已经探索了所有的可能性,充分暴露了自身的不足;另一方面,保守派、中间派、本土派转向AI搜索的不同路线以及各自产品的优缺点也清晰地呈现在人们面前。
但人们仍有疑虑:
AI原生搜索引擎虽然效果显著,但目前AI原生应用独立实现商业化的案例却寥寥无几。单次搜索需要7-15次模型调用的AI搜索,是否永远无法实现商业化?还是说,这样的模式只是昙花一现?
3.“革命是自己的生命”,鲶鱼也不怕
没错,推理成本是AI搜索商业模式能否闭环的关键因素。
对于传统搜索引擎来说,单次搜索的成本仅为0.2分钱,而以360AI搜索为代表的AI原生搜索引擎,单次搜索就有7-15个大型模型调用,推理成本要高得多,但这个问题并非无法解决。
事实上,通过巧妙选择和整合不同的AI模型,CoE架构可以充分利用各模型的分析优势和差异化定价结构,提升产品性能,控制成本。国内第三方大模型激烈的价格战也为AI搜索成本整体下降奠定了基础。此外,通过向大模型厂商提供用户和“坏案例”反馈,360AI搜索与大模型厂商形成了互利的合作关系。从长期来看,情况也在改善,推理成本正在快速下降,有点类似于摩尔定律。
虽然AI搜索的商业模式还未完全成型,但这更多的是时间问题。微软CEO纳德拉强调:“据我所知,搜索业务是地球上最赚钱的软件业务,我需要的是更多的用户。”因此,我们不用担心一个拥有大量用户的搜索引擎会一直亏损。据了解,360AI搜索已经实现了商业闭环。
创始人周鸿祎曾把360比作中国互联网的“鲶鱼”,不是巨人,也不是鲨鱼。这条“鲶鱼”十二年前曾用“300大战”搅动过中国搜索市场,至今仍稳居中国搜索引擎市场第二。
十二年后,人工智能浪潮来袭,市场再次动荡。秉承一贯的快速行动,360这条“鲶鱼”在短短八九个月内迅速超越AI,成为全球最大的AI原生搜索引擎。而且,其潜力不减,依然是全球增速最快的搜索引擎。
纵观全球商业史,几乎每一次需要“自我革命”的技术浪潮中,行业第二大玩家往往比行业第一大玩家更果断、更勇敢、更灵活。巨大的沉没成本迫使传统巨头为了步步高升而采取“保守”创新,柯达、诺基亚、谷歌、百度亦是如此。另一方面,对于“没有历史包袱”的创业公司来说,AI搜索领域并不是“颠覆性创新”的理想突破口。
目前,人工智能搜索仍处于快速发展阶段,搜索体验仍将快速提升,与传统搜索引擎的差距将越来越大。人工智能搜索将让搜索引擎从信息检索工具进化为帮助用户完成知识探索的“知识引擎”,并最终依托不可逆转的历史趋势取代传统搜索引擎,成为用户检索信息、获取知识的首选。
或许到那时大多数人就会意识到,如今搅动市场的我们所认为的“鲶鱼”,其实是“鲸鱼”。
本文来自微信公众号,作者:Sia,36氪经授权发布。


