2024 知乎盐 Club 新知青年大会发布 AI 大模型产品「知乎直答」

   日期:2024-07-02     来源:网络整理    作者:二手钢材网    浏览:187    评论:0    
核心提示:搜索产品,以知乎社区内容为核心的「知乎直答」又有什么优势?在这一点上,得益于站内的优质内容,「知乎直答」确实在一些领域中表现得比较专业,回答的内容更加切实,而不是空洞。但会不会更大程度地使用「知乎直答」作为日常获取信息和观点的渠道呢?

但严格来说,“知乎直答”并不是什么新鲜事。

早在今年3月,在2024知乎发现大会上,知乎其实就发布了AI功能“发现·AI搜”。在官方的说法中,“发现·AI搜”以社区可信内容为基础,为用户带来集新搜索、实时问答和跟帖功能于一体的全新体验。

这句话基本可以套用在“知乎直答”身上,不同之处在于从“以社区可信内容为依托”变成了“以知乎社区优质内容为核心,多种数据源为辅助”,也从依附于知乎的功能正式升级为拥有独立域名(zhida.ai)的独立产品。

但对于普通用户来说,更关心的问题或许是:作为一款AI大模型产品,知乎直答是否真能如官方所说“为大家提供一种获取可靠信息的新途径”?而相比其他同类AI搜索产品,以知乎社区内容为中心的知乎直答究竟有哪些优势?

凡事都需要“熟能生巧”。

“AI搜索”只是外壳,知乎内容才是灵魂

知乎直答的产品设计非常简洁、熟悉,一言以蔽之,是一流的AI搜索设计,国内外很多AI搜索产品也都采用了这样的设计,原因也不复杂:好用、够用。

图/雷科技

进入首页,中间是核心的问题框,下方是问题推荐栏,作为新用户的引导,也是增加用户粘性的策略。侧边栏是问答列表和用户设置。

输入问题后,知乎直答也要经过“理解问题”“查找资料”之后才能“生成答案”“完成回答”。完成回答之后,除了能看到最终的答案内容,还能看到之前的“参考来源”。

图/雷科技

同时,还可以继续“深挖”,问AI一些问题。比如,当16计划介绍不锈钢电池外壳时,小雷继续问“其他厂商会用吗?”AI可以理解上下文,不用重复“不锈钢电池外壳”。

_从丑变漂亮的体验知乎_手机阅读软件体验知乎

图/雷科技

除了默认的“深入”模式外,用户还可以选择“简短”模式进行提问,顾名思义,该模式每次输出的单词较少。

以上就是知乎直答的基本功能了,坦白说并没有太大的惊喜,但在这个阶段已经算是比较成熟的设计了,只是有些细节需要打磨,比如在后续问题中选择答题模式时选项窗口的弹出位置等。

但俗话说,“美丽的外表都是相似的,有趣的灵魂却很难找到。”

知乎直答的核心竞争力来自于知乎的海量答案,它不仅是中文互联网上最优质、最重要的语料库之一,而且是一个实时更新、汇集了无数用户问答的数据库。

简单来说,在大模型预训练阶段,“知乎图AI”大模型将以优质的知乎问答作为核心语料进行训练;而在“知乎直答”的实际应用中,也将以知乎为核心数据库进行“寻找信息”,并最终在此基础上“生成答案”。

但不管怎么说,最后还是要看真正的动作。

随着AI大模型的使用,知乎的答案会更靠谱吗?

众所周知,AI大模型最强大的能力之一就是对自然语言的理解,而AI搜索相较于传统搜索最大的优势之一,就是能够更精准地理解用户意图。

从“理解问题”的角度看,知乎直答确实在一定程度上体现了AI大模型的优势。比如当我问“你和米塔AI搜有什么区别”时,我就能理解我在问知乎直答和米塔AI搜的区别,并从功能定位、技术特点、用户交互等角度进行比较。

图/雷科技

就是用汉语十级考试的题目让“知乎直答”理解“人有能力,可以为所欲为,想干什么就干什么;人没能力,可以为所欲为,想干什么就干什么,什么都干不了”,并且还能准确理解语义。

从丑变漂亮的体验知乎_手机阅读软件体验知乎_

图/雷科技

此外,知乎直答还能根据上下文进行理解,还能理解一些垂直领域的专业术语。比如问“詹姆斯是NBA的GOAT吗?”,可以理解是指勒布朗詹姆斯,也能理解这里的GOAT代表的是NBA历史上最伟大的球员。

图/雷科技

不过知乎直答在时间判断上好像有些问题,比如问五年前,可以准确推导出2019年,但是问十年前,却能直接推导出2012年(应该是2014年)。

图/雷科技

此外,从引用来源来看,“知乎直答”的逻辑可能也存在问题,在“搜索资料”的过程中,更有可能以“十年前”而不是“2012年”或者“2014年”作为搜索的关键词。

这也引出了“知乎直答”在明白问题之后的下一步:找资料。

相比其他AI大模型产品,AI搜索最核心的技术差异在于基于RAG(检索增强生成)技术、实时联网生成答案。除了检索能力,影响大模型生成质量的另一个关键因素是数据库。

相比其他AI搜索引擎,知乎有一个独特的优势——它可能是中文世界最优质的站内内容。同时,在从“发现·AI搜索”功能升级到“知乎直答”产品的过程中,知乎已经不局限于站内内容,而是拓展到了全网可搜索的内容。

比如在“国产大飞机C919目前处于什么水平?”这个问题上,知乎直答不仅在站内找到了一些答案,还查阅了不少来自媒体报道的内容,包括百度百科、澎湃新闻、政府网站、新华社等来源。

手机阅读软件体验知乎__从丑变漂亮的体验知乎

图/雷科技

然而我们在使用“知乎直答”的时候,很多人首先关心的问题是:“知乎直答”真的能用知乎的答案吗?

最简单的答案是:它是被使用过的,并且是真正可追溯的。

以苹果计划推出不锈钢电池外壳的问题为例,知乎直答上第一个回答的质量并没有让肖磊感到意外,因为并没有提到电池能量密度的普遍提升,以及欧盟政策的影响。

不过知乎直答还是从七个方面回答了苹果推出不锈钢外壳电池的原因,并在一些地方直接标注了引用来源,其中大部分都是来自知乎的回答,只有来源13、15是外部媒体的报道。

图/雷科技

点击这些参考链接确实可以看到相应的信息和观点来源,但需要注意的是,这些参考只是部分内容,例如在“维护方便”部分,参考来源只提到了前半句“不锈钢电池外壳的设计可能便于维护”。

至于后半句关于“iOS修复模式”的说法,在参考链接中其实根本没有提及,更多的是说“创建”一个大模型。

此外,虽然“知乎直答”宣称能够充分利用站内海量优质内容,但不同问题所能利用的内容质量参差不齐,部分问题和答案本身质量就比较低,甚至答案都是由AI生成的。

这或许也是知乎选择将搜索范围从站内扩大到整个互联网的主要原因之一。

但不管怎样,知乎问答归根结底还是为了“生成答案”。从这个角度来说,得益于站内高质量的内容,知乎问答在某些方面确实更加专业,答案也更加务实而非空洞。

以C919的问题为例,“米塔AI搜索”给出的答案比较题外,结论也很宽泛。

秘塔AI搜寻答案,图/雷科技

同一问题在知乎问答上有更高质量的答案,相关信息和观点有意义,可以帮助用户更好地理解C919的定位、竞争力和意义。

知乎直接回答,图/雷科技

此外,在“五年前人们是如何看待5G的”问题中,“知乎直答”在开篇就回答道,“五年前,也就是2019年,人们对5G的看法是多种多样的,充满期待但也伴随着一些质疑。”随后展开的观点也确实反映了当时中国互联网上对于5G的不同看法。

图/雷科技

不过在一些问题上,肖雷也发现了“知乎直答”的一些不足。

比如在询问“姚明加入NBA那年,NBA亚军球队的主教练是谁?”时,可以看到“知乎直接回答”知道姚明2002年加入NBA,但是却说“没有直接的信息表明姚明加入NBA那年,亚军球队的主教练是谁”。

但如果你继续问“那么2002年NBA亚军球队的主教练是谁?”,知乎直答就能给出正确的推理过程和答案——时任新泽西篮网队(现布鲁克林篮网队)主教练的拜伦·斯科特。

_从丑变漂亮的体验知乎_手机阅读软件体验知乎

图/雷科技

也就是说,知乎直答完全有能力直接给出正确答案,但不知道是什么因素限制了它,需要用户不断提问,才能给出最终的答案。

在不锈钢电池外壳的后续问题中,提问轮次的增加也会影响知乎直答对上下文的理解能力。比如在第五轮后续问题中,AI直接问“换用不锈钢外壳会有什么变化?”似乎AI忘记了关注点一直都是手机电池。

图/雷科技

第六轮提问时,肖磊再次提到“手机电池”,AI又能回到正题,根据手机电池做出回答。

简单来说,知乎直答一开始还能够很轻松地通过上下文理解新问题,但是随着上下文长度的增加,这种理解能力可能会明显下降。

最后的话

总体来看,在众多AI大模型产品中,“知乎直答”确实找到了一些差异化的定位,在站内优质内容的基础上,提供信息量更高、可追溯性更好的答案。

但问题还是存在的,有些可以通过一些技巧解决,比如最好能指定时间而不是用“X年前”作为输入词,多轮问答可以适当强调关键词等;有些还是需要基础大模型和技术改进,比如模型对用户意图的更深层次理解,对参考来源进行加权排序或筛选等。

截至目前,如果我知道某些领域和话题在知乎上已经有了精彩的讨论,我确实会更愿意使用“知乎直答”来快速便捷地了解和深入探究。

但人们会把知乎问答作为日常信息和观点的渠道吗?还是要看后续模型和产品的完善。我相信还是有希望的,就像知乎问答公众号回答过的一个关于知乎问答的问题一样:

AI时代才刚刚开始,前面的路还很长。

查看原图174K

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2