它是目前最成功的AIGC产品。
很多人喜欢在前面加一个形容词,“像病毒( AI)”。这位特斯拉自动驾驶前负责人、前科学家毫不掩饰自己对自动驾驶的热爱。

他甚至思考了一下,认为新产品功能可能具有类似的革命潜力。

就连首席执行官也认为这“很酷”。

一直活跃在 AIGC 体验最前沿的宾夕法尼亚大学沃顿商学院副教授 Ethan 对其给予了高度评价:“这简直就是目前 AI 行业最好的黑科技。用过的大家它说它很好!”他还特别推荐人们收听人工智能生成的“播客”,表明这个功能特别令人印象深刻。

是的,它就是(LM代表语言模型),一个仍然免费的强大工具,谷歌喜欢称它为“虚拟研究助手”。
我更喜欢称之为“一条鱼吃更多”:
向它提供一个文档,它会立即将其转换为播客、学习指南、常见问题解答集、时间线、大纲和聊天。
保证你360度无死角“读懂”这条“鱼”。

界面
工具链接:
-1-任何东西都可以变成播客!
我们先从最流行的“吃法”说起。
只需将文件和链接拖放到工具中,即可将它们变成有趣、易于理解的对话。
谷歌将其称为“音频概述”,但您也可以将其称为“播客”。
一经上线,便火遍全网。媒体评论称,这一新功能是“迄今为止最引人注目、最令人震惊的人工智能潜力展示之一”。
它也非常容易使用。
首先,上传信息。
受益于底层大模型(1.5 Pro)的多模态能力,除了文本文件之外,视频、PPT、录音甚至数据集都可以变成播客。
换句话说,甚至你的个人网站、博客、妈妈的红烧肉食谱、课堂(讲座)录音甚至信用卡账单都可以变成播客。

我上传了斯诺登的传记,一本很厚的书,并选择了“音频概述”:

几分钟后,我收到了一集大约 9 分钟长的播客。
听了开头我就非常喜欢,因为它直入重点“技术与控制”:
主持人1:好的,系好安全带,因为今天我们要深入探讨爱德华·斯诺登的思想。斯诺登是揭露全球监控的告密者。我们将深入研究他的回忆录《永久记录》的摘录。让我告诉你,这不是一本典型的自传。这是一个关于一个人的故事。一个男人面临重大问题的故事。他特别利用自己的生活以及与技术的关系来帮助我们理解权力和控制力的巨大变化。
主持人2:他从一开始就很引人注目。我的意思是,谁小时候会破解时钟?
主持人1:我知道,对吧? 6 岁的孩子热衷于重新连接家庭微波炉上的时钟。这个故事充分说明了他早期对系统及其工作原理的迷恋。以及如何操纵它们。
主持人2:如何控制它们。这就像他所说的早期的公民抗命行为。
播客内容逻辑清晰、重点突出。

可惜目前只支持英文,所以我用飞书提取了AI播客的章节摘要,翻译成中文。
你可以想象,在后台,一个模型正在编写并不断编辑对话脚本。
除了对话的娱乐性之外,它最重要的职责是揭示见解:不仅仅是总结材料,而是找出最有趣和最令人惊讶的部分。
现在看来确实如此。
另外,“主持人”是一男一女,他们的声音听起来非常自然,这和你平时听到的AI语音播报有很大不同。
他们用“嗯”、“你知道”来停顿,还故意结巴。他还用“好吧,事情是这样的”来介绍自己的观点,并用“”等口语来强化对方的观点。谈话非常自然。
难怪《华尔街日报》专栏作家本·科恩说人工智能只让他感到惊讶两次。 “第一次接触,这是第二次。”
“我不知道是惊讶还是害怕,”热门商业音频节目《》的主持人之一大卫在亲身体验后评价道。
其实早在2023年就推出了,但热度一般。直到最近,新的“播客”功能上线,立即引发了全网“将复杂文档转换为播客”的潮流。
现在有 10 个用户,我希望其中 9 个用户正在使用这个新功能。
比如,有人直接把今年诺贝尔物理学奖得主伊利亚推荐的所有经典论文都整理成了播客。
毕竟,并不是每个人都可以通过阅读来有效学习,而对于许多听觉学习者来说,播客可能更有效。

另一位用户将他的账单变成了一个关于如何在 Uber 上“花钱”的播客。
这位AI主持人甚至会在节目中表示,他为用户的奢侈行为感到羞愧。

一个数据集也可以变成一个播客来详细解释该数据集,是不是很奇怪?

编辑部主任还介绍了一个很棒的学习方法:
使用手机(或录音机)录制课堂音频,辅以手工笔记,简要记下一些要点。
然后,将课堂录音和笔记一起上传以创建播客。
每个周末收听并参与这些播客可以复习最重要的课堂知识。

顺便说一下,谷歌还有另一个很棒的播客实验,叫做,但它目前更专注于学术文本,而且一般都有更严肃的语气。
-2-“一鱼吃多”和隐藏的超能力
除了播客生成之外,“笔记本指南”部分还提供了五种最常见的“吃鱼”方式:
常见问题解答、学习指南、目录、时间表、简报。

视频下方显示英文原文
上传了一段斯威夫特在2022年纽约大学毕业典礼上演讲的视频。
“常见问题解答”可以自动总结一些问题,帮助理解视频内容:

《学习指南》就像阅读理解一样,提供对视频内容的深入理解。
“目录”,顾名思义,就是绘制内容的“地图”。
“通报”是对要点的总结。
由于很难从这篇演讲中提取出一个时间线,所以我们选择了一个关于今年诺贝尔医学奖获得者的故事来展示“时间线”的好处。


但最令人印象深刻的是与内容“交谈”的自由。
您可以选择系统推荐的相关问题:

您也可以自由提问。


亮点是答案背后的超级力量:基于可信来源的事实核查。
几乎每个答案的最后都有相应的评论。
点击该数字,系统将立即追溯到原文来源。例如,数字“1”立即返回到原始段落(左)。

其次,答案会对原文中没有明确证据的地方进行解释和强调。
例如,斯诺登并未讨论互联网实名制,并在回答中补充说,上述分析是“猜测”。

对于完全超出正文范围的内容,直接拒绝回答。

最后,还有一个很棒的事情:你可以发现文本之间的知识关系。
例如,斯威夫特的演讲、李笑来的《财富的真相》、斯诺登的传记《永远的记录》和《批判性思维》背后都有共同的思维模式。

例如,批判性思维和财富思维有什么共同点?

在结束本文之前,有必要提一下大模型的错觉。
事实上,伊森早在2023年就使用过它,当时他就发现它相当不准确。

Ethan 在 2023 年使用过它,发现它相当不准确,例如在数字方面。
不过他现在发现,用同样的题目再次测试时,错误已经大大减少了,虽然还不够完美。
结合我们使用大型模型的经验,如果您的要求是准确地显示重要的数字,那么最好回到原始来源进行比较和检查。
参考链接
本文来自微信公众号,编辑:sia,36氪授权发布。


