量子比特 |公众号
《她》又一个国内版刚刚来了。
作为实时语音对话功能,是否有效还要通过实际测试来确定。
我们直接以最近的热门话题——李子柒复出为话题来对话吧:

视频地址:
可以看出,对于“李子柒复出”这样一个比较新的话题,这个AI对于信息的掌握还是比较全面的。
它首先用“太震撼了”来表达对此事的整体感受,并准确、高度概括了内容:
以中国非物质文化遗产漆器为视频主题,这一选择本身就是对传统文化的致敬。
当被问到对视频内容更具体的感受时,国内的“她”仿佛是李子柒的人类粉丝:
依然保持高水准,每一帧都像一幅画;她的视频总是让人感受到一种宁静和美好的感觉。
不仅如此,国内的《她》甚至可以概括网友们的讨论,包括李子柒制作漆器所付出的努力和心血。

而且从整个对话过程来看,这个AI在语言表达上,比如语气、自然停顿等,和人类没有什么区别;即使随意中断,也是完全OK的~

同样的话题,我们交给GPT-4o:

视频地址:
嗯,GPT-4o对李子柒了解,但不多。
无论是中文还是英文的问题,由于其知识截至2023年10月,GPT-4o无法保持实时新闻热点。
那么这个国产的“她”到底是怎样的AI呢?
没关系,它是来自昆仑万维的Skyo,基于天宫模型4.0 4o版本(4o)。
那么除了能够追踪时事热点之外,Skyo 还能解锁哪些能力呢?
更多实际测试,我们继续吧~
随意打断聊天并将话题留在场上
大约半年前,GPT-4o实时语音对话功能发布时,让现场和网上的观众震惊的是,无论对话如何被打断,它都能立即接听。

虽然在刚才李子柒的例子中,我们已经展示了一些“随时打断”的能力,所以这次我们会增加一点难度。
随时中断,中英文切换
这次我们测试的主题是去西雅图旅游,看看Skyo能给出什么样的建议:

视频地址:
在我们提出简单的要求后,Skyo很快就开始制定旅行计划。
当提到西雅图的标志性景点太空针塔时,我们进行了第一次打断(00:50),Skyo 立即停止回答并开始听新问题。
当Skyo想要继续扩展其对太空针塔的介绍时,我们立即第二次打断(01:09);第三次(01:38)我们直接打断并用英语提问:
好的,很好,顺便问一下,我可以尝试一下吗?
随后Skyo也了解了英语的需求,立即开始推荐当地著名的咖啡店。
这一轮随时打断+中英文切换,Skyo,过去了。
别让言语掉到地上
现实生活中,很多人在与人交流时,可能无法接听对话。
那么如果我们用Skyo作为话题终结者进行交流,会产生什么样的效果呢?来吧,让我们开始吧:

视频地址:
我们首先以“电影”为借口主动发起话题。
但当Skyo反问时,我们给出了两个冷漠的答案:“不”(00:27)和“不”(00:47)。
第一次话题结束时,Skyo巧妙地将话题从电影转移到音乐或书籍上;第二次话题结束时,Skyo联系了上下文(因为我们是从电影开始话题的),它开始谈论自己对电影的看法。 。
总而言之,说实话,这件事不可能存在于Skyo这边。
情感陪伴,“人”声可变
自从大型对话式AI模型出现以来,情感陪伴无疑成为了很多用户的必需品。
那么Skyo是否也能给人们在苦难时带来精神上的安慰呢?
请观看录像机:

视频地址:
当我们提出“被老板骂”的情况后,Skyo会用自己的方式引导我们移开视线。
当被要求切换女声时(00:42),Skyo也做出了回应,秒变女声,然后有理有据地列出自己的观点,进行心理启蒙。
可以看出,Skyo作为国内实时语音对话新产品,在多个维度的测试中均达到了标准。
那么下一个问题:
如何?
Skyo实时语音对话助手是一个应用端到端实时语音对话建模技术的多模态大模型项目。
其强大的记忆功能使其能够在对话过程中跟踪和回忆用户的偏好和历史信息,从而提高多轮对话的准确性。
这种成熟的技术积累使得Skyo在高强度的会话交互过程中能够保持出色的稳定性和流畅性。
此外,Skyo采用全双工、低延迟的实时语音对话架构。
全双工是指助理可以同时听和说。用户无需按通话开始和结束按钮即可实现无缝沟通,使人机交互更加自然、高效。
在技术测试中,Skyo的低延迟实时响应接近人类思维的反应时间,体现了其在对话响应速度上的显着优势。

在交互能力方面,Skyo拥有更好的情感理解和个性化记忆功能。
它不仅可以记录用户的历史偏好,还可以根据用户的需求提供个性化的交互体验,例如提供温暖的女声或更情绪化的回应。
这使得Skyo能够在非正式、非固定的场景下保持尊重、平等的人机交互体验。
Skyo的优异表现依赖于其多模态模型的应用,使其能够在多种场景下保持高质量的交互体验。
例如,用户可以与助手讨论最新的科技新闻,助手可以根据用户的请求从科技资源库中检索相关信息并进行异步交互,增强用户的交互感和沉浸式体验。
此外,Skyo系统的自主研发特性使其在互联网语音交互和应用场景方面具有出色的适应性。
Skyo通过自主研发的数据积累和语音交互技术,实现实时、高效、个性化的沟通体验,让用户在每一次对话中感受到近乎无障碍的人机交互和温暖陪伴。


