智能事物
作者:程倩
編輯心形
“草莓”熟了吗?
智东西8月28日报道,今日,外媒援引知情人士的话称,一款代号为“草莓”(原名Q*)的新车型将于今年秋季推出。
“草莓”项目就是传闻已久的神秘Q*模型,据说这是之前戏剧性成功的关键原因之一。它展现出更强的能力,可以解决前所未有的数学难题和复杂的编程,让当时的AI变得安全。研究人员对此感到震惊。
该项目最重要的用途有两点:一是改进现有产品,二是助力开发下一代旗舰车型Orion,这些都指向了想要在大型车型中保持领先地位、获得更多营收机会的决心。
但最近有消息称,“草莓”项目已经向美国国家安全官员进行了演示,这可能是在这家初创公司安全部门高管频繁离职的背景下,提高产品透明度的举措。

本月初,首席执行官 Sam 在推特上偷偷展示了自家花园里摘的五颗草莓,有网友根据草莓成熟的时间预测,GPT-5 可能会在未来 4-6 周内发布。发布时间可能正好是在秋天。

▲ 网友猜测草莓成熟时间
也许不久的将来,我们就会看到“草莓”项目直接被融入其中。
1、保持大机型霸主地位,“草莓”可助新旗舰机型减少幻觉
“草莓”项目是一个重要的新技术里程碑,它可以解决以前从未见过的数学问题,经过训练后可以解决涉及编程的问题、回答产品营销策略等主观问题,以及解答复杂的字谜。
一直以来都没有露面的“草莓”模特,最近越来越多地出现在公众视野中。

除了展示 5 颗草莓外,另一位研究人员还发布了一张自己吃晚餐的照片,盘子里有草莓。

▲研究员边吃晚饭边发帖
在新机型可能越来越近的现实下,此举或许是为了保持其在大机型领域的霸主地位,毕竟其竞争对手已经拿出了多款堪比最新旗舰机型 GPT-4 的机型。
虽然当前模型仍然是企业和 AI 应用程序开发人员的首选,但谷歌、xAI 和 meta 等其他公司的模型在许多排名上正在迅速赶上。
因此,该公司的前景在一定程度上取决于它最终能否推出代号为Orion的新旗舰机型,该机型旨在改进其去年初推出的旗舰机型GPT-4。
“草莓”项目的发布对于猎户座的训练至关重要——它可以为猎户座生成高质量的训练数据,并减少幻觉。

模型可以帮助克服获取高质量数据的限制,从而使用从互联网中提取的文本或图像等真实世界数据来训练新模型。
人工智能初创公司 Alex 的首席执行官兼前首席架构师 Alex 认为,使用 模型生成更高质量的训练数据有助于减少其模型所犯的错误数量,也称为幻觉。这是因为“训练数据中的歧义较少,因此它做出的猜测也较少。”
除了下一代旗舰机型外,草莓计划的推出还将对现有产品进行改进。
型号正在通过内部“精炼”过程进行简化和缩小,以便在 Orion 推出之前用于改进现有产品的性能。这款尺寸较小、简化的 型号将能够保持与较大型号相同的性能。较大型号具有相同的性能水平,但操作更简单且成本更低。
一个显而易见的想法是将 模型改进后的推理能力融入到模型中。这可能意味着用户会得到更准确的答案,但速度会更慢。
因此,这可能不适合搜索引擎等用户期望立即得到响应的工具,但对于不太紧迫的用例(如修复非关键编码错误)来说却非常有用。
因此在不久的将来,用户将能够根据请求的时间敏感度自主选择打开或关闭“草莓”模型。

第二,收入危机?今年夏天,政府官员们看到了
面对资金实力雄厚的大型科技公司,以及疯狂赚钱的激烈的初创企业竞争对手,需要开拓更多的收入机会。
尽管与一年前相比,该公司的业务增长迅速,API 和向企业销售的订阅收入增长了约两倍,达到每月 2.83 亿美元,但其每月的亏损可能更高。财务数据和参与该业务的人士的分析表明,今年的亏损可能高达 50 亿美元。
知情人士透露,他们希望为公司筹集更多资金,并寻找减少损失的方法。作为与微软商业合作的一部分,自2019年以来,它已从微软筹集了约130亿美元,这将持续到2030年。但合作条款可能会发生变化,包括如何向微软支付租用云服务器以开发其模型的费用,这是目前它最大的成本。
鉴于现有的对话式人工智能并不擅长数学密集型领域,例如航空航天和结构工程,解决棘手数学问题的模型可能是一个潜在的有利可图的应用。数学推理的改进也可以帮助模型更好地推理对话查询,例如客户服务请求。
谷歌和一些初创公司也在开发推理技术。上个月,谷歌的模型在国际数学奥林匹克竞赛中击败了大多数人类选手;最新模型可以编写更复杂的代码,并回答有关图表和图形的问题;其他初创公司正试图通过将问题分解为更小的步骤来提高推理能力,但这种方法速度更慢,成本更高……


▲谷歌等公司正在开发推理技术
因此,“草莓”模型的发布或将给推理技术带来新的思路。
今年 5 月,他透露,“我们觉得我们有足够的数据来开发下一个模型。我们已经进行了各种实验,包括生成合成数据。”他当时可能指的是猎户座模型。
据一位知情人士透露,今年夏天, 模型的性能已向国家安全官员进行了展示。
此次演示可能是提高美国政策制定者透明度的努力的一部分,因为包括联合创始人约翰在内的几位安全高管近几个月离职,引发了人们对该技术安全性的担忧。
结论:寻求开拓更多收入机会
模型的推出是大型模型行业永无止境的战斗的一部分,旨在领先于其他资金雄厚的竞争对手,并确保其在大型模型领域的主导地位。此外,这项技术还对未来的产品产生影响,例如解决多步骤任务的智能代理。
大模型玩家也希望在这个领域开拓更多的营收机会,以支撑大模型训练的高昂成本。


