智能事物
杨瑞宇撰稿
編輯 莫英
据智东西9月14日消息,据昨日报道,美国大模型独角兽发布了增强推理能力的大型语言模型o1-以及更简化的o1-mini(草莓模型深夜突袭!物理、化学和生物达到博士生水平,远强于GPT-4o,可用)。据悉,两种新模型将为开发者提供强大的推理能力,尤其是在科学、技术、工程和数学(STEM)领域。
目前,这两种模型均向 Plus 用户和使用付费 API 的开发者开放,因此开发者现在可以在现有的第三方应用和服务中测试这些模型,或者使用它们来构建新的应用和服务。
目前,o1-和o1-mini型号专注于文本处理,擅长编码和文档起草。它们还可以生成计划、进行风险评估、创建应用程序和游戏、自动执行提案请求以及与他人进行战略互动,但内容有限。在快速响应方面仍有改进空间。
然而,o1系列模型不是多模态的,在某些应用场景(例如图像输入、函数调用等)无法完全取代GPT-4o。
据悉,o1系列机型目前仅面向“Tier 5”级别用户群体开放,且暂不支持批量请求,每分钟最多可处理20个请求,不适合需要快速、持续响应的应用场景。
其中,o1模型擅长提供广泛的“世界知识”,是目前最昂贵的AI模型。
开发人员可以通过公共 API 以及 Azure、Azure AI 和 Azure 访问这些新的 o1 模型。
1. 缺乏多模态功能:o1系列模型仅支持文本处理,无法完全替代GPT-4o
新的o1模型采用了“推理”机制,称他们会“尝试多种策略,识别错误,并经历一个完整的思考过程。”API的技术总监在视频电话采访中分享了该模型开发背后的一些想法。
O1 系列产品经理 Handa 表示:“在我们的测试中,这些模型在一些最具挑战性的基准测试中表现得像博士生一样。”该模型在处理“推理相关问题”方面“比 GPT 系列表现更好”。
o1-和o1-mini型号目前仅支持文本输入和输出,这意味着它们在功能上无法完全取代GPT-4o。GPT-4o是目前最先进的型号,不仅可以处理文本,还支持多模态输入和输出,包括分析文件附件和生成图像。因此,对于需要这些高级功能的第三方开发者来说,GPT-4o仍然是更合适的选择。
据和汉达称,o1系列模型并非多模态的。另外,这些模型目前无法浏览网页,因此无法获取2023年10月之后的新信息。不过,用户可以通过文本输入提供最新的知识,以供模型参考和分析。
它们的输出速度也较慢,有时候需要一分钟以上的时间,有时甚至需要几分钟。

▲有用户反映,o1模型的生成速度有时候有点慢(来源:X截图)
一些获得早期试用的开发者报告称,这些模型在编码和起草法律文件等任务上提高了性能。因此,对于愿意尝试并为更高性能支付额外费用的开发者来说,o1- 和 o1-mini 模型仍然是值得考虑的选择。
正如其 o1- 和 o1-mini 推理模型的 API 文档所述:“GPT-4o 及其 mini 是需要图像输入、函数调用或快速响应的应用程序的合适选择。但是,如果你的目标是开发需要深度推理并且可以容忍更长响应时间的应用程序,那么 o1 模型可能是更好的选择。”
2. o1系列限制每分钟最多20个请求
o1- 和 o1-mini 型号最初仅适用于“Tier 5”用户,即那些通过 API 花费 1,000 美元且在过去至少 30 天向公司付款的用户。
据该公司介绍,新的o1型号系列目前处于预览阶段,与其他型号相比,有特定的使用限制。o1型号每分钟最多只能处理20个请求,这意味着它们不适合需要快速和持续响应的应用场景。此外,o1型号目前不支持批量请求,而其他型号可以批量处理请求,通常在24小时内返回结果,成本较低。

据 API 技术总监介绍,o1 模型提供了更多除 STEM 之外的学科的“世界知识”,是目前最昂贵的 AI 模型。它的价格为每输入 100 万个代币 15 美元,每输出 100 万个代币 15 美元。相比之下,GPT-4o 每输入 100 万个代币的成本为 15 美元,每输出 100 万个代币的成本为 4 美元。这意味着,o1 模型比 GPT-4o 贵了 200% 到 300%。
相比之下,o1-mini模式更加经济,每投入100万个代币收费3美元,每产出100万个代币收费12美元,比o1模式便宜80%。
他说:“当然,我们将在未来几周和几个月内调整价格,以达到合适的水平。”

▲ 各款主力车型定价明细
3.o1系列模型能做什么:生成计划、评估风险、创建游戏、请求提案、增长黑客……
在处理上下文方面,o1系列模型的局限性与GPT-4o等顶级模型类似,能够处理最多个token,包括输入和输出。

o1-model 在单次输出或响应中最多可以生成 32768 个令牌,而 o1-mini 可以生成两倍的令牌,即 65536 个令牌。
此外,一些开发人员在 o1- 和 o1-mini 发布后就开始思考如何使用它,并对其进行测试,看看它能做什么和不能做什么。
基于这项工作,以下是迄今为止 O1 和 O1-mini 模型的一些最有趣的用途。
1、生成计划和白皮书:有用户反映,o1系列机型只需简单的提示,就能生成详细的行动计划和完整的文档,比如一份有参考价值的白皮书。

▲o1-可生成企业生成式AI用例的白皮书(来源:X截图)
2. 规划、基础设施和风险评估:AI影响者和商业顾问Allie K.在X上分享了一系列o1模型输出的示例,展示了该模型在多个领域的应用能力,包括组织员工时间表、评估合并风险、设计更高效的仓库和平衡城市电网等优化任务。
3. 快速创建应用程序和游戏:o1模型似乎是该系列的直接竞争对手,尤其是它的功能,因为它还为用户提供了一种强大而快速的方式来生成自己的交互式应用程序和游戏。

▲o1并且可以创建应用程序(来源:X截图)
4. 自行填写招标书 (RFP):承包商,尤其是为政府机构提供服务的承包商,对招标书 (RFP) 非常熟悉。RFP 是机构以标准化格式征求合同投标的一种方式。这个过程既繁琐又耗时。宾夕法尼亚大学沃顿商学院教授 Ethan 在 X 上发帖称,o1 模型可以自主填写 RFP,尽管它仅限于文本输入,不接受文件上传。
5、战略参与和增长黑客:自动生成帖子应用程序的创始人Ruben在X上发布了一个演示视频,展示了o1模型如何生成全面合理的计划来帮助他的公司发展。
不过,这家网络通知初创公司的首席技术官阿南德 (Anand) 认为,GPT-4o 在编写简单程序方面速度更快。
结论:我们会持续优化o1、GPT系列机型,为用户提供更多应用构建选项
笔者认为,虽然o1系列可能并不适合部分开发者,但它的推出对于那些拥有实验空间、想要开发新应用和服务的开发者来说,无疑是一个激动人心的时刻。
它还承诺将继续提升 o1 系列及其 GPT 系列的功能,这意味着希望在该 AI 公司平台上构建应用程序的开发人员将拥有充足的选择。
随着这些模型的不断优化升级,将会在文学、艺术等更多领域展现出应用潜力。


