美国东部时间 12 月 5 日星期四,我们确认了网上报道的一些消息,并正式推出了名为 Pro 的套餐,每月订阅费为 200 美元。据该公司称,该套餐的订阅者可以大规模访问其最好的模型和工具,包括无限制地访问最智能的模型 o1,以及同系列中较小的模型 o1-mini、GPT-4o 和 human - 类似高级语音模式 Voice。
另外,Pro包中还可以包含一个新的o1版本,称为o1 pro模式,这也是Pro专属的o1版本。据该公司称,这个新版本使用更多的计算来进行更深入的思考,并为最困难的问题提供更好的答案。希望未来 Pro 中能够添加更强大的计算密集型生产力功能。

在社交媒体上发布的信息很少,本周四有两项新行动。一是在 Plus 套餐中包含 o1,每月费用为 20 美元;二是推出 Pro,每月费用为 200 美元,并且允许无限订阅。使用模型,更加智能o1。


o1 pro 模式在数学、科学和编码方面比 o1 更强大、更可靠
我们相信,Pro 为每天使用研究级智能的研究人员、工程师和其他个人提供了一种提高生产力的新方法,使他们能够站在人工智能 (AI) 进步的最前沿。

特别介绍了o1 pro模式,称Pro提供了“最智能模式的一个版本”,“可以思考更长时间以获得最可靠的响应”。在外部专家测试员的评估中,o1 pro模式可以产生更可靠、准确、全面的答复,尤其是在数据科学、编程、判例分析等领域。
下图显示,在数学、科学和编码方面具有挑战性的机器学习 (ML) 基准测试中,o1 pro 模式的表现优于 o1 和 o1-。数学方面,O1专业模式得分为86分,O1和O1-分别得分为78分和50分。在编码方面,O1 Pro 模式得分为 90,O1 和 O1- 分别得分为 89 和 62。在Q&A博士级别科学题中,O1专业模式得分为79分,后两者分别为76分和74分。


为了凸显o1 pro模式的主要优势——更高的可靠性,评测门槛也被提高了。要求模型只有在四次尝试中正确回答问题四次而不是仅回答一次时才可以认为已经解决了问题。 。即使在如此高的标准下,o1 pro模式的表现也明显优于o1和o1-。
从下图可以看出,在四个问题和答案都必须正确的标准下,o1 pro模式比o1和o1-有更大的优势。数学方面,o1 pro模式得分为80分,o1和o1-分别为67分和37分。编码方面,o1 pro 模式得分为 75,o1 和 o1- 分别为 64 和 26。在回答博士级别的科学问题方面,o1 pro 的模式得分为 74,后两者分别为 67 和 58。



