智能事物
李水清编撰
編輯心形
新版GPT-4o已经降至1元/百万,依然跳动!
智东西7月19日报道,7月18日晚间,最便宜的型号GPT-4o mini上市,我们第一时间对比了国内外10家厂商大型号API最新定价,其中不乏来自其他同行的压力。
GPT-4o mini API的输入价格为每百万15美分(约合1.09元人民币),输出价格为每百万60美分(约合4.36元人民币),比GPT-3.5 Turbo便宜60%以上;但其能力却远超GPT-3.5 Turbo,在MMLU测试中取得了82%的好成绩,在LMSYS排行榜上的聊天偏好度上也超越了GPT-4。
此前,由于大型号价格昂贵,不少开发者转而选择谷歌 1.5 Flash、3 Haiku 等小型号,如今这些型号均被 GPT-4o mini “狙击”。

▲GPT-4o mini 相较于其他小型号性价比高很多(图片来源:)

如下表所示,根据智东西统计,目前GPT-4o mini的售价明显低于1.的投入价2.5元/万、输出价7.6元/万,也低于3海酷的1.8元/万,投入价1万元,输出价9元/万,性能各方面碾压它们。



同时,从上表可以看出,深度探索、智浦AI、字节跳动、阿里云、百度、字节跳动、腾讯云、科大讯飞等国内厂商在6月份均相继大幅下调旗下机型价格,但现在价格优势也减弱了。
比如阿里云Qwen-Turbo输入价2元/百万,输出价6元/百万,百度ERNIE 3.5系列输入价12元/百万,输出价12元/百万,Byte-pro-128k输入价12元/百万,输出价12元/百万,月租5元/百万,输出价9元/百万……在GPT-4o mini面前,性价比不得不受到质疑。
首席执行官萨姆表示,GPT-4o mini 正在“走向廉价到无法衡量的智能”。

▲ CEO Sam 在社交平台 X 上发文
公告称,GPT-4o mini的成本较2022年功能相对基础的GPT-3的text-003型号降低了99%。
目前,GPT-4o mini 已在线免费提供,有望逐步取代 GPT-3.5。
1.超越GPT-3.5 Turbo,成为最佳小模型
GPT-4o mini具有低成本、低延迟的特点,可以处理多种任务,如:链式或并行模型调用、处理大量上下文、快速实时文本交互等。
具备上下文处理能力,API中支持文本和视觉输入,并支持16k输出,未来会扩展到视频和音频的输入/输出。

在多项全球权威基准测试中,GPT-4o mini超越了自家的GPT-3.5 Turbo以及多款小型号。

在 MMLU 文本智能与推理基准上,GPT-4o mini 以 82.0% 的得分领先,而 Flash 和 Haiku 的得分分别为 77.9% 和 73.8%。
在MGSM数学推理测试中,GPT-4o mini取得了87.0%的高分,远超过Flash的75.5%和Haiku的71.7%。
在编码性能测试中,GPT-4o mini 也以 87.2% 的优异成绩领先,而 Flash 和 Haiku 分别为 71.5% 和 75.9%。
在多模态推理领域,GPT-4o mini 在 MMMU 评估中的得分为 59.4%,也领先于 Flash 的 56.1% 和 Haiku 的 50.2%。
GPT-4o mini 在从收据中提取结构化数据或根据对话历史生成高质量电子邮件回复等任务上的表现明显优于 GPT-3.5 Turbo。

GPT-4o mini昨晚刚刚发布,AI专家在社交平台X上表示:“大型语言模型尺寸的竞争正在加剧……落后!我敢打赌,我们将会看到非常小的模型,甚至GPT-2参数级别的模型已经非常擅长‘思考’和可靠。”

▲AI专家在社交平台X上发文
2.API输入价格低至1元,现已免费上线
GPT-4o mini 现已正式上线,并集成到 API、Chat API 和 Batch API 中供开发者使用。
成本方面,GPT-4o mini输入价格为每百万15美分(约合人民币1.09元),输出价格为每百万60美分(约合人民币4.36元),大致相当于处理约2500页标准图书内容的成本。
GPT-4o mini 的微调功能计划在未来几天推出。

对于用户来说,无论是免费版、Plus 版还是团队版,从今天开始都可以体验 GPT-4o mini,它将逐步取代 GPT-3.5。企业用户也将从下周开始能够访问此升级。
报道称,GPT-4o mini继承了与GPT-4o同样严格的安全保护机制,在训练前阶段过滤掉不良信息,训练后利用强化学习、人工反馈(RLHF)等技术,让模型行为更加符合安全策略。
作为首个应用指令层次化方法的模型,GPT-4o mini在API方面展现出更强的防御能力,有效抵御越狱攻击、实时注入、系统实时提取等风险。
我们将继续监控 GPT-4o mini 的使用情况,如果发现新的风险,立即采取措施提高模型安全性。
公告最后附上了9位团队负责人的名字,其中赵文卓、任文忠、胡文斌、陈文忠、陆文斌均为中国籍,毕业于清华、北大、同济等国内知名高校。

结论:车型尺寸竞争逆转,价格战加剧
大型号价格战愈演愈烈,相比2022年功能相对基础的GPT-3 text-003型号,GPT-4o mini成本大幅下降99%,延续6月份行业价格战高潮。
每次新品发布都会给同行带来压力。同日, 还与法国 AI 明星独角兽联合发布了一款名为 NeMo 的小杯模型,其性能超越了 Llama 3 8B。更低成本、更高性能……小杯模型的出现将推动 AI 无缝融入更多日常场景,也让行业从不同角度思考 AI 的落地。


