该公司称新发布的机型是目前功能最强大、性价比最高的小型机型,并计划后期将图像、视频和音频功能融入其中。

该迷你人工智能模型是 GPT-4o 的一个分支,是迄今为止速度最快、功能最强大的模型,于 5 月份在一场与高管的直播活动中亮相。
据该公司介绍,GPT-4o中的o代表omni,GPT-4o改进了音频、视频和文本功能,可以以更快的速度和更高的质量处理50种不同的语言。
该公司成立于 2015 年,由微软公司支持,投资者对其的估值超过 800 亿美元,为了赚钱,它投入巨资购买处理器和基础设施来构建和训练其模型,因此面临着保持在生成人工智能市场领先地位的压力。

周四发布的微型人工智能模型是多模态性前沿研究的一部分,即在单一工具中提供多种类型的人工智能生成媒体(如文本、图像、音频和视频)。
“世界是多模态的,”首席运营官布拉德·莱特坎普去年表示。“如果你考虑一下我们人类处理和与世界互动的方式,我们看事物、听事物、说事物——世界比文本大得多。所以对我们来说,将文本和代码作为单一模态、单一界面来理解这些模型的强大程度以及它们可以做什么,总是感觉不完整。”
该公司在一份新闻稿中表示,GPT-4o mini 将从周四开始向免费用户以及 Plus 和 Team 订阅用户开放,并于下周向用户开放。


