观望了3个月,月之暗面终于加入大模型价格战,但这家AI独角兽依然保持着自己独特的风格,并没有跟风其他大模型企业降低API调用价格。8月7日,月之暗面宣布上下文缓存存储降价50%。
降价一方面得益于上下文缓存技术带来的推理成本降低,另一方面也因为有充足的资本“支撑”。同日,华夏时报记者从知情人士处获悉,月之暗面刚刚完成新一轮逾3亿美元融资。半年前,该公司完成逾10亿美元A轮融资。
今年《魔兽争霸》的爆红,让《月之暗面》的商业号召力更加强大,一方面成为国内仅有的两家尝试C端产品收费模式的大型模型厂商之一,另一方面屡屡推出新品,如今又愿意降价吸引客户。反过来,这也是《月之暗面》未来能否持续受到资本关注的重要因素。
另一种形式的降价
“上下文缓存存储费用下调50%,由原来的10元/1M/分钟降至5元/1M/分钟。”月之暗面官方微信显示。
月之暗面相关负责人向华夏时报记者解释,上下文缓存是一项创新的大模型推理加速技术,在上下文复用的场景下,可以提高模型响应速度,降低推理成本最高可达90%。
“目前,Kimi开放平台的上下文缓存技术处于公测阶段,我们近期根据开发者的反馈调整了缓存存储价格,希望吸引更多开发者参与进来。在公测阶段,我们预计上下文缓存的价格还会根据用户反馈、使用情况以及我们的技术迭代不断调整。”上述负责人表示。
上下文缓存不同于前段时间大模型公司纷纷降价的API调用, (艾媒咨询)CEO兼首席分析师张毅表示,月之暗面的上下文缓存技术是一项创新的大模型推理加速技术,本质是通过重复上下文来提高模型响应速度、降低推理成本。“月之暗面通过技术创新来降低成本,提高产品竞争力和生产效率。其他大模型公司降价也是因为技术改进、成本降低,但可能更在意市场竞争压力、培养市场使用习惯等因素。”
在张毅看来,《月之暗面》大幅降价将使企业能够以更低的成本进行大规模数据处理和分析,有助于公司吸引更多对成本敏感的用户,在市场推广阶段,这一降价举措对扩大市场份额起到了一定的作用。
至于API降价,目前月之暗面尚未公布这方面的消息。不过,上周月之暗面发布了企业级模型推理API,针对的是大规模应用对稳定性要求较高的企业。在专注C端的同时,月之暗面也在加大对B端的布局。
大模型API的价格战一直没停过,前不久360宣布360安全大模型正式免费,上周,国内API价格战首倡者再次降价,宣布其API输入费用调整为:输入缓存命中部分仅需0.1元/百万,输出部分需2元/百万。大模型价格再降一个数量级。
此次降价的理由和《月之暗面》类似,该公司表示,通过启用上下文硬盘缓存技术,预计未来会重复使用的内容会被缓存在分布式硬盘阵列中,如果输入存在重复,则重复的内容会被缓存在分布式硬盘阵列中,部分信息只需要从缓存中读取,无需计算。这项技术不仅降低了服务延迟,还大幅降低了最终的使用成本。
资本价值再次上升
《月之暗面》通过上下文缓存技术降低成本,是公司能够大幅降价的原因之一,而降价的另一大原因则来自于公司持续的资本投入。
近日,月之暗面被曝完成超3亿美元新一轮融资,腾讯参与其中。此轮融资也把公司估值推高至33亿美元的高位。其实早在今年5月,月之暗面就传出过类似的消息。当时有消息称,新入局者包括腾讯、高榕创投等机构。
《华夏时报》记者向《月之暗面》求证,对方拒绝置评。不过,一位知情人士告诉记者,融资消息属实。消息刚出来的时候,这轮融资才刚刚开始,现在已经完成了。
自去年成立以来,月之暗面一直是资本的“宠儿”。天眼查数据显示,月之暗面于2023年6月完成天使轮融资,2023年7月完成一轮A轮融资,2023年2月完成一轮IPO,当月获得超10亿美元A+轮融资。
“在当前大尺寸模型行业的起步阶段,资本投入非常重要。从数据上可以看出,月之暗面在短时间内获得大量资本认可,一是因为公司有一定的技术基础,尤其是长上下文窗口技术,具有一定的领先优势,二是其成长期正是市场需求爆发的时候。”张毅说。
当然,张毅向华夏时报记者分析,月之暗面未来的发展势头受到多方面因素影响,“首先是市场竞争形势。这个赛道有很多大公司在竞争,竞争对手的策略也会影响月之暗面的发展;其次,来自于商业模式。无论是API付费、为用户提供精准的结果导向搜索检测,还是大模型的应用,商业模式能否实现可持续发展非常重要。AI大模型行业的发展是一个长期的过程,在市场格局明朗之前,企业能否持续吸引资本关注也很关键。”
好消息是,从近期的融资情况来看,AI大模型赛道依然受到资本的青睐。
除了月之暗面,近日有媒体报道称,另一家AI模式独角兽零一万事完成新一轮融资,金额达数亿美元。本轮融资参与方包括国际战略投资、东南亚财团等。记者通过官方联系渠道联系零一万事,但截至发稿时对方尚未回应。上个月,百川智能向华夏时报记者证实,公司已完成A轮融资,融资金额达50亿元,公司将启动B轮融资,估值200亿元。腾讯也在投资方名单中。


