李彦宏在世界人工智能大会上对百模大战和大模型发展的看法

   日期:2024-07-08     来源:网络整理    作者:二手钢材网    浏览:239    评论:0    
核心提示:这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。市场的风向变了,不仅仅只是大佬的口风在变。

在2024年世界人工智能大会产业发展主论坛暨人工智能全球治理高层会议上,百度创始人、董事长兼首席执行官李彦宏谈了对AI大模型的看法,让大家感到意外。

他首先指出,“百模大战造成了巨大的社会资源浪费,特别是计算能力的浪费。但与此同时,也使我们构建了追赶世界最先进基础模型的能力。”

他随后强调,“没有应用,只有基础模型都是没有价值的,不管开源还是闭源。”同时,李彦宏还表示,要跳出移动时代的思维逻辑,避免陷入“超级应用陷阱”,并不是只有10亿DAU的应用才算成功。

可以说,李彦宏的发言相当激烈,这似乎是第一次有大佬在如此高层的场合谈“百模大战”和大模的发展。

当然,持有类似观点的并非只有李彦宏一人。

金沙江创投管理合伙人朱啸虎6月份在黑马班也提到,不少创业者盲目投入AI底层技术,虽然创造了“百模大战”的盛况,但也造成了社会资源的浪费。

他强调,“显然,AI创业公司的赚钱趋势已经完全改变了。”

如何改变?

除了李彦宏、朱啸虎之外,猎豹移动董事长兼CEO、猎户星空董事长傅盛、智普AI COO张帆、百川智能创始人王小川等其他大咖也曾在不同场合谈到大模型行业竞争转型的方向,最终达成共识的关键点就是“场景”与“应用”。

因基础大机型注重“量”而引发的“百型大战”似乎已经落下帷幕,大机型的重心还是要放在“量”的场景应用上。

这点大佬们已经达成共识了,今年大家的口气都变了!

不要与基础模型过度竞争,“数量”场景适用

过去一段时间,美国涌现了一大批专注于大模型应用开发的初创企业,例如Adept、.ai等。

与此同时,谷歌、微软等领先的大型模型公司和科技巨头也致力于利用开源模型或自研的基础模型,开发针对各类应用场景的解决方案。

此次GPT的推出以及对开发者的一系列优惠政策,旨在吸引更多的创业团队参与到GPT技术的创新应用当中,从而丰富GPT生态,助力未来在场景应用大模型领域取得优势。

从国外大模型行业的动向来看,国内这些大佬们的语气转变并非空穴来风。

目前,百度温馨易言的日均调用量已经突破5亿,而就在两个月前百度官方宣布温馨易言的日调用量突破2亿。

短短两个月时间,调用量发生如此大的变化,可见大机型的“放量”应用,不仅仅是厂商推动的,更是整个市场的需求,被摆上台面,并呈现爆发式增长的趋势。

阿里云的主场也正在发出类似的信号。

世界人工智能大会上,阿里云CTO周靖人公布了统一大模型和阿里云百联平台的最新进展。过去两个月,统一千文开源模型下载量翻倍,突破2000万次,阿里云百联服务的客户数量从9万增长到23万,增幅超过150%。

谈到大机型,国内的大佬们现在似乎更愿意告诉市场他们的大机型有多好用、有多少人在用、下一步可以怎么用、以及一系列与场景应用实现相关的东西,而不是去对比参数。

以朱啸虎为代表的投资者也开始寻找应用层大模型的投资机会。

市场的趋势发生了变化,而且不仅仅是大佬们的语气发生了变化。

“超级能力”的应用在哪里?

“AI时代,比起只衡量DAU的‘超级应用’,‘超能力’应用更加重要。”在世界人工智能大会上,李彦宏试图对大规模模型应用发展的下一步趋势做出总结。

然而,“超级能力”应用或许并不难理解,市场悬而未决的问题是,这类应用究竟是如何开发出来的,又是如何向公众推广的?

基于目前的行业表现,“智能相对论”认为,有几点值得探讨。

1、“超级能力”应用背后,需要大模型技术的迭代与适配。

大部分行业趋势都是趋同的,今年以来在大模型领域掀起的MoE架构迭代趋势,代表着大模型在技术上正在支撑“体量”的场景应用。

对于“百模大战”,几乎所有大佬的口风都180 °大转变了?__对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

如今,谷歌的GPT-4、xAI的AI、昆仑万维的Grok-1、浪潮的天宫AI、浪潮的 2.0-M32、统一千文团队发布的Qwen1.5-MoE-A2.7B等国内外大型模型均采用了MoE架构。

MoE架构通过引入专家网络( )和门控机制( )实现了模型的稀疏性和模块化,并在数据处理、计算资源分配、输出结果优化等方面有非常好的反馈,为大规模模型场景应用的实现和推广提供了非常关键的技术支撑。

例如微软提出了端到端的MoE训练和推理解决方案——MoE,通过深度优化并行训练中的MoE通信,实现高效的模型并行,降低通信开销。此外,MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失情况,动态调整输入样本分配给专家,以提升效果。

2、“超级能力”应用意味着更加商业化的生态竞争。

技术虽好,但如果商业化路径不清晰,在如今的市场中,依然会面临崩盘。近日,微软官网更新了一则通知——“GPT即将停产”。曾经在AI圈引发无数热议和高潮的GPT,似乎正走向失败。

谁能记得,GPT概念出来的那场发布会,被外界形容为“一时风云”。

其初衷是希望利用低门槛的技术能力与全球开发者共同打造一批“超级能力者”应用,但由于技术问题带来的体验缺陷、货币化政策不明确,GPT概念的商业化之路始终受阻,最终“失败”。

_对于“百模大战”,几乎所有大佬的口风都180 °大转变了?_对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

大部分“超级能力”应用都是建立在成熟的商业生态之上的,或许全球所有的AI厂商都需要认识到这一点。值得一提的是,在大洋彼岸,阿里云于2022年11月发起的开源AI模型社区刚刚斩获2024年度SAIL之星奖。

经过一年多的发展,MoDa社区已经成为国内最大、最活跃的AI模型社区,汇聚了超过5500个优质模型和上千个数据集,为超过560万开发者提供模型和免费计算服务。或许,这条没走过的生态路,在中国会焕发新的生机。

3、“超级能力”的应用必然会在行业场景中涌现。

朱啸虎给大模型创业者的建议:“不要迷信AI,关注前沿场景,尽快落地。”——场景是孵化“超级能力”应用的摇篮。但深究起来,不能只看场景,最终还是要看用户的反馈和价值呈现。

医疗、教育、金融、制造、交通、农业等行业是大规模模型应用的“高发”场景,但所打造出的智能实体或解决方案的好坏,只有喝水的人才知道。

To B项目重在效率。在快递领域,目前通过大佬帮忙处理订单,已经可以做到“一图一句就发快递”,无需其他繁琐流程,时间从3分多钟缩短到19秒,而且90%以上的售后问题也由大佬来解决。——这种效率提升堪称“超级能干”。

对于To C场景,看用户,此前百度高考智能代理在高峰期每天要回答考生两百多万道题目,对于全国一千万考生来说,这个比例相当高了——这个用户量也算得上是“超级能干”了。

如今大模型应用覆盖了文本生成、数据处理、PPT制作、营销、客服、医疗诊断等各种通用、垂直场景。其实市场不缺场景,缺的是有能力、有效果的应用,“量”应用必须在场景中找到用户、找到价值。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2