OpenAI发布Sora正式版:视频生成领域的GPT-1时刻,国内AI企业反应不一

   日期:2024-12-12     来源:网络整理    作者:二手钢材网    浏览:209    评论:0    
核心提示:我们就从国内企业跟进Sora的选择与否,聊聊视频生成的中国牌局。虽然视频生成模型现在商业前景不明,但有没有可能以后会爆发,企业悄悄投入然后惊艳所有人?而在所有产品中,视频生成模型是一个尤为沉重且具有挑战性的项目。大模型的牌局,国内企业正在找到自己的节奏感。

Sora自2月16日发布以来一直被批评为“技术未来”。终于在12月10日,Sora的正式版出现了,它可以生成最高分辨率为1080p、最长长度为20秒的视频。

CEO 表示,Sora的正式版是视频生成领域的GPT-1时刻。

然而,国内AI公司并没有像GPT时期那样跟上视频生成领域的步伐,而是表现出了更为复杂的态度。

有些人选择跟进。例如,Sora问世后,阿里巴巴、字节跳动、快手、腾讯等互联网公司,以及智普AI、爱视科技、盛树科技等AI公司,都相继发布了视频生成模型。大多数人表示他们达到或超过了 Sora 的预览版。

有些人选择不跟进,包括互联网公司中的百度。李彦宏曾明确表示“无论Sora有多受欢迎,百度都不会做”。百川智能等AI公司也明确表示不会制作类似Sora的模型。虽然《月之暗面》、商汤科技、零一一切都有文森特视频的模型,但它们并不是重点。

视频生成赛道不再延续GPT时代的发展模式,即大打王牌,国内科技公司争相效仿。 Sora之后,国内AI扑克游戏开始有了自己的节奏,呈现出更加复杂的局面。

国内有能力构建大规模通用基础模型的科技公司对于技术路线和商业前景的判断开始出现明显分歧。我们将跟进国内公司对Sora的选择,谈谈视频生成的中国扑克游戏。

首先我们要明确,对标Sora模式的国内科技公司在做什么?

Sora之后,视频生成模型的中国牌局_Sora之后,视频生成模型的中国牌局_

简单来说,Sora视频生成模型的核心技术路线是+与以文本(自然语言)、图片、视频作为提示词的视频生成相结合。

要对 Sora 的模型进行基准测试,它必须至少具有以下几个特征:

1、多功能性,不针对某种风格、行业、角色等,任何内容的视频都可以生成。

2、画质高,画质和精度高(最高可达1080p),视频时间长(可达一分钟),画面一致性强(了解物理定律)。

面对Sora,国内科技公司并不像它推出时那样毫无准备。但跟不跟,不再是那样高度一致,而是分为三类:

第一类是明确的后续。

在互联网公司阵营中,字节跳动、快手等主打视频的公司,以及综合性科技公司腾讯,拥有成熟的数字基础设施、丰富的技术人才资源以及内部的视频产品基因,所以他们几乎立即选择跟进。字节跳动推出了极萌,快手也发布了科灵大模型。以混元大模型为核心,腾讯发布并开源了混元多模态生成模型,被认为是腾讯版的Sora。

在大型模型初创企业中,智普AI是最敏捷的。今年7月,其发布了AI视频生成工具青影,允许用户通过文本/图片生成10秒、4K、60帧的视频。海螺AI还在10月份新增了视频生成功能,支持文字提示词生成6秒视频片段。

第二类是坚决不效仿的。

Sora之后,视频生成模型的中国牌局__Sora之后,视频生成模型的中国牌局

与第一类公司的态度相反,也有互联网公司和大型模型初创公司坚决不追随Sora。比如《索拉》出来后,百川智能的王小川就表示,团队里有人提议做《索拉》,但他明确表示不会朝这个方向跟进。

百度的李彦宏也有同样的想法。虽然百度在视频生成领域取得了一定的成绩,但他也非常坚决不做Sora。原因是Sora的商业化可能需要五年甚至十年的时间。目前,百度更加专注。在大型语言模型和多模态大型模型中,没有尝试将类似Sora的模型产品化。

第三类是一看就停下来。

此外,国内还有大量企业出于FOMO和“害怕错过”的考虑,对Sora做出了规划,但并未投入巨资,处于试水状态。

例如,阿里部门的阿里妈妈团队发布了视频生成场景来测试电商营销;在《大模六小虎》中,月之暗面也推出了视频代模,但依然以kimi产品为主; 01万物联网进入B端业务,以视频生成模式为导向的影视制作行业正处于调整期,类Sora产品很难成为核心增长点。

综上所述,如果说全球大规模模式是一场“斗地主”,那么游戏规则不再是打王炸,国内科技公司也得跟上,而是各根据自己的牌,业务的重要性和优先级,来决定Sora的策略。

为什么自Sora以来大型模型行业的游戏规则发生了变化?

国内科技公司的表现表明,对Sora尚无共识,整体舞台还比较混乱,规则模糊。迷雾之域,游戏规则只能自己探索。

Sora之后,视频生成模型的中国牌局__Sora之后,视频生成模型的中国牌局

当今视频生成领域的现状笼罩在三重迷雾之中。

技术迷雾:Sora 被认为是一个世界模拟器,也是通向 AGl 的一条有希望的道路。目前这条技术路线存在不少争议。

比如李飞飞、lecun等人就认为Sora无法实现AGI。李飞飞指出,Sora仍然是二维图像,只有三维空间智能才能实现AGI。 Sora 预览版中生成的“日本女性走过霓虹灯闪烁的东京街道”的视频无法将镜头置于女性身后,这表明 Sora 并不真正了解三维世界。学术大师Lecun也对Sora点名不利,称它根本不是现实世界的模型,仍将面临GPT4的巨大瓶颈。

确实,即使在Sora正式版中,生成的手部细节不准确、动态过程的一致性等问题仍然存在。

国内企业坚决不追随Sora的原因之一是对这条技术路线持保留态度。例如,百川智能的王小川认为,Sora只是一个阶段性产品,其技术高度、突破性和应用价值都不及GPT。总之,实现AGI、模拟物理世界的技术路线的开放性决定了Sora并不是唯一的解决方案。

商业迷雾:视频生成模式的商业前景和投资回报率短期内尚不明确,成为阻碍国内企业退出的又一障碍。

《Sora》的预览版和正式版都延续了“暴力美学”。研究科学家诺姆·布朗表示,Sora是规模力量最直观的展现,即通过计算能力、数据、参数量的叠加,试图让它变得更加强大。大型模型的出现具有理解物理世界的能力。这种方法成本高,需要大量的资源投入。是否跟进Sora取决于各公司对该模型的商业预期和投资回报率。

如果视频生成模型是针对ToB收费的,通过API或SaaS服务,基础模型厂商将需要投入大量人力来优化业务流程和开发交互页面。影视行业正处于调整周期,AI影视制作业务增长有限。这无形中增加了AI企业的机会成本,因为同样的人力、物力、算力投入到金融AI、教育AI、大型政企等领域显然会取得更大的成果。因此,百度、零壹五五等公司将视频生成领域视为边缘业务,并不重点投资。

Sora之后,视频生成模型的中国牌局__Sora之后,视频生成模型的中国牌局

在ToC场景中,一方面个人付费意愿不高,视频生成也不是大众日常使用的高频场景,生成成本和订阅费用普遍高于文本模式。另外,Sora模型无法解决幻觉和一致性问题。问题不一定能创造实际价值,所以C端支付的规模非常有限。另一方面,模型完全免费,视频生成模型产品作为企业的流量入口。这种商业模式只适合以视频为核心业务的企业。

例如,快手和字节跳动拥有核心视频业务,可以快速扩展其模式。对于C端用户或者B端生产力工具来说,此类公司可以快速将视频生成能力与现有产品集成。模型开发的边际成本将随着商业化规模的扩大而降低。

总体而言,对于国内绝大多数基础模具制造商来说,视频生成领域是一个相对边缘的业务,投资回报率较低。

第三层迷雾是市场结构竞争迷雾。

虽然目前视频生成模式的商业前景还不明朗,但未来有没有可能会爆发,企业悄悄投入,让大家惊喜呢?这种押注边缘轨道以“捡漏”的商业神话在大型模型中可能很难发生。

目前,大型车型的产品化和商业化前景普遍模糊。一般模型厂商需要尽快从大量不明确的产品中选择成功概率较高、市场潜力较大的选项,并重点投入。在所有产品中,视频生成模型是一个特别繁重且具有挑战性的项目。在这种情况下,我们必须优先考虑成功率较高的产品,降低视频生成模型的业务优先级。

从另一个角度来看,即使企业将视频生成模式放在首位,也可能很难建立竞争优势。因为现在大机型的市场竞争与GPT时期不同。如今,各公司在基础训练设施、核心架构设计、技术储备等方面都积累了一定的经验。事实上,复制Sora以及推出类似Sora的应用程序的技术障碍其实并不像时期那么难。这也意味着,即使一家公司率先发布视频生成模型,也可能无法长期保持竞争优势和市场垄断地位。这种竞争格局也削弱了Sora的商业想象力。

技术迷雾、商业迷雾、竞争迷雾仍然笼罩着视频生成领域,导致Sora的游戏有太多的不确定性和太多的可能性。现在说哪种理解是正确的、哪种路线是最终的胜利者还为时过早。每个公司只能按照自己的游戏规则进行游戏。

_Sora之后,视频生成模型的中国牌局_Sora之后,视频生成模型的中国牌局

大模型技术必须持续发展,但从Sora开始,国内科技公司不再紧跟,开始有自己的节奏。

具体来说,对于Sora这样的重磅新事物,国内企业对于大机型的产品化和商业化有着自己的理解和思考,并开始定义自己的玩法。跟随空则显示实力,不跟随空则显示实力,重要的是心态和战略定力。

另外,你不只是盲目追随产品,但你讲故事的能力还是值得学习的。

无论是2月份利用Sora抢了的风头,还是最近Sora正式上线,总能一次次带动节奏、设定话题、吸引眼球。这对于资本密集型的​​AI公司来说是非常重要的能力。

你不必跟进Sora,但你不能错过关键技术。

以百度为例。虽然它没有计划推出Sora产品,但它并不缺乏关键技术。例如,其拥有自主研发的多模态可控成像技术,可以在保持物理特性不变的情况下实现高水平的图像。可控性的提升恰恰是下一阶段视频生成的核心。此外,百度也没有完全忽视视频生成领域。目前投资视频生成初创公司盛树科技和AI视频短剧公司晶影科技。

聚焦主赛道,根据其核心业务、业务重点等多重因素,确定追赶Sora的优先顺序。在大模博弈中,国内企业正在寻找自己的节奏感。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2