据字母榜(ID: )不完全统计,仅在中国,就有超过20家公司推出自研的AI视频产品/模型。飞帆产业研究数据显示,2024年上半年,仅文胜视频领域就有18起融资活动,其中12起集中在中国。
今年 2 月 Sora 震撼发布前后,抖音前 CEO 张楠几乎同时转投快手,并宣布将推出 AI 原生照片视频产品。不过,近半年来,面对国内其他玩家争相成为 Sora 的“国产替代品”,字节跳动在原生视频领域进展缓慢。
更糟糕的是,新的竞争对手还在不断涌现,字节跳动的最新对手就是现在。
知情人士向 透露,目前其内部正在开发一个大型视频模型,该模型可能会嵌入星业 AI 或海螺 AI,并作为单一应用场景出现。
对此,商业化负责人魏伟表示,现在包括苹果在内的各大机型公司都在尝试AI视频,但对于苹果来说,该技术还处于早期阶段,目前还没有明确的计划推出AI音频或者AI视频。
作为国内“AI四龙”之一,其创始人为闫俊杰,今年3月正式宣布获得阿里巴巴领投的6亿美元投资,投后估值25亿美元。据飞凡产业研究数据显示,6月,其旗下星野AI月活跃用户数为400万,海螺AI月活跃用户数为200万。
无论是微博,还是智扑AI,对流量的焦虑,都引发了文森视频的“军备竞赛”。
6月6日,快手发布文胜网大视频模型“刻灵”,将视频生成时长提升至2分钟。上线不到两个月,申请“刻灵”内测的用户数已超70万。飞凡研发数据显示,6月,旗下海螺AI用户数环比下降176万,环比下降19.95%。
虽然飞凡研究CEO吴伟表示,整个6月聊天AI产品数据都在下滑,这是行业整体情况,但对于智扑这样的AI公司来说,无论是自主研发视频大模型,还是将闻胜视频作为单一功能场景插入到原有大模型中,依然是引流的最优选择。
除了吸引流量之外,对于坐拥短视频业务的字节跳动来说,文胜视频还将强化简影等视频剪辑工具的能力,并有望带动平台内容供给的丰富度。
面对文化视频领域竞争对手的持续压力,字节跳动不得不迎头赶上。
字节跳动并不是唯一一家在文化视频领域没有取得很大成效的大型公司。
宣布“全面发力AI”的百度,年初已在测试AI视频模型UniVG,阿里达摩院则推出了AI视频产品“迅光”。
据 报道,2024 年第一季度,字节跳动 AI 研发团队将视频生成模型作为重点,并挖走了原视频生成模型项目负责人姜璐。2024 年 1 月,字节跳动推出了 AI 视频生成工具——极梦-V2,支持 4K 到 8K 的超高分辨率视频生成。随后 2 月,剑影推出了一款名为的 AI 绘画工具。三个月后,剑影正式更名为“极梦”,并推出了 AI 绘画和 AI 视频生成功能,生成时间为 3-12 秒。
不仅腾讯自己的AI实验室推出了视频生成模型,腾讯混元团队还与中山大学、香港科技大学联合开发了大视频模型——Your-Pose-v2,通过上传人物图片,并提供动作视频,让图片中的人模仿视频中的动作,视频最长可达10秒。
腾讯集团副总裁姜杰表示,腾讯混元已经支持文字转视频、图片转视频、图片转文字转视频、视频转视频等多种视频生成能力,并且已经具备16s视频的生成能力。
在 Sora 引发 视频热议后,快手推出了 ,将 视频从 60 秒延长到 2-3 分钟。 视频赛道也引发了 AI 初创公司之间的竞争。
除了智浦AI之外,摩视科技旗下Morph、爱视科技旗下忆影AI、右脑科技旗下Vega AI等均已在AI视频领域占据一席之地,并且也在不断迭代产品。
不过,并非所有大型车型公司都将“国产Sora”研发放在了战略重点。
以长文平台起家的《月之暗面》在推出文胜视频模式Sora时,完成超10亿美元新一轮融资,引发关注。当同样领投的阿里巴巴已经传出正在开发大视频模式的消息时,《月之暗面》除了长文之外,还未有新动作。
百川智能创始人、搜狗前CEO王小川今年3月接受采访时表示,百川不会走Sora的路,他认为Sora这样的文学视频模型既不接近AGI理想,也离现实场景不近,Sora的高度、突破性、应用价值都低于GPT。
各大机型厂商纷纷抢占文盛视频,显然是看好AI视频的“钱景”。
公开数据显示,APP中长期支持“一键AI美颜”的美图秀秀从亏损走向2023年总营收27亿元,同比增长29.3%,经调整归母净利润3.7亿元,同比增长233.2%。这一增长主要得益于AI驱动的主营业务收入增长。如今,美图秀秀用户每天处理数亿张图片和视频,其中约83%使用泛AI功能。
以美图的AI配音视频工具开拍为例,它面向的是B端用户,即抖音、小红书、哔哩哔哩上的视频创作者。“用(开拍)拍配音可以设置字幕,滤镜美颜会更自然。美图甚至还有专门的APP Wink,恢复画质的功能也很好用。”一位小红书博主告诉自媒体,如今除了简影,美图的开拍和 Wink 已经成为她自媒体必用的剪辑工具。
原字节跳动视觉技术负责人、爱视科技创始人兼CEO王长虎也表示,过去移动互联网时代,国民级的产品肯定有抖音、快手,相比语言,视频更贴近用户,未来产品化、商业化的可能性更大。
对于目前仍在通过投资流量来换取用户、仍处于亏损状态的AI创业公司等大型模型商来说,文胜视频成为了一个极具吸引力的新型商业化场景。
更别提上线两个月,申请科灵内测的用户已经突破70万。在文胜视频“让特朗普说唱”、“让李白跳抖肩舞”的网络梗狂欢中,AI视频正在创造新的流量入口。
对于需要用日活和下载量证明自己的AI创业公司来说,社交平台的流量投入成本依然较高。开发大视频模型,将文学视频作为流量入口嵌入到原有的AI工具中,无疑将帮助亏损的大模型创业公司尽可能降低成本。
此外,对于我们来说,如果想要接手因API端口调用被禁用而寻找“下一个买家”的B端用户,无论是利用AI为电商平台生成店铺素材,还是视觉创意、商业摄影、专业视频剪辑、商业设计等领域,文胜视频功能的加载都能吸引一批“钱包更鼓”的B端用户。
不过,对于字节跳动等短视频平台等“不缺钱”的互联网巨头来说,“进入”文学视频赛道,也有关其核心业务的重要考虑。

一直活跃在视频直播领域的简影,不仅是视频创作的工具,也与抖音的内容生态息息相关。面对快手科灵的“先发制人”,以及美图开拍等APP的打压,对于不断引导视频创作者在创作完成后“一键发布到平台”的大公司来说,创作入口的争夺,与其背后的内容生态的构建进程有着直接的关系。
此外,无论是抖音与博纳联合出品的AI科幻短剧《三星堆:未来启示录》,还是快手原创的AI奇幻短剧《山海镜:劈波斩浪》,对于抖音、快手等巨头APP来说,文森视频的AI技术也能更大程度地丰富平台内容。
同时,投宝研究院的数据显示,2021年中国AI视频生成行业市场规模为800万元,预计2026年这一市场规模将达到92.79亿元。到2023年底,该领域已经涌现出独角兽企业:估值100亿美元的AI公司、估值40亿美元的AI公司、估值15亿美元的AI公司。年初爆红的Pika,成立不到一年,6月5日宣布完成8000万美元B轮融资,估值4.7亿美元。
据飞凡产业研究数据显示,2024年上半年全球仅活视频领域就发生过18起融资事件,其中12起集中在中国。其中爱视科技A轮融资规模达亿元,盛数科技A轮融资规模达数亿元。动辄数千万甚至上亿的融资金额也显示出资本市场对活视频的热切关注。
而需要不断融资以满足百万级大型模型月运营成本的AI创业公司,如果想要赢得投资人的心,同样需要 Video的新故事。
但利用AI视频进行流量引流、商业化落地、向资本市场讲好新故事,仍面临诸多挑战。
2月中旬,的视频模型Sora引发了热烈讨论。它可以生成长达1分钟的流畅视频。尽管CTO在3月份透露计划“今年晚些时候”正式推出Sora,但Sora尚未开放公测,仅提供给部分艺术家进行内部测试。
Sora公测延迟或许指向AI视频生成质量问题。曾担任阿里巴巴智能设计实验室负责人、打造AI设计平台“鲁班”的特勘科技创始人吴春松(昵称乐成)也针对国内出海商家和海外本土企业推出了视频AIGC生成平台。他表示,“在面向C端用户的产品上线初期,用文胜视频生成一个可用的视频需要尝试25次,对用户来说,中卡概率太低了。”
B站一位UP主告诉紫子邦,现在使用国内的几个文学视频模型,“如果想要生成准确符合文字描述的结果,很多时候更多的还是要看运气。尝试10次之后,如果经过调整后能用上3-4次,就已经是技术很好的模型了。”
为了解决文字生成视频质量不稳定的问题,特肯科技通过“图片生成文字,视频生成图片”的技术迭代,将AI生成视频的成功概率从1/25提升到了1/10(10次中只有1次成功生成)。但对于专业的视频创作者来说,如果想真正用AI生成高可用性的商业视频,不能只使用社交平台上流行的“老相片复活”等简单易复制的操作,他们对AI生成视频分镜、情节的准确性,甚至镜头效果的美观性和一致性都提出了更高的要求。
另一方面,目前国内的视频模型,即便是在时长和准确率上表现优秀的科灵,也依然因为“平台还缺少用来训练模型的基础语料,如果跳出美食、人像领域,视频生成的准确率就会下降”。
除了制作品质不稳定之外,文盛视频的商业化道路也并不好走。
除了像美图秀秀这样拥有稳定流量入口的美图外,即便是国内的短视频超级APP抖音、快手,也尚未创造出突破圈层的商业作品,多数仍是与影视制作团队的内部合作项目。
即便选择出海,包括5月海外用户规模达176万的爱诗科技,以及在海外音视频编辑领域占据领先地位的字节跳动,商业化路径也并不明朗。在已经出海的AI视频工具中,仅针对企业定制的营销数字人视频,就实现了一年内从100万美元到3500万美元的增长。
商业化路径不明朗,加上每月动辄数百万的研发费用,意味着对于AI大模型厂商来说,文森视频这次的“大考”恐怕并不会轻松。
尚处于亏损但热度不减阶段的 Video赛道,一定程度上给了张一鸣更多的追赶时间。


