阿里巴巴申请仲裁通义大模型前员工周畅违反竞业协议,引发AI圈热议

   日期:2024-12-06     来源:网络整理    作者:二手钢材网    浏览:155    评论:0    
核心提示:可以说他就是当今世界上最懂阿里大模型的人,但这个人现在跳槽到了字节跳动,对于阿里来说这无异于釜底抽薪。《第一财经》杂志通过多方信源了解到,字节给周畅提供了一份几乎无法拒绝的合同:4-2的职级和8位数的年包工资,按阿里的职级体系换算大约是连跳两级且薪资翻好几倍。

11月13日上午,一则关于阿里巴巴决定申请仲裁的“同益模型前员工周畅违反竞业限制协议”的消息迅速在AI圈传开,当天中午,媒体就报道了这一消息。已得到阿里巴巴内部人士证实:情况属实。

早在2020年,周畅就开始带领阿里巴巴达摩院团队训练一个名为M6的多模态模型。 2023年火爆后,他的团队基于M6开发了“统一千文”大模型,该模型现已成为众多统一系列AI产品的技术基础。可以说,他是当今世界上最了解阿里巴巴大模式的人,不过这个人现在已经跳槽到了字节跳动。对于阿里巴巴来说,这无异于将锅底倒掉。

7月中旬,第一个消息传出,周畅即将辞职创业。然而,10月底,他已经加盟字节跳动。 “辞职创业只是一个幌子,因为我害怕在竞争中落败。”在为字节服务的猎头公司工作的沉曼告诉第一财经记者。 “但是这次我不能再隐瞒了。周畅并不是唯一一个来到字节的人。一个人,他的团队十多人也跳槽了。”

此外,近几个月加入字节大模型团队的关键人才还包括零一算法副总裁黄文浩、面墙智能前核心成员、旭智科技创始人秦宇佳。

中国最年轻、最激进的科技公司一直以庞大的招聘团队而闻名。最鼎盛时期,人力资源部门有5000多名员工,其中大部分人的唯一工作就是招聘,辅之以同等规模的外包猎头系统。 ,共同构成了史无前例的劫人工厂。其他类似规模的科技公司在招聘团队规模上大约落后其一个数量级,这意味着只要 Byte 决定进入该市场,每家竞争公司都将面临人才流失的风险。

但字节曾经是“缓慢的”。 CEO梁如波在2024年初的全体会员大会上反映,公司“直到2023年才开始讨论GPT,行业里做得比较好的大型模型初创公司都是2018年到2021年创立的”。 2023年10月,当百度宣布在百度搜索、图书馆、地图等各类应用中植入AI能力时,豆宝App刚刚上线。这是 Byte 当时唯一的 AI 原生应用程序。

字节加速从抢人开始

从2023年中期开始,这家工厂对AI方向人才的需求就没有停止过。 “对象主要是阿里巴巴同易团队、百度问信和飞票团队,以及包括月暗面、智普等在内的‘AI六小龙’”,沉曼说,“有国内模型开发经验的人才基数小,工作时往往可以直接针对团队甚至个人。”字节对于基础模型研发相关人才的招聘没有上限,而且为目标团队的候选人提供的薪资数字非常可观。在原来工资的基础上加薪一倍的情况很常见。

根据沉曼的经验,字节的各个部门首先要向招聘团队提交招聘需求,但公司对各个部门招聘人才有不同级别的权限。字节等级分为10级,从最低的1-1到最高的5-2。数字越大,等级越高。其中,2-1(工程师)至3-1(高级技术专家)内部比例最大。业务稳定期间,会出现大量2-1、2-2招聘需求。在业务需要“开疆拓土”的阶段,会发布3-2、4-1及更高的要求。一般来说,只有盈利部门才会对3-1及以上有较多需求,但在招聘大模研发人才时,字节就显得格外大方。 《第一财经日报》杂志从多方渠道获悉,字节给周昌提供了一份几乎无法拒绝的合同:4-2的职级和8位数的年薪。按照阿里巴巴的职级制度,大约连续跳两级,你的工资就会翻几倍。字节还给跟他一起来的原来团队成员的等级为4-1和3-2(相比阿里巴巴等级P10和P9)。 “你也可以把周昌的合同看成英雄帖,字节是在告诉大家,它愿意付出,也负担得起。”沉曼说道。

_字节跳动阿里_字节跳动对应阿里职级

对于字节来说,抢人早已成为企业开拓新业务的常用手段。字节创始人张一鸣曾多次在公开场合提到“人才密度”的概念。在他看来,只要人才密度超过业务复杂度,有了有效的激励,企业的成功就会水到渠成。

张一鸣本人就是这一理论最忠实的践行者。字节的头条、抖音等信息流产品所依赖的核心技术,即推荐、广告、搜索算法(简称“推荐搜索”),实际上都是由百度开发的。 2014年至2015年,张一鸣高薪聘请了百度网络搜索部门时任副总监杨振源、首席架构师朱文佳以及一批机器学习算法工程师。如今,杨振源担任字节跳动副总裁兼火山引擎业务负责人,朱文佳则担任今日头条CEO兼产品技术总监。 2023年初,一支代号“种子”的神秘团队成立,专注于大生意。模型底层技术的研发。

事实上,比外部抢人更早发生的,是字节内部的“抢人”,或者用官方的话来说:团队重组。

神秘、特殊是乐颜对Seed团队的最早印象。 2023年初,他发现字节机器学习平台的算力使用列表前排出现了一些新名字。根据以往的经验,排名靠前的团队是Byte内部最受关注、获得资源最多的团队,而前几名的算力使用量往往可以占到当时总算力的一半。一些消息灵通的同事表示,这个新组建的团队很可能正在研究基本模型,他们的工作空间有第二个访问控制。

乐岩2020年才加入Byte担任算法工程师,但他对公司灵活的管理方式并不陌生。从每个人到每个部门,一切都在效率的指挥棒下迅速移动和安排。 ,再搬家,再搬家。

在公司内部AI Lab衰落之后,字节AI的研究重点转向了应用机器学习(AML),也被称为机器学习中台部门。一方面,该部门负责传统产品推广和搜索算法的研发。被要求拓展新业务,包括搭建Byte的计算集群和训练大型模型。关键人物包括前机器学习系统负责人朱一波,2023年辞职后联合创办了“人工智能六小龙”之一的步星;杨红霞,大语言模型研发技术专家,2023年初加入字节,曾就职于阿里巴巴达摩院,担任M6大模型技术总监,是周畅的前任领导,但她已经离开字节2024 年 5 月。

2023年初Seed团队的成立,是字节AI业务的又一次调整。团队主要成员来自搜索、AML、AI Lab等部门的大型模型相关人才。不仅如此,乐燕表示,团队还在寻找其他部门的人才,以增加这一新兴业务的“人才密度”。

沉漫估计现在Seed团队的人数应该已经超过150人了,而这还只是开发Byte基础模型的团队。 2023年底,Byte成立了一个名为Flow的团队,负责基于大模型的AI原生应用的研发。豆宝就是它的成果之一。团队人员增长较快,目前已近300人。另外,字节各业务部门都需要思考如何将大模型落地到相关业务场景中。

回归AI核心

_字节跳动阿里_字节跳动对应阿里职级

Byte 正在自上而下重建其核心——人工智能。

早在2016年,张一鸣就在公司内部成立了AI实验室,并邀请了多名科学家加入,其中包括微软亚洲研究院原常务副院长马维英、华为诺亚方舟实验室原主任李航、人工智能研究院院长李雷等。自然语言处理技术专家。 ,建立了包括计算机视觉(CV)、自然语言处理(NLP)、语音音频处理、音乐、机器学习等多个子团队,几乎涵盖了当时人工智能的所有前沿领域。同时,该实验室在北京、上海、深圳、新加坡、美国、欧洲等地设有办事处。马维英被任命为人工智能实验室负责人,直接向张一鸣汇报。

AI Lab的成立,展现了张一鸣在新技术时代的雄心。当时字节还不是一家“大公司”。它成立仅四年,只有一款热门应用程序——今日头条。无论公司资质还是业务量,都无法与阿里巴巴、百度、腾讯等巨头相比。在此期间,百度和腾讯相继建立了自己的人工智能实验室,并从世界各地招募人才。百度还聘请了微软前全球执行副总裁陆奇加盟。字节是那波AI Lab建设浪潮中罕见的初创公司,而且它比阿里巴巴更早做出这一决定,阿里巴巴直到2017年5月才宣布成立达摩院。

Byte后续的发展,数十倍、数百倍地回报了这段时间的技术投入。

AI实验室成立同年9月,抖音诞生。当时,成立于2011年的快手已经通过“农村包围城市”的策略,在三四线城市获得了大量用户。作为新生的同类应用,抖音试图从一二线城市突围,将“音乐”、“青春”、“潮流”融合起来,确立了主要风格,并建​​立了支撑这些风格所需的功能——换脸、装扮、美化甚至跳舞,都依赖人工智能技术。以《噢舞蹈》为例。它利用字节AI实验室的“人体关键点检测”技术,让用户了解自己在镜头前跳舞时的姿势是否与目标姿势准确匹配。 2017年,抖音推出了基于该技术的“跳舞机”功能。应用版本更新后的第二天,抖音就冲上了应用商店免费榜第一名。

人工智能技术不仅支撑着抖音,也让字节成为真正的App工厂和全球化公司。 2018年,张一鸣在当年举办的首届数字中国建设峰会上发表了题为《科技走出去,搭建全球创造交流平台》的主旨演讲。他表示,“人工智能技术是字节跳动在全球市场占据主导地位的关键”。无论是综合资讯产品、News,还是短视频产品、.ly、Vigo Video,这些产品虽然名称不同,但核心都是同一套人工智能技术解决方案——推荐算法,张一鸣称之为全球用户都在使用的人工智能技术解决方案。提供一致的产品体验。

然而,当抖音、抖音等核心应用在市场上取得绝对优势,开始进入“流量如何商业化”阶段时,AI Lab在字节的地位开始松动。一个指标是,AI实验室负责人马维英的举报对象从张一鸣变成了时任抖音负责人张楠。这意味着AI Lab不再是集团层面的前瞻性项目,而是成为了抖音的一项服务。应用技术团队。

马维英在2020年中宣布离开字节跳动,重返学术界,加入清华大学智能产业研究院。担任实验室主任的李雷和王昌虎也在次年辞职。李雷和马维英一样重返学术界,而王长虎则在2023年投资视频生成模型领域创业。

随着核心团队成员的离开,字节AI Lab体系开始进一步被削弱和分裂。据乐岩介绍,2020年他加入AI Lab时,这个部门还是字节跳动AI研究的核心部门,团队规模有数百人。但次年,AI实验室进行了重组,各个小组被拆分为不同的业务线。比如,图像视觉团队的一些人被划分到商业化团队,为公司的一些业务提供技术中台支持,比如抖音的手势、人体识别等AI功能。经过这次重组,整个AI实验室只剩下不到50人。他们主要做一些学术性的研究,比如机器人技术。原来的视觉模型、自然语言处理等方向已经不复存在。

字节跳动阿里_字节跳动对应阿里职级_

张一鸣很早就意识到人工智能在内容分发方面的巨大潜力,但他可能没有意识到人工智能在内容生产方面具有更大的潜力,这种潜力如此之大,可能会颠覆其基于内容分发技术的产品形态和竞争优势。目前,业内不少创业项目正在打造基于生成式AI的新一代内容社区,包括可能取代小红书的文字、图片社区,以及可能颠覆抖音、抖音的短视频社区。如果Byte无法提供类似或更好水平的内容制作技术,用户很可能会转向其他平台。毕竟,社区的本质首先是为创作者提供创作工具,其次是提供表达的渠道。抖音、小红书、抖音的崛起已经多次说明了这一点。

公开资料显示,早在2017年,马维英就公开表示:“人工智能算法在内容分发方面做得很好,但很多信息需求并不能通过搜索3个网页来满足……我们希望人工智能能够运用在创作中”最终释放人们更多的创造力。” AI实验室主任李航也在2022年发表论文,讨论基于其的“序列到序列模型”,这就是后来让GPT系列模型流行起来的新AI架构。李航在那篇论文中提到了BERT和GPT。当年11月的最后一天,依据。 2024年初,字节CEO梁如波在全员大会上反思了公司对大模型的“迟缓”反应,“直到2023年才开始讨论GPT”。

2023年紧急成立的Seed团队,一定程度上承担了AI Lab成立之初所分配的角色:了解和掌握最前沿的人工智能技术,让字节跳动不落后,甚至引领行业。

化妆课、烧钱、饱和攻击

字节跳动自2023年以来的状态,与其说是试图重现“努力就能创造奇迹”的神奇效果,更多的是因为害怕被抛在后面而补课。

他们不仅在人才端抢人,还在应用端抢用户。据第一财经统计,字节有大约20个AI应用仍在正常运行,其中大部分将在2024年之后发布。在模型层,只有语言模型的字节将在2023年正式发布,而图像、语音、音乐、视频、3D等不同模式的生成式AI模型将于2024年完成。掀起最新生成式AI浪潮的Byte已成为最完善的科技公司生成式人工智能模型和最多的人工智能应用。

字节再次使出了最拿手的招数:内部赛马、外部“小步快迭代”、烧钱。

乐燕告诉第一财经记者,Seed和Flow现在是Byte的生成模型和应用部门,但当公司高层把目光投向这个领域时,每一个拥有AI研发能力的团队都会尝试开发更好的模型或产品,并争夺更多资源和晋升机会。 “比如Seed最近发布了两个视频模型(而且即使某个团队的模型稍微弱一些,也根本不会被外界看到。Byte一直都是这种赛马模式。”

面对外界,字节采取了一贯的“饱和攻击”。以科兹为例。它对应了AI代理最流行的应用场景之一。它允许用户自己创建定制的聊天机器人,并且这个机器人可以将各种功能节点(例如插件、模型、代码)按照一定的顺序和逻辑关系将它们连接起来,创建复杂的业务流程,以实现特定的任务或功能。

字节跳动阿里__字节跳动对应阿里职级

白话代理经理古德白从今年年初开始就一直在尝试打造一款基于AI工作流程的营销工具。他告诉第一财经记者,科泽几乎每天都在更新版本,这需要大量的资源投入和团队配置。字节聘请了大量的外包公司来完成最终的产品测试。 “初创公司很难应对这样的饱和攻击。”再见说。而且,Coze一推出就直接采取了“免费使用模型”的策略,这让国内另一个率先实现AI工作流功能的平台迅速陷入沉寂,而Coze则后来居上。

字节也是今年国内大机型价格战的始作俑者。 2024年5月,在火山引擎FORCE动力大会上,字节跳动正式发布了豆宝大号车型,同时攻击了该车型的B端价格。豆宝通用模型Pro-32k版推理输入价格仅为0.0008元/千。 ,比行业平均价格低99.3%。这意味着客户花1元钱让豆宝模型处理200万个汉字,相当于三本《三国演义》——当时,同样的钱只能输入不到4000个汉字。将字符放入 GPT-4 中,甚至不足以写一篇短篇小说。小说。面对字节发起的价格战,竞争对手不得不迅速跟进。阿里云主力同易千文机型降价97%;百度甚至直接宣布文信两款轻量级车型免费。

在面向C端用户的AI应用上,字节跳动在烧钱方面更是毫不留情。花钱买流、买量,成为了产品冷启动最直接、最快捷的方式。据广告情报分析平台统计,豆宝智能助手4、5月份的投资金额接近1800万元。到6月初,投资金额飙升至1.24亿元。

同时,字节还限制了豆宝竞品在抖音平台上的广告投放。其中,受影响最大的就是智能助手Kimi。该产品由“AI六小龙”之一的月之暗面推出。豆宝终结之前,曾依靠在抖音、哔哩哔哩等平台的快速增长。不过,“AI六小龙”的一名员工表示,豆宝不仅复制了这条成功路径,还凭借母公司字节跳动的力量,限制了包括Kimi在内的对手在抖音的广告推送。

结果,今年3月,Kimi依靠社交平台广告超越百度同类产品“文小言”(原文心一言),成为月活跃度最高的原生生成式AI应用。四个月后,Kimi被豆宝超越。一个月之内,豆宝的月活跃用户数从904万猛增至5127万,将广告攻势不那么激进的Kimi和文晓燕远远抛在了后面。 《AI产品榜》数据显示,豆宝10月排名以近7000万月活跃用户领跑中国AI产品。智能助手Kimi和文晓燕的月活跃用户分别只有3900万和3400万左右。

花钱买用户的成本还不算高。一位熟悉Kimi投放策略的人士告诉第一财经记者:“目前Kimi和豆宝的用户留存率还是很健康的,单个用户的获取成本只有十几块钱。对于成熟的互联网产品来说,这是一个非常划算的数字。用户获取成本几百元。”

但这些用户是否忠诚则是另一回事。以视频生成领域为例。今年7月,Luma AI发布的最新模型Dream在4天内获得了超过1000万用户。这些人是最早的用户,后来在 Pika 发布后纷纷涌入 Pika。而且,广告流量带来的边际效益也在减少。根据App公布的流媒体数据和用户数据综合显示,前不久,步星的智能助手阅文也疯狂上线,花费近7000万元,但截至今年10月,转化仅不到20,000 个新用户。 。

与Byte的咄咄逼人相反,国内其他主要厂商和初创公司则持谨慎态度。

除了字节之外,其他中国科技公司对生成式人工智能的热情正在减弱——积极的一面是,该领域正在变得理性。最先押注AI的李彦宏在刚刚召开的第三季度董事会议上表示,“百度不会碰空型视频一代”,在文晓燕的宣传上选择了“稳健”而不是“激进” ;阿里巴巴不再执着于开发一应俱全的AI超级应用,而是更专注于AI云服务;短视频巨头快手目前尚未推出语言模型应用,而是专注于视频模型的开发和应用。不少人向第一财经记者证实,随着国内模型在能力上逼近GPT-4,而GPT-5却一再推迟,很多企业,尤其是资源有限的初创公司,不愿意投入训练下一代基础模型(俗称作为“预训练”)变得谨慎。甚至有投资者声称,已有不止两家AI小虎暂停了“预训练”。

_字节跳动对应阿里职级_字节跳动阿里

一位业内人士向第一财经记者表示,独角兽选择推迟预训练下一代大语言模型的原因之一是,甚至预训练比现有模型好1甚至1.5代、超越GPT的模型-4型号,其推理能力仍不满足终端应用从伴侣领域走向生产力领域的产品要求。目前GPT-4o在生产力领域的应用现状已经说明了这一点。根据步星创始人蒋大新在阿里云大会上提到的数据,GPT-4达到万亿参数后,如果增加参数数量,边际效益就会下降。

字节没有显示出放缓的迹象。沉曼向第一财经透露,预训人才是字节目前最急需的人才。最近,字节成立了一个名为“大模型研究院”的组织。从名字上看,它可能比基于现有算法的训练模型承担更多前沿任务。最初市场传闻称,周畅是从阿里云挖来的,让他来负责这个团队。不过,也有消息称,为了避免竞业禁止协议,周畅被派往新加坡从事具身智能领域工作,研究机器人在物理世界自由移动所需的“世界模型”。 AI Lab在Byte中日渐式微,但张一鸣仍然看重和关注的最后一个研究方向是机器人。这些机器人被认为能够满足 Byte 的电子商务履行需求。

豆宝还没有盈利。根据上次专家采访纪要,字节跳动对于大模型的财务政策是“推理层无损失”,即模型训练阶段所需的研发投入、芯片算力投入、人员成本都可以战略性地承担损失,一旦模型投入使用,每次呼叫的成本就需要降低。豆宝目前按照API调用向B端用户收费,平均每亿次调用收费约80元至200元。豆宝可以通过此类调用赚取8%-10%的毛利润。 C端用户暂未收费。采访纪要称,从2023年到2024年,字节跳动通过“模型蒸馏”将模型大小从300B缩减至80B左右,大幅降低了算力开销。

目前,豆宝尚未向C端用户收费。主要原因之一是产品不够。一旦开始充电,用户可能会流失。根据分钟提供的数据,每个豆宝用户平均每天使用该应用的时长仅为10至11分钟,而这个时长是多次使用后的累计数。如果平均分配每次使用的时长,这个数字将减少到2分钟,也就是说,用户每次打开豆袋,基本上只有3到4轮对话就结束了。 “如果2分钟内无法满足需求,他们可能会切换到其他应用程序,不一定是其他人工智能工具。例如,用户可能会打开微信、小红书等应用程序。”纪要称。

豆宝已经是中国用户数量最多的原生AI。不过,Byte 对此有一个更激进的目标,那就是在今年年底前实现月活跃用户数达到 1 亿。

未来看起来,字节的饱和投资有很大一部分会被浪费,但目前的现实是,它必须为新技术时代的到来做好充分的准备。作为Byte从社交媒体到的战略标杆,meta在AI方面也投入了数百亿美元。扎克伯格在最近与英伟达首席执行官黄仁勋的谈话中解释了原因。这样做时,他说:“你今天在 上看到的很多内容都是根据你的兴趣与你匹配的……未来,我认为这些内容将由创作者使用人工智能工具创建,或者由人工智能合成生成”。

字节的财务状况在众多大公司中还算不错。据科技媒体The报道,字节跳动2024年上半年营收约为730亿美元(约合人民币5280亿元)。这一数字已远远超过腾讯同期营收3206亿元,并接近meta。目前Byte的估值仅为meta的1/5。如果需要资金,它还有一个比其他公司更可观的融资渠道:上市。但其造血业务——广告和电商增速却迅速放缓。今年前三季度,字节在中国的单季度广告增速从40%左右下滑至17%以下,连续两个季度未能实现既定目标。与此同时,抖音电商的销售增速从年初的60%以上下降到9月份的不足20%。一旦成熟业务的增速达到个位数,字节用于支持新业务的现金流将受到限制。

然而,对于一家试图进行重大转型的公司来说,上市并不是一个好的选择——许多公司在上市前已经成功转型,但上市后成功的公司并不多。对于字节来说,造血能力决定一切。 (应受访者要求,文中沉曼、乐燕均为化名)

本文转载自 ,作者:Jeff Wang 和 Lu。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2