版权保护下的 AI 训练数据集:成本、竞争与法律风险

   日期:2024-07-26     来源:网络整理    作者:二手钢材网    浏览:249    评论:0    
核心提示:然而,对于那些网络效应较弱甚至没有网络效应的人工智能初创企业来说,从头开始建立商业模式是很困难的。三、生成式人工智能反垄断调查的突破口如果“准并购”的概念在法律上难以突破,那么监管机构很可能将从生成式人工智能所依赖的一个或多个关键构件的控制寻求突破。

许多高质量的文本、音频和图片AI训练数据集都受版权保护。作者原则上可以对其作品的使用收取许可费。这将引发额外的成本导致的训练数据供应缩减。这还将增加模型训练的成本,并减少模型开发者之间的竞争。

欧盟《人工智能法案》要求模型开发者遵守《版权指令》中规定的《欧盟版权法》,特别是第4条,该条授予商业研究的版权例外,但允许版权持有人选择退出此例外。在美国存在一定的法律不确定,有几起案件悬而未决。如果法院裁定不适用合理使用例外,人工智能投资者将面临惩罚性法定赔偿的风险。为了避免这种情况,最大的人工智能公司已经与大型媒体公司签署了数据许可协议。例如,OpenAI与《纽约时报》、贝塔斯曼媒体集团和Reddit新闻平台签署了协议。

如果各国严格执行版权法,人工智能模型获取训练数据的困难就增加了,规模较小的人工智能开发商和初创公司可能没有财力支付版权许可,以至于被完全挤出市场。

3、接触用户途径的便利性

AI模型开发者需要商业渠道来创造收入,以支付训练和运行模型的成本。

一些初创公司从头开始建立自己的商业模式,而且还比较成功。例如,OpenAI创建了一个收费的GPT应用商店,还向专业版ChatGPT的用户收取订阅费。在ChatGPT推出一年内就覆盖了1亿多用户。

然而,对于那些网络效应较弱甚至没有网络效应的人工智能初创企业来说,从头开始建立商业模式是很困难的。一种更简单的创收途径是与GAMMAN合作,将人工智能模型嵌入到他们成熟的商业模式中。例如,谷歌正在将自己的和第三方的人工智能模型嵌入其搜索引擎和其他服务中,对部分人工智能驱动服务的访问收取高价。

所以,尚未形成商业模式的初创企业也愿意与GAMMAN合作,将AI模型嵌入其价值链下游端——现有的GAMMAN面向用户的服务中;作为回报,初创企业在价值链上游端进行反向合作,GAMMAN授予初创企业访问计算基础设施和可能的训练数据的权限。

二、GAMMAN 和 AI 初创企业之间的“竞合”协议是否属于 “并购”?

基于以上原因,想要保持技术前沿地位的AI初创公司需要与GAMMAN签署竞合协议,以克服训练成本和获取客户的障碍。GAMMAN可以沿着整个AI价值链进行垂直整合,而初创企业主要覆盖价值链的投入和中间部分。

图:AI初创企业与GAMMAN的合作竞争模型(来源:Brugel)

竞争管理机构对这些交易和协议持怀疑态度,担心竞合协议可能会成为GAMMAN施加影响力并减少AI初创公司竞争的木马。其中一个重要的法律问题在于,GAMMAN从战略投资到挖走初创公司创始人和技术人才等行为,是否是一种只在规避反垄断监管的新的并购方式——“准并购”?

但竞争管理机构的几项调查迄今为止尚未找到任何确凿证据。

尽管欧盟委员会于2024年4月得出结论,认为微软对OpenAI的投资安排不属于收购,但它仍在继续调查是否对该安排展开正式的反垄断调查,理由是该安排可能会对欧盟内部市场产生扭曲影响。德国也是类似,在2023年11月确定该安排不受德国合并控制,但如果微软未来增加对OpenAI的影响力,它保留了重新审查的可能性。

美国反垄断执法机构如今也加入调查的行列。

三、生成式人工智能反垄断调查的突破口

如果“准并购”的概念在法律上难以突破,那么监管机构很可能将从生成式人工智能所依赖的一个或多个关键构件的控制寻求突破。

1、数据

与硬件不同,训练数据是非竞争性的,可以同时被许多人使用。然而,许多高质量训练数据来源都受版权和许可费用的约束。

特别是在专业领域或数据监管更为严格的领域(如医疗保健或金融)尤其如此。预训练或微调一个在这些领域拥有深厚专业知识的模型可能需要访问大量数据,而这些数据并不广泛可用,而且对于市场新参与者来说很难收集。

当然,仅仅拥有大量数据并不违法。然而,反垄断执法机构可能对公司对数据的控制进行特别关注,以分辨其是否可能减少数据的供应、造成获取的障碍、阻碍公平竞争的充分发展。

2、人才

生成式人工智能的另一个重要投入是劳动力专业知识。开发生成式模型需要大量工程和研究人员,他们必须具备特定且相对稀缺的技能,并且对机器学习、自然语言处理和计算机视觉有深入的了解。公司能够获得和留住的人才可能不仅在生成式人工智能的发展路径上发挥关键作用,而且在发展速度上也发挥关键作用。

由于人才稀缺,实力雄厚的公司可能会有动机锁定员工,从而扼杀来自实际或潜在竞争对手的竞争。为了确保市场竞争和创新,必须允许具有创新想法的人才自由流动,而且至关重要的是,不要受到竞业禁止条款的阻碍。

英国CMA在7月宣布对微软聘请Inflection AI(OpenAI的竞争对手)核心团队所进行调查,就属于此类。另外,美国FTC于2024年4月23日宣布的全面禁止所有员工(包括高级管理人员)签署新的竞业禁止协议,也是为了促进IT人才的流动。不过很快就被法官挑战其合法性,前景尚不明朗。

3、计算资源

生成式人工智能系统通常需要大量计算资源。计算通常需要专用硬件,例如带有图形处理单元 (GPU)等专用芯片的计算机,或者通过云计算服务来获取计算资源。然而,芯片的运行维护成本和云服务价格都很昂贵,目前也只有少数公司提供,这增加了反竞争行为的风险。

如今,一些专用芯片市场已经高度集中,而且对服务器芯片的需求可能会超过供应。例如,对可用于训练AI的服务器芯片的需求激增导致短缺,促使AWS、微软、谷歌和甲骨文等主要云服务器提供商“限制向客户提供产品”。而高度集中的市场中的公司更容易采取不公平的竞争手段或其他反垄断法违规行为。

2022年,美国联邦贸易委员会针对英伟达(Nvidia)的诉讼进行两个多月后,英伟达宣布放弃了以400亿美元收购Arm的计划。此次合并如果成功,可能将扼杀多个处理器市场的竞争,包括云服务提供商的芯片。

四、关注:人工智能供应链中不同细分市场

未来反垄断机构针对人工智能的调查,将在一定程度上从主要的市场进入壁垒(比如模型训练成本)转移到人工智能供应链中不同细分市场的潜在竞争问题上。

同时,他们更愿意在反竞争行为之前,向市场提供保持这些细分市场开放和可竞争的方法,让新企业可以参与竞争,研究人员可以自由地转向能够最好地推进技术发展的工作,企业家可以继续创新。

英国竞争管理委员会提供的行为规则指导,可以为相关企业提供一些指引:包括对硬件和数据的开放访问、向人工智能企业和消费者提供各种商业模式、不降低他人竞争能力的合作伙伴关系、不偏向人工智能服务和模型、不搭售或捆绑销售。

企业应当在了解正在使用人工智能技术的性质、如何使用机密数据以及谁有权访问这些数据的基础上,避免使用有关公司使用人工智能的不精确和不准确的营销材料。因为这些材料可能会被误解为暗示公司或行业对人工智能的使用正在促进反竞争行为。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2