人工智能领域顶级学术会议NIPS 2024最佳论文近日出炉,北大和字节跳动团队的一篇关于视觉自回归模型的论文位列其中。文章第一作者是被字节跳动起诉索赔800万元的前实习生田某某。
北京大学和字节跳动团队获奖论文截图。
所谓自回归模型的原理是根据序列的前一个值(上下文)来预测并生成后续值。 GPT等大型语言模型是典型的自回归模型。
这篇来自北京大学和字节跳动团队的获奖论文展示了自回归模型在图像生成领域的潜力。本文提出了一种新的图像生成范式称为(VAR,视觉自回归模型),可以快速学习视觉分布,具有良好的泛化能力,从而验证了在图像领域,VAR模型在自然语言处理领域也具有自回归能力。模型的展开律(Law)和零样本泛化能力。
从具体效果来看,VAR模型的图像生成质量、推理速度和可扩展性超过了图像生成领域常用的扩散模型()。在VAR模型提出之前,自回归模型在图像生成领域的性能明显落后于扩散模型。
NIPS(神经信息处理系统会议)每年12月举行,被视为机器学习领域最具影响力的会议之一,与ICML(国际机器学习会议)齐名。 2024年NIPS将于12月10日至15日在加拿大温哥华举行。
上述获奖论文受到外界关注,部分原因在于作者的身份。北京大学博士生田某某在字节跳动实习期间以第一作者身份发表了这篇论文,但目前与字节跳动陷入司法纠纷。
)
谈及诉讼原因,字节跳动内部人士表示,由于田某是博士生,所以公司对其进行了解雇,并先移交给了学校。但在事件处理过程中,田某多次否认,称攻击模型训练任务的不是自己,而是其他实习生。考虑到田某某完全不知情,且涉案行为已触犯公司安全红线,公司最终决定向法院提起诉讼,以表明公司严肃态度,杜绝类似事件再次发生。
11月5日,字节跳动内部报告披露,2024年6月至2024年7月,原集团商业产品与技术部实习员工田某某因对团队资源分配不满,通过编写、篡改代码等方式对团队进行恶意攻击。 。研究项目的模型训练任务造成资源损失。公司已终止与他的实习协议,同步阳光诚信联盟、企业反舞弊联盟,同步与他的学校。
南都记者多次通过电子邮件、社交平台等渠道联系田某某,但未得到回复。


