推广 热搜： 边框产量方形 pc材料工序投资税收分类 2022 低周疲劳冬季

机器之心AIxiv专栏：全球顶级实验室学术交流与传播平台

日期：2024-11-30 来源：网络整理作者：二手钢材网浏览：349 评论：0

核心提示：由超过一百万个大模型智能体组成的虚拟社会会是什么样的？一个很直观的想法是采用类似「群聊」的模式，但让一百万个智能体同时参与群聊显然不现实。例如，在社交媒体中，信息通道会根据社交网络和推荐算法将个性化内容推送给不同的智能体。Server（环境服务器）中，从而形成闭环模拟真实社交媒体的动态演化过程。

OASIS的共同第一作者为（排名不分先后）：阿卜杜拉国王科技大学（KAUST）访问生、上海人工智能实验室实习生、骆驼人工智能社区实习生、博士生杨子毅大连理工大学学生、上海人工智能实验室实习生张再斌（导师为陆虎川教授）。

通讯作者包括：上海人工智能实验室星奇研究员殷振飞、Egent.AI首席执行官、CAMEL人工智能社区创始人李国豪、上海人工智能实验室青年科学家邵晶。

超过百万个大型模型代理组成的虚拟社会会是什么样子？

近日，上海人工智能实验室联合大连理工大学、牛津大学、马克斯普朗克研究所等国内外机构联合发布了百万级智能交互开源项目OASIS。

该项目构建了一个基于大型模型的通用社交模拟平台，支持多达百万个AI主体的交互。研究人员可以使用 OASIS 轻松模拟复杂社会环境中超大规模 AI 代理的交互。

例如，在社交媒体场景（如、等平台）中研究消息传播、群体极化、羊群效应等经典社会现象。

这些论证研究验证了OASIS作为社交模拟平台的有效性和实用性。同时，OASIS还讨论了智能体社会对大型模型和智能体迈向AGI的技术路径的影响。

虚拟推特生成器__推特模拟器

研究背景

随着大语言模型通用能力的不断提升，基于大语言模型的AI智能体已成为当前人工智能领域的一大研究趋势。从单个智能体的研究到多个智能体相互作用的研究，产生了许多引人注目的成果，如CAMEL[1]、[2]、[3]、[4]等。

然而，现有方法普遍面临以下挑战：

1.规模扩展不足：目前很少有研究将智能体交互数量扩展到数万个，而实现这一目标需要克服复杂的工程挑战。

2.交互形式有限：即使有些工作已经实现了数万个代理交互，但这些交互形式仍然比较初级，通常只能支持简单场景的模拟。

思考OASIS平台的核心问题之一是：“如何设计一个能够支持数万甚至数百万智能体交互模拟的平台？”

一个很直观的想法就是采用类似“群聊”的模式，但让百万个座席同时参与群聊显然是不现实的。

现实生活中，有一个成熟的平台支撑着每天数亿用户的高频交互，那就是社交媒体。

_推特模拟器_虚拟推特生成器

各类社交媒体APP [5]

社交媒体深刻改变了我们的生活、工作和学习方式，也彻底改变了人们的沟通和协作模式。不仅可以支持超大规模用户的高效交互，还可以灵活扩展至各种应用场景。

因此，社交媒体为构建支持大规模代理交互的通用平台提供了理想的基础。

基于这样的认识，OASIS团队从社交媒体的角度设计并搭建了这个平台，旨在充分利用社交媒体的优势，探索并实现智能体的大规模交互与协作。

绿洲框架

_推特模拟器_虚拟推特生成器

OASIS框架的主要特点是：

可扩展性

OASIS是基于社交媒体的基本组件而设计的，因此可以适配不同形式的社交媒体平台，例如X（原创）等，用户可以轻松构建符合自己需求的社交媒体环境。此外，OASIS的模块化设计使得研究人员可以轻松地将其扩展到其他场景，例如城市模拟、人工智能等。这种灵活性使其适合各种研究和应用场景。

支持大规模交互

OASIS在计算资源方面的优化表现尤为突出。例如，使用24块A100 GPU，一周内即可完成百万级智能体的模拟；而对于数万个智能体的交互，只需一颗A100 GPU即可完成。这种高效的性能显着降低了大规模代理研究的门槛。

复杂性和真实性

OASIS支持21种不同的交互动作，包括发帖、转发、点赞、关注、搜索等，充分模拟社交媒体用户的行为。此外，OASIS还集成了推荐系统、动态环境等先进功能，为研究复杂的社会行为提供高度模拟的环境，满足用户多样化的研究需求。

绿洲整体架构

虚拟推特生成器_推特模拟器_

OASIS由以下五个核心组件组成：

1.（环境服务）

环境模块是整个社交媒体环境的核心数据库，负责存储用户、帖子、关注关系等动态信息。该数据支持实时更新，模拟真实社交媒体交互的动态和复杂性。

2.（信息渠道）

（信息通道）会根据当前环境的定义来选择如何在Agent之间传输交互信息。例如，在社交媒体中，信息渠道会基于社交网络和推荐系统获取用户信息、帖子内容、关注关系等数据，并参考开源技术方案构建类似X平台的算法。系统可以根据用户关注点和兴趣推送精准信息。

同时，信息通道是模块化、即插即用的，支持轻松切换到其他平台上的推荐机制（例如），以及其他领域的信息交换机制（例如AI评论和Arxiv机制）。

3.

推荐系统会将选定的帖子推送给代理。代理根据帖子信息采取不同的操作 ()。 OASIS支持多种开源或闭源的大语言模型（LLM），并赋予代理丰富的交互能力，以高度模拟的方式与环境进行交互。

4. 时间

为了模拟社交媒体中的时间概念，OASIS设计了时间序列概率激活模块，通过收集用户发布内容的频率来模拟不同时间点的用户行为，以提高系统的模拟性。

5.

为了支持大规模智能体的高效仿真，OASIS采用多线程调度、负载均衡等技术，在仿真过程中同时运行数百个线程来处理推理任务。这种设计显着提高了推理效率，满足数万甚至数百万智能代理交互的需求。

绿洲工作流程

1. 用户生成

团队通过数据采集和生成获得大规模的用户信息，并将这些信息注册到（环境服务器）中，构建社交媒体环境的基本框架。

2、信息渠道

（环境服务器）将用户、帖子和关系数据传递到（信息通道）。

信息通道根据当前场景的具体环境规则决定如何向其他智能体推送信息。例如，在社交媒体中，信息渠道基于社交网络和推荐算法将个性化内容推送给不同的代理。

3. 代理交互

代理根据推荐内容与环境进行交互，其行为（）会动态更新到（环境服务器），从而形成对真实社交媒体动态演化过程的闭环模拟。

社会模拟实验

研究团队利用OASIS框架在X平台及平台上进行了多项经典社会现象实验，包括新闻传播、群体极化、谣言传播、羊群效应等。

1.消息传播实验

消息传播实验旨在通过OASIS尽可能模拟真实场景，观察是否能够更好地再现消息传播趋势。

研究团队选择开源和数据集，通过API收集数据集中用户的相关信息（如个人资料、历史推文等）。

在实验中，他们重现了200条源推文的传播路径，并将模拟结果与真实数据进行比较和分析，以评估模型的重现性。

_推特模拟器_虚拟推特生成器

研究团队从规模（Scale，指受影响的用户数量）、深度（Depth，指信息传播的渗透程度）、最大广度三个维度分析了模拟结果与真实结果的差距。传播（Max ，指传播路径的最大分支数）。

结果表明，从通信规模和广度来看，仿真结果与真实结果比较接近。但在传播深度方面，模拟结果与真实情况存在一定差距。

这种差距是可以理解的，因为用户建模更加精细，能够更准确地捕捉用户的兴趣偏好和行为特征，从而更有效地反映实际的沟通深度。

2. 群体极化实验

研究团队还利用OASIS模拟了一个经典的社会心理学实验——群体意见极化实验（Group），并将实验场景迁移到平台上。群体极化现象是指用户在交互过程中观点逐渐变得更加极端。

在实验中，团队向 196 位用户发布了一篇有争议的帖子。帖子内容是：“一个已经取得一定成功的作家，是应该冒着收入中断的风险来写出一部精彩的杰作，以增加成名的概率，还是应该维持现状，享受稳定的收入？” ”。

通过这种场景模拟，研究团队对用户多轮互动中的意见进行了问卷调查，记录用户态度的变化趋势。结果如图所示。

虚拟推特生成器__推特模拟器

从实验结果可以看出，随着交互的继续，用户的观点逐渐趋于极端，给出的答案也越来越极端。

团队进一步测试了没有安全护栏的模型和对准后的模型。结果表明，模型的极值趋势明显更加明显。这表明，当去除安全约束后，模型在交互中的观点的极端性将会进一步加剧。

3. 羊群实验

该团队使用 OASIS 的 Agent 模块重现了[6]中发表的一项研究，并探索了羊群现象（）。

羊群效应是指个人追随群体行为或观点的倾向。例如，用户更有可能喜欢有大量点赞的帖子。

该实验是在模拟平台上进行的，该平台仅显示帖子的最终得分（喜欢的数量减去不喜欢的数量）。将帖子分为三组进行对比实验：

通过观察智能体交互后每组帖子最终得分的变化，可以评估初始得分对用户行为的影响。实验结果（如下图所示）表明，最初的“喜欢”显着提高了帖子的最终得分，而最初的“不喜欢”则对得分有抑制作用。这说明用户在决策时受到群体行为的显着影响，进一步验证了羊群效应的存在。

_推特模拟器_虚拟推特生成器

实验结果表明，智能体表现出比人类更强的羊群效应。当最初的评论收到“不赞成”时，代理更有可能继续关注其他人的行为，进一步点击“不喜欢”或更少点击“喜欢”。

4.谣言传播实验

研究团队构建了一个包含100万用户的社交环境，其中核心用户（粉丝数量较多的大V）196人，其余用户为普通用户。

在实验中，论文作者要求分析能力最强的核心用户发布8条消息。这些消息包括4对真假消息，涵盖科技、娱乐、教育、健康等领域。

实验模拟了96分钟的交互过程，每3分钟为一个时间步长。在此期间，团队统计了真假新闻相关帖子数量的变化，以分析真假新闻的传播范围和影响力。

推特模拟器__虚拟推特生成器

实验结果表明，谣言（假新闻）的影响力明显强于真实新闻。这一现象表明，在OASIS构建的主体社会中，虚假新闻的传播规律与人类社会相似[7]，呈现出强烈的虚假新闻倾向。

团队将新的注意力关系可视化，其中绿点代表用户，红线代表新的注意力关系。从可视化结果可以看出，用户之间新的注意力关系表现出明显的聚合效应。

这种现象与谢林的隔离模型（Model）[8]中的群体聚合模型有一定的相似之处。

虚拟推特生成器_推特模拟器_

具体来说，用户倾向于关注与其现有社交网络更接近的用户，从而导致新的关系逐渐形成小网络群体。

5. 不同量级的实验

研究团队还模拟了不同群体规模对实验结果的影响并得出了一些发现。例如，随着群体规模的增加，Agent的观点变得更有建设性，群体行为的趋势变得更加显着。详情请参阅论文。

_推特模拟器_虚拟推特生成器

用户规模越大，用户的观点就越有建设性。

推特模拟器__虚拟推特生成器

用户规模越大，群体行为趋势越明显。

标签： 机器之心AIxiv 学术交流传播智能体交互社交媒体平台研究需求满足

打赏

更多>同类资讯

0 条相关评论

• 滤芯PD/PDP130+2901300106阿托拉斯滤	• 滤芯PD130+2901200405滤芯DD25+阿托拉斯滤
• 不锈钢过滤器不锈钢压缩空气过滤器	• 304L不锈钢过滤器 316L不锈钢过滤器
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器
• JDG800给料机配件无极调速器摆线减速机	• GLD800/7.5给料机锰钢甲带柔性甲带片穿条
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器

机器之心AIxiv专栏：全球顶级实验室学术交流与传播平台

推荐资讯

推荐图文资讯

一艘一万吨的货船一般造价是多少钱？(组图)

英特尔与高通口水战：高通处理器能否挑战英

钢板重量怎么算？钢板理论重量计算公式是什

日照钢铁收购营口中板，中国制造业更是雄居

联发科 Helio G81-Ultra 处理器性能分析：4

有哪些钢材会被用来制造剑呢？这些钢材的优

资讯点击排行

热门标签

推荐视频

最新加入公司