谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

作者:news 发表时间:2025-08-12
宁德时代:宜春锂矿暂停开采 正积极申请延续许可证恢复生产最新进展 具身智能机器人利好消息不断,机构看好这些细分领域太强大了 算力硬件股震荡走强 胜宏科技再创历史新高官方通报来了 环保设备行业财务总监CFO观察:仕净科技张丽华大专学历 薪酬为66万元上涨20% 而公司归母净利润下滑456%又一个里程碑 直击WRC|能投影,会陪伴!动易科技新品人形机器人亮相 专家已经证实 汇量科技早盘涨逾11% 机构看好程序化广告仍保持较高增长 不到两岁的基金播客,有了成长的烦恼? 宇树王兴兴:人形机器人最快在1-2年迎来“ChatGPT时刻”官方通报来了 永顺煤矿网络竞价销售公告是真的吗? 财付通注册资本由153亿增至223亿,增幅约46% 博瑞医药定增被受理 将于上交所上市官方处理结果 环保设备行业财务总监CFO观察:盈峰环境王庆波违规收到2次警示函 薪酬却高达120万元涨幅达50% 环保设备行业财务总监CFO观察:碧兴物联王进违规收到1次警示函 2024年薪酬57万元 兴证研究 • 本周重点报告(8.4-8.10)后续来了 宇信科技赴港上市收到证监会反馈意见:需说明控股股东认定、股权质押及业务资质等问题 环保设备行业财务总监CFO观察:皖仪科技周先云54岁最年长 学历大专 2024年薪酬46万元 宇树王兴兴:人形机器人最快在1-2年迎来“ChatGPT时刻”实时报道 李大霄:长钱入市正在进行学习了 永顺煤矿网络竞价销售公告 新华联合投资达成复牌指引 8月12日上午起复牌 富智康集团授出2723.8万股奖励股份实时报道 突然爆雷!知名AI软件供应商股价暴跌超25%!学习了 穆迪首席经济学家:美国经济衰退迫在眉睫,关税收入绝非长久之计秒懂 Coreweave和Circle,两大美国“IPO妖股”将迎来财报检验,就在今天官方通报 金价承压回落,关注今晚美CPI数据指引最新报道 流动性紧缩冲击来袭?分析师预警:美债发行“抽走”资金,9月恐成市场压力临界点后续反转 韩国大企业CEO平均年龄首次降至60岁以下最新进展 通达集团附属认购若干兴业银行理财产品这么做真的好么? 富智康集团授出2723.8万股奖励股份官方通报 利空情绪释放,橡胶板块或维持偏强震荡格局 A股两融余额再回2万亿!该贪婪还是恐慌?反转来了 泰达生物附属医数精诚与深算院签署生态合作协议最新进展 利空情绪释放,橡胶板块或维持偏强震荡格局记者时时跟进 韩国大企业CEO平均年龄首次降至60岁以下秒懂 大唐新能源前7个月累计完成发电量约2135.63万兆瓦时同比增加11.75%后续反转 消息称花旗CEO访问墨西哥,讨论子公司上市可能性实测是真的 博雷顿计划回购公司H股学习了 万兴科技,宣布赴香港IPO,冲刺A+H | A股公司香港上市 娃哈哈砍掉年销300万以下经销商,部分并入大经销商引发款项纠纷秒懂 宇树王兴兴:AI创新永远伴随随机性,机器人领域需要全球共创后续反转 学费1.4万涨到2.8万,是否“充分告知”是关键 临近9.3限产炒作,钢价何去何从? 首发对话实录 | 王兴兴,谈宇树上市意义!官方已经证实 卫昶:人形机器人很热,希望能够真正静下心来把技术打磨好官方通报来了 京东何晓冬:打造机器人购买首选平台 唐山独立轧钢企业将于2025年8月9日起实施限产措施又一个里程碑 申万机械:“世界天路”新藏铁路即将开工官方已经证实 11万股东深夜惊雷!刘益谦旗下*ST天茂拟主动退市,昔日“法人股大王”为何自断A股生路?最新进展 “全球关注”,普京将“创造历史” 俄罗斯西南部一建筑发生燃气爆炸 已致16人受伤实测是真的 景林二季报暗藏玄机:砍苹果押俄版谷歌,206亿腾挪有术 临近9.3限产炒作,钢价何去何从?是真的吗? 最高法重拳整治高利贷、砍头息,叫停银行“随意抽断贷”行为官方通报来了 11万股东深夜惊雷!刘益谦旗下*ST天茂拟主动退市,昔日“法人股大王”为何自断A股生路?专家已经证实 四川实现离境退税“即买即退”多省市口岸互认 时隔4年,葛兰再限购专家已经证实

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。

在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。

不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。

在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。

这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。

同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。

包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

谷歌让

相关文章