谷歌让-12-个-AI-大模型攒局玩“大富翁”：Claude3.5-爱合作-GPT-4o-最“自私”

宁德时代：宜春锂矿暂停开采正积极申请延续许可证恢复生产最新进展 具身智能机器人利好消息不断，机构看好这些细分领域太强大了 算力硬件股震荡走强胜宏科技再创历史新高官方通报来了 环保设备行业财务总监CFO观察：仕净科技张丽华大专学历薪酬为66万元上涨20% 而公司归母净利润下滑456%又一个里程碑 直击WRC｜能投影，会陪伴！动易科技新品人形机器人亮相 专家已经证实 汇量科技早盘涨逾11% 机构看好程序化广告仍保持较高增长 不到两岁的基金播客，有了成长的烦恼？ 宇树王兴兴：人形机器人最快在1-2年迎来“ChatGPT时刻”官方通报来了 永顺煤矿网络竞价销售公告是真的吗？ 财付通注册资本由153亿增至223亿，增幅约46% 博瑞医药定增被受理将于上交所上市官方处理结果 环保设备行业财务总监CFO观察：盈峰环境王庆波违规收到2次警示函薪酬却高达120万元涨幅达50% 环保设备行业财务总监CFO观察：碧兴物联王进违规收到1次警示函 2024年薪酬57万元 兴证研究 • 本周重点报告(8.4-8.10)后续来了 宇信科技赴港上市收到证监会反馈意见：需说明控股股东认定、股权质押及业务资质等问题 环保设备行业财务总监CFO观察：皖仪科技周先云54岁最年长学历大专 2024年薪酬46万元 宇树王兴兴：人形机器人最快在1-2年迎来“ChatGPT时刻”实时报道 李大霄：长钱入市正在进行学习了 永顺煤矿网络竞价销售公告 新华联合投资达成复牌指引 8月12日上午起复牌 富智康集团授出2723.8万股奖励股份实时报道 突然爆雷！知名AI软件供应商股价暴跌超25%！学习了 穆迪首席经济学家：美国经济衰退迫在眉睫，关税收入绝非长久之计秒懂 Coreweave和Circle，两大美国“IPO妖股”将迎来财报检验，就在今天官方通报 金价承压回落，关注今晚美CPI数据指引最新报道 流动性紧缩冲击来袭？分析师预警：美债发行“抽走”资金，9月恐成市场压力临界点后续反转 韩国大企业CEO平均年龄首次降至60岁以下最新进展 通达集团附属认购若干兴业银行理财产品这么做真的好么？ 富智康集团授出2723.8万股奖励股份官方通报 利空情绪释放，橡胶板块或维持偏强震荡格局 A股两融余额再回2万亿！该贪婪还是恐慌？反转来了 泰达生物附属医数精诚与深算院签署生态合作协议最新进展 利空情绪释放，橡胶板块或维持偏强震荡格局记者时时跟进 韩国大企业CEO平均年龄首次降至60岁以下秒懂 大唐新能源前7个月累计完成发电量约2135.63万兆瓦时同比增加11.75%后续反转 消息称花旗CEO访问墨西哥，讨论子公司上市可能性实测是真的 博雷顿计划回购公司H股学习了 万兴科技，宣布赴香港IPO，冲刺A+H | A股公司香港上市 娃哈哈砍掉年销300万以下经销商，部分并入大经销商引发款项纠纷秒懂 宇树王兴兴：AI创新永远伴随随机性，机器人领域需要全球共创后续反转 学费1.4万涨到2.8万，是否“充分告知”是关键 临近9.3限产炒作，钢价何去何从？ 首发对话实录 | 王兴兴，谈宇树上市意义！官方已经证实 卫昶：人形机器人很热，希望能够真正静下心来把技术打磨好官方通报来了 京东何晓冬：打造机器人购买首选平台 唐山独立轧钢企业将于2025年8月9日起实施限产措施又一个里程碑 申万机械：“世界天路”新藏铁路即将开工官方已经证实 11万股东深夜惊雷！刘益谦旗下*ST天茂拟主动退市，昔日“法人股大王”为何自断A股生路？最新进展 “全球关注”，普京将“创造历史” 俄罗斯西南部一建筑发生燃气爆炸已致16人受伤实测是真的 景林二季报暗藏玄机：砍苹果押俄版谷歌，206亿腾挪有术 临近9.3限产炒作，钢价何去何从？是真的吗？ 最高法重拳整治高利贷、砍头息，叫停银行“随意抽断贷”行为官方通报来了 11万股东深夜惊雷！刘益谦旗下*ST天茂拟主动退市，昔日“法人股大王”为何自断A股生路？专家已经证实 四川实现离境退税“即买即退”多省市口岸互认 时隔4年，葛兰再限购专家已经证实

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于 Claude 3.5 Sonnet 的智能体，就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”，只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体，这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似，但相对简单，玩家只需要对手中的“资源”做出处置。这当中，虽然每个玩家心里都有各自的小九九，但作者关注的目标，是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏，真名叫做 Donor Game（捐赠博弈）。

在这过程中，作者关注的是各模型组成的智能体群体的表现，因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些，就是 GPT 和 GPT 坐一桌，Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体，它们各自手中都握有一定量的“资源”，系统会从这 12 名玩家中随机抽取 2 个，分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者，受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说，捐赠者每花费掉一份资源时，受赠者都可以获得两份，这也是总体资源能够增加的来源。

不过对于单个个体而言，选择不进行捐献，在短期内的收益会更高。

在做决定之时，捐赠者能够知道受赠者之前做出的决定，从而判断是否要捐赠。

这样的“捐赠”，每一代中一共会进行 12 次，一轮结束后，手中资源量排在前 6 名的智能体可以保留至下一代。

同时，下一代会产生 6 个新的智能体，这 6 个新智能体会从留下的 6 个智能体那里学习策略，但同时为了差异化也会引入随机变异。

包括初始的一代在内，基于每个模型产生的智能体，都会进行十轮迭代。

谷歌让