宁德时代:宜春锂矿暂停开采 正积极申请延续许可证恢复生产最新进展
具身智能机器人利好消息不断,机构看好这些细分领域太强大了
算力硬件股震荡走强 胜宏科技再创历史新高官方通报来了
环保设备行业财务总监CFO观察:仕净科技张丽华大专学历 薪酬为66万元上涨20% 而公司归母净利润下滑456%又一个里程碑
直击WRC|能投影,会陪伴!动易科技新品人形机器人亮相
专家已经证实
汇量科技早盘涨逾11% 机构看好程序化广告仍保持较高增长
不到两岁的基金播客,有了成长的烦恼?
宇树王兴兴:人形机器人最快在1-2年迎来“ChatGPT时刻”官方通报来了
永顺煤矿网络竞价销售公告是真的吗?
财付通注册资本由153亿增至223亿,增幅约46%
博瑞医药定增被受理 将于上交所上市官方处理结果
环保设备行业财务总监CFO观察:盈峰环境王庆波违规收到2次警示函 薪酬却高达120万元涨幅达50%
环保设备行业财务总监CFO观察:碧兴物联王进违规收到1次警示函 2024年薪酬57万元
兴证研究 • 本周重点报告(8.4-8.10)后续来了
宇信科技赴港上市收到证监会反馈意见:需说明控股股东认定、股权质押及业务资质等问题
环保设备行业财务总监CFO观察:皖仪科技周先云54岁最年长 学历大专 2024年薪酬46万元
宇树王兴兴:人形机器人最快在1-2年迎来“ChatGPT时刻”实时报道
李大霄:长钱入市正在进行学习了
永顺煤矿网络竞价销售公告
新华联合投资达成复牌指引 8月12日上午起复牌
富智康集团授出2723.8万股奖励股份实时报道
突然爆雷!知名AI软件供应商股价暴跌超25%!学习了
穆迪首席经济学家:美国经济衰退迫在眉睫,关税收入绝非长久之计秒懂
Coreweave和Circle,两大美国“IPO妖股”将迎来财报检验,就在今天官方通报
金价承压回落,关注今晚美CPI数据指引最新报道
流动性紧缩冲击来袭?分析师预警:美债发行“抽走”资金,9月恐成市场压力临界点后续反转
韩国大企业CEO平均年龄首次降至60岁以下最新进展
通达集团附属认购若干兴业银行理财产品这么做真的好么?
富智康集团授出2723.8万股奖励股份官方通报
利空情绪释放,橡胶板块或维持偏强震荡格局
A股两融余额再回2万亿!该贪婪还是恐慌?反转来了
泰达生物附属医数精诚与深算院签署生态合作协议最新进展
利空情绪释放,橡胶板块或维持偏强震荡格局记者时时跟进
韩国大企业CEO平均年龄首次降至60岁以下秒懂
大唐新能源前7个月累计完成发电量约2135.63万兆瓦时同比增加11.75%后续反转
消息称花旗CEO访问墨西哥,讨论子公司上市可能性实测是真的
博雷顿计划回购公司H股学习了
万兴科技,宣布赴香港IPO,冲刺A+H | A股公司香港上市
娃哈哈砍掉年销300万以下经销商,部分并入大经销商引发款项纠纷秒懂
宇树王兴兴:AI创新永远伴随随机性,机器人领域需要全球共创后续反转
学费1.4万涨到2.8万,是否“充分告知”是关键
临近9.3限产炒作,钢价何去何从?
首发对话实录 | 王兴兴,谈宇树上市意义!官方已经证实
卫昶:人形机器人很热,希望能够真正静下心来把技术打磨好官方通报来了
京东何晓冬:打造机器人购买首选平台
唐山独立轧钢企业将于2025年8月9日起实施限产措施又一个里程碑
申万机械:“世界天路”新藏铁路即将开工官方已经证实
11万股东深夜惊雷!刘益谦旗下*ST天茂拟主动退市,昔日“法人股大王”为何自断A股生路?最新进展
“全球关注”,普京将“创造历史”
俄罗斯西南部一建筑发生燃气爆炸 已致16人受伤实测是真的
景林二季报暗藏玄机:砍苹果押俄版谷歌,206亿腾挪有术
临近9.3限产炒作,钢价何去何从?是真的吗?
最高法重拳整治高利贷、砍头息,叫停银行“随意抽断贷”行为官方通报来了
11万股东深夜惊雷!刘益谦旗下*ST天茂拟主动退市,昔日“法人股大王”为何自断A股生路?专家已经证实
四川实现离境退税“即买即退”多省市口岸互认
时隔4年,葛兰再限购专家已经证实
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。
而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。
每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

12 个智能体组一桌游戏
作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。
在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。
再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。
每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。
捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。
也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。
不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。
在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。
这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。
同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。
包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

