老鼠和 AI 居然学会了同一套 “队友法则”!《科学》证实:合作不是本能是最优解

在日常生活中,我们大概都经历过那种“心有灵犀一点通”的默契时刻,比如打篮球时的空中接力,或者玩双人游戏时的完美配合。当然,我们肯定也没少遇到过那些让人血压飙升的“猪队友”——你明明已经准备好大招了,他却在旁边梦游。人类社会能够运转,几乎完全依赖于“合作”这种行为。但你有没有想过,当我们与他人合作时,大脑里究竟发生了什么?
是大脑里的某个开关被打开了吗?我们是如何判断队友的意图,并在一瞬间决定是“等等他”还是“自己先上”的?
长期以来,神经科学家们都在试图寻找这种复杂社会行为背后的生物学基础。最近,来自加州大学洛杉矶分校(UCLA)的研究团队在顶刊《科学》(Science)上发表了一项重磅研究。他们不仅在小鼠的大脑中找到了控制合作的关键神经回路,还做了一件更有意思的事:他们训练了一群人工智能(AI)智能体来做同样的任务。结果令人惊讶——AI为了达成合作目标,竟然“自发”演化出了和生物大脑几乎一模一样的策略和神经机制。
这不仅揭示了“神配合”背后的秘密,也让我们看到生物智能与人工智能在底层逻辑上的惊人一致性。
1. 给老鼠设计的“双人成行”游戏
为了搞清楚合作的本质,研究人员首先得设计一个必须靠“两个人”配合才能通关的游戏。他们设计了一个特殊的实验箱,中间用透明隔板隔开,两边各有一只老鼠。规则很简单:两只老鼠必须在极短的时间窗口内(比如0.75秒),几乎同时去触碰各自区域的一个“鼻触口”(Nose-poke port),才能同时获得水的奖励。
如果一只老鼠先碰了,另一只没跟上,那大家都别想喝水。这就像是我们要两个人同时转动钥匙才能打开保险箱一样,极其考验同步性。
如图所示,这套装置让两只小鼠既能通过视觉看到对方,又能通过嗅觉和触觉感知对方(隔板上有孔)。

Figure 1
起初,这些小鼠只是各自为战,但在经过长达数周的训练后,神奇的事情发生了:76%的小鼠组合学会了合作。特别是其中41%的“高水平组合”,它们的配合默契度简直令人咋舌,其同步触碰的精准度远超随机水平。随着训练的深入,它们不仅成功率(Correct trials)越来越高,而且那种只有一只老鼠瞎忙活的“失误”(Miss trials)也大幅减少。但是,这就引出了一个关键的科学问题:它们是真的学会了“配合队友”,还是只是各自训练出了一个固定的节奏(比如每隔5秒按一下),然后碰巧撞在了一起?
为了验证这一点,科学家做了一个巧妙的“重新洗牌”测试。他们打乱了小鼠的数据,模拟如果它们互不理睬、只按自己节奏来的情况。结果发现,真实实验中的成功率远高于这种模拟情况。这说明,小鼠们绝对不是在“盲打”,而是在**积极地协调(Active Coordination)**彼此的动作。
更有力的证据来自“拉窗帘”实验。当研究人员把中间透明的隔板换成不透明的板子,挡住小鼠的视线,切断它们之间的视觉交流后,它们的合作成功率瞬间暴跌。这直接证明了:能看见队友,获取队友的信息,是达成“神配合”的绝对前提。
2. “神队友”的自我修养:学会等待与确认
既然确定了小鼠是在真合作,那么问题来了:它们具体用了什么招数来达成同步呢?为了看清动作细节,科学家动用了先进的AI动作捕捉技术(SLEAP),对小鼠的每一帧动作进行了微秒级的分析。
分析结果揭示了成为“神队友”的三大核心策略,这些策略随着训练次数的增加而变得愈发熟练:
2.1 靠近(Approach)
首先是位置上的准备。小鼠会更频繁地主动从远处跑向中间的隔板区域(社交区),让自己处于随时可以行动的位置。这听起来很简单,但这是一种意图的展示。2.2 等待(Waiting)
这是区分“大神”与“菜鸟”的分水岭。数据显示,高水平的小鼠学会了一项极其违背本能的行为——克制。当一只动作快的小鼠先到达鼻触口时,它不会急着把头伸进去(因为那样会导致任务失败),而是会停下来,“Hold”住自己的动作,耐心地等待动作慢的同伴赶上来。如图所示,这种“等待行为”在正确试次(Correct trials)中出现的频率远高于错误试次,且随着训练天数的增加,小鼠等待的时间越来越长,表现得越来越有耐心。

Figure 2
2.3 互动(Interaction)
这是最精彩的部分。在行动前的最后几秒,两只小鼠会隔着有孔的板子进行“头对头”的互动。它们会互相触碰鼻尖,就像两名特种兵在行动前互相对视点头确认一样。这种互动行为在训练后期暴涨了近160%。
如图的数据清晰地展示了这一趋势:随着训练的进行,靠近、等待和互动这三种行为的时长和频率都在显著上升。更重要的是,在那个看不见队友的“不透明隔板”条件下,等待和互动几乎完全消失了。这说明,小鼠的这些策略完全是基于对同伴状态的实时观测而做出的理性决策,而不是僵化的肌肉记忆。
3. 大脑中的“合作指挥部”:前扣带回皮层(ACC)
找到了行为策略,科学家们的下一步是挖出控制这些策略的大脑区域。他们将目光锁定在了前扣带回皮层(ACC)。在人类和灵长类动物中,这个区域已知与社会决策、同理心以及预测他人行为有关。
研究人员使用微型显微镜技术,实时记录了小鼠在进行合作任务时ACC区域成千上万个神经元的活动。结果令人振奋:大脑里真的存在专门负责“合作”的神经元!
3.1 你的位置,由于我的大脑来编码
研究发现,ACC中有一类特殊的神经元,它们不关心“我”在哪,只关心“队友”在哪。当队友靠近鼻触口时,这些神经元会疯狂放电;而当视线被阻挡看不到队友时,这些神经元的活动就沉寂了。更有趣的是,一只小鼠的合作表现越好,它大脑里这类“关注队友位置”的神经元就越多。这简直就是“默契”的神经学证据——所谓默契,就是你的大脑里时刻装着队友的位置信息。
3.2 “按住不动”与“立刻行动”的二选一
还记得刚才提到的“等待”策略吗?神经记录显示,ACC能够极其精准地编码这种决策过程。科学家们发现了两组截然不同的神经元:
“按兵不动”神经元(Hold cells):当我到了但队友没到时,这组神经元被激活,抑制冲动,告诉身体“再等等”。
“立刻行动”神经元(Proceed cells):当检测到队友也到位了,这组神经元瞬间爆发,发出“冲”的指令。
为了验证ACC是否真的是“指挥部”,科学家们使用了光遗传学技术(一种可以用光来控制神经元开关的技术)。当他们在关键时刻人为抑制ACC的活动时,小鼠的合作成功率立刻下降,它们不再能够精准地等待队友,变得像无头苍蝇一样各自乱撞。这一锤定音地证明了:ACC就是那个让小鼠能够理解队友状态并抑制自身冲动的核心中枢。
4. 殊途同归:AI竟然“进化”出了同样的脑回路
如果说小鼠的合作本能是千万年进化的产物,那么在没有任何生物学预设的情况下,从零开始训练的人工智能(AI)会如何应对同样的挑战呢?为了回答这个问题,研究团队构建了一个多智能体强化学习(MARL)模型,让两个AI智能体在一个虚拟的网格世界里玩同样的“双人鼻触游戏”。
在这个虚拟世界里,AI没有被告知任何关于“配合”的规则,它们唯一的目标就是想办法拿到更多的奖励。
4.1 硅基大脑的“重演”
令人震惊的结果出现了:AI不仅很快学会了合作,而且它们“无师自通”地采用了和小鼠一模一样的策略。如图所示,经过训练的AI智能体在行动的同步性上表现极佳,哪怕没有复杂的交流语言,它们也能配合得天衣无缝。

Figure 3
更深入的分析(如图所示)揭示了它们是如何做到的:当发现队友离目标还很远时,跑得快的AI会主动停下来,甚至稍微后退一点(Idle or move backward),表现出了典型的“等待行为”。

Figure 4
这说明,“等待”并不是生物独有的情感或本能,而是在多智能体系统中,为了实现共同利益最大化而涌现出的最优数学解。
4.2 惊人一致的“神经网络”
更令人起鸡皮疙瘩的是,当科学家像解剖大脑一样“解剖”AI的神经网络时,他们看到了熟悉的画面。在AI那由代码构建的“大脑”深处,竟然也自发分化出了两组功能明确的神经元(人工神经元):
“队友监视”神经元:这些单元专门负责计算队友离目标的距离,而且这种计算只在合作模式下开启,在单打独斗模式下则处于关闭状态。
“决策”神经元:AI网络内部也自然演化出了负责“Hold”(等待)和“Proceed”(行动)的专用单元。
研究人员做了一个残酷的测试(如图所示):他们人为地“删掉”了AI网络中负责“Hold”决策的那几个神经元。结果,这个原本聪明的AI瞬间变成了“猪队友”,它不再懂得等待,总是急匆匆地冲上去导致任务失败。这种由于神经元缺失导致的行为崩塌,与在小鼠ACC区域进行抑制实验的结果简直如出一辙。
这一发现具有极大的启示意义:无论是碳基生物(大脑)还是硅基智能(AI),在面对相似的社会协作挑战时,为了解决问题,竟然会独立进化出几乎完全相同的计算策略和神经架构。这不仅验证了生物大脑机制的普适性,也为未来开发更懂得“人情世故”、能与人类更好协作的AI提供了全新的蓝图。
5. 结语:通往“人机共生”的未来钥匙
这项研究最让人深思的,莫过于这种跨越物种、甚至跨越生命形式的“殊途同归”。它告诉我们,合作可能不仅仅是一种情感或道德选择,更是一种在复杂环境中生存的最优算法。无论是拥有数亿年进化史的大脑,还是刚刚诞生几十年的神经网络,只要目标是“共赢”,它们都会不约而同地找到那条通往协作的必经之路——关注同伴,抑制冲动。
对于人类而言,这不仅让我们更深刻地理解了自身“社会性”的生物学根源,也为治疗自闭症等社交认知障碍提供了新的靶点——也许某些“社恐”或社交障碍,正是因为大脑中那个负责“关注队友位置”或“抑制冲动”的开关出了问题。
而对于正在飞速发展的人工智能领域,这项发现更是意味深长。未来的AI不应只是算力强大的冷血机器,我们希望它们能成为人类的“神队友”。如果我们能将这种基于生物学原理的“合作回路”植入机器人的大脑,或许在不久的将来,无论是自动驾驶汽车在十字路口的默契避让,还是家庭机器人在厨房里的得力帮手,都能让我们体验到那种“心有灵犀”的完美配合。
在这个万物互联的时代,理解合作的本质,或许就是我们通向更高阶智能文明的入场券。
论文信息
标题:Neural basis of cooperative behavior in biological and artificial intelligence systems.
论文链接:
发表时间:2026-1
期刊/会议:Science (New York, N.Y.)
作者:Mengping Jiang, Linfan Gu, Mingyi Ma, ..., Weizhe Hong
超能文献原文链接:
作者:超能文献(suppr.wilddata.cn)