传统的学习与决策模型指出,个体行为的驱动机制在于通过调整对预期奖赏结果的偏差(奖赏预期误差,reward prediction error,reward PEs)来最大化获益。然而,奖赏预期误差所伴随的情绪体验会进一步调控决策过程。例如,面对意外的低额(不公平)提议时产生的厌恶情绪,可能促使个体选择拒绝此类提议,以“惩罚”违背社会规范的提议者,尽管这一行为会以牺牲自身收益为代价(利他惩罚)。该过程已在经典社会决策任务“最后通牒博弈”(Ultimatum Game, UG)中被隐式建模,但目前尚无研究系统地考察情绪和奖赏预期误差影响利他惩罚决策的认知神经机制。基于此,该研究采用改良版的最后通牒博弈范式 [该范式能够量化实际获得奖赏(体验情绪)与预期奖赏(情绪)之间的差异,从而得到reward PEs和情绪预期误差],通过结合功能磁共振成像和多体素模式分析方法,旨在揭示奖赏和情绪预期误差影响利他惩罚决策的神经计算表征差异(图1)。

图1. 研究流程
与以往研究一致,奖赏和情绪预期误差都能显著预测利他惩罚决策;当被试体验到的奖赏或愉悦感低于预期,或唤醒度高于预期时,他们会更倾向于拒绝分配方案。然而,相较于情绪预期误差,奖赏预期误差对利他惩罚决策的驱动作用更显著(图2)。

图2. 奖赏和情绪预期误差对利他惩罚决策的预测作用
而在神经层面,奖赏和情绪评估在单变量和多变量分析中展现出不同的神经表征。具体而言,左侧背内侧前额叶皮层的激活可以表征实际奖赏体验,双侧前脑岛则参与表征实际的情绪体验。此外,奖赏和情绪预期误差的全脑神经表征模式呈现出特异性的分离,而前额叶-脑岛回路的神经表征模式只能识别试次水平奖赏预期误差的变化(图3)。

图3. 奖赏和情绪预期误差的神经表征模式及其差异
同时,在决策阶段,利他惩罚决策相关的神经表征模式与奖赏预期误差的神经表征模式高度相似,但与情绪预期误差的神经表征模式有所不同。具体而言,在被试进行利他惩罚决策前,前额叶-脑岛回路中对违背预期的奖赏价值的激活响应越强,他们越倾向于拒绝不公平的分配方案(图4)。

图4. 奖赏和情绪预期误差神经表征模式对利他惩罚决策的预测作用
综上,该研究为更精确地理解大脑中情绪和奖赏的独特表征及其对社会决策的影响提供了新的视角,并可能对复杂社会情境中奖赏和情绪加工缺陷有关精神病理症状的治疗提供启示。该研究目前已在国际高水平期刊《Communications Biology》(中科院生物学大类1区TOP)发表。心理学部副教授许婷为论文第一作者,香港大学心理学系Benjamin Becker教授为通讯作者,伯明翰大学心理学院副教授张磊、心理学部教授周峰、陆军军医大学医学心理学系教授陈志毅、心理学部博士生张然为本工作做出了重要贡献。该研究得到国家自然科学基金(32250610208, 82271583)和2030重大脑科学与类脑研究项目的资助。
论文信息:Xu, T., Zhang, L., Zhou, F., Fu, K., Gan, X., Chen, Z., ... & Becker, B. (2025). Distinct neural computations scale the violation of expected reward and emotion in social transgressions. Communications Biology, 8(1), 106.