本文来自微信公众号:神经现实 (ID:neureality),来源:新墨西哥大学,译者:范范,校对:老司橘,编辑:Soda,题图来自:视觉中国
人每天都在做无数选择。它可能是个复杂艰难的抉择——去新城市工作还是留在原地?它也可以很简单,比如选择去尝试新餐厅还是回最爱的老地方?决策的过程塑造了我们对于身处的世界有怎样的了解与认知。
这些或简单或复杂的选择通常是在两者之间:我们熟悉的、基本知道从中能得到什么的事物;以及尝试新的、却不知道有何后果的事物。可当我们在做出其中一个选择的时候,大脑里究竟在发生些什么呢?
新墨西哥大学心理学系的助理教授杰瑞米·霍格文在他最新发表于《神经元》期刊的论文中详细探究了这一问题的答案。
这一研究是新墨西哥大学(UNM)与俄勒冈健康与科学大学(OHSU)的合作项目,研究分析了猕猴的模型数据及使用功能性磁共振成像技术(fMRI)获取的人类观测数据。
论文题目:The neurocomputational bases of explore-exploit decision-making;DOI:https://doi.org/10.1016/j.neuron.2022.03.014
这篇名为《“探索-利用”型决策的神经计算基础》的文章探究了灵长类动物和人类在信息最大化(探索)和优先已知回报(利用)之间进行选择时的大脑活动。
“这就是‘探索’和‘利用’的权衡。尽管探索行为对健康的决策是至关重要的,但究竟为什么动物会选择探索新的事物,而不惜放弃熟悉的回报——这是我们领域中一个长久不衰的迷。”霍格文解释说。
“我们希望可以解出那些能激励‘探索-利用’决策的大脑计算机制。”
霍格文所说的“大脑计算机制”指的是我们大脑中的神经元通过复杂的神经网络(正如计算机主板电路一样)进行的运算过程。而霍格文的团队想要问的是,大脑对不确定性的容忍度究竟有多少?这些大脑环路会更重视即时且已知的回报,还是更倾向于激发鼓励对新事物的探索?
通过在模拟测试中对“探索-利用”型决策过程进行计算机建模,该团队发现对未来收益的估算会鼓励对新选项的尝试,在成年人类和恒河猴中都是如此。这一被称为“部分可观察马尔可夫决策过程”*的多学科模型,可以用来评估无数现实情境下的决策过程。
*译者注:部分可观察马尔可夫决策过程(Partially Observable Markov Decision Process,缩写:POMDP),是一种通用化的马可夫决策过程,它假定决策者并不完全地获取信息,用于解决不完美观察下的顺序决策问题。
接下来的一步就是分别在OHSU收集猕猴的数据,以及在UNM和心理研究网络研究所(Mind Research Network)收集人类进行决策任务时的fMRI数据。实验对象面对3个选项,他们只有有限的机会了解每个选项对应的价值,而且随着时间推移,其中一个选项会被随机替换。
不确定性总伴随着新选项出现,因为它的回报价值无法预测,唯一能了解的方式就是去探索它。
使用这些方法,霍格文和他的团队成功地将计算模型和fMRI数据融合,从而看到了一个部分相交、部分独立的神经网络在交流和运算着“探索”和“利用”的价值,成功地绘制出了整个大脑的决策过程。
“有趣的是,这涉及了不同的价值信号在一些灵长类动物高度演化的脑区中的独特编码方式,比如外侧前额叶皮层在‘探索’中的激活程度就比在‘利用’中更高。”
本质上,大脑中像外侧前额叶皮层那样(从演化角度而言)较“新”的区域,在做出陌生的选择时被激活更多;而更“旧”的大脑系统,包括杏仁核及眶额叶皮层,在权衡“探索”和“利用”两者价值的过程中展现出更高活性。
这意味着大脑中新的和旧的神经环路在决策过程中共同协作,而非像我们之前所想的那样互相对抗。
重叠和不同的网络代表着新颖性和探索性,University of New Mexico
这一项目在跨物种灵长类动物的研究以及从科研到临床的干预上都有不错的前景。
此外,据霍格文说,当我们的决策过程可能受到影响时(比如脑部受到创伤),这种对“探索-利用”决策的研究对于了解和使用针对神经环路的药物或经颅神经刺激来治疗相应的大脑失调都十分重要。但想要了解受损的大脑如何工作,科学家首先必须了解正常的大脑怎样运行。
“一些对公众健康影响重大的大脑失调患者也会出现‘探索-利用’型决策的损伤。”霍格文说。
“在我看来——这也是基于这一领域很多其他人的想法——许多精神病、神经性疾病或神经退行疾病的患者面临的一些问题很可能就与过分‘探索’和过分‘利用’的决策特征相关。”
原文:https://neurosciencenews.com/explore-exploit-decisions-20420/
本文来自微信公众号:神经现实 (ID:neureality),来源:新墨西哥大学,译者:范范,校对:老司橘,编辑:Soda