通过AI算法模仿人类大脑!DeepMind正在研究多巴胺奖励系统

摘要

我们大脑中的多巴胺奖励系统是我们大脑中最重要的系统之一。它是我们日常生活中的上瘾、专注和许多其他活动的基础。神经科学的研究人员几十年来一直对研究该系统的路径感兴趣。现在,人工智能研究人员正利用目前用于人工智能的数学算法,在大脑内部运行的路径之间建立联系。神经科学证据和人工智能算法之间的这种联系可以帮助人工智能研究人员在我们迈向通用人工智能的过程中开发更复杂的算法。我们的大脑奖励系统是由大脑结构

我们大脑中的多巴胺奖励系统是我们大脑中最重要的系统之一。它是我们日常生活中的上瘾、专注和许多其他活动的基础。神经科学的研究人员几十年来一直对研究该系统的路径感兴趣。现在,人工智能研究人员正利用目前用于人工智能的数学算法,在大脑内部运行的路径之间建立联系。神经科学证据和人工智能算法之间的这种联系可以帮助人工智能研究人员在我们迈向通用人工智能的过程中开发更复杂的算法。

我们的大脑奖励系统是由大脑结构和神经通路组成的集合,负责奖励相关认知,如联想学习、动机、欲望和快乐。你选择喜欢一个物体而不是另一个物体的能力是由于大脑用积极的情绪来奖励你,使你能够将这种“类似”内在化。

多巴胺奖励系统,或中边缘通路和中皮层多巴胺途径是大脑奖励系统的核心。多巴胺是一种神经递质,用于激活人类大脑的奖赏区域。根据大脑某些区域的多巴胺水平,你会感受到诸如“动机”、“快乐”和“欲望”等感觉。

这一途径始于大脑的腹侧颞区( VTA )。中脑边缘途径将伏隔核连接到 VTA 。核心是大脑中与动机和奖励密切相关的区域。

当你经历一些有益的事情时, VTA 中的多巴胺神经元被激活,并通过中脑边缘途径使伏隔核中的多巴胺水平升高。

这就是你感觉得到回报的时候。

另一种途径,介皮层通路开始于 VTA ,然后将前皮质连接到 VTA 。

当你体验到一些有益的东西时, VTA 中的多巴胺神经元会被激活,并通过中皮层通路从一个复杂的神经调节系统投射到前端皮质内。

这就是你在情感上得到回报的时候。

从历史上看,神经科学家认为多巴胺水平直接使我们感到愉悦。但是,近年来的研究表明,多巴胺是在获得奖励之前释放的。人们认为,多巴胺的作用是分配环境刺激和增加寻求奖励的重要性。

DeepMind 的研究人员在《自然》杂志上发表了一篇论文,发现有证据表明,人工智能算法中的“分布式强化学习”模拟了大脑中的多巴胺奖励系统。

根据 MIT 技术评论, Distribution 强化学习将未来奖励的概率作为一种分配更加准确。它是 DeepMind 在其研究中发展缓慢的一种算法。在这一特定的研究中, DeepMind 的研究人员探索了这样的假设: Dopamine 神经元是否也以同样的分配方式预测报酬?

他们对小鼠进行了实验,并观察到神经元的释放模式与每次“不同结果”的模式是一致的。

这一发现是非常重要的,因为多巴胺调节在无数的心理健康状况,以及我们的动机和情绪调节。它也证明了我们在人工智能领域的直觉常常可以瞥见我们的身体是如何运作的。

在未来的几年里,我们可能会看到在人工智能算法和我们大脑内部工作之间产生更多这种联系。随着我们越来越接近通用人工智能,这是神经科学和人工智能研究者的交叉,生物发现和系统发现的重复将导致令人兴奋的发现。

匿名

发表评论

匿名网友