AI

认知科学如何推动人工智能的发展

Posted by Surflyan on 2018-05-10

导言

人工智能一直致力于用计算机来实现人类的智能所能完成的任务,经过数代人的努力,现在的人工智能已经取得了一定的成绩,但距离真正的人类智能还很遥远。而要想获得更近一步的成果,回归认知科学,从神经科学借鉴经验,已经是众多业内人士的共识。可以说,认知时代的人工智能依赖于脑科学、生命科学和心理学等学科的发现。

下面从两个例子具体说明认知科学如何推动人工智能的发展。

1. 从生物神经元到 M-P 神经元模型

M-P 神经元模型,源于发表于 1943 年的一篇极具创新性的论文。两位作者分别是神经生理学家沃伦·麦克洛克(McCulloch)和数学家沃尔特·皮茨(Pitts),论文描述了神经元的时间总和、域值等特征。首次实现用一个简单电路(感知机, 尽管感知机的定义时候来提出的)来模拟大脑神经元的行为。

由于是模仿生物神经元结构和工作原理而建立的模型,因此先了解下生物神经元的结构,如下图:

生物神经元 [来源:维基百科]

神经网络中的最基本元素——神经元(neuron)模型。在生物神经网络中,每个神经元与其它神经元,通过突触联接。神经元之间的“信息”传递,属于化学物质传递的。当它“兴奋(fire)”时,就会向与它相连的神经元发送化学物质(神经递质, neurotransmiter),从而改变这些神经元的电位;如果某些神经元的电位超过了一个“阈值(threshold)”,那么,它就会被“激活(activation)”, 也就是“兴奋”起来,接着向其它神经元发送化学物质,犹如涟漪,就这样一层接着一层传播。根据生物神经网络的结构和特点,McCulloch 和 Pitts 提出了逻辑运算上的模型,即 M-P 模型。下图是一个 M-P 模型的示意图:

人工神经元

将生物神经元结构与人工神经元进行对比:

这样定义之后,一个神经元膜电位总和的表示便是:

一个神经元是否被激活,取决于输入信号总和是否超过阈值。只有当输入信号总和超过阈值 $\theta_j$ 时,神经元才会被激活而产生兴奋,即产生输出信号。

2. 从神经科学到计算机视觉

如何像人类大脑一样完成一项视觉任务是复杂的,比如深度感知、目标跟踪、边缘检测等,而扫描环境和定位是大脑经常做的事情,这些都被人们认为是理所当然的事情。神经科学为理解大脑功能提供了大量医学案例,如著名的 Phineas Gage 病例。同样的,计算机视觉受神经科学启发影响,而这一领域的奠基之作正是 Hubel 和 Wiesel 的研究成果。

1981 年,Hubel 和 Wiesel 因“关于视觉系统中信息处理的发现”获得了诺贝尔生理学或医学奖,他们在上世纪 50 年代晚期测试了猫的视皮质细胞。Hubel 和 Wiesel 进行的经典实验旨在帮助我们理解沿着视觉通路的神经元如何从视网膜上的光线模式中提取越来越复杂的信息来构建图像。在实验中,他们把微电极埋进猫的视皮质细胞,之后在屏幕上打出一些光影和图形。通过固定猫的头部,他们能轻易控制视网膜上的成像,并测试细胞对线条、直角、边缘线等图形的反应。透过放大器和扬声器,他们甚至能听到细胞启动的声音。他们的工作揭示了视觉皮质神经元如何编码图像特征,这些物体的基本属性有助于我们建立我们对周围世界的看法。

提及计算机视觉,就不能不介绍 Marr 的视觉计算理论,Marr 的视觉计算理论立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论。Marr 建立的视觉计算理论, 使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展。

在 60 年代开始之初,已经有很多人研究视觉神经生理学、心理学问题,也有人做一些边缘检测的工作。但关于视觉到底要解决哪些问题、是怎么实现的,大家莫衷一是,谈不清楚,David Marr 的第一个贡献就是分出了三个层次。在 Marr 看来,要从不同的层次去进行信息处理的研究,视觉过程主要包括三个阶段:

  • 第一阶段:将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图;

  • 第二阶段:在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图;

  • 第三阶段:在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。

David Marr 是从这个神经科学和脑科学这个方向来的,他提出的上述方法是强有力的,它使视觉信息科学得以迅速发展壮大。

认知科学中的人工智能

认知科学的核心原则是,如果不分析多层次的思想,就不可能获得对大脑的完整理解。换句话说,必须使用许多技巧来充分评估和理解人类思维过程。人工智能是一种强大的方法,可以使认知科学的研究人员通过人脑的计算建模来研究行为。有许多方法来模拟思维如何构建,包括从创建和观察人造神经元到代表思维作为规则,符号和计划的高层次集合。

人工智能中的认知科学

除了模拟智能来模拟和研究人的思维外,人工智能还涉及机器中认知现象的研究,并试图在计算机程序中实现人类智能的各个方面。这些程序可以用来解决各种复杂的问题,其目标是比人类更有效地做到这一点。认知科学领域的新理论常常影响更好地模拟人类思维过程的改进的人工智能智能体。认知科学的成就有助于改善人类思维的人工模拟。反过来,更精确的人工智能为认知科学研究人员提供了更好的人类思维模型。尽管认知科学和人工智能的目标不同,但两个领域之间的合作对他们的成功至关重要。认知科学人工智能指的是与这些领域重叠的跨学科研究,试图实现认知科学和人工智能目标。

人工智能应从神经科学中借鉴想法和思路—Geoff Hinton。AI 要达到像科幻小说描述的那样还需要很长的路,因为我们了解的人类的智慧还不够。特别是,需要脑神经科学进一步的发展才能够让我们更了解人类的大脑,人类的智慧,从而创造出更智慧的属于人造的智能。

参考文献

[1] Kenneth D. Forbus,AI and Cognitive Science: The Past and Next 30 Years,2010
[2] Samantha Luber,Cognitive science artificial intelligence: Simulating the human mind to achieve goals,2011
[3] McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5(4): 115-133.
[4] Hubel, D. H. & T. N. Wiesel. Receptive Fields, Binocular Interaction And Functional Architecture In The Cat’s Visual Cortex, Journal of Physiology, (1962), 160, 106–154