按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
尽管神经网络有这些局限性,它现在仍然显示出了惊人的完成任务的能力。整个领域内充满了新观点。虽然其中许多网络会被人们遗忘,但通过了解它们,抓住其局限性并设计改进它们的新方法,肯定会有坚实的发展。这些网络有可能具有重要的商业应用。尽管有时它会导致理论家远离生物事实,但最终会产生有用的观点和发明。也许所有这些神经网络方面的工作的最重要的结果是它提出了关于脑可能的工作方式的新观点。
在过去,脑的许多方面看上去是完全不可理解的。得益于所有这些新的观念,人们现在至少瞥见了将来按生物现实设计脑模型的可能性,而不是用一些毫无生物依据的模型仅仅去捕捉脑行为的某些有限方面。即便现在这些新观念已经使我们对实验的讨论更为敏锐,我们现在更多地了解了关于个体神经元所必须掌握的知识。我们可以指出回路的哪些方面我们尚不足够了解(如新皮层的向回的通路),我们从新的角度看待单个神经元的行为,并意识到在实验日程上下一个重要的任务是它们整个群体的行为。神经网络还有很长的路要走,但它们终于有了好的开端。
①查尔斯·安德森(charles Anderson)和戴维·范·埃森提出脑中有些装置将信息按规定路线从一处传至另一处。不过这个观点尚有争议。
①该网络以一个早期网络为基础。那个网络被称为“自旋玻璃”,是物理学家受一种理论概念的启发而提出的。
①这对应于一个适定的数学函数(称为“能量函数”,来自自旋玻璃)的(局域)极小值。霍普菲尔德还给出了一个确定权重的简单规则以使网络的每个特定的活动模式对应于能量函数的一个极小值。
①对于霍普菲尔德网络而言,输出可视为网络存贮的记忆中与输出(似为“输入”之误——译者注)紧密相关的那些记忆的加权和。
①在1968年,克里斯托夫·朗格特… 希金斯(Christopher Longuet…Higgins)从全息图出发发明了一种称为“声音全息记录器”(holophone)的装置。此后他又发明了另一种装置称为“相关图”,并最终形成了一种特殊的神经网络形式。他的学生戴维·威尔肖在完成博士论文期间对其进行了详细的研究。
(2)他们和其他一些想法接近的理论家合作,在1981年完成了《联想记忆的并行模式》,由杰弗里·希尔顿(Geoffrey Hinton)和吉姆·安德森编著。这本书的读者主要是神经网络方面的工作者,它的影响并不像后一本书那样广泛。
(1) PDP即平行分布式处理(Parallel Distributed Processing)的缩写。
①更准确他说是误差的平方的平均值在下降,因此该规则有时又叫做最小均方(LMS)规则。
① 29个“字母”各有一个相应的单元;这包括字母表中的26个字母,还有三个表示标点和边界。因而输入层需要29x7=203个单元。
②例如,因为辅音p和b发音时都是以拢起嘴唇开始的,所以都称作“唇止音”。
③中间层(隐层)最初有80个隐单元,后来改为120个,结果能完成得更好。机器总共需要调节大约2万个突触。权重可正可负。他们并没有构造一个真正的平行的网络来做这件事,而是在一台中型高速计算机上(一台VAX 11//780 FPA)模拟这个网络。
①计算机的工作通常不够快,不能实时地发音,因而需要先把输出录下来,再加速播放,这样人们才能听明白。
②塞吉诺斯基和罗森堡还表明,网络对于他们设置的连接上的随机损伤具有相当的抵抗力。在这种环境下它的行为是”故障弱化”。他们还试验以11个字母(而不是7个字母)为一组输入。这显著改善了网络的成绩。加上第二个隐单元层并不能改善它的成绩,但有助于网络更好地进行泛化。
①除了上面列出的以外,NEttalk还有许多简化。虽然作者们信奉分布式表达,在输入输出均有“祖母细胞”即,例如有一个单元代表“窗口中第三个位置上的字母a”。这样做是为了降低计算所需要的时间,是一种合理的简化形式。虽然数据顺序传入7个字母的方式在人工智能程序是完全可以接受的,却显得与生物事实相违背。输出的“胜者为王”这一步并不是由“单元”完成的,也不存在一组单元去表达预计输出与实际输出之间的差异(即教师信号)。这些运算都是由程序执行的。
②这种比较不太公平,因为神经网络的一个单元更好的考虑是等价于脑中一小群相神经元。因而更合适的数字大约是8万个神经元(相当于一平方毫米皮层下神经元的数目)。
①它是由斯蒂芬·格罗斯伯格、托伊沃·科霍宁等人发展的。
①我不打算讨论竞争网络的局限性。显然必须有足够多的隐单元来容纳网络试图从提供的输入中所学的所有东西,训练不能太快,也不能太慢,等等。这种网络要正确工作需要仔细设计。毫无疑问,不久的将来会发明出基于竞争学习基本思想的更加复杂的应用。
'英'弗兰西斯。克里克《惊人的假说》
第十四章 视觉觉知(1)
“宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们不首先学习并掌握书写它们所用的语言和符号,我们就无法理解它们。”
——伽利略
现在让我们总瞰一下到目前为止我们所涉及到的领域。本书的主题是“惊人的假说”——即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里斯托弗·科赫
(Christof Koch)和我认为探索意识问题的最佳途径是研究视觉觉知,这包括研究人类及其近亲,然而,人们观看事物并不是一件直截了当的事情,它是一个建设性的、复杂的处理过程。心理学研究表明,它具有高度的并行性,又按照一定的顺序加工,而“注意”机制则处于这些并行处理的顶端。心理学家们提出过若干种理论试图来解释视觉过程的一般规律,但没有一种更多地涉及脑中神经元的行为。
脑本身是由神经元及大量支持细胞构成的。从分子角度考虑每个神经元都是一个复杂的对象,常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学和化学信号快速地作出反应,并将它们的高速电化学脉冲沿轴突发送出去,其传送距离通常比细胞体直径还要大许多倍。脑中的这些神经元数目巨大,它们有许多不同的类型。这些神经元彼此具有复杂的连接。
与大多数现代计算机不同,脑不是一种通用机。在完全发育好以后,脑的每一部分完成某些不同的专门任务。而另一方面,在几乎所有的反应中,都有许多部分相互作用。这种一般性观念得到了人脑研究的支持,这些研究包括对脑损伤者的研究以及使用现代扫描方法从头颅外进行的对人脑的研究。
视觉系统的不同的皮层区的数目比人们所预料的要多得多。它们按一种近似等级的方式连接而成。在较低级的皮层区,神经元到眼睛的连接最短,它们主要对视野中一小块区域中的相对简单的特征敏感,尽管如此,这些神经无也受该区域所处的视觉环境影响。而较高级皮层区的神经元则对复杂得多的视觉目标(如脸或手)有反应,对该物体在视野中的位置并不敏感。(目前看来)似乎并不存在单独的皮层区域与视觉觉知全部内容相对应。
为了理解脑如何工作,我们必须发展出描述神经元集团间如何相互作用的理论模型。目前这些模型对神经元进行了过分的简化。尽管现代计算机比其上一代在运算速度上快得多,也只能对数目很少的一群这类简化神经元及其相互作用进行模拟。尽管如此,虽然这些不同类型的简化模型仍显原始:却经常表现出一些令人吃惊的行为。这些行为与脑的某些行为有相似之处。它们为我们研究脑所可能采取的工作方式提供了新的途径。
以上是背景知识。在此基础上,我们着手解决视觉觉知问题,即:如何从神经元活动的角度来解释我们所看见的事物。换句话说,视觉觉知的“神经关联”是什么?这些“觉知神经元”究竟位于何处呢?它们是集中在一小块地方还是分散在整个脑中?它们的行为是否有什么特别之处?
作为开始,让我们首先回顾一下第二章曾概述的各种观点。视觉觉知究竟包括哪种心理学处理过程呢?如果我们能够找出这些不同的处理过程在脑中的确切位置,那或许会对定位我们所寻找的觉知神经元有所帮助。
菲力普·约翰逊… 莱尔德认为,脑和现代计算机一样,具有一个操作系统。该操作系统的行为与意识相对应。他在著作《心理模型》(Mental Medels)一书中,从更加广阔的背景下提出了这一思想。他认为,有意识和无意识过程的区别在于后者是脑中高度的并行处理的结果。正如我已在视觉系统中所描述的那样,这种并行处理就是大量的神经元能够同时工作,而不是序列式地一个接一个地处理信息。这才能使有机体有可能进化成具有特殊的、运转快速的感觉、认知及运动系统。而更为序列式的操作系统对所有这些活动进行全局控制,这样才能够快速、灵活地作出决定。粗略地打个比方,这就好像一个管弦乐队的指挥(相当于操作系统)控制着乐队所有成员同时演奏一样。
约翰逊…莱尔德假定,虽然这个操作系统可以监视它所控制的神经系统的输出,它能利用的只是它们传递给它的结果,而不是它们工作的细节。我们通过内省只能感觉到我们脑中所发生的情形的很少的一部分。我们无法介人能产生信息并传给脑的操作系统的许多运作中。因为他将操作系统视为主要是序列式的,所以他认为,“在内省时,我们倾向于迫使本来是并行的概念进入序列式的狭窄束缚中。”这是使用内省法会出现错误的原因。
约翰逊…莱尔德的观点表达得很清楚,又很有说服力。但是,如果我们希望从神经的角度理解脑,还必须要识别该操作系统的位置和本质。它不一定与现代计算机的许多特性相一致。脑的操作系统可能并不是清晰地定位于某一特殊位置上。从两种意义上说,它更像是分布式的:它可能涉及脑中相互作用的若干分离的部分,而其中某一部分的活动信息又会分散到许多神经元。约翰逊… 莱尔德对脑的操作系统的描述使人多少想起丘脑,但是丘脑的神经元太少了,以致于无法表达视觉觉知的全部内容(虽然这是可以验证的)。似乎更有可能的是,在丘脑的影响下新皮层的部分神经元(而不是全部神经元)可以表达视觉觉知。
我们寻找的觉知的神经关联会处于脑功能等级的哪个阶段呢?约翰逊… 莱尔德认为,操作系统处在处理等级的最高层次,而雷·杰肯道夫认为觉知与中间层次有更多联系。究竟哪种观点更合理呢?
杰肯道夫关于视觉觉知的观点①是基于戴维·马尔(Davidmarr) 的2。5维图而不是三维模型的思想的(大致说是第六章所描述的以观察者为中心的可见表面的表象)。这是由于人们直接感受到的只是视野中物体呈现的那一侧;物体后面存在看不见的部分则仅仅是推测。另一方面,他相信对视觉输入的理解(即我们感觉到的是什么)是由三维模型和“概念结构”(conceptua1 structure,是思维的另一种堂皇的说法)决定的。以上就是他的意识的中间层次理论。
下面的例子会有助于理解这个理论。如果你看见一个背对着你的人,你只能看见他的后脑勺,而看不见他的脸。然而,你的脑会推断出他有一张脸。我们会这样进行推理,因为如果他转过身来,表明他的头的正面并没有脸,你会感到十分惊讶的。以观察者为中心的表象是与你所看见的他的头的后部相对应的。这是你所真实感觉到的。你的脑所做出的关于其正面的推断是从某种三维模型表象得到的。杰肯道夫认为你并不直接察觉这个三维模型(就此而言,同样你也没有直接察觉你自己的思想)。正如一句古诗所说:未闻吾所言,安知吾所思?
由于初读杰肯道夫的著作①时不容易理解他的语言,我把他的理论的倒数第二种说法放在脚注中。②如果我对他的理论的理解是正确的话,他的观点应用于视觉即是“形态上的差异”(包括一个视觉目标的位置、形状、颜色、运动等)是与一种短时记忆有关(或由它引起/支持/投射)的表象,这种表象是一种“胜者为王”机制(一种选择机制)的结果,而注意机制的作用则使它更加