Page 151 - 信息的脉络
P. 151
·第三部分·
家系统的兴起和神经网络让人们看到了新的希望。
神经网络在工程应用上真正有实用意义的重大突破发生于 1957 年。康奈尔大
学的实验心理学家罗森布拉特在一台 IBM 704 计算机上模拟实现了一种他发明的
叫作“感知机”(Perceptron)的神经网络模型。感知机神经网络模型引起科学界
的关注,并且得到了以美国海军为首的多个组织的资助。
罗森布拉特发明感知机是受到人脑中神经元处理信息的方式的启发。一个神
经元就是大脑中的一个细胞,它能够接收与之相连的其他神经元的电或化学输入
信号。简单地说,一个神经元把它从其他神经元接收到的所有输入信号加起来,
如果达到某个特定的阈值水平,它就会被激活。重要的是,一个给定的神经元与
其他神经元的不同连接(突触)有不同的强度,当计算信号输入总和的时候,给
定的神经元会给弱连接分配较少的权重,而将更多的权重分配给强连接的输入。
神经科学家认为,弄明白神经元之间的连接强度是如何调整的,是了解大脑如何
学习的关键。
受大脑神经元网络的启发,罗森布拉特提出可以应用感知机网络来执行视觉
任务,如人脸和物体识别。
明斯基认为以大脑为灵感的亚符号人工智能研究方法就是一条死胡同,而且
正从更有价值的符号人工智能的研究中“窃取”研究资金。在《感知机》一书中,
明斯基和佩珀特对于是否能够设计出一种成功的、用来学习多层神经网络权重设
置的算法持怀疑态度,符号人工智能阵营的其他人也持此态度。在《感知机:计
算几何学导论》一书里,明斯基和派普特使用数学方法,证明了感知机在处理线
性可分的数据时,其学习过程可以使得权重收敛到一个稳定值,换句话说就是感
知机处理线性可分问题是可行的。但是他们同时也指出了感知机的致命弱点:“感
知机能解决线性可分的问题,但是它也仅仅能解决线性可分的问题。”两位教授
同样用数学方法,证明了感知机,更准确地说是单层的感知机并不能处理非线性
数据的分类问题,其中最典型的就是“异或问题”。
明斯基在书中最后给出了他对多层感知机的评价和结论:“研究两层乃至更
多层的感知机是没有价值的。”因此,多层感知机在没来得及被大家深入探究之
前,就被明斯基直接判处了死刑。1971 年,年仅 43 岁的罗森布拉特丧生于一次划
船事故。
也是在这个时候,神经网络上取得了新的进展,一个典型的事件是 1989 年,
杨立昆(Yann LeCun)在 AT & T Bell 实验室验证了一个反向传播在现实世界中的
杰出应用,即“反向传播应用于手写邮编识别”系统,这个系统能很精准地识别
各种手写的数字。但很不幸的,展开这类算法所需要的计算能力和数据那时候并
• 135 •