Page 203 - 信息的脉络
P. 203

·第三部分·
               张图像搭建了一个人脸识别系统。但这种模型在只有 50 张图像的数据集上却没法
               运行。不过事实证明,如果你有 50 个非常好的数据,也可以做出有价值的东西,
               如缺陷检查系统。在许多根本不存在巨型数据集的行业,吴恩达认为重点必须从
               大数据转向优质数据。例如,只需要 50 个经过深思熟虑的实例就足以向神经网络
               解释人们想要它学会什么。

                   杨立昆(Yann LeCun)提出了另一种思路,即自监督学习思路。
                   杨立昆说,对于深度神经网络,“我最不喜欢的描述是‘它像大脑一样工作’,
               我不喜欢人们这样说的原因是,虽然深度学习从生命的生物机理中获得灵感,但

               它与大脑的实际工作原理差别非常大。将它与大脑进行类比给它赋予了一些神奇
               的光环,这种描述是危险的。这将导致天花乱坠的宣传,大家在要求一些不切实
               际的事情。人工智能之前经历了几次寒冬就是因为人们要求了一些人工智能无法
               给予的东西”。

                   杨立昆在 IEEE 一次采访中表示,深度阐述了他的自监督学习思路,他认为
               AI 想要突破现在的瓶颈,必须让机器学习世界模型,从而能够填补缺失的信息,
               预测将要发生的事情,并预测行动的影响。监督学习的局限性有时会被误以为是

               深度学习的局限性,这些限制可以通过自监督学习来克服。杨立昆提到,人类和
               动物能够通过观察,简单的交互,以及无监督的方式学习世界知识,因此可以假设,
               这里面蕴含的潜在能力构成了常识的基础。这种常识能够让人类在陌生的环境下
               完成任务,如一位年轻的司机,从来没有在雪地里开过车,但是他却知道如果车
               开得太猛,轮胎会打滑。

                   早在几十年前,就有学者研究人类、动物甚至智能系统如何“借力”世界模型,
               自我学习。因此,当前 AI 也面临着重新设计学习范式和架构,使机器能够以自我
               监督的方式学习世界模型,然后使用这些模型进行预测、推理和规划。

                   世界模型需要融合不同的学科的观点,包括但不限于认知科学、系统神经科学、
               最优控制、强化学习以及“传统”人工智能。必须将它们与机器学习的新概念相结合,
               如自监督学习和联合嵌入架构。
                   构建世界模型的一个关键挑战是如何使该模型能够表示多个模糊的预测。现

               实世界并不是完全可以预测的:一个特定的情况可能有多种演变的方式,并且许
               多与情况相关的细节与手头的任务无关。例如,人们可能需要预测开车时周围的
               汽车会做什么,但不需要预测道路附近树木中个别叶子的详细位置。那么,世界
               模型如何学习现实世界的抽象表示,做到保留重要的细节、忽略不相关的细节,

               并且可以在抽象表示的空间中进行预测呢?
                   杨立昆的愿景需要更深入地探索,而且前方还有许多艰巨的挑战。其中,最


                                                    • 187 •
   198   199   200   201   202   203   204   205   206   207   208