物理学“不存在”?诺贝尔物理学奖颁给了计算机学家?(上)
发布人:物理科学与技术学院  发布时间:2024-12-02   浏览次数:54

北京时间108日下午545分,2024年诺贝尔物理学奖揭晓,奖项授予约翰·霍普菲尔德(John J. Hopfield)和杰弗里·辛顿(Geoffrey E. Hinton),以表彰他们在人工神经网络实现机器学习方面的基础性发现和发明。

看到这一消息之后,很多人都会疑惑:机器学习和人工神经网络确实是近几年很火的应用,但这不应该是计算机领域的成就吗?就算得奖也应该是数学和计算机相关的图灵奖,为什么会得诺贝尔物理学奖呢?(辛顿也正是2018年图灵奖得主之一,由此成为历史上第一位诺贝尔奖和图灵奖双料得主

这两位科学家是如何从物理学中汲取灵感,从而为人工神经网络奠定基础的。

IMG_256

2024年诺贝尔物理学奖得主John J. Hopfield(左)和Geoffrey Hinton(右)(图片来源:瑞典皇家科学院)

 Part.1

机器如何能像人类一样学习?

即使很小的孩子也可以指着不同的动物,自信地说出它是狗、猫还是松鼠。他们偶尔会弄错,但很快他们就能做到几乎每次都给出正确的答案。

即使没有看到任何关于动物的图表或解释,孩子也可以学会辨认。在遇到每种类型的动物的几个例子后,不同的类别就会在孩子的脑海中形成。

然而,像识别动物这种对人脑非常简单的事情,计算机却完全不擅长。这是因为,人脑会使用很多超出于逻辑之外的方式来认识或者模拟世界。

早在1943年,神经学家就提出了大脑细胞的协作模型。在他们的模型中,一个神经细胞通过感受来自其他神经细胞的信号,来决定它自己会产生什么信号。

同时人们还发现,大脑的神经细胞是通过“有电”或者“没电”的电信号来进行交流的,这本身是一种二进制信号。也就是说,大脑用许多细胞的二进制信号形成了完整的图像识别功能

IMG_257

天然神经系统和人工神经网络的相似性。关于人工神经网络的理论在几十年前就已形成,但当时人们并没有找到实现它的方法。(图片来源:瑞典皇家科学院)

计算机中使用的也是二进制信号,那么可不可以利用计算机来模拟大脑的神经系统呢?这是人工神经网络artificial neural network)的思想雏形。虽然计算机学家认为这在理论上可行,却完全找不到合适的实现方法。因此,关于人工神经网络的工作在接下来的几十年里鲜有人问津。

IMG_258

神经网络示意图(图片来源:Pixabay

Part.2

水滴和神经网络的共同点

如何解决这一难题?科学家在物理学中获得了灵感。

物质中的每个分子每时每刻都在进行无规则的热运动,但是许多分子集合起来却能表现出整齐划一的磁现象;单个水分子会做出杂乱的流动,但大量水分子集合起来却可以形成整齐的漩涡流动。

这说明,许多物理体系中的集体现象虽然是建立在单个个体的基础之上的,但是会产生完全超越个体的新现象,并且能够稳定存在。

凝聚态物理学家霍普菲尔德由此产生一个大胆的联想:神经网络的本质,不也是和这些集体现象一样吗?单个神经元看似杂乱的行动,却能够产生稳定的图像功能,这就是物理学中不规则的个体所形成的有规律的集体现象的翻版。如果能用规范物理集体的方程来规范我们的计算机二进制节点,那么应该也能实现与大脑的神经网络相似的功能。

于是,霍普菲尔德开始考虑用单个分子的自旋来代替神经元,然后用多个分子体系的总能量来代替神经系统所能产生的状态。在物理学中,系统总是倾向于处于能量最低的状态。他想通过理论计算的方式来证明,这些分子的自旋状态之间相互影响,从而使整个体系处在能量最低态

霍普菲尔德使用了两个古老的方程,其中一个方程描述了原子的磁矩是如何对齐的,另一个用来描述磁铁中的能量分布。在应用了这两个方程之后,他建立一种联想记忆模型,后来被称为霍普菲尔德网络Hopfield neural network)。

霍普菲尔德网络通过向节点输入图像(原始模型中只有30个分子,因此这是一个只有30个点的图像)进行编程,这些节点被赋予10的值。然后使用能量公式调整网络的连接,使这几个分子体系获得低能量。此时,就好比我们的大脑记住了一幅图。

当向分子体系输入另一个状态时,科学家设置了一个逐个遍历节点并检查网络是否具有更低能量的规则。如果一个黑色像素变成白色后能量降低,那么它就会改变颜色。这个过程会一直持续下去,直到能量无法降低,也就是达到了能量最低态。

当达到这一点时,分子体系会呈现出它最初保存的原始图像。这就好比,我们先记住一幅图,然后再看另一幅图,人脑可以清晰地指出这个图与我们记住的图之间有什么不同。

简单地说,霍普菲尔德训练了一个由30个分子组成的体系,让它们学会玩“大家来找茬”游戏。

IMG_259

霍普菲尔德的模型示意图。首先让分子体系记住右下角的图像(字母“J”)。此时,如果将分子体系的状态改成右上角的图,那么每个分子会按照既定的规则更改自身的能量,最终使得整体重新回到右下角的图像。(图片来源:瑞典皇家科学院)

如果你只保存一个模式,这可能看起来并不那么显著。也许你在想,为什么你不只是保存图像本身,并将其与正在测试的另一个图像进行比较,但霍普菲尔德的模型的特殊之处在于,它不仅可以同时保存几幅图片,并且可以对图片进行区分。这就好比,我们的大脑可以同时记住好几张图,然后再判断新看到的图与记住的哪张图类似。

虽然只有30个点,但霍普菲尔德网络成功模拟了大脑的工作模式。这是物理学家对物理现象进行抽象和重新运用得到的结论。

物理现象居然和生物现象有着某种相通的工作方式,不知道是自然界的默契,还是背后有更深刻的原理。

参考文献:

[1]J.J. Hopfield, Proc. Natl. Acad. Sci. USA 79, 2554 (1982).

[2]J.J. Hopfield, Proc. Natl. Acad. Sci. USA 81, 3088 (1984).

[3]J.J. Hopfield and D.W. Tank, Biol. Cybern. 52, 141 (1985).

[4]S.E. Fahlman, G.E. Hinton and T.J. Sejnowski. In Proceedings of the AAAI-83 conference, pp. 109-113 (1983).

[5]D.H. Ackley, G.E. Hinton and T.J. Sejnowski, Cogn. Sci. 9, 147 (1985).