客观日本

【日本AI的未来】曾领跑世界的日本神经元网络研究(上)——访AI研究先驱甘利俊一

2025年04月07日 信息通信

2024年的诺贝尔物理学奖授予了约翰·霍普菲尔德(美国普林斯顿大学)和杰弗里·辛顿(加拿大多伦多大学)。该奖项是对他们在使基于人工神经元网络的机器学习成为可能的发现和发明方面的认可。人工神经元网络正是当今AI的基础。

类似的研究在日本也曾进行国,甚至起步更早。日本国立研究开发法人理化学研究所(以下称“理研”)的甘利俊一先生(荣誉研究员/原脑科学综合研究中心主任)就是该研究的核心人物,他针对此次诺贝尔物理学奖发表了评论,在祝贺两位获奖者的同时,还提到“人工智能和神经元网络理论研究的源头在日本也曾有过……”。

作为本次专访的上篇,我们请甘利先生回顾了曾经的“源头”景象,并请他讲述了那些与当今AI技术相关的研究成果是如何在日本诞生的。

title

理研的甘利俊一先生(荣誉研究员/原脑科学综合研究中心主任),至今仍是活跃在一线的研究学者

20世纪60年代初,年轻研究学者自发组成的研究小组开发了理论

——请您回顾一下AI研究的历史,并谈谈您是从何时开始参与的?

回顾AI研究就会发现,直至今日,它经历了多次热潮和低谷的起伏。

最初的AI研究,是通过编写计算机程序来实现智能的。不过,与此同时,也出现了一种观点:既然人类的大脑是通过学习来获得智能功能的,那么在计算机中构建人工脑神经网络并让其学习,是否就能实现类似人类的智能呢?

这便是美国心理学家弗兰克·罗森布拉特提出的脑型学习机器“感知机”。这大约是在1950~60年代的事情。如今的AI正是这种感知机的进化。

从研究的早期阶段开始,就有人认为应该将其与大脑研究相结合。也就是说,从信息的角度研究大脑的机制,或许能让我们对人工智能有新的发现。

title

“感知机是最初的研究”

我1963年从东京大学完成博士课程,之后前往九州大学任职,我的专业是数理工学。数理工学的理念是,用数学思维去探究世间万物的机制,从而实现理论上的阐释。因此,研究对象可以是任何事物。我自己也研究过很多不同的内容。

我到九州大学任职时,正是罗森布拉特的感知机收到关注的时候。我对在计算机中编写类似神经元网络的程序并让其学习,从而实现模式识别的想法产生了浓厚兴趣。

于是,我和几位数学专业的年轻研究学者一起成立了一个跨学科研究小组,专门研究“感知机”。这是我首次直接参与AI相关的研究。

title

感知机的工作原理(编辑部根据甘利先生的原画绘制)

想出让中间层也能学习的构造

——在那个自发研究小组中诞生的“随机梯度下降法”,与此次诺贝尔物理学奖所认可的研究成果有关,您能简单介绍一下吗?

没错。罗森布拉特设想的学习机器的模型由三层构成,分别是接收输入信号的“输入层”、进行信息转换的“中间层”以及最终做出决策的“输出层”。学习仅在最后一层进行,中间层只负责信息处理。

而我们则构思出了让中间层也能学习的构造。那么,如何让机器在中间层也能学习呢?当时的人工神经元(模拟大脑神经细胞的模型)是开/关的二进制类型,其机制是如果回答错误,就对输出层的元件进行修改,由此实现学习。

title

“大脑神经细胞的输入输出实际上是模拟信号”

而我们想到了“模拟神经元”,即一个神经元不只是处于“开”(1)或“关”(0)的状态,而是可以接收和输出如“3.61”或“0.12”这样连续变化的模拟量。我们认为这样就能让中间层也能进行学习,机器学习也就能更顺利地进行。实际上,真正大脑神经细胞的输入和输出也是模拟信号。

将这个机制应用到神经元网络模型中即可。学习时如果回答错误,无论是在最后输出层还是中间层,在信息接收的连接点处稍微改变模拟量,最终的答案就会稍有变化。通过微分可以了解逐个改变众多参数时答案的变化情况,朝着接近正确答案的方向调整,学习就能不断推进。在数学上,这被称为“梯度”。我们将此内容整理成论文于1967年发表。遗憾的是,当时社会上对人工智能的热情退潮,到了1970年代,这项研究在全球范围内都陷入了低谷。

title

AI研究的历史(供图:日本总务省)

神经元网路的研究,“日本也有源头”

——然后,1970年代后期到1980年代迎来了第二次热潮。

是的。1986年,一篇关于“误差反向传播算法”的论文发表,其机器学习的思路与我们1967年论文中提出的想法完全一致。然而,当时计算机的性能有了显著提升,计算机模拟也能大规模进行,由此掀起了第二次热潮。然而,我们早先提出的理论却完全被遗忘了。

另一方面,日本当时将脑科学和数理信息科学相结合、以数学方法研究大脑的活动变得活跃起来。以东京大学的伊藤正男老师为核心,启动了一个大规模研究大脑的团队项目。他们认为其中也应该纳入理论研究学者,我也因此参与其中。

title

“六七十年代日本是最先进的国家”

福岛先生和我等几位研究学者率先开展了大脑模型的研究。当时的日本提出了各种神经元网络模型,或许在这个领域是最先进的国家。在与AI相关的领域,我们在1970年代构思了“联想记忆”模型。我们思考大脑是如何记忆和回忆事物的,认为大脑可能是通过联想让相关信息浮现出来,于是构建了联想记忆模型并进行了数学公式化。

有趣的是,联想记忆和随机梯度下降法这两项成果,与此次诺贝尔物理学奖被认可的成就相关。虽然并非直接关联,但他们重新发现了我们的想法并加以发展,才有了如今AI的进步。

事实上,如果看了霍普菲尔德的论文,就会发现其中引用了我的论文,但被引用的是没有直接关联的论文。我的联想记忆论文并未被直接引用,引用的是我后来写的关于自组织的论文。我不知道为何会出现这样的引用错误,不过这种事情确实会发生。

——关于此次诺贝尔物理学奖的评论中,您写到“日本也有源头”,这句话有什么含义呢?

此次诺贝尔物理学奖所认可的研究源头之一是随机梯度下降法。虽然该方法看似理所当然,但提出神经元网络的感知机可以用随机下降法进行学习的第一人是我。

正如我前面提到的,霍普菲尔德的联想记忆模型,其实日本之前就提出了相同的模型。中间层深度叠加处理的深度学习机制,也与福岛先生提出的“新认知机”基本相同,这也是日本在1978年左右就已开展的研究。

所以我才写下“日本也有源头”。然而,在写那条评论的初稿时,我曾犹豫要不要直接写成“源头在日本”。但我认为那样可能太狂妄了,毕竟在日本开展研究之前就有罗森布拉特等先驱者,我们也是受到了他们的影响才开展研究的。所以我认为“日本也有源头”的表述更为恰当。

title

甘利先生对2024年诺贝尔物理学奖的评论(供图:理研)

Peter Gruss

甘利俊一

理化学研究所荣誉研究员/原脑科学综合研究中心主任、东京大学名誉教授、帝京大学尖端综合研究机构特聘教授。
1936年1月3日出生,对数理工学的各个方面都很感兴趣,研究内容包括基于拓扑几何学的网络理论、运用微分几何学的连续体力学(物理空间论)、信息论、学习与模式识别、神经元网络理论等。近年来,他提出为统计学、系统理论、信息论等提供共同理论基础的“信息几何学”,并基于此构建了信息数学体系。作为AI研究领域的先驱,在国际上也颇具知名度。曾荣获日本学士院奖、瑞宝中绶章、文化功劳者、文化勋章等多项荣誉。

 

原文:宇津木聪史/JST Science Portal 编辑部
翻译:JST客观日本编辑部

日语原文