客观日本

捕捉1毫秒动作的机械眼,革新智能系统(上)

2020年01月14日 机械/机器人

电视之类的影像是通过连续不断地显示静态图像从而让其看起来流畅变化。每秒显示的图像通常为30帧或者60帧左右,这是根据人眼的能力而设定的。如果以比这远远快得多的速度来捕捉生活中的现象,那么又会是怎样的一番景象呢?东京大学研究生院信息理工学系研究科的石川正俊教授实现了以每秒1000帧的速度来拍摄和处理图像的机械眼“高速视觉”,并探索由此带来的各种新的可能。JST ACCEL项目经理岸则政与石川教授正在合作构建高速视觉平台,并以其开创新的价值。

捕捉1毫秒动作的机械眼,革新智能系统

以高速视觉来捕捉世界
培育并推广新的价值之芽

拍摄或播放视频时,表示每秒显示的图像张数称为帧速率(fps)。就人眼而言,以30fps左右的帧速率显示的动作看起来是流畅的,实现高清图像的8K影像规格中除了30fps和60fps外,还配备了120fps的规格。“高速视觉”则是利用机械眼能以远远高于这个规格的速率来动作继而使得1000fps成为了可能。

东京大学研究生院信息理工学系研究科石川正俊教授介绍说:“以1000fps的速率捕捉影像,能获得高速移动物体的更为完整的信息”。例如,如果以30fps的速率来拍摄时速150公里的球,只能每隔140cm左右捕捉到一次球的影像,而140cm之间球的移动只能依靠推算(图1)。但若是以1000fps来拍摄的话,则每隔约4cm就能捕捉到一次球的移动影像,故而能够更加准确地掌握球的实际运动轨迹。由于无需推算,还可以缩短处理时间,能实现很多以前无法实现的事。

捕捉1毫秒动作的机械眼,革新智能系统

■图1:以30fps拍摄时速为150公里的球时,拍摄间隔约为140cm。而如果是1000fps,则能以约4cm的间隔获得球的动作轨迹。以30fps拍摄时,在140cm之间发生了什么需要靠推测,但1000fps的话则可以获得球的实际运动轨迹,无需通过复杂的计算推测。

石川教授接着说:“高速视觉不仅仅是高速拍摄技术。从拍摄到图像处理,再到反馈给机器人的动作等只需要几毫秒的时间”。通过分别在1毫秒内驱动以相机为首的感知系统/识别系统(传感器技术)和处理系统(计算机技术),以及马达等为首的运动系统和动作系统(驱动器技术),进而实现能实时适应现实世界变化的全新智能系统。

石川教授强调说,高速视觉研究“不同于传统的科学研究手法”。传统的科学研究往往是为了解决某个课题而进行调查研究,然后开发出相应的技术。与此不同,高速视觉的研究则并没有明确的待解决具体课题,而是立足于高速视觉,探索以前从未想到过的各种可能,从而创造出新的价值。石川教授充满期望地表示:“我们搭建高速视觉平台,并向社会推出以此为基础而实现的智能系统。其价值如同巨浪,会波及到很多领域。我们希望籍此建立起一个崭新的世界”。

从自动驾驶到墙面检查
多领域磨练技术

在汽车图像处理应用方面拥有多年经验的ACCEL项目经理岸则政介绍了高速视觉技术比较容易理解的应用案例之一:自动驾驶。他说“例如,自动刹车技术是通过观测汽车周围的物体并预测其接下来移动而工作的,因此对于突然闯入的物体,自动刹车有时无法及时反应。而高速视觉则能以1毫秒的周期来分析和判断周围的情况,并且能瞬间控制刹车动作”。除此之外,高速视觉项目瞄准的应用范围还包括生物·医疗/检测与工厂自动化(FA)、高速人机交互、交通、高速扫描存档及公共安全等众多领域(图2)。

捕捉1毫秒动作的机械眼,革新智能系统

■图2:高速视觉的应用领域。高速视觉的基础技术(平台)可应用于众多领域。

岸则政介绍说:“高速视觉项目的目的是通过新技术给人以启迪。为此,通过介绍新技术的具体应用可能,让更多的人思考如何使用这一新技术至关重要。我们的战略不是设想某一个用途然后去精益求精,而是要进入很多不同的领域,并不断提高这些领域所需要的相关技术”。以这个战略为基础,项目组开发出了追踪球等动态物体并使其始终位于画面中心的拍摄技术,以及在移动或伸缩的物体上显示影像的动态投影等的多项技术(图3、4)。

捕捉1毫秒动作的机械眼,革新智能系统

■图3:高速追踪技术。可以自动追踪高速移动的乒乓球的运动并拍摄,能清楚观察到球的旋转。对图像进行解析,通过高速驱动反射镜片而使得球始终位于图像中心。

捕捉1毫秒动作的机械眼,革新智能系统

■图4:动态投影技术。能够配合人的动作,在其所穿的T恤正面投射图像。能检测到布料的伸缩状态,并瞬间调整所要投影的图像。

在隧道中边行驶边检查墙壁(图5)是备受期待的应用技术之一。目前项目组以实际应用为目标正与中日本高速道路公司共同推进相关实验。以往实施隧道安全检查时要事先封锁公路,现在利用高速视觉技术,只要让配备了相机的检查车辆以正常速度行驶就可边行走边拍摄,并且能高精度地检测出隧道内是否出现裂痕等情况。从时速100公里的车上拍摄隧道墙壁,即使以1000fps拍摄,每两帧之间也会间隔约3厘米。为此,通过高速驱动反射镜片,使通过的位置始终处于画面中央,从而消除移动所带来的影响,拍出不模糊的图像。

捕捉1毫秒动作的机械眼,革新智能系统

■图5:在时速100公里行驶的同时能检测出隧道内宽仅为0.2毫米的裂纹。通过高速驱动反射镜持续捕捉对象,能抑制车辆移动所造成的画面模糊。有望消除拥堵、提高检查频率和作业效率等。

这是一项划时代的检测技术,可以避免因限制交通而引起的交通拥堵等,还能降低成本,有望增加检测频度。要想实现该技术,不仅是高速图像处理,还需要实现产品的小型化以便配备到车辆上,而且需要在低照度下进行拍照,以免妨碍到隧道内其他车辆的行驶。包括这些周边技术在内,目前正在全面推进,稳步走向实用化。(未完待续)

日文原文

原文:JSTnews 2019年11月号
翻译·编辑:JST客观日本编辑部