客观日本

NEC开发弱标签学习法,图像识别AI的追加学习,创建数据时间缩短75%

2022年07月01日 信息通信

NEC与理化学研究所开发出了提高图像识别用人工智能(AI)开发效率的方法。让AI学习新物体的识别方法时,只需为其追加有关物体的正确答案示例即可。由此可以将创建学习数据所需时间缩短至原来的几分之一。该方法的主要对象为工程现场和工厂使用的图像识别AI。

在图像识别AI的开发中,负担比较大的工作是由人创建用于AI学习的附带正确答案(标签)的数据。比如为了开发识别车辆类型的AI,需要为图像中的车辆贴上“乘用车”或“出租车”等标签。通过大量读取并学习带标签的图像,AI即使遇到新的图像也能识别出车辆的类型。

title

在这项工作中,常用的学习方法是为所有要识别的对象贴标签的“完全标签学习”法。让可以识别乘用车和出租车的AI新学习“摩托车”时,除了图像中的摩托车外,还要为已经学习过的乘用车和出租车贴标签创建正确答案示例。这样虽然容易开发出高精度AI,但创建学习数据时需要大量的时间和精力。

对此,研究人员探索了让AI代替人创建学习数据,以及用少量数据实现高精度学习等代替手段。其中一种方法是,仅为追加对象(摩托车)张贴标签来创建学习数据的“弱标签学习”法,其优点是可以大幅缩短张贴标签所需的时间。

然而,在弱标签学习法中,AI有时会将没有标签的乘用车和出租车识别为“背景”,而不是车辆,因此存在图像识别精度降低等问题。为使正确答案示例与AI的回答的差值接近于0,研究人员调整了AI学习公式,但弱标签学习会发生差值变为负数等意想不到的变化。学习结果不稳定,很难提高AI的精度。

因此,此次在AI的公式中添加了避免差值随着学习的进展而变为负数的项目,使得学习结果变得稳定。利用可识别80种物体的AI估算确认,创建增加一个识别对象的学习数据所需的时间缩短至原来的四分之一。

title

识别精度也比以往的弱标签学习有所提高。在识别0至9的手写数字的问题上,此前的弱标签学习AI的平均正确率为83.09%,而改良版提高至88.63%。识别车和船等10种物体的问题的平均正确率也由29.57%提高至49.98%。

NEC打算将该技术用于开发负责工程现场的工作改善、危险行为监督以及工厂部件检查等的AI。

日文:寺冈笃志、《日经产业新闻》,2022/6/22
中文:JST客观日本编辑部