客观日本

用技术维护网络秩序,SNS公司提高监视AI精度

2022年12月16日 信息通信

SNS(社交平台)公司正在推进内容审核技术的开发。人工智能(AI)可瞬间识别互联网上大量发布的内容,被判断为有害的内容将会被自动屏蔽。还可对应暧昧的表述。预计网络活动和网络交流今后将进一步扩大,如何维护网络空间的“秩序”再次成为迫切课题。

title

各SNS公司一方面加强监视,另一方面维持言论自由的平衡

SNS运营商等主体对发布内容进行监视与删除的做法被称为“内容审核”,诽谤中伤、虚假信息、暴力等有害内容将被停止公开。7月发生的对前首相安倍晋三的枪击暗杀事件中,犯罪嫌疑人就被认为是参考了网络上的信息而制造出了枪支,从预防犯罪的观点出发,针对有害内容的对策必不可少。

监管网络上发布的大量内容,关键在于AI的进步。运营新闻网站等平台的雅虎,就将使用基于AI的代表性方法——深度学习的自然语言处理技术和其独有的超级计算机“kukai”来进行监管。

上述系统通过自然语言处理读取发布内容,对过度批评、诽谤中伤、歧视等项目的相符程度进行评分。达到一定标准后就会自动删除,即使未达到标准,分数高的内容也会被进行人工二次审核。

研究人员将雅虎专业团队的巡查监视结果等作为正确数据让AI学习,旨在再现人的判断。AI的模型会随时改善,以提高判断的妥当性和适应性。该公司负责人称,从判定评论违规到删除所需的时间为“1秒或最迟数秒内。帖子发布后会立即被删除”。

当用户发布的内容中有较多的表述及个人相关内容时,与人工监视一样,能在多大程度上正确解读是否违规已成为一大课题。运营Instagram和Facebook的美国Meta(前身为Facebook)公司针对仇恨言论,开发了一种不使用教学数据、由AI对其平台上数百万条内容进行直接学习的技术。

仇恨言论含有俚语、讽刺等表达方式,其含义和语境易随时间的推移发生变化,但该公司的技术有望高精度地检测出是否违规。4~6月,在收到人工报告前AI就已处理的仇恨言论数量占Facebook处理总数的96%。与2018年同期的53%相比,检测精度有所提升。

在SNS平台上,用户为避免被检测到违规,故意拼写错误、不使用特定词语等“兜圈子”现象也反复出现。AI能在多大程度上正确解读发文意图,能否掌握顾及言论自由的智慧呢?技术进步掌握着实现安心、安全的网络社会的钥匙。

最后需要人类的判断

title

美国企业家埃隆·马斯克收购美国Twitter后,内容审核再度引发关注。如同马斯克早前曾不满Twitter对推文内容的监管太严格一样,在言论自由的平衡掌握上,各SNS公司一直面临着艰难的判断。

围绕袭击美国议会事件、俄罗斯入侵乌克兰等事件出现了大量虚假信息。各国政府都在加强管控,各公司也被越来越多地问及对策强化的计划。AI的精度在逐年提高,已经能够实现不间断监视人工无法应对的大量内容,并根据指导方针瞬间进行自动删除,将来会应用得越来越多。

然而,无论技术多么先进,最终都离不开人工的判断。在言论自由和安全性之间的微妙界限问题上,对AI的设计、最终的删除标准等进行深思熟虑十分重要。

眼下美国大型IT公司正进行大规模裁员。有报道称,此举对内容审核的影响令人担忧,实际负责人权等事务部门的人员被大幅削减。能否坚持不懈地致力于人工参与,将决定技术和网络社会能否健康发展。

日文:水口二季、《日经产业新闻》、2022/11/25
中文:JST客观日本编辑部