科学研究 - 用技术维护网络秩序，SNS公司提高监视AI精度

SNS（社交平台）公司正在推进内容审核技术的开发。人工智能（AI）可瞬间识别互联网上大量发布的内容，被判断为有害的内容将会被自动屏蔽。还可对应暧昧的表述。预计网络活动和网络交流今后将进一步扩大，如何维护网络空间的“秩序”再次成为迫切课题。

各SNS公司一方面加强监视，另一方面维持言论自由的平衡

SNS运营商等主体对发布内容进行监视与删除的做法被称为“内容审核”，诽谤中伤、虚假信息、暴力等有害内容将被停止公开。7月发生的对前首相安倍晋三的枪击暗杀事件中，犯罪嫌疑人就被认为是参考了网络上的信息而制造出了枪支，从预防犯罪的观点出发，针对有害内容的对策必不可少。

监管网络上发布的大量内容，关键在于AI的进步。运营新闻网站等平台的雅虎，就将使用基于AI的代表性方法——深度学习的自然语言处理技术和其独有的超级计算机“kukai”来进行监管。

上述系统通过自然语言处理读取发布内容，对过度批评、诽谤中伤、歧视等项目的相符程度进行评分。达到一定标准后就会自动删除，即使未达到标准，分数高的内容也会被进行人工二次审核。

研究人员将雅虎专业团队的巡查监视结果等作为正确数据让AI学习，旨在再现人的判断。AI的模型会随时改善，以提高判断的妥当性和适应性。该公司负责人称，从判定评论违规到删除所需的时间为“1秒或最迟数秒内。帖子发布后会立即被删除”。

当用户发布的内容中有较多的表述及个人相关内容时，与人工监视一样，能在多大程度上正确解读是否违规已成为一大课题。运营Instagram和Facebook的美国Meta（前身为Facebook）公司针对仇恨言论，开发了一种不使用教学数据、由AI对其平台上数百万条内容进行直接学习的技术。

仇恨言论含有俚语、讽刺等表达方式，其含义和语境易随时间的推移发生变化，但该公司的技术有望高精度地检测出是否违规。4～6月，在收到人工报告前AI就已处理的仇恨言论数量占Facebook处理总数的96%。与2018年同期的53%相比，检测精度有所提升。

在SNS平台上，用户为避免被检测到违规，故意拼写错误、不使用特定词语等“兜圈子”现象也反复出现。AI能在多大程度上正确解读发文意图，能否掌握顾及言论自由的智慧呢？技术进步掌握着实现安心、安全的网络社会的钥匙。

最后需要人类的判断

美国企业家埃隆·马斯克收购美国Twitter后，内容审核再度引发关注。如同马斯克早前曾不满Twitter对推文内容的监管太严格一样，在言论自由的平衡掌握上，各SNS公司一直面临着艰难的判断。

围绕袭击美国议会事件、俄罗斯入侵乌克兰等事件出现了大量虚假信息。各国政府都在加强管控，各公司也被越来越多地问及对策强化的计划。AI的精度在逐年提高，已经能够实现不间断监视人工无法应对的大量内容，并根据指导方针瞬间进行自动删除，将来会应用得越来越多。

然而，无论技术多么先进，最终都离不开人工的判断。在言论自由和安全性之间的微妙界限问题上，对AI的设计、最终的删除标准等进行深思熟虑十分重要。

眼下美国大型IT公司正进行大规模裁员。有报道称，此举对内容审核的影响令人担忧，实际负责人权等事务部门的人员被大幅削减。能否坚持不懈地致力于人工参与，将决定技术和网络社会能否健康发展。

日文：水口二季、《日经产业新闻》、2022/11/25
中文：JST客观日本编辑部

用技术维护网络秩序，SNS公司提高监视AI精度