科学研究 - 九州大学制成阴离子交换膜材料图谱，联用两种无监督机器学习技术

九州大学研究生院工学研究院的加藤幸一郎教授、藤谷刚彦教授以及研究生院工学府博士三年级学生Phua Yin Kan等人组成的研究团队，针对燃料电池和水电解装置核心部件的阴离子交换膜（AEM）材料，构建了融合“可解释AI”、ChatGPT及专家知识的“人机协同（Human-in-the-loop）”框架。通过该框架，针对以往高度依赖经验法则的设计指南，研究团队成功在分子描述符层面将结构与物性的关系进行定量关联，并提取出了联苯骨架的有效性、侧链长度为8个键长的重要性等可供实验人员应用的定量设计指针。由此，AI不再仅能进行预测，研究者还能理解其为何做出该预测并将其反映到材料设计中，进而有望减少材料开发过程中的试错次数，实现候选材料的高效筛选。相关研究成果已发表在期刊《Journal of Materials Chemistry A》上。

图1 材料图谱制作流程（供图：九州大学）
通过让无监督机器学习模型学习已报道化学结构的自建数据库，制作材料探索图谱。

燃料电池和水电解装置核心部件的阴离子交换膜（AEM），是实现氢能社会的关键材料。在AEM聚合物的分子设计中，需要同时实现高离子传导性与长期碱性稳定性，但这两项要求存在相互竞争的关系，因此其设计至今仍高度依赖经验法则。机器学习技术，尤其是人工神经网络（ANN），虽然能够高精度预测高分子材料的物性，但由于其判断依据是难以理解的“黑箱”，实验研究者要将预测结果应用于分子设计并非易事。此外，可解释AI（XAI）方法在处理高维分子描述符的ANN模型时计算成本高昂，难以应用于实际材料体系。

研究团队此前已构建了系统收录346种阴离子交换膜（AEM）聚合物的化学结构与物性的自建数据库，并通过无监督机器学习生成材料图谱，进而实现了结构与性能关系的俯瞰式可视化。然而，从材料图谱中定量提取单个结构特征与物性的关系，并将其作为实验人员可用于合成策略的设计指针加以提出，此前一直是个难题。

在本次研究中，研究团队利用自建数据库，构建了能够从“黑箱”ANN模型中提取实验研究者可应用的定量分子设计指针的框架。

首先，研究团队通过基于统计方法与可解释AI的独创两阶段降维策略，将数千维的分子描述符空间压缩至67维。这一降维不仅实现了以往因计算成本壁垒难以开展的高维ANN模型可解释AI（SHAP）分析，同时也带来了ANN模型预测精度的提升。

其次，研究团队在以SHAP分析识别出的重要描述符的解释中利用了ChatGPT。通过向ChatGPT提供描述符的源代码与公式定义，辅助其将数学上抽象的描述符转化为化学上直观的语言。在此过程中，研究团队发现ChatGPT的输出存在解释偏差与局限性，因此通过纳入专家验证与修正流程，确保了解释结果的可靠性。

通过这一系列流程，研究团队成功提取出多项定量分子设计指针，包括联苯骨架的有效性、主链至阳离子位点的侧链长度为8个键长的重要性、每4个碳原子引入一个杂原子的重要性等。

这些指导原则与最新的实验性知识独立吻合，为以往以经验法则形式流传的设计知识，提供了分子描述符层面的定量依据。

此外，研究团队基于提取出的设计指针提出的4种概念性AEM聚合物之中的2种被预测在80℃条件下会表现出0.1S/cm以上的阴离子传导率。训练数据库中满足相同条件的聚合物仅占14.4%，这提示该框架可高效筛选有前景的候选材料。

该框架适用于所有采用分子描述符的材料体系，因此能够在各类功能高分子材料领域，从“黑箱”AI的预测结果中提取出实验研究者能够理解并应用的设计指针。该框架有望为减少材料开发中的试错做出贡献，有助于降低合成与评价所需的时间和成本。

研究团队今后将与论文共同作者之一、东京都立大学的田中学副教授合作，推进通过框架提出的概念性聚合物结构的实验合成与评价，通过实验验证预测精度与设计指针的合理性。相关数据库与源代码已在GitHub公开，该框架由其他研究团队在其他材料中的拓展应用与验证也值得期待。

原文：《科学新闻》
翻译：JST客观日本编辑部

【论文信息】
期刊：Journal of Materials Chemistry A
论文：Orchestrating Explainable AI, ChatGPT, and Human Expertise: A Framework for Extracting Polymer Design Guidelines
DOI：10.1039/D5TA06120B