九州大学研究生院工学研究院的加藤幸一郎教授、藤谷刚彦教授以及研究生院工学府博士三年级学生Phua Yin Kan等人组成的研究团队,针对燃料电池和水电解装置核心部件的阴离子交换膜(AEM)材料,构建了融合“可解释AI”、ChatGPT及专家知识的“人机协同(Human-in-the-loop)”框架。通过该框架,针对以往高度依赖经验法则的设计指南,研究团队成功在分子描述符层面将结构与物性的关系进行定量关联,并提取出了联苯骨架的有效性、侧链长度为8个键长的重要性等可供实验人员应用的定量设计指针。由此,AI不再仅能进行预测,研究者还能理解其为何做出该预测并将其反映到材料设计中,进而有望减少材料开发过程中的试错次数,实现候选材料的高效筛选。相关研究成果已发表在期刊《ChemElectroChem》上。
图1 材料图谱制作流程(供图:九州大学)
通过让无监督机器学习模型学习已报道化学结构的自建数据库,制作材料探索图谱。
燃料电池和水电解装置核心部件的阴离子交换膜(AEM),是实现氢能社会的关键材料。在AEM聚合物的分子设计中,需要同时实现高离子传导性与长期碱性稳定性,但这两项要求存在相互竞争的关系,因此其设计至今仍高度依赖经验法则。机器学习技术,尤其是人工神经网络(ANN),虽然能够高精度预测高分子材料的物性,但由于其判断依据是难以理解的“黑箱”,实验研究者要将预测结果应用于分子设计并非易事。此外,可解释AI(XAI)方法在处理高维分子描述符的ANN模型时计算成本高昂,难以应用于实际材料体系。
研究团队此前已构建了系统收录346种阴离子交换膜(AEM)聚合物的化学结构与物性的自建数据库,并通过无监督机器学习生成材料图谱,进而实现了结构与性能关系的俯瞰式可视化。然而,从材料图谱中定量提取单个结构特征与物性的关系,并将其作为实验人员可用于合成策略的设计指针加以提出,此前一直是个难题。
在本次研究中,研究团队利用自建数据库,构建了能够从“黑箱”ANN模型中提取实验研究者可应用的定量分子设计指针的框架。
首先,研究团队通过基于统计方法与可解释AI的独创两阶段降维策略,将数千维的分子描述符空间压缩至67维。这一降维不仅实现了以往因计算成本壁垒难以开展的高维ANN模型可解释AI(SHAP)分析,同时也带来了ANN模型预测精度的提升。
其次,研究团队在以SHAP分析识别出的重要描述符的解释中利用了ChatGPT。通过向ChatGPT提供描述符的源代码与公式定义,辅助其将数学上抽象的描述符转化为化学上直观的语言。在此过程中,研究团队发现ChatGPT的输出存在解释偏差与局限性,因此通过纳入专家验证与修正流程,确保了解释结果的可靠性。
通过这一系列流程,研究团队成功提取出多项定量分子设计指针,包括联苯骨架的有效性、主链至阳离子位点的侧链长度为8个键长的重要性、每4个碳原子引入一个杂原子的重要性等。
这些指导原则与最新的实验性知识独立吻合,为以往以经验法则形式流传的设计知识,提供了分子描述符层面的定量依据。
此外,研究团队基于提取出的设计指针提出的4种概念性AEM聚合物之中的2种被预测在80℃条件下会表现出0.1S/cm以上的阴离子传导率。训练数据库中满足相同条件的聚合物仅占14.4%,这提示该框架可高效筛选有前景的候选材料。
该框架适用于所有采用分子描述符的材料体系,因此能够在各类功能高分子材料领域,从“黑箱”AI的预测结果中提取出实验研究者能够理解并应用的设计指针。该框架有望为减少材料开发中的试错做出贡献,有助于降低合成与评价所需的时间和成本。
研究团队今后将与论文共同作者之一、东京都立大学的田中学副教授合作,推进通过框架提出的概念性聚合物结构的实验合成与评价,通过实验验证预测精度与设计指针的合理性。相关数据库与源代码已在GitHub公开,该框架由其他研究团队在其他材料中的拓展应用与验证也值得期待。
原文:《科学新闻》
翻译:JST客观日本编辑部
【论文信息】
期刊: ChemElectroChem
论文:Unsupervised Machine Learning-Derived Anion-Exchange Membrane Polymers Map: a Guideline for Polymers Exploration and Design
DOI:10.1002/celc.202400252

