日本九州工业大学和理化学研究所通过共同研究开发出一种新型信息技术,能高精度预测各种人体细胞中药物反应的基因表达模式(图1)。
图1:发布概要
本次研究将药物反应基因表达数据视为由药物、基因、细胞和时间序列构成的张量结构,开发了机器学习方法,利用新的张量分解法Tensor Train Weighted Optimization算法,来预测各种细胞中尚未观测到的药物反应。研究小组利用新开发的方法预测了药物的疗效,结果表明,这种方法有望大大提高疗效预测的性能。
首先,为了评估由药物、细胞和基因构成的3阶张量结构——药物反应基因表达数据中的未观测值预测性能,研究小组将观测值人工改为缺失值,调查了能否准确再现观测值。结果发现,新方法与以往的方法相比,最大能以约1.5倍的精度补全缺失值(图2)。另外,由于药物反应基因表达模式会随着时间变化,因此研究小组构建了由药物、细胞、基因和时间序列组成的4阶张量,实施了相同的性能评估。结果显示,新方法对高阶张量结构的数据尤其有效(精度与以往的方法相比最大提高约2倍)。
图2:新方法与以往的方法相比,补全张量缺失值的性能更高
接下来,研究小组将补全了缺失值的药物反应基因表达数据应用于药物的疗效预测。结果显示,缺失值越多的细胞,越能大幅提高疗效预测的性能,性能最大提高约20%(图3)。另外,研究小组把新提出的方法应用于将1483种药物添加到16种人体细胞中获得的药物反应基因表达数据,筛选出了对很多疾病均有望发挥疗效的药物,比如驱虫药氯硝柳胺能治疗成人T细胞白血病等。此外,还通过近年来的文献和临床报告,确认了新预测的药物疗效的有效性。
图3:通过新提出的方法补全了缺失值的基因表达数据对新药开发也有用
利用这种可预测各种人体细胞中的药物反应的新方法,有望促进新药开发,包括查明药物的作用机制、预测药效以及探索工具化合物等。今后计划进一步改善算法,提高预测可靠性和计算效率。同时,不仅是已经获批的药物,还将把解析对象扩大到合成化合物和天然化合物等所有化合物中,以探索针对各种疾病的药物候选化合物。
(日文新闻发布全文)
文:JST客观日本编辑部翻译整理