大阪大学蛋白质研究所的日本蛋白质结构数据库(Protein Data Bank Japan : PDBj,https://pdbj.org)作为亚洲代表性机构,目前已将新型冠状病毒(SARS-CoV-2)最新解析的蛋白质结构信息录入蛋白质结构数据库(Protein Data Bank: PDB)。
3月11日进行定期数据更新时,数据库还开设了新型冠状病毒专页(https://pdbj.org/featured/covid-19),对相关的PDB数据进行了汇总,以方便研究人员利用(图1)。专页每周三的北京时间 8:00am更新内容。
图1:PDBj的中文页面
针对SARS-CoV-2的结构研究,早在新型冠状病毒国际分类标准确定前就已启动。为了提高SARS-CoV-2的蛋白质信息精度,PDBj向录入的研究人员逐一进行了确认,以保证数据验证、编辑和录入的过程中的信息准确,提高录入数据的可靠性。
PDBj提供的数据库中除SARS-CoV-2外,还收录了很多相似病毒的蛋白质结构信息。PDBj数据库包含了病毒、微生物、植物、动物的蛋白质和核酸等16万件以上数据。PDBj剔除了其中相似的结构信息,严格提取与此次的新型冠状病毒(SARS-CoV-2)有直接关系的录入项目。
研究背景
蛋白质结构数据库(Protein Data Bank:PDB)是世界上唯一保存经过实验确定的生物大分子三维结构的数据库。全球每天的下载量为200万件以上,被广泛用于从基础研究到新药开发等的方面。包括日本蛋白质结构数据库在内,分别位于日美欧的全球4个基地组成了国际蛋白质结构数据库(worldwide Protein Data Bank:wwPDB)联盟,共同进行录入、维护和管理。日本是wwPDB的创始成员,负责亚洲和中东地区的数据处理及录入。所有PDB数据从大阪大学向世界发布(图 2)。
图2:蛋白质结构数据库的录入地区分工地图
美国的信息录入基地为罗格斯大学与加利福尼亚大学圣地亚哥分校的联合研究团队(RCSB PDB),欧洲为位于英国的欧洲生物信息研究所(EMBL-EBI)。大阪大学蛋白质研究所的日本蛋白质结构数据库(PDBj)20年来一直作为亚洲方面录入基地活动。
根据约定,全球研究人员解析的蛋白质结构信息必须要提前录入日美欧任意一个基地的数据库中。一般来说,为确保实验的原创性,录入的PDB数据在包含其信息的相应研究论文发表前是不会公开的。不过,蛋白质的结构信息是被积极用于以立体结构为基础的新药研究的基础信息,关于新型冠状病毒的结构信息也被期待能尽快上传和公开。
有名的抗流感药物扎那米韦(商品名称:依乐韦)和奥司他韦(商品名称:达菲)就是利用录入PDB中的立体结构开发的(参考:https://numon.pdbj.org/mom/113)。通过模拟病毒蛋白质的天然基质进行药物设计,从而加速新药研究的例子广为人知。
研究内容与成果
抗流感药物的开发案例也表明,新型冠状病毒(SARS-CoV-2)的蛋白质结构信息积累,有助于进一步加深对新型冠状病毒的了解,有望加速基于立体结构的新药研究。在日美欧达成一致的情况下,数据库中新录入新型冠状病毒的结构信息时,会与录入人员或研究人员单独联系,强烈建议其在发表论文前就即时公开信息。其中亚洲和中东地区的数据录入者由PDBj负责联系。
由于新型冠状病毒(SARS-CoV-2)最早发现于中国,1月26日中国的研究人员就在PDBj中录入了最初的相关结构信息。SARS-CoV-2拥有与已知的冠状病毒非常相似的基因,而且在国际分类标准确定前就录入了结构数据,因此即使是专家,也很难仅精确提取SARS-CoV-2的信息。PDBj通过在数据验证、编辑和录入的过程中收集准确的信息,严格区分与SARS-CoV-2相似的病毒数据。为支援新药加速推进研发,以后只准确收集录入的新型冠状病毒SARS-CoV-2的结构信息数据,并以日语、英语、中文和韩语的形式通过以下HP发布。
图3:介绍新型冠状病毒的蛋白酶作用和对新药开发的意义的页面
https://numon.pdbj.org/mom/242
文:JST客观日本编辑部