文献解读
干货分享 | 代谢组学常用数据库特点总结
上期我们简要介绍了代谢组学常用数据库。本期将详细介绍每个数据库特点。
HMDB(www.hmdb.ca)
HMDB由加拿大人类代谢组计划(Human Metabolome Project, HMP)发起,并于2007年发布首个代谢组草图。目前最新版本HMDB4.0包含114100代谢物、5498条疾病链接、3840 NMR实验图谱、22198 MS/MS实验质谱图和7418 GC-MS实验质谱图。另有几千到数万个代谢物预测的NMR或MS谱图。相较于以前版本,4.0版新增了6777个代谢物—SNP互作关系,2497个代谢物—药物互作关系和18192个代谢反应。此外,HMDB支持多种搜索方式,包括化合物名字搜索、分子量搜索、分子结构搜索和二级质谱搜索。但该库目前不支持批量搜索,仅限于单个代谢物搜索,搜索效率较低。另外,该库也不支持代谢通路搜索、代谢化合物浓度搜索等功能。HMDB是当前世界上最完整且最全面的人类代谢物和人类代谢数据精选收集。我国科学家对该库的完善也有一定贡献。
KEGG(https://www.kegg.jp)
KEGG是基因组破译方面的数据库,其第一版于1995年上线,当时仅包含Pathway、Genes、Compound和Enzyme四个部分。目前KEGG已包含18个部分,17268种代谢物和460条通路,整合了基因组、化学、系统功能和健康信息。将已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能进行关联是KEGG数据库的特色之一。与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,使研究者能够对其所要研究的代谢途径有一个直观全面的了解。
Metlin(https://metlin.scripps.edu)
Metabolite Link (Metlin)数据库由The Scripps Institute Gary Siuzdak组于2003年创建,2005年对公众开放,主要侧重用于液质非靶向代谢组学(Non-targeted Metabolomics)代谢物鉴定领域,目前包括超百万种小分子物质,超431000个高分辨率MS/MS质谱图。该库的主要特征是含有大量代谢物的二级质谱图,而且每个化合物都有多种不同碰撞能的图谱,可以清晰的找到代谢物的碎片离子。用户还可以获得分子量、化学式、化学结构等信息。该数据库的主要缺陷是没有代谢物在生物体中的浓度、代谢通路等信息,也没有临床相关信息,偏重于化学分析。
GMD(http://gmd.mpimp-golm.mpg.de/)
The Golm Metabolome Database (GMD)是由德国Max Planck研究所的科学家建立的植物代谢组学数据库,包含1450种已被鉴定的代谢物和10336个相关质谱图。该库资源侧重于气质非靶向代谢组学,其最大特点是含有大量的植物代谢物的GC-MS图谱(特别是衍生化后的)。用户可以导入自己的GC-MS数据进行搜索比对和鉴定。另外,该库还含有部分代谢物在植物中的浓度,可以按照植物名、部位等进行搜索。但是,该数据库仅仅收录GC-MS 平台检测的植物样本代谢组数据,应用范围有一定限制。
SMPDB(http://smpdb.ca/)
SMPDB(The Small Molecule Pathway Database)
The Small Molecule Pathway Database(SMPDB)由加拿大卫生研究院、阿尔伯塔大学和加拿大代谢组学创新中心共同创建,是一个交互的、可视的小分子通路的数据库,包含910条手绘小分子代谢通路,其中468条药物通路,232条疾病通路,105条代谢通路,100多条其他通路。这些通路中百分之七十以上不能在任何其他通路数据库中找到。SMPDB特别为临床代谢组学、转录组学,蛋白质组学和系统生物学中通路阐释和通路发现而设计。SMPDB提供了巧妙详细地人类代谢通路、代谢疾病通路、代谢物信号通路和药物活性通路的超级链接图表。每个小分子和人类代谢组数据库(HMDB)或DrugBank中包含的详细描述进行超链接,而每个蛋白质或酶复合物和UniProt进行超链接。该库方便浏览,并支持全文搜索。用户能够用一列代谢物名字、药物名字、基因/蛋白质名字、SwissProt ID,Affymetrix ID或Agilent微阵列ID来查询SMPDB。这些查询将产生一列匹配的通路,并在每个通路图表中高亮显示匹配的分子。基因、代谢物和蛋白质浓度数据也可以通过SMPBD的映射界面进行可视化。所有SMPDB的图像、图像映射、描述和表都是可下载的。
以上是本期分享的内容,更多干货请关注麦特绘谱微信公众号。
精彩回顾