[本站讯]山东大学公共卫生学院/国家健康医疗大数据研究院薛付忠教授团队在国际顶尖生物信息学期刊Briefings in Bioinformatics上在线发表了题为“MRSL: a causal network pruning algorithm based on GWAS summary data”的大数据因果推断文章。山东大学公共卫生学院生物统计学系博士毕业生侯蕾是论文的第一作者,山东大学薛付忠教授和李洪凯研究员为共同通讯作者。
Briefings in Bioinformatics在数学与计算生物学领域排名第一,致力于用数学、统计学、计算机方法和工具来解决生物学问题,聚焦生物-生化研究方法领域的重点研究和前沿进展,为当代遗传学、分子和系统生物学领域提供分析工具和实用指导。
因果发现是通过分析观察性研究数据来揭示变量间因果网络结构的有力工具。遗传变异可以为因果发现提供有用的补充信息。近年来,孟德尔随机化研究提供了丰富的边际因果关系。本研究提出了一种基于边际因果关系的因果网络裁剪算法MRSL,仅使用公开的GWAS summary data,将图理论与多元MR结合,学习变量间的条件因果网络结构,巧妙使用因果拓扑序来提升算法准确性。模拟研究结果表明,与其他八种已发表的方法相比,MRSL的F1分数高2倍,计算时间快100倍。此外,本研究使用UK Biobank的GWAS summary data,将MRSL应用于26种生物标志物和44种ICD10定义的疾病。研究结果涵盖了大多数具有生物学解释的预期因果关系,以及一些由临床病例支持的新因果关系。