[本站讯]3月26日下午,加州大学河滨分校(UCR)计算机科学与工程系姜涛教授访问山大数学学院,作了题为“Combinatorial Methods for Inferring Isoforms from Short Sequence Reads(组合最优、生物信息学)”的学术报告。
姜涛教授结合其研究成果向大家讲解了如何通过高通量测序方法来推测细胞中基因的表达情况。在基因表达的过程中,由于存在可变剪切,一个基因可以在真核生物的细胞中转录成不同的mRNA。姜涛教授谈到,剪切的过程是一个组合选择的过程,剪切后的结果不同会产生出不同的同型异构体(isoforms)。基因表达量对于基因的功能有很大的影响,姜涛教授举例说,人体中的10号染色体中的基因KLF6已被发现具有4种常见的同型异构体,但只有在第一种表达的情况下,该基因才会有抑制肿瘤的功能。随着科学技术的发展,运用高通量测序手段研究基因的表达调控在生物学和医学上有着广阔的应用前景。姜涛教授结合Illumina第二代测序手段介绍了其研究成果的主要路线,即把由数千万甚至上亿的核苷酸组成的mRNA打碎成mRNA短片段(short reads),通过对短片段的研究来推测整个基因的表达情况。目前比较先进的研究方法(例如Scripture和Cufflinks)都是在不清楚同型异构体结构的情况下来推测基因的表达。姜涛教授研究的核心思想是:在假定同型异构体给定的情况下,结合RNA-Seq短序列,运用二次规划的方法来预测同型异构体的表达量;而后,将相似的思想加以推广,同样可以用来预测同型异构体结构。姜涛教授说,通过研究基因中外显子的边界覆盖情况,可以判断同型异构体表达的高低。算法在“枚举法”的基础上,引入Lasso Regression(回归)方法,使得对基因表达的推测更加精确。报告会最后,姜涛教授表示希望通过这次报告会,可以加深大家对于生物信息学和数学算法之间联系的体会、增加对于生命科学发展的了解。
数学学院李国君教授主持报告会。数学学院、计算机学院有关教师和学生参加了报告会。
姜涛,加州大学河滨分校(UCR)计算机科学与工程系教授,综合基因组生物学协会会员,植物细胞生物学中心会员;同时担任上海生物信息技术中心客座教授、清华大学计算机科学与技术学院客座教授;主要研究方向为算法分析与设计、计算分子生物学。