一、报告题目
单细胞蛋白组数据表征与多组学整合的深度学习模型-scPROTEIN、scMHNN及BERMAD
二、主讲人
张瀚(南开大学)
三、报告时间
2024年5月25日 09:30–10:30
四、报告地点
青岛校区华岗苑东楼E119
五、摘要
单细胞蛋白组数据独特的复杂性使得蛋白组数据的分析处理成为一个严峻的挑战。scPROTEIN是专为单细胞蛋白组数据分析设计的深度学习框架,旨在解决蛋白质定量数据的不确定性、数据缺失、批处理效应以及高噪声等一系列在处理中相互交织的复杂问题。scPROTEIN基于图对比学习进行单细胞蛋白质组学表征学习,设计了统一的深度学习框架学习到准确的细胞嵌入表示,可用于一系列下游分析。这一框架不仅能够提高单细胞蛋白组数据的分析精度,还能够推动临床蛋白组数据的应用研究,为解析复杂的生物学问题提供了新的方法与工具。此外,单细胞多组学整合成为重要需求,超图神经网络模型scMHNN被设计用于单细胞表观基因组、转录组和蛋白质组数据的整合分析。还开发了具有双通道框架的多层自适应自动编码器BERMAD对单细胞RNA-seq数据进行批量效应去除,它通过自编码器进行自适应多层分布匹配,并保持了数据多样性。
六、主讲人简介
张瀚,南开大学人工智能学院智能工程系主任,教授,博士生导师。研究方向为图学习、组学数据处理与分析、医学影像处理等,获2022年天津市自然科学一等奖(2/3)。近年来以第一作者与通讯作者(含并列)在Nature Methods、PNAS、Nucleic Acids Research、Bioinformatics、Information Sciences、KBS、ESWA、BIB、IEEE TIM等期刊发表学术论文三十余篇及2020年ESI热点论文1篇;研发了组学数据整合与批次效应处理、异质图学习等系列智能方法和国际广泛使用的蛋白质(碳水化合物活性酶CAZy)功能注释的dbCAN算法工具链,曾任中国自动化学会青工委常委。
七、主办单位
非线性期望前沿科学中心
数学与交叉科学研究中心
中俄数学中心青岛基地