[本站讯]近日,国际计算机视觉与模式识别大会(CVPR 2025)在美国纳什维尔举行。软件学院副研究员孙皓亮,博士研究生房乐鑫、赵丽君参加会议,并汇报展示论文成果。
1.论文题目:SeqMvRL: A Sequential Fusion Framework for Multi-view Representation Learning(CVPR 2025)。软件学院博士毕业生王任为该篇文章的第一作者,孙皓亮、软件学院孟文佳为通讯作者。

论文简介:多视图表示学习旨在通过整合实体的多个可观测视图来构建统一表示,以提升下游任务的性能。现有方法主要侧重于识别视图间的兼容成分,并采用单步并行融合策略进行整合。然而,这种静态的并行融合机制未能充分考虑视图间潜在的冲突关系,从而限制了表示的有效性。针对这一局限性,本文提出了一种基于序列式融合的多视图表示学习框架(SeqMvRL)。该框架将多视图融合过程建模为顺序决策问题,创新性地引入了成对集成器(PI)和下一视图选择器(NVS)两个核心组件,分别对应强化学习中的环境和智能体。其中,PI负责将当前融合特征与选定视图进行动态整合,NVS则通过学习策略自适应地选择最优的下一融合视图。这种序列式融合机制能够根据当前融合状态动态调整视图融合顺序,有效缓解视图间的冲突问题,从而提升统一表示的质量。此外,本文设计了一种新颖的奖励函数,通过强化特征可辨别性来指导视图选择过程。在分类和聚类任务上的实验结果表明,SeqMvRL框架显著优于传统的并行融合方法。
2.论文题目:Minding Fuzzy Regions: A Data-driven Alternating Learning Paradigm for Stable Lesion Segmentation(CVPR 2025)。软件学院博士研究生房乐鑫为该篇文章的第一作者,软件学院教授李雪梅为通讯作者。

论文简介:深度学习在医学图像分割领域取得了显著进展,但现有模型在精准分割病灶区域方面仍面临挑战。主要原因在于,医学图像中的部分病灶区域存在边界模糊、形状不规则以及组织密度差异小等问题,从而导致标签存在模糊性。然而,现有模型在训练过程中对所有数据一视同仁,未考虑样本质量的差异,这使得噪声标签对模型训练产生负面影响,并导致特征表征不稳定。为此,本文提出了一种数据驱动的交替学习范式(DALE),用于优化模型的训练过程,从而实现更稳定、高精度的分割效果。该范式聚焦于两个关键问题:(1)减弱噪声标签的干扰;(2)校正不稳定的特征表示。为了缓解噪声标签带来的负面影响,本文设计一种基于损失一致性的协同优化方法,并从理论上证明了其有效性。具体而言,通过引入标签置信度参数动态调整不同置信度标签在训练过程中的影响程度,从而降低噪声标签的干扰。此外,为了校正不稳定特征表示的学习偏差,本文提出一种分布对齐方法,以恢复不稳定表征的潜在分布,进一步提升模型在模糊区域中的判别能力。值得注意的是,DALE 是一种模型无关的训练范式,可灵活应用于各种分割模型中。
3.论文题目:Attraction Diminishing and Distributing for Few-Shot Class-Incremental Learning(CVPR 2025)。赵丽君为该篇文章的第一作者,软件学院陈振铎为通讯作者。

论文简介:小样本类增量学习(FSCIL)旨在在对一组基础类进行预训练后,通过有限的样本持续学习新类别。为了避免灾难性遗忘和过拟合,大多数FSCIL方法通常先在基础类别上训练模型,然后在后续的增量阶段冻结特征提取器。然而,对最近邻分类的依赖使FSCIL容易受到“枢纽现象”(hubness)的影响,这种现象会在动态开放的场景中显著降低性能。尽管近期一些方法尝试适应FSCIL的动态性和开放性,但它们通常局限于对特征空间的有偏优化。本文中首次对FSCIL中固有的hubness现象进行了理论分析。为缓解hubness现象带来的负面影响,本文从距离度量和特征空间两个关键角度出发,提出了一种新颖的吸引力减弱与分散(D2A)方法。大量实验结果表明,本文的方法能够广泛且显著地提升现有方法的性能。
CVPR是计算机视觉领域的全球顶级学术会议,被中国计算机学会(CCF)列为A类会议,汇聚了全球顶尖学者、企业研发团队及创新成果,代表了该领域的最前沿研究方向与技术突破。此次孙皓亮参会受到王宽诚教育基金会的资助,该基金会长期支持中国学者参与国际高水平学术交流,助力科研人才培养。
【供稿单位:软件学院 作者:孙皓亮 房乐鑫 赵丽君 摄影:孙皓亮 房乐鑫 赵丽君 编辑:新闻网工作室 责任编辑:蒋晓涵 韩怡雯 】