数学与信息学院、软件学院崔金荣副教授研究团队在计算机图像处理领域知名期刊连续发表研究论文

来源单位及审核人:数学与信息学院、软件学院 邓平宇 编辑:曾子焉审核发布:林慷祺发布时间:2026-05-15

近日,数学与信息学院学崔金荣副教授在计算机图像处理领域知名期刊IEEE Transactions on Image Processing(中科院一区Top期刊,影响因子13.7)上,围绕复杂多视图聚类任务连续发表两篇科研论文。

第一篇研究论文题为“Deep Multi-View Clustering With Meta Information Compression”,崔金荣副教授为文章第一作者,课题组硕士研究生刘付邦为第二作者。

多视图聚类作为一种无监督技术是实现复杂数据潜在结构挖掘的重要基础。现有的深度多视图聚类方法通常依赖不同视图间的一致性和互补性来划分样本。然而,现有的深度学习方法往往面临在选择互补信息与捕捉关键细节之间的两难困境:一是捕获视图间的互补语义的同时可能引入各个视图中与标签无关的冗余信息;二是仅提取一致的语义信息则类似于对各个视图求取交集,会导致特定于某些视图的标签相关信息丢失。这些问题都会影响所学表征的判别性,从而限制聚类任务的性能。

针对这些问题,本研究提出了一种基于元信息压缩的深度多视图聚类框架(DMVC_MIC)。该框架通过构建信息压缩器,基于元学习双层优化策略引导模型在尽可能少的信息条件下紧凑地描述原始样本,从而提取关键语义并有效降低冗余信息的干扰。在此基础上,设计语义拼图机制,通过挖掘底层特征之间的潜在关系对语义片段进行补充与重组,以获得更加完整且具有判别性的共识表示。实验结果表明,在多个多视图数据集上的聚类任务中,所提出的方法均取得了优于现有方法的性能,验证了该框架在多视图语义表示学习中的有效性与鲁棒性,为多视图无监督学习提供了一种新的研究思路。

第二篇研究论文题为“Deep Multi-View Clustering via Cluster-Semantic Guidance”,崔金荣副教授为文章第一作者,课题组硕士研究生吴小煌为第二作者,哈尔滨工业大学(深圳)文杰教授为文章合作作者。

针对现有的深度学习方法在学习聚类友好型判别性表征时面临两难困境:一是缺乏跨视图聚类分布的协同优化,忽略了视图中的聚类结构的分离性,这导致簇间可分性不足;二是在建模跨视图样本一致性时通常只关注表示对齐,缺乏对样本之间内在关系的细致考虑。本研究提出了一种簇级语义引导的深度多视图聚类框架(DMVC_CSG)。该框架主要由三个核心模块组成:自编码器与动态融合模块、判别性簇蒸馏模块以及簇引导语义聚合模块。自编码器与动态融合模块采用视图特定的编码器来提取数据的嵌入表示,从而保留视图内的信息。为了获得统一且全面的表示,引入了一种动态融合策略,有效利用多视图之间的互补信息。在此基础上,判别性簇蒸馏模块增强视图特定表示和一致性表示中的簇间可分性,以获得更稳定且具有判别性的聚类特征。簇引导语义聚合模块聚合相似样本的语义信息,并以簇语义为指导,使模型能够有效学习判别性特征表示。在多个公共数据集上的综合实验结果表明,提出的方法在多个多视图数据集上的聚类任务中取得了具有竞争力的性能。

自2022年来,崔金荣副教授课题组在人工智能领域开展了一系列的研究工作,取得突出成绩,成果相继发表在 IEEE Transactions on Image Processing (中科院一区,影响因子13.7), IEEE Transactions on Neural Networks and Learning Systems (中科院一区,影响因子11.1), IEEE Transactions on Medical Imaging (中科院一区,影响因子11.3)等知名期刊上。

该研究得到国家自然科学基金项目(62576140、62371234、62076129)、深圳市科技计划项目(JCYJ20240813105135047)、广东省基础与应用基础研究基金(2026A1515011517;2024A1515030213)等资助。

相关论文链接:https://ieeexplore.ieee.org/abstract/document/11249721

         https://ieeexplore.ieee.org/document/11493650


文图/数学与信息学院、软件学院

上一篇:下一篇: