计算机研究与发展 ›› 2020, Vol. 57 ›› Issue (8): 1627-1638.doi: 10.7544/issn1000-1239.2020.20200212
所属专题: 2020数据挖掘与知识发现专题
夏冬雪1,2,杨燕1,王浩1,阳树洪2
Xia Dongxue1,2, Yang Yan1, Wang Hao1, Yang Shuhong2
摘要: 基于图谱理论的多视图聚类是该领域的代表性方法之一.然而,现有模型尚存在3个问题.1)这类方法大多没有考虑不同视图之间的聚类性能差异,强制要求所有视图共享一个公共相似图;2)部分模型将相似图构建和聚类分步进行,导致所构建的相似图对于聚类任务并非最优;3)虽已有若干模型采用核学习处理数据间的非线性关系,但大多基于全局模型计算数据在核空间中的自表达关系,不利于充分挖掘局部非线性信息,且易带来沉重的计算负荷.为了应对以上问题,提出一种基于邻域多核学习的后融合多视图聚类算法,在类划分空间而不是数据相似图的层次进行信息融合,采用邻域多核学习方案在充分保留局部非线性关系的同时减轻计算负荷,并提出一种交替优化方案将相似图构建、多核组合、类指示矩阵生成等子任务在统一的框架下进行协同优化.多个数据集上的实验表明:该算法具有良好的多视图聚类效果.
中图分类号: