计算机研究与发展 ›› 2019, Vol. 56 ›› Issue (8): 1677-1685.doi: 10.7544/issn1000-1239.2019.20190150
所属专题: 2019人工智能前沿进展专题
洪敏1,2,贾彩燕1,2,李亚芳3,于剑1,2
Hong Min1,2, Jia Caiyan1,2, Li Yafang3, Yu Jian1,2
摘要: 大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果.
中图分类号: