261.
基于图的子空间聚类(SC)已成为有效处理高维数据的流行技术。然而,现有方法存在以下问题:构建的图忽略了与聚类建立关联以及无法捕捉数据的内在相关结构。为了解决上述问题,提出一个新的SC方法——图正则化弹性网子空间聚类(GENSC)。GENSC使用L
2范数正则化强化具有相关结构的样本之间的连通性,并使用L
1范数正则化摒弃不同子空间的样本之间的连通性;同时,构建表征的最近邻图捕捉样本之间的内在局部结构,并增加秩约束以鼓励所学习的图具有清晰的聚类结构。GENSC将L
2范数、L
1范数和秩约束刻画到一个一般的框架中,并提出一个迭代的优化算法来求解该框架。在9个真实数据集上与现有方法进行比较的实验结果表明,在ChinaCXRSet上,GENSC的精确度(Accuracy)和归一化互信息(NMI)值分别超出次优方法9.03和7.61个百分点,聚类纯度(Purity)达到最好;在UMIST上,GENSC的精确度、NMI和Purity值分别超出次优方法4.15、3.17和5.21个百分点,验证了GENSC的有效性。… …
相似文献