摘要
- 本文针对Hadoop分布式数据平台提出并设计了一种可扩展的Fuzzy C-Means (FCM)聚类方法BigFCM 。
- BigFCM 的性能通过本研究开发的评估框架与 Apache Mahout K-Means 和 Fuzzy K-Means 进行了比较。使用包括 SUSY 和 HIGGS 在内的多千兆字节数据集的广泛评估表明,BigFCM 在保持聚类质量的同时具有可扩展性。
聚类
- 分区聚类
- 层次聚类