k-means的k值怎麼確定

k-means的k值怎麼確定

1、 數據的先驗知識,或者數據進行簡單分析能得到K值。

2、 基於變化的算法:即定義一個函數,隨着K的改變,認爲在正確的K時會產生極值。

3、 基於結構的算法:即比較類內距離、類間距離以確定K。

4、 基於一致性矩陣的算法:即認爲在正確的K時,不同次聚類的結果會更加相似,以此確定K。

5、 基於層次聚類:即基於合併或分裂的思想,在一定情況下停止從而獲得K。

6、 基於採樣的算法:即對樣本採樣,分別做聚類根據這些結果的相似性確定K。如,將樣本分爲訓練與測試樣本對訓練樣本訓練分類器,用於預測測試樣本類別,並與聚類的類別比較

7、 使用Canopy Method算法進行初始劃分。

8、 使用BIC算法進行初始劃分。