1、 數據的先驗知識,或者數據進行簡單分析能得到K值。
2、 基於變化的算法:即定義一個函數,隨着K的改變,認爲在正確的K時會產生極值。
3、 基於結構的算法:即比較類內距離、類間距離以確定K。
4、 基於一致性矩陣的算法:即認爲在正確的K時,不同次聚類的結果會更加相似,以此確定K。
5、 基於層次聚類:即基於合併或分裂的思想,在一定情況下停止從而獲得K。
6、 基於採樣的算法:即對樣本採樣,分別做聚類根據這些結果的相似性確定K。如,將樣本分爲訓練與測試樣本對訓練樣本訓練分類器,用於預測測試樣本類別,並與聚類的類別比較
7、 使用Canopy Method算法進行初始劃分。
8、 使用BIC算法進行初始劃分。