顯示具有 WEKA 標籤的文章。 顯示所有文章
顯示具有 WEKA 標籤的文章。 顯示所有文章

2010年8月11日 星期三

WEKA:由程式產生資料庫 Instances

WEKA API 請參閱官方網站:http://www.cs.waikato.ac.nz/ml/weka/

由於 WEKA 有自己專用的檔案格式 ARFF
但資料在記憶體中做完 preprocessing 以後,還得特地存成 *.arff 檔
再叫 WEKA 的 API 把 *.arff 檔讀進來,顯然是很蠢的事情=..=~
經過一番尋找,總算在官方文件中發現產生 Instances 資料庫的方法了!

可參閱:Creating an ARFF file

2010年8月6日 星期五

WEKA:K-Means 分群演算法

K-Means 分群演算法:
輸入一群資料,以及設定為需要分成 c 群
演算法會先隨便找出 c 個點當作中心點
然後對剩下的每個點都去計算跟這 c 個中心點的距離,來決定要把他們分在哪一群
遞迴是先找出這 c 群中下一個中心點
也就是對每一個點都去計算群內其他點到這個點的距離平方
找出全體的距離平方最短的那個點,就是下一個中心點~
而如果每一群找出來中心點都跟原本一樣,就表示已經找到局部最小值了~