Laporan Data Mining Tentang Membangun Model Klasifikasi Menggunakan WEKA
Membangun model klasifikasi dengan WEKA |
KakaKiky - Pada postingan perkuliahan kali ini Kiky akan membagikan laporan mata kuliah data mining tentang bagaimana cara membangun model klasifikasi dengan menggunakan software WEKA. Bagi kamu yang ingin tahu bagaimana caranya, silahkan simak pembahasan selengkapnya di bawah ini ya!
Membangun Model Klasifikasi Dengan Weka
A. Konversi file dataset ke dalama format .arff
Langkah-langkah yang harus dilakukan
antara lain :
1. Bukalah situs
http://archive.ics.uci.edu/ml/datasets/ untuk mencari dataset yang diinginkan
pada situs UCI Repository yang memiliki attribute tipe numerik dan kategorik.
Saya memilih krkopt.data untuk dataset yang akan diproses.
2. Ubah extension file dimana yang
awalnya .data menjadi .csv untuk memudahkan file diubah menjadi .arff.
3. Berilah nama atribut pada setiap
kolom sesuai dengan informasi atribut yang telah tertera pada situs UCI
Repository seperti dibawah ini.
4. Setelah menambahkan nama atribut pada
file, buka aplikasi WEKA untuk mengubah extension dataset .csv menjadi .arff.
5. Pilih Tool’ pada WEKA, lalu klik
Arffviewer kemudian pilih File. Klik Open lalu pilih file krkopt.csv. Setelah
file terbuka, simpan file dengan extension arff untuk mengubahnya dengan klik
Save As lalu menyimpan file dengan extension .arff pada file dan klik Save.
Jika sudah, data berhasil dikonversi.
B. Metode SVM untuk dataset krkopt.arff
Langkah-langkah yang harus dilakukan
antara lain:
1. Buka aplikasi WEKA dan pilih
Explorer. Masukkan data krkopt.arff dengan mengklik “Open File” dan pilih
dataset krkopt.arff. Klik “Classify”, setelah itu klik “Choose”.
2. Untuk data numeric, saya menggunakan
metode SVM. Klik pilihan “Function” lalu pilih SMO untuk penggunaan metode SVM.
3. Ubah Cross-Validation Fold menjadi 5
dan 10. Lalu klik Start.
Cross-Validation Fold: 5
Hasil yang akan
diperoleh seperti yang dibawah ini:
Dari gambar di atas dapat kita ketahui :
- Correctly Classified Instances: 34.6414 %
- Incorrectly Classified Instances: 65.3586 %
- Precision: 0.338
- Recall: 0.346
- F-Measure: 0.329
Cross-Validation Fold : 10
Hasil yang
akan diperoleh seperti di bawah ini:
Dari gambar di atas dapat kita ketahui:
- Correctly Classified Instances: 34.9373 %
- Incorrectly Classified Instances: 65.0627 %
- Precision: 0.341
- Recall: 0.349
- F-Measure: 0.332
Kesimpulan
Dari kedua hasil yang telah terlihat
pada tabel diatas, dapat disimpulkan bahwa metode SVM yang digunakan pada
dataset krkopt.arff dengan Cross- Validation Fold yang bernilai 10 lebih baik
dalam mengenal dataset krkopt.arff dibandingkan dengan Cross-Validation Fold yang
bernilai 5. Hal ini ditunjukkan dengan perbandingan nilai Correctly Classified
Instances pada fold 10 lebih tinggi dibandingkan Cross-Validation Fold yang
bernilai 5. Begitu juga dengan nilai Precision, Recall, dan F-Measure dimana
nilai Cross-Validation Fold yang bernilai 10 lebih tinggi dibandingkan
Cross-Validation Fold yang bernilai 5.
C. Metode Decision Tree untuk dataset krkopt.arff
Langkah-langkah yang harus dilakukan
antara lain :
1. Buka aplikasi WEKA dan pilih
Explorer. Masukkan data krkopt.arff dengan mengklik “Open File” dan pilih
dataset krkopt.arff. Klik “Classify”, setelah itu klik “Choose”.
2. Untuk data kategorik, saya
menggunakan metode Decision Tree. Klik pilihan Trees
lalu pilih J48 untuk penggunaan metode
Decision Tree.
3. Ubah Cross-Validation Fold menjadi 5
dan 10. Lalu klik Start.
Cross-Validation Fold: 5
Hasil yang
akan diperoleh seperti yang dibawah ini:
Dari gambar di atas dapat kita ketahui :
- Correctly Classified Instances: 67.1086 %
- Incorrectly Classified Instances: 32.8914 %
- Precision: 0.672
- Recall: 0.671
- F-Measure: 0.670
Cross-Validation Fold: 10
Hasil yang akan diperoleh seperti yang
dibawah ini:
Dari gambar di atas dapat kita ketahui :
- Correctly Classified Instances: 68.7696 %
- Incorrectly Classified Instances: 31.2304 %
- Precision: 0.688
- Recall: 0.688
- F-Measure: 0.687
Kesimpulan
Dari kedua hasil yang telah terlihat
pada tabel diatas, dapat disimpulkan bahwa metode Decision Tree yang digunakan
pada dataset krkopt.arff dengan Cross-Validation Fold yang bernilai 10 lebih
baik dalam mengenal dataset krkopt.arff dibandingkan dengan Cross-Validation
Fold yang bernilai 5. Hal ini ditunjukkan dengan perbandingan nilai Correctly
Classified Instances pada fold 10 lebih tinggi dibandingkan Cross-Validation
Fold yang bernilai 5. Begitu juga dengan nilai Precision, Recall, dan F-Measure
dimana nilai Cross- Validation Fold yang bernilai 10 lebih tinggi dibandingkan
Cross-Validation Fold yang bernilai 5.
D. Kesimpulan
Dari seluruh data yang telah kita
hasilkan, dapat kita simpulkan penggunaan metode Decision Tree lebih baik
dibandingkan metode SVM dalam mengenal dataset krkopt.arff. Hal ini terlihat
dari nilai Correctly Classified Instances, Incorectly Classified Instances,
Precision, Recall, dan F-Measure yang dihasilkan pada metode Decision Tree
lebih tinggi dibandingkan dengan nilai yang diperoleh dari metode SVM.
Nah sobat itulah laporan Data Mining
tentang membangun model klasifikasi dengan WEKA lengkap dengan pembahasannya.
Semoga dapat bermanfaat bagi kamu yang sedang mencari referensi laporan data
mining. Cukup sekian, Wassalamu’alaikum and Be Prepared!