Laporan Data Mining Tentang Membangun Model Klasifikasi Menggunakan WEKA

laporan data mining membangun klasifikasi
Membangun model klasifikasi dengan WEKA

KakaKiky - Pada postingan perkuliahan kali ini Kiky akan membagikan laporan mata kuliah data mining tentang bagaimana cara membangun model klasifikasi dengan menggunakan software WEKA. Bagi kamu yang ingin tahu bagaimana caranya, silahkan simak pembahasan selengkapnya di bawah ini ya!

Membangun Model Klasifikasi Dengan Weka

A. Konversi file dataset ke dalama format .arff

Langkah-langkah yang harus dilakukan antara lain :

1. Bukalah situs http://archive.ics.uci.edu/ml/datasets/ untuk mencari dataset yang diinginkan pada situs UCI Repository yang memiliki attribute tipe numerik dan kategorik. Saya memilih krkopt.data untuk dataset yang akan diproses.

2. Ubah extension file dimana yang awalnya .data menjadi .csv untuk memudahkan file diubah menjadi .arff.

3. Berilah nama atribut pada setiap kolom sesuai dengan informasi atribut yang telah tertera pada situs UCI Repository seperti dibawah ini.

4. Setelah menambahkan nama atribut pada file, buka aplikasi WEKA untuk mengubah extension dataset .csv menjadi .arff.

5. Pilih Tool’ pada WEKA, lalu klik Arffviewer kemudian pilih File. Klik Open lalu pilih file krkopt.csv. Setelah file terbuka, simpan file dengan extension arff untuk mengubahnya dengan klik Save As lalu menyimpan file dengan extension .arff pada file dan klik Save. Jika sudah, data berhasil dikonversi.

B. Metode SVM untuk dataset krkopt.arff

Langkah-langkah yang harus dilakukan antara lain:

1. Buka aplikasi WEKA dan pilih Explorer. Masukkan data krkopt.arff dengan mengklik “Open File” dan pilih dataset krkopt.arff. Klik “Classify”, setelah itu klik “Choose”.

2. Untuk data numeric, saya menggunakan metode SVM. Klik pilihan “Function” lalu pilih SMO untuk penggunaan metode SVM.

3. Ubah Cross-Validation Fold menjadi 5 dan 10. Lalu klik Start.

Cross-Validation Fold: 5

Hasil yang akan diperoleh seperti yang dibawah ini:

Dari gambar di atas dapat kita ketahui :

  • Correctly Classified Instances: 34.6414 %
  • Incorrectly Classified Instances: 65.3586 %
  • Precision: 0.338
  • Recall: 0.346
  • F-Measure: 0.329

Cross-Validation Fold : 10

Hasil yang akan diperoleh seperti di bawah ini:

Dari gambar di atas dapat kita ketahui:

  • Correctly Classified Instances: 34.9373 %
  • Incorrectly Classified Instances: 65.0627 %
  • Precision: 0.341
  • Recall: 0.349
  • F-Measure: 0.332

Kesimpulan

Dari kedua hasil yang telah terlihat pada tabel diatas, dapat disimpulkan bahwa metode SVM yang digunakan pada dataset krkopt.arff dengan Cross- Validation Fold yang bernilai 10 lebih baik dalam mengenal dataset krkopt.arff dibandingkan dengan Cross-Validation Fold yang bernilai 5. Hal ini ditunjukkan dengan perbandingan nilai Correctly Classified Instances pada fold 10 lebih tinggi dibandingkan Cross-Validation Fold yang bernilai 5. Begitu juga dengan nilai Precision, Recall, dan F-Measure dimana nilai Cross-Validation Fold yang bernilai 10 lebih tinggi dibandingkan Cross-Validation Fold yang bernilai 5.

C. Metode Decision Tree untuk dataset krkopt.arff

Langkah-langkah yang harus dilakukan antara lain :

1. Buka aplikasi WEKA dan pilih Explorer. Masukkan data krkopt.arff dengan mengklik “Open File” dan pilih dataset krkopt.arff. Klik “Classify”, setelah itu klik “Choose”.

2. Untuk data kategorik, saya menggunakan metode Decision Tree. Klik pilihan Trees

lalu pilih J48 untuk penggunaan metode Decision Tree.

3. Ubah Cross-Validation Fold menjadi 5 dan 10. Lalu klik Start.

Cross-Validation Fold: 5

Hasil yang akan diperoleh seperti yang dibawah ini:

Dari gambar di atas dapat kita ketahui :

  • Correctly Classified Instances: 67.1086 %
  • Incorrectly Classified Instances: 32.8914 %
  • Precision: 0.672
  • Recall: 0.671
  • F-Measure: 0.670

Cross-Validation Fold: 10

Hasil yang akan diperoleh seperti yang dibawah ini:

Dari gambar di atas dapat kita ketahui :

  • Correctly Classified Instances: 68.7696 %
  • Incorrectly Classified Instances: 31.2304 %
  • Precision: 0.688
  • Recall: 0.688
  • F-Measure: 0.687

Kesimpulan

Dari kedua hasil yang telah terlihat pada tabel diatas, dapat disimpulkan bahwa metode Decision Tree yang digunakan pada dataset krkopt.arff dengan Cross-Validation Fold yang bernilai 10 lebih baik dalam mengenal dataset krkopt.arff dibandingkan dengan Cross-Validation Fold yang bernilai 5. Hal ini ditunjukkan dengan perbandingan nilai Correctly Classified Instances pada fold 10 lebih tinggi dibandingkan Cross-Validation Fold yang bernilai 5. Begitu juga dengan nilai Precision, Recall, dan F-Measure dimana nilai Cross- Validation Fold yang bernilai 10 lebih tinggi dibandingkan Cross-Validation Fold yang bernilai 5.

D. Kesimpulan

Dari seluruh data yang telah kita hasilkan, dapat kita simpulkan penggunaan metode Decision Tree lebih baik dibandingkan metode SVM dalam mengenal dataset krkopt.arff. Hal ini terlihat dari nilai Correctly Classified Instances, Incorectly Classified Instances, Precision, Recall, dan F-Measure yang dihasilkan pada metode Decision Tree lebih tinggi dibandingkan dengan nilai yang diperoleh dari metode SVM.

Nah sobat itulah laporan Data Mining tentang membangun model klasifikasi dengan WEKA lengkap dengan pembahasannya. Semoga dapat bermanfaat bagi kamu yang sedang mencari referensi laporan data mining. Cukup sekian, Wassalamu’alaikum and Be Prepared!