Laporan Data Mining Tentang Data Preprocessing
Data Preprocessing |
KakaKiky - Pada materi kuliah kali ini akan dibahas tentang laporan mata kuliah Data Mining tentang Data Preprocessing. Bagi kamu yang ingin mengetahui lebih lanjut tentang laporan ini, silahkan simak pembahasan selengkapnya di bawah ini!
Laporan Data Mining - Data Preprocessing
1. Importing The Libraries
- Fungsi matplotlib untuk membuatkan char
- Fungsi numpy untuk memanggil baris dan kolom
- Fungsi pandas untuk melakukan preprocessing.
2. Importing The Dataset
Variable x akan menampilkan kolom bagian
features, sedangkan variabel y menampilkan kolom bagian dependent variabel.
Pada gambar diatas ialah tampak data
yang berasal dari file data.csv yang masih belum diolah. Berdasarkan gambar
tersebut dapat dilihat bahwa sebuah dataset terdiri atas features dan dependent
variable. Features berisikan kategori, sedangkam dependent variable hanya
berisi 2 kemungkinan saja. Berikut ialah tampak hasil ketika program sudah
dijalankan:
a) Print (x)
Print(x) memanggil seluruh kolom kecuali
kolom akhir, karena dependent variabel. Output NaN, berarti tidak ada data.
b) Print (y)
Print(y) memanggil kolom pada bagian
akhir atau dependent variabel.
3. Taking Care of Missing Data
Gambar diatas ialah tampak contoh
program untuk memperbaiki data yang kosong atau hilang, saat dijalankan maka
akan menghasilkan output sebagai berikut:
Print(x) sudah menampilkan keseluruhan data, dan tidak ada lagi data yang kosong.
Nah sobat, itulah laporan singkat mata
kuliah Data Mining tentang Data Preprocessing yang dapat kamu jadikan bahan
pembelajaran. Semoga dapat bermanfaat bagi kamu yang sudah membaca, cukup
sekian, Wassalamu’alaikum and Be Prepared!