Data Mining: Pengertian, Komponen Utama, Arsitektur, Dan Contoh
Materi Data Mining |
KakaKiky - Pada postingan kali ini kita akan membahas tentang Data Mining, mulai dari pengertian tentang data mining, arsitektur data mining, dan contoh data mining dalam kehidupan sehari-hari. Bagi kamu yang ingin mengetahui materi ini silahkan simak pembahasannya di bawah ini ya!
Apa Itu Data Mining?
Data Mining merupakan penambangan pengetahuan dari jumlah data yang banyak bisa juga disebut sebagai suatu proses penggalian dari sejumlah besar data yang bertujuan untuk menemukan informasi (knowledge). Data Mining juga dikenal dengan istilah Knowledge Discovery from Data (KDD). Selain itu juga masih banyak lagi istilah lainnya yang memiliki makna yang sama dengan data mining diantaranya adalah Knowledge Mining from Data, Knowledge Extraction, Data atau Pattern Annalysis, Data Archeology dan Data Dredging.
Untuk menemukan pengetahuan terdapat
beberapa proses yang memiliki urutan iterative yaitu:
- Data Cleaning: Tahap ini dilakukan untuk dapat menghilangkan noise dan data-data yang tidak konsisten.
- Data Integration: Tahapan untuk menggabungkan sumber yang telah diperoleh
- Data Selection: Tahapan pengambilan data yang relevan dengan tugas analisis. Data yang diambil berasal dari database.
- Data Transformation: Tahapan pengubahan kebentuk yang sesuai dengan pengumpulan. Dilakukan untuk operasi ringkasa/agregasi.
- Data Mining: Tahap ini dilakukan agar pola data dapat diekstrak dengan menerapkan metode pintar.
- Pattern Evaluation: Tahap yang digunakan untuk identifikasi serta mendapatkan pola yang menarik dengan melihat analisis yang telah dilakukan.
- Knowledge Presentation: Tahapan memvisualisasikan informasi yang telah diperoleh pada pengguna.
Komponen Utama Sistem Data Mining
Data Mining juga memiliki suatu sistem
yang mengharuskan memuat komponen-komponen utama sebagai berikut:
- Database, data warehouse, world word web, atau penyimpanan informasi lainnya
- Database atau data warehouse server
- Knowledge base
- Data mining engine
- Pattern eveluation module
- User interface.
Data Mining juga merupakan suatu langkah
utama dalam proses penemuan informasi di mana diterapkannya metode untuk
mengekstrak pola data. Data Mining adalah proses menemukan pengetahuan yang
menarik dari jumlah data yang besar (big data) yang tersimpan pada database,
gudang data, atau tempat penyimpanan informasi lainnya.
Dalam menganalisis data yang sangat
besar, tidak akan cukup hanya dengan proses seperti yang disebutkan di atas,
namun proses data mining harus dilakukan dengan efisiensi dan scable. Data
mining menggunakan suatu metode algoritma untuk analisis data agar efektif saat
dilakukannya pengalihan informasi dari sejumlah data yang besar. Algoritma yang
digunakan juga harus dibuat efisiensi dan dapat diukur yaitu dengan waktu
eksekusi dari algoritma juga harus sesuai dan realistis untuk data dengan
ukuran besar tersebut.
Arsitektur Data Mining
Data Mining juga memiliki arsitektur
yang memuat beberapa komponen utama yaitu sebagai berikut:
- Database, Data Warehouse, World Word Web, atau Penyimpanan Informasi lainnya. Hal-hal di atas adalah satu set database, gudang data, spreadsheet, atau repository informasi-informasi lainnya.
- Server adalah yang bertanggung jawab untuk mengambil data yang releban, berdasarkan permintaan data mining dari pengguna.
- Basis Pengetahuan Untuk menunjukkan pencarian atau evaluasi ketertarikan pola yang dihasilkannya
- Mesin Data Mining Biasanya terdiri dati satu set modul fungsional untuk tugas seperti karakterisasi, asosiasi, dan analisis korelasi, klasifikasi, prediksi, cluster analisis, outlier analisis, dan evolusis analisis.
- Modul Evaluasi Pola Menggunakan ketertarikan dan berinteraksi dengan modul data mining untuk mencari dengan fokus pola, dilakukan agar dapat menyaring pola yang ditemukan.
- Antarmuka Pengguna (User Interface) Sebagai perantara komunikasi antara pengguna dengan sistem penambangan data. Bertujuan juga untuk memudahkan pengguna dalam berinteraksi dengan sistem yang dapat menentukan kueri atau tugas penambangan data.
Alasan Data Mining Penting Sejak Teknologi Informasi Berkembang
Mengapa data mining menjadi penting
sejak teknologi informasi berkembang dengan begitu pesat dan dikaitkan dengan
Revolusi Industri 4.0?
Data Mining menjadi penting karena
tersedianya data dalam jumlah yang sangat besar serta kebutuhan untuk mengubah
data tersebut menjadi berbagai informasi yang berguna dan bermanfaat bagi
manusia dalam berbagai aspek-aspek kehidupan. Teknologi informasi yang telah
berkembang menciptakan berbagai kumpulan data serta informasi yang semakin hari
semakin besar.
Salah satu manfaat dari data mining
dalam kehidupan kita adalah penganalisaan pasar (analisis pasar), retensasi
pelanggan, kontrol produksi sains dan pendeteksi scamming (penipuan). Hal-hal
inilah yang menunjukkan betapa meningkatnya kebutuhan teknologi pada data,
media penyimpanan, pengunaan database, dan pengunaan pada aplikasi mobile
(smartphone).
Alasan Data Mining dikaitkan dengan
Revolusi Industri 4.0 adalah karena dunia kini telah memasuki era digital, di
mana data semakin berlimpah (big data). Sejak tahun 1960-an, teknologi
informasi dan database telah berkembang secara sistematis dari sistem file
primitif (kuno) ke yang canggih dan sistem pengolahan database yang kuat. Pola
data dapat ditambang dari banyaknya jenis database, misalkan seperti relasional
database, gudang datam transaksional, dan object – relational database.
Tantangan era Revolusi Industri 4.0
sangatlah besar. Era Revolusi Industri 4.0 hampir memasuki satu dekade.
Teknologi pada era ini terus-terusan mengalami perkembangan. Efek Revolusi
Industri 4.0 ini dapat dilihat dengan kasat mata yaitu pada kehidupan sehari –
hari. Banyak aktifitas – aktifitas lama yang sudah mengalami perubahan ataupun
pergantian. Perubahan tersebut ternyata memberi kenyamanan pada penggunanya
yang diakibatkan oleh kecepatan dan kemudahan akses. Era Revolusi Industri 4.0
sudah berada di tengah masyarakat dan terua menerus untuk beranjak maju.
Walaupun saat ini data mining berkembang
dengan begitu cepatnya, namun pastinya juga sistem ini dapat melakukan
kesalahan. Salah satu alasannya adalah karena jumlah data yang begitu besar dan
kurangnya kebutuhan alat-alat untuk menganalisis data yang kuat. Selain itu
jika data yang terlalu besar dibiarkan begitu saja sehingga data yang telah
terkumpul di dalam repository hanya akan menjadi arsip dan tidak dapat diolah
lagi menjadi informasi yang berguna bagi pengetahuan. Tentunya hal ini juga
sangat berpengaruh bagi hasil yang terdapat dalam teknologi yang diciptakan.
Semakin berkembang pesatnya teknologi
juga dapat dilihat dari semakin berkembang pesatnya beberapa e-commerce seperti
Shopee, Tokopedia, Bukalapak, Lazada, dan sebagainya sebagai toko online. Hal
lainnya juga ditunjukkan dari penggunaan media sosial seperti facebook,
twitter, instagram, pinterest, youtube, dan sebagainya. Para pengguna
aplikasi-aplikasi tersebut bukan hanya sebagai penikmat data-data yang sudah
tersedia, namun juga menjadi produsen dari data itu sendiri.
Contoh Penerapan Data Mining Dalam Kehidupan Sehari-Hari
Contoh Data Mining Dalam Kehidupan Sehari-hari
Karena kemampuan pengolahan dan dan
pengelolaannya serta mengekstrak data menjadi informasi yang menarik dan
berguna bagi pengguna, membuat Data Mining menjadi hal yang sangat bermanfaat
di berbagai aspek kehidupan sehari-hari. Sebagai contoh penerapan metode data
mining dalam bidang olahraga yaitu sebagi sensor atau alat untuk mencatat
jumlah statistik pada suatu permainan olahraga, misalkan basket, sepak bola,
voli, dan sebagainya. Di dalam olahraga basket, data mining digunakan untuk
menganalisa statistik permainan NBA, yaitu berapa jumlah shots yang dihasilkan,
skor permainan, blocked, assists, pelanggaran, dan sebagainya yang mencakup
keunggulan bersaing antara satu tim dengan tim yang lainnya.
Selain itu metode data mining juga dapat
diterapkan pada bisnis online, yaitu pada proses transaksi jual beli secara
online atau dapat dikatakan juga sebagai e-commerce yang menjadikan data mining
sebagai teknik yang paling sering digunakan oleh berbagai macam organisasi dan
perusahaan dalam skala besar yang bertujuan untuk pemasaran dan pengembangan
produk.
Beberapa contoh lainnya adalah penerapan
metode data miding pada aplikasi bidang perbankan, pemasaran, serta asuransi.
Dalam hal tesebut data minging dapat berkontribusi agar terciptanya pemecahan
masalah bisnis pada bidang perbankan dan keuangan dengan cara menemuka pola,
sebab-akibat, dan korelasi terhadap informasi bisnis dan harga pasar yang tak
selalu terlihat oleh manger. Karena jumlah volume data yang juga begitu sangat
besar.
Daalm bidang perkantoran, data mining
juga digunakan pada alat absen sidik jari atau finger print dan dalam bidang
telkomunikasi data mining digunakan sebagai sarana statistik yang bertujuan
untuk mencatat kepadatan jumlah penelepon di jam-jam tertentu. Hal ini
bertujuan untuk mencatan kepadatan jumlah penelepon di jam tertentu sehingga
operator yang menanggani dapat memberikan tarif tertentu bagi pelanggan mereka.
Nah sobat, itulah pembahasan lengkap
tentang Data Mining, mulai dari pengertian tentang data mining, arsitektur data
mining, dan contoh data mining dalam kehidupan sehari-hari. Semoga pembahasan
ini dapat menambah ilmu dan wawasan kamu dalam dunia teknologi. Cukup sekian,
wassalamu’alaikum and Be Prepared.