Apa Itu Data Mining: Langkah-Langkah Dan Contoh Nyata

Data mining adalah istilah bahasa Inggris yang terkait dengan ilmu komputer yang terjemahannya adalah data mining . Ini terdiri dari fungsionalitas yang mengatur data dalam pola , asosiasi , perubahan , dan anomali yang relevan . Istilah data mining pertama kali muncul pada tahun 1990 di komunitas basis data. Data mining adalah langkah analisis proses yang dikenal sebagai KDD ( Knowledge Discovery in Databases ), terjemahan literalnya menjadi “Knowledge Discovery in Databases”.

data mining dapat dibagi menjadi beberapa langkah dasar yaitu: eksplorasi, konstruksi model, definisi standar dan validasi dan verifikasi.

Data mining adalah praktik yang relatif baru di dunia komputasi, dan menggunakan pencarian informasi, kecerdasan buatan, pengenalan pola, dan teknik statistik untuk mencari korelasi antara data yang berbeda yang memungkinkan Anda memperoleh pengetahuan yang bermanfaat bagi perusahaan atau individu. Bagi sebuah perusahaan, data mining dapat menjadi alat penting yang meningkatkan inovasi dan profitabilitas.

Penggunaan data mining cukup umum di database besar, dan hasil akhir dari penggunaannya dapat ditampilkan melalui aturan, hipotesis, pohon keputusan, dendrogram, dll. Data mining yang dijalankan dengan baik harus menyelesaikan tugas-tugas seperti: deteksi anomali, aturan asosiasi pembelajaran (pemodelan dependensi), clustering , klasifikasi, regresi, dan summarization. data mining proses biasanya terjadi dengan menggunakan data yang terdapat dalam gudang data .

Ada beberapa perusahaan dan perangkat lunak yang didedikasikan untuk penambangan data, karena identifikasi pola dalam basis data semakin penting. Namun, identifikasi standar yang relevan tidak unik untuk dunia komputer. Otak manusia menggunakan proses serupa untuk mengidentifikasi pola dan memperoleh pengetahuan.

Dalam beberapa tahun terakhir, data mining telah banyak digunakan di bidang sains dan teknik seperti bioinformatika, genetika, kedokteran, pendidikan dan teknik elektro. Konsep data mining sering dikaitkan dengan penggalian informasi tentang perilaku masyarakat. Untuk alasan ini, dalam beberapa situasi, penambangan data memunculkan masalah hukum dan masalah yang terkait dengan privasi dan etika. Meskipun demikian, banyak orang mengklaim bahwa penambangan data secara etis netral karena tidak memiliki implikasi etis.

Contoh Penambangan Data Nyata

Data mining sering digunakan oleh perusahaan dan organisasi untuk mendapatkan pengetahuan tentang pengguna/karyawan/pelanggan. Misalnya, di sektor publik dimungkinkan untuk memeriksa silang antara status perkawinan seorang karyawan dan gaji yang diperolehnya untuk melihat apakah hal ini berpengaruh pada kehidupan perkawinannya.Perusahaan seperti jaringan supermarket dapat menggunakan data silang ini untuk menentukan produk yang dibeli bersama. Jika seorang pelanggan yang membeli produk X juga membeli produk Y, mungkin ada baiknya untuk menempatkan kedua produk di dekatnya untuk memudahkan pelanggan membeli.