DATA MINING
Data Mining adalah serangkaian proses untuk menggali nilai
tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak
diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha
untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar.
Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu
seperti kecerdasan buatan (artificial intelligent), machine learning, statistik
dan database. Data mining adalah proses menerapkan metode ini untuk data dengan
maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining
adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat
yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini
sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan,
penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun
oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan
perjalanan penumpang penerbangan, data sensus dan supermarket scanner data
untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk
membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan
terhadap collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan
data mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili
seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis
tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi
masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan
pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.
Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau
dihapus sama sekali, selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur
Data Mining dalam penerapannya antara lain: clustering, classification,
association rule mining, neural network, genetic algorithm dan lain-lain. Yang
membedakan persepsi terhadap Data Mining adalah perkembangan teknik-teknik Data
Mining untuk aplikasi pada database skala besar. Sebelum populernya Data
Mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.
Tidak ada komentar:
Posting Komentar