Chapter 3
Selamat siang
menjelang istirahat kantor….
Ketemu lagi
dikesempatan yang sebenarnya kurang berbahagia ini buat sang penulis,
dikarenakan saya sedang dalam masa berkabung… BB saya baru saja wafat saudara!
(just an unimportant info, forget it!).
Oke,
dikesempatan kali ini saya mau membahas lebih lanjut tentang Data Warehouse. Namun,
pembahasan kali ini lebih berfokus pada Data Mining.
Landasan
utama kenapa saya ingin membahas Data Mining adalah karena sebenarnya saya pribadi
masih bingung tentang perbedaan serta hubungan antara Data Mining dengan Data
warehouse. Istilah-istilah tersebut kelihatan seperti istilah kembar siam tapi
tak sama, karena kedua istilah tersebut sama-sama menggunakan kata depan “Data”
(sedikit maksa memang!). Oke, langsung aja kita masuk ke pembahasan…
Apa itu Data
Mining?
Ada beberapa
definisi terkait dengan Data Mining, diantara:
- Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar, merupakan evolusi alami dari teknologi database dan merupakan metode yang paling banyak dibutuhkan dengan penggunaan aplikasi yang sangat luas.
- Ekstraksi dari suatu informasi yang berguna dan menarik.
- Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mecari pola dan aturan yang berarti.
Jadi, pada dasarnya
Data Mining berhubungan erat dengan analisa data dan penggunaan perangkat lunak
untuk mencari pola dan kesamaan dalam sekumpulan data. Data Mining
mengekstraksi pola yang sebelumnya tidak terlihat atau tidak begitu jelas
sehingga tidak seorangpun yang memperhatikan adanya informasi penting yang dapat
diperoleh.
Lalu apa beda
data mining dengan data warehouse dan OLAP (On-line Analytical Processing)?
Secara singkat bisa dijawab bahwa teknologi yang ada di data warehouse dan OLAP
dimanfaatkan penuh untuk melakukan data mining. Gambar di bawah menunjukkan
posisi masing-masing teknologi:
Gambar 1: Data
mining dan teknologi database lainnya
Dari gambar
di atas terlihat bahwa teknologi data warehouse digunakan untuk melakukan OLAP,
sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk
seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi
tentunya). Dalam prakteknya, data mining juga mengambil data dari data
warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik
dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang
mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data
mining seperti: information science (ilmu informasi), high performance
computing, visualisasi, machine learning, statistik, neural networks (jaringan
syaraf tiruan), pemodelan matematika, information retrieval dan information
extraction serta pengenalan pola. Bahkan pengolahan citra (image processing)
juga digunakan dalam rangka melakukan data mining terhadap data image/spatial.
Dengan
memadukan teknologi OLAP dengan data mining diharapkan pengguna dapat melakukan
hal-hal yang biasa dilakukan di OLAP seperti drilling/rolling untuk melihat
data lebih dalam atau lebih umum, pivoting, slicing dan dicing. Semua hal
tersebut diharapkan nantinya dapat dilakukan secara interaktif dan dilengkapi
dengan visualisasi.
Nah, jadi
seperti itu pembahasannya saudara. Sekian dulu ya dari saya, semoga dapat
menambah wawasan…. Saya mau ngacir dulu, waktu istirahat kantor nya udah mau
abis. See you next time! ^_^
Info yang bagus nih sist,
BalasHapusSaya kurang paham nih maksud dari "Data mining digunakan untuk melakukan information discovery". Information discovery disini, informasi yang bagaimana yah sist? thanks.
Pada artikel disebutkan:
BalasHapus"Dengan memadukan teknologi OLAP dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan di OLAP seperti drilling/rolling untuk melihat data lebih dalam atau lebih umum, pivoting, slicing dan dicing"
Boleh dijelaskan pengertian drilling/rolling, pivoting, slicing dan dicing gag? Hehee...
Berkunjung ke http://dapatilmubareng.wordpress.com/2013/10/01/pengenalan-e-goverment/ yah..
Terimakasih..
@SisIra: maksud dari information discovery itu adalah data mining digunakan untuk mengumpulkan / menemukan informasi-nformasi penting yang nantinya dapat digunakan oleh para data analis / bisnis analis dalam membuat keputusan.
BalasHapuscontoh jika sebuah Bank pemberi kartu kredit mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar Rp. 1.000 per buah maka biaya yang dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah Rp. 12 Milyar!! Dari dana Rp. 12 Milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? Mungkin hanya 10%-nya saja. Secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia. Dari informasi inilah seorang analis dituntut untuk bijak dalam membuat keputusan bagi perusahaannya.
@SisMinarti: maksud Drilling/Rolling yaitu untuk menampilkan data pada level yang lebih detil atau untuk agregasi dari satu dimensi atau beberapa dimensi.
BalasHapusRotation/Pivoting yaitu melihat data dari berbagai sudut pandang (view point). kita dapat memutar-mutar sumbu pada cube sehingga kita memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang kita perlukan.
Slicing dan dicing yaitu Slicing merupakan pemotongan sisi dari cube, artinya data yang kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan penyaringan subset data dari proses slicing.
noted: Cube merupakan contoh data multidimensi selain spreadsheet. Dengan cube data menjadi lebih mudah untuk dimanipulasi.
mau tanya neh teknik pencarian data mining itu apa saja bisa di jelaskan?
BalasHapussilakan berkunjung ke zayikin.bologspot.com
Teknik-teknik dalam Data Mining yang bisa diterapkan antara lain : market basket analysis dan Algoritma Apriori.
BalasHapusMarket basket analyst merupakan Analisis dari kebiasaan membeli customer dengan mencari asosiasi dan korelasi antara item-item berbeda yang diletakkan customer dalam keranjang belanjaannya. Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan bisnis.
Algoritma Apriori bertujuan untuk menemukan frequent itemsets yang dijalankan pada sekumpulan data.