Selasa, 01 Oktober 2013

Sekilas Data Mining

Chapter 3

Selamat siang menjelang istirahat kantor….
Ketemu lagi dikesempatan yang sebenarnya kurang berbahagia ini buat sang penulis, dikarenakan saya sedang dalam masa berkabung… BB saya baru saja wafat saudara! (just an unimportant info, forget it!).
Oke, dikesempatan kali ini saya mau membahas lebih lanjut tentang Data Warehouse. Namun, pembahasan kali ini lebih berfokus pada Data Mining.
Landasan utama kenapa saya ingin membahas Data Mining adalah karena sebenarnya saya pribadi masih bingung tentang perbedaan serta hubungan antara Data Mining dengan Data warehouse. Istilah-istilah tersebut kelihatan seperti istilah kembar siam tapi tak sama, karena kedua istilah tersebut sama-sama menggunakan kata depan “Data” (sedikit maksa memang!). Oke, langsung aja kita masuk ke pembahasan…

Apa itu Data Mining?
Ada beberapa definisi terkait dengan Data Mining, diantara:
  • Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar, merupakan evolusi alami dari teknologi database dan merupakan metode yang paling banyak dibutuhkan dengan penggunaan aplikasi yang sangat luas.
  • Ekstraksi dari suatu informasi yang berguna dan menarik.
  • Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mecari pola dan aturan yang berarti.

Jadi, pada dasarnya Data Mining berhubungan erat dengan analisa data dan penggunaan perangkat lunak untuk mencari pola dan kesamaan dalam sekumpulan data. Data Mining mengekstraksi pola yang sebelumnya tidak terlihat atau tidak begitu jelas sehingga tidak seorangpun yang memperhatikan adanya informasi penting yang dapat diperoleh.
Lalu apa beda data mining dengan data warehouse dan OLAP (On-line Analytical Processing)? Secara singkat bisa dijawab bahwa teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining. Gambar di bawah menunjukkan posisi masing-masing teknologi:

Gambar 1: Data mining dan teknologi database lainnya

Dari gambar di atas terlihat bahwa teknologi data warehouse digunakan untuk melakukan OLAP, sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data mining seperti: information science (ilmu informasi), high performance computing, visualisasi, machine learning, statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information extraction serta pengenalan pola. Bahkan pengolahan citra (image processing) juga digunakan dalam rangka melakukan data mining terhadap data image/spatial.

Dengan memadukan teknologi OLAP dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan di OLAP seperti drilling/rolling untuk melihat data lebih dalam atau lebih umum, pivoting, slicing dan dicing. Semua hal tersebut diharapkan nantinya dapat dilakukan secara interaktif dan dilengkapi dengan visualisasi.


Nah, jadi seperti itu pembahasannya saudara. Sekian dulu ya dari saya, semoga dapat menambah wawasan…. Saya mau ngacir dulu, waktu istirahat kantor nya udah mau abis. See you next time! ^_^

6 comments:

  1. Info yang bagus nih sist,

    Saya kurang paham nih maksud dari "Data mining digunakan untuk melakukan information discovery". Information discovery disini, informasi yang bagaimana yah sist? thanks.

    BalasHapus
  2. Pada artikel disebutkan:
    "Dengan memadukan teknologi OLAP dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan di OLAP seperti drilling/rolling untuk melihat data lebih dalam atau lebih umum, pivoting, slicing dan dicing"
    Boleh dijelaskan pengertian drilling/rolling, pivoting, slicing dan dicing gag? Hehee...

    Berkunjung ke http://dapatilmubareng.wordpress.com/2013/10/01/pengenalan-e-goverment/ yah..
    Terimakasih..

    BalasHapus
  3. @SisIra: maksud dari information discovery itu adalah data mining digunakan untuk mengumpulkan / menemukan informasi-nformasi penting yang nantinya dapat digunakan oleh para data analis / bisnis analis dalam membuat keputusan.

    contoh jika sebuah Bank pemberi kartu kredit mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar Rp. 1.000 per buah maka biaya yang dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah Rp. 12 Milyar!! Dari dana Rp. 12 Milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? Mungkin hanya 10%-nya saja. Secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia. Dari informasi inilah seorang analis dituntut untuk bijak dalam membuat keputusan bagi perusahaannya.

    BalasHapus
  4. @SisMinarti: maksud Drilling/Rolling yaitu untuk menampilkan data pada level yang lebih detil atau untuk agregasi dari satu dimensi atau beberapa dimensi.

    Rotation/Pivoting yaitu melihat data dari berbagai sudut pandang (view point). kita dapat memutar-mutar sumbu pada cube sehingga kita memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang kita perlukan.

    Slicing dan dicing yaitu Slicing merupakan pemotongan sisi dari cube, artinya data yang kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan penyaringan subset data dari proses slicing.

    noted: Cube merupakan contoh data multidimensi selain spreadsheet. Dengan cube data menjadi lebih mudah untuk dimanipulasi.

    BalasHapus
  5. mau tanya neh teknik pencarian data mining itu apa saja bisa di jelaskan?

    silakan berkunjung ke zayikin.bologspot.com

    BalasHapus
  6. Teknik-teknik dalam Data Mining yang bisa diterapkan antara lain : market basket analysis dan Algoritma Apriori.

    Market basket analyst merupakan Analisis dari kebiasaan membeli customer dengan mencari asosiasi dan korelasi antara item-item berbeda yang diletakkan customer dalam keranjang belanjaannya. Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan bisnis.

    Algoritma Apriori bertujuan untuk menemukan frequent itemsets yang dijalankan pada sekumpulan data.

    BalasHapus