Machine Learning vs Datamining

Assalammu’alaikum,

Kali ini saya ingin share mengenai Machine Learning dan Datamining, lebih tepatnya mungkin perbedaan antara Machine Learning dan Datamining. Judulnya agak serem juga ya Machine Learning vs Datamining hehehe, tapi tujuannya bukan memperlihatkan mana yang lebih baik, tapi lebih kepada menjelaskan sebenarnya kapan suatu sistem learning atau pencarian pola atau pencarian knowledge (pengetahuan) dikatakan Machine Learning kapan dapat dikatakan Datamining.

Bahasan singkat ini sebenarnya saya ambil dari posting saya di facebook ketika selesai acara seminar CodeLabs UNIKOM yang ada materi mengenai datamining juga. Dan kenapa saya tulis kembali di blog, karena pada tanggal 29 Januari 2014 kemarin ada acara seperti penjelasan mengenai kelompok keilmuan E (Game Tech dan Artificial Intelligence) di Program Studi Teknik Informatika UNIKOM, kebetulan saya menjadi pengisi materi mengenai sistem rekognisi yang memanfaatkan Machine Learning dan ada yang menanyakan mengenai apa perbedaan Machine Learning dan Datamining.

Di UNIKOM untuk semester genap tahun ajaran 2013/2014 kelompok keilmuan dibagi menjadi 5 (A, B, C, D, E), kelompok A adalah Sistem Informasi, B adalah Rekayasa Perangkat Lunak, Teknologi Database, Datamining dan Business Intelligence (kurang lebih),  C adalah Jaringan dan Multimedia, D adalah Web Mobile Tech, dan E adalah Game Tech dan Artificial Intelligence dimana untuk AI didalamnya mencakup Computer Vision, Perceptual Computing, Natural Language Processing, terutama yang menggunakan Machine Learning.

Mahasiswa tersebut menanyakan, apa perbedaan Datamining di kelompok keilmuan B dan Machine Learning di kelompok keilmuan E.

Berikut pembahasan yang saya posting di facebook sebelumnya :

Kemarin setelah ada seminar mengenai datamining, saya sempat berfikir kembali mengenai kapan itu disebut machine learning dan kapan itu adalah datamining..

pernah saya tanyakan pada dosen pengampu datamining Bu Putri kemarin, saya mendapatkan jawaban kurang lebih dititik beratkan pada “…datamining menggunakan data yang sangat besar dalam proses penggalian pengetahuan…”

Lalu saya tanyakan kembali pada dosen pengampu machine learning Bu Masayu, karena setahu yang beliau ajarkan dan saya baca pada beberapa referensi semakin banyak experience maka semakin baik knowledge yang dibentuk, dan mendapatkan jawaban kurang lebih “…machine learning tidak menitik beratkan pada preprocessing…” , walaupun jika dilihat selama eksplorasi terdapat preprocessing seperti pada citra ataupun beberapa dataset dengan struktur tertentu. Namun belum mempermasalahkan kebutuhan pada proses bisnis tertentu.

Untuk sekarang saya setuju mengenai memang pada machine learning tidak mempelajari bagaimana prepare data atau preprocessing data, dan bagi saya mungkin datamining lah yang menggunakan metode machine learning untuk menggali pengetahuan… karena jika dikaitkan mengenai banyak data, ya pada dasarnya semakin banyak experience (data) semakin baik model yang dibentuk…
dan mungkin datamining biasanya erat kaitannya dengan mempelajari knowledge apa yang ingin dicari dan untuk kebutuhan business process apa… 

artinya datamining lebih dekat dengan penerapan dilapangan dibanding machine learning, karena perlu diutamakan melihat kebutuhan bisnis.

CMIIW

Uraian saya diatas semoga dapat sedikit memperjelas sebenarnya apa yang membedakan datamining dan machine learning, dan pada dasarnya datamining menggunakan algoritma yang ada machine learning, termasuk business intelligence menggunakan datamining dan memanfaatkan metode-metode atau algoritma yang ada di machine learning.

Dan untuk di IF UNIKOM apa yang membedakan Datamining di kelompok B dan Machine Learning di kelompok E.

Di B riset yang dilakukan lebih kepada pemanfaatan datamining dalam suatu process bisnis, sehingga itu memperlihatkan suatu business intelligence salah satunya. Artinya terdapat kebutuhan yang dapat dikatakan nyata di lapangan, terdapat proses bisnis yang jelas, dan sesuai kebutuhan proses bisnis masing-masing.

Sehingga Algoritma atau metode didalamnya tidak harus dibuat program khusus from scratch (dari awal) dalam risetnya, dapat menggunakan tools datamining atau business intelligence yang sudah tersedia, sehingga dapat langung diimplementasikan pada proses bisnis yang ada pada studi kasus dan dengan kata lain karena menggunakan tools yang sudah ada sehingga efeknya kita tidka bisa melakukan perubahan variabel tertentu atau parameter tertentu dalam metode ketika ingin melakukan optimasi pada sisi metode learning dalam datamining atau business intelligencenya. Namun dalam datamining pun lebih memperdalam mengenai tahapan bagaimana melakukan data processing, atau pre-processing untuk mempersiapkan dataset.

Sedangkan di kelompok keilmuan E (game tech dan AI) machine learning lebih di titik beratkan pada penerapan metode learning atau AI terhadap kasus tertentu, atau membandingkan lebih dari suatu metode pada suatu kasus tertentu, dan mendapatkan performasi nya yang berupa efektifitas dari metode tersebut terhadap masalah yang kita pilih, dan efisiensi (waktu dan ruang) dari metode tersebut. Dan didalamnya dapat dilakukan perubahan parameter atau variabel tertentu dalam suatu metode guna mencoba melakukan optimalisasi hasil dari segi efektifitas maupun efisiensi.

Artinya pada kelompok E kita membuat program Machine Learningnya benar-benar dari awal, karena program dibuat bertujuan melakukan experiment sebagai proof of concept yang sudah kita bangun sebelumnya. Kita melakukan analisis mengenai metode dan kasus, lalu dilihat jika metode A diterapkan pada kasus B, analisis kita seperti apa, dan ketika diimplementasikan menjadi menjadi seperti apa. Apakah hasil analisis dan experiment (implementasi) itu sama atau tidak? jika sama kenapa? jika tidak kenapa?

Artinya kita benar-benar melakukan riset mengenai bagaimana performasi metode tertentu terhadap masalah tertentu juga. Dan bagaimana jika ternyata belum ada kebutuhan di dunia nyata atau sebenarnya belum ada proses bisnis yang membutuhkan metode atau optimalisasi dari metode tersebut, kalau menurut pandangan saya, itu tidak masalah. Selama metodenya jelas, masalah yang mau kita ambil jelas (bukan masalah yang melatar belakangi dibuatnya suatu sistem/software seperti halnya keilmuan Sistem Informasi) dan juga Research Position (posisi riset, yang dapat membedakan dengan penelitian sebelumnya atau kontribusi kita terhadap area riset tersebut).

Karena pada dasarnya kelompok keilmuan E bagian dari Computer Science yang lebih fokus pada perspektif teknologi, teori, pembuktian suatu teori atau hipotesis, experiment, yang mungkin kita belum tahu dimasa yang akan datang akan dimanfaatkan pada field keilmuan mana atau kasus seperti apa.

Mungkin seperti itu pandangan saya terhadap Machine Learning dan Datamining khususnya yang ada di kelompok keilmuan Program Studi Teknik Informatika UNIKOM. Semoga bermanfaat.

Advertisements

3 thoughts on “Machine Learning vs Datamining

  1. Tanaya Lutfi September 16, 2014 / 6:00 pm

    pak hendri, saya ma tanya. kalo peran AI dalam data mining apa ya pak?
    terima kasih sebelumnya

    • situkangsayur September 17, 2014 / 12:45 am

      Kalau merujuk pada buku AI : Modern Approach (Stuart Russel dan Peter Norvig), Ai bisa dibagi menjadi 4 bagian yaitu:
      1. “Searching” yang biasa berupa problem resolving,
      2. “Planning” merupakan proses komputasi berbagai tahap untuk menyelesaikan suatu masalah namun sebelum dieksekusi (rencana),
      3. “Learning” proses pembelajaran,
      4. “reasoning” biasanya berupa inferences dari metode learning tertentu yang biasanya dibagi menjadi dua yaitu deductive dan inductive (bisa dibaca di artikel saya mengenai machine learning).

      Learning yang merupakan bagian dari AI biasa kita sebut “Machine Learning” dan dapat dikatakan merupakan core dari AI, karena merupakan bagian dimana mesin mempelajari berbagai hal dan merupakan tipe pembelajaran inductive (inductive inference).

      Sedangkan Datamining seperti yang sudah ditulis diatas “… pada dasarnya datamining menggunakan algoritma yang ada machine learning,..” untuk tujuan bisnis tertentu.

      Sehingga Datamining menggunakan metode Learning yang ada dalam AI, atau Datamining merupakan implementasi algoritma Learning yg ada dalam Ai (bagian dari AI) untuk kebutuhan/melakukan optimasi pada proses bisnis tertentu.

  2. Kang Agus January 7, 2015 / 2:13 pm

    nice article pak. Jazakallah bi khoir

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s