Kenapa dalam MSE, error di pangkatkan 2? dan kenapa ada yang mengambil 2m (jumlah data) untuk mengambil mean

Assalammu’alaikum,

baiklah setelah kemarin 2 kali seminar (seminar inaicta dan tesis) lau di hari Jum’at, 18 September 2015, 2 kali sidang (sidang tesis dan sidang Jum’at yang berbahagia) hehee… Ada pertanyaan yang dasar banget yang saya tidak bisa jawab, sebenarnya sebelumnya pernah baca penjelasan mengenai MSE dari mana asalnya, tapi saya ngeblank bener-bener lupa, dan memang belum tahu kenapa MSE seperti itu (tujuan squared, atau RMSE dengan tambahan akar pangkat 2 dari error). Jadi pertanyaannya kurang lebih :

  1. apa arti pangkat 2 dari pada RMSE atau MSE?
  2. kenapa dalam MSE yang saya gunakan dalam penelitian tesis itu 1/2m, dimana ‘m’ adalah jumlah data, dan kenapa dalam RMSE digunakan squared root atau akar pangkat 2?
  3. dan apa perbedaanya MSE dan RMSE? kenapa tida jumlahkan errornya lalu bagi jumlah data saja?

Saya agak ngeblank , mencoba mengingat apapun yg pernah saya baca atau lihat videonya, dalam referensi machine learning banyak yg menyebutkan karena “lebih sering digunakan”, tapi kenapa bentuk fungsinya hrs seperti itu? karena make sense kenapa tidak langsung saja delta atau error dibagi jumlah data (absolute error). Setelah sampai masjid baru inget, ada di part video Andrew Ng (entah bagian discussionnya) hahaha…

time to googling dan stackexchange 😀

Nah setelah mendapatkan beberapa informasi berikut hasil pencarian dan diskusi di FB dengan para ahli yg lebih ahli dan lebih senior hehe :

“Revisiting a 90-year-old debate: the advantages of the mean deviation, lebih cenderung ke mean deviation…  tapi http://stats.stackexchange.com/…/mean-absolute-deviation-vs… ,

“the mean deviation is rarely used”…. ada yang bilang agar lebih efisien, atau lebih mudah…

http://stats.stackexchange.com/…/why-square-the-difference-…

https://ww1.cpa-apc.org/Publicat…/…/PDF/1996/Oct/strein2.pdf

http://www.leeds.ac.uk/educol/documents/00003759.htm

Mean Deviation vs Standard Deviation..

untuk penggunaan 1/2m hanya untuk mempermudah membaca cost function dengan mengkalikan dengan setengah. hasilnya akan sama, terhadap proses minimisasi gradien.

 

Dan berikut beberapa komentar diskusi di FB : Continue reading

Data Science ada dimana-mana

Assalammu’alaikum wr.wb,

Kemarin saya sehabis pulang dari salah satu ecommerce di Indonesia untuk mendiskusikan berbagai possibility yang bisa mereka lakukan pada beberapa sistem mereka agar lebih pintar dan memanfaatkan seluruh data yang mereka miliki, bertemu dengan seseorang kita sebut saja mas boy yang berprofesi sebagai salesman produk makanan di perusahaan makanan lokal yang ternama.

Saya kebetulan mendapatkan tempat duduk yang bersebelahan dengan mas boy setelah itu berkenalan dan ngobrol lalu membicarakan mengenai kultur perusahaan, tempat kerja dan lain-lain. Saya ketahui ternyata mas boy ini salesman senior di suatu perusahaan dan sudah mencoba berbagai perusahaan. Lalu saya tanya-tanya mengenai pekerjaannya, apa yang dikerjakannya. Continue reading

Apa itu Deep Learning ??

Assalammu’alaikum,

Kali ini saya ingin share mengenai apa itu deep learning, setidaknya sejauh yang saya pelajari hingga hari ini, kebetulan di startup yang kami bangun (bareng teman-teman saya) di starlabs.id (PT. Starlabs Global Teknologi) sedang mencoba mengimplementasikan engine untuk machine learning dan dua algoritma deep learning.

Banyak referensi yang bisa kita gunakan mengenai deep learning, terutama dari berbagai perusahaan besar dunia sekelas google, facebook, baidu, microsoft, amazon, nvidia dan lain-lain. Apa itu Deep Learning? seberapa penting atau seberapa bernilai deep learning? terutama untuk business, siapa tokoh yang banyak melakukan riset atau membangun deep learning? Dan kenapa saya dan teman-teman ingin membangun engine sendiri untuk machine learning? bukankah banyak framework, library dan services (terutama seperti azure dan aws) untuk machine learning? Continue reading

Machine Learning vs Datamining

Assalammu’alaikum,

Kali ini saya ingin share mengenai Machine Learning dan Datamining, lebih tepatnya mungkin perbedaan antara Machine Learning dan Datamining. Judulnya agak serem juga ya Machine Learning vs Datamining hehehe, tapi tujuannya bukan memperlihatkan mana yang lebih baik, tapi lebih kepada menjelaskan sebenarnya kapan suatu sistem learning atau pencarian pola atau pencarian knowledge (pengetahuan) dikatakan Machine Learning kapan dapat dikatakan Datamining.

Bahasan singkat ini sebenarnya saya ambil dari posting saya di facebook ketika selesai acara seminar CodeLabs UNIKOM yang ada materi mengenai datamining juga. Dan kenapa saya tulis kembali di blog, karena pada tanggal 29 Januari 2014 kemarin ada acara seperti penjelasan mengenai kelompok keilmuan E (Game Tech dan Artificial Intelligence) di Program Studi Teknik Informatika UNIKOM, kebetulan saya menjadi pengisi materi mengenai sistem rekognisi yang memanfaatkan Machine Learning dan ada yang menanyakan mengenai apa perbedaan Machine Learning dan Datamining. Continue reading

Big Data (from workshop big data itb 29 Nov 2013) dan Bisnis Intellijen

Bigdata merupakan issue yang cukup hangat diperbincangkan sejak tahun 2009 hingga sekarang, namun kebutuhan Big Data itu sendiri sebenarnya sudah berkembang sejak lama, bahkan era 90an pada saat data pada satuan GB masuk kedalam kategori cukup besar mengingat spesifikasi storage device yang tidak sebesar masa sekarang.

Big data pun dimaknai sebagai engembangan dari pandangan tradisional dalam pengolahan, dimana unstructured data harus mulai dikelola agar dapat mendukung proses pengambilan keputusan. Sumber data baru ini, yaitu unstructured data, berdampak pada lonjakan ukuran dan kompleksitas yang melebihi kapasitas dan kapabilitas metoda, teknik, dan system konvensional yang telah ada. Oleh karena itu, diperlukan pendekatan baru dalam melakukan pengelolaan data. Big data adalah data yang secara umum memiliki karakteristik 4V yaitu: variety (keragaman, struktur, keterhubungan), velocity (kecepatan pertumbuhan data, data stream), volume (jumlah), dan veracity (akurasi dan kebenaran). Continue reading

Tugas Akhir Ilmu Komputer di UNIKOM

Assalammu’alaikum,

Nah sudah menjelang awal 2014 dan akhir 2013, kali ini saya ingin share opini saya mengenai perkembangan tugas akhir di if unikom untuk yang membahas mengenai area ilmu komputer atau sain komputer selama saya mengajar di UNIKOM. Area yang saya maksud adalah Artificial Intelligence, computer vision atau sistem rekognisi, sistem terdistribusi ataupun sistem berkinerja tinggi (komputasi berkinerja tinggi) yang kalau di unikom ada di kelompok keilmuan C, yang beberapa diantaranya saya pelajari di perkuliahan saya program magister saya di itb, dan mungkin juga ini termasuk kriptografi dan steganografi. Oh ya, saya sendiri adalah alumni S1 teknik Informatika sehingga seperti kata dosen saya kemarin, saya mungkin akan lebih punya sense untuk memiliki rasa ingin membantu merubah prodi if unikom lebih baik ketimbang dosen saya tersebut.

Saya merasa sedikit ada perbedaan yang sangat mendasar dan urgen terhadap beberapa penelitian mahasiswa di if unikom untuk area-area tersebut, termasuk tugas akhir saya sendiri sebelumnya, sehingga karena saya saat artikel ini ditulis saya masih berstatus dosen if unikom, saya sempat memberikan sedikit masukan ketika rapat mengenai skripsi/tugas akhir if unikom. Namun sayang sekali mendapat penolakan yang bagi saya tetap alasannya tidak logis bagi saya yang beberapa bulan atau 1.5 tahun terakhir saya banyak diberikan tugas eksplorasi oleh dosen-dosen saya di S2 itb, sehingga saya banyak mencari referensi untuk membantu saya dalam menyelesaikan tugas-tugas kuliah saya tersebut. Continue reading