Kenapa dalam MSE, error di pangkatkan 2? dan kenapa ada yang mengambil 2m (jumlah data) untuk mengambil mean

Assalammu’alaikum,

baiklah setelah kemarin 2 kali seminar (seminar inaicta dan tesis) lau di hari Jum’at, 18 September 2015, 2 kali sidang (sidang tesis dan sidang Jum’at yang berbahagia) hehee… Ada pertanyaan yang dasar banget yang saya tidak bisa jawab, sebenarnya sebelumnya pernah baca penjelasan mengenai MSE dari mana asalnya, tapi saya ngeblank bener-bener lupa, dan memang belum tahu kenapa MSE seperti itu (tujuan squared, atau RMSE dengan tambahan akar pangkat 2 dari error). Jadi pertanyaannya kurang lebih :

  1. apa arti pangkat 2 dari pada RMSE atau MSE?
  2. kenapa dalam MSE yang saya gunakan dalam penelitian tesis itu 1/2m, dimana ‘m’ adalah jumlah data, dan kenapa dalam RMSE digunakan squared root atau akar pangkat 2?
  3. dan apa perbedaanya MSE dan RMSE? kenapa tida jumlahkan errornya lalu bagi jumlah data saja?

Saya agak ngeblank , mencoba mengingat apapun yg pernah saya baca atau lihat videonya, dalam referensi machine learning banyak yg menyebutkan karena “lebih sering digunakan”, tapi kenapa bentuk fungsinya hrs seperti itu? karena make sense kenapa tidak langsung saja delta atau error dibagi jumlah data (absolute error). Setelah sampai masjid baru inget, ada di part video Andrew Ng (entah bagian discussionnya) hahaha…

time to googling dan stackexchange 😀

Nah setelah mendapatkan beberapa informasi berikut hasil pencarian dan diskusi di FB dengan para ahli yg lebih ahli dan lebih senior hehe :

“Revisiting a 90-year-old debate: the advantages of the mean deviation, lebih cenderung ke mean deviation…  tapi http://stats.stackexchange.com/…/mean-absolute-deviation-vs… ,

“the mean deviation is rarely used”…. ada yang bilang agar lebih efisien, atau lebih mudah…

http://stats.stackexchange.com/…/why-square-the-difference-…

https://ww1.cpa-apc.org/Publicat…/…/PDF/1996/Oct/strein2.pdf

http://www.leeds.ac.uk/educol/documents/00003759.htm

Mean Deviation vs Standard Deviation..

untuk penggunaan 1/2m hanya untuk mempermudah membaca cost function dengan mengkalikan dengan setengah. hasilnya akan sama, terhadap proses minimisasi gradien.

 

Dan berikut beberapa komentar diskusi di FB :

Screen Shot 2016-01-18 at 10.56.08 PM

Screen Shot 2016-01-18 at 10.56.29 PM

Screen Shot 2016-01-18 at 10.56.44 PM

Screen Shot 2016-01-18 at 10.57.11 PM

Screen Shot 2016-01-18 at 10.57.34 PM

Screen Shot 2016-01-18 at 10.57.50 PM

Screen Shot 2016-01-18 at 10.57.59 PM

Sebenernya mau di postingnya tahun 2015, September kemarin, tapi baru inget di publishnya 18 Januari 2016 hehe

Sekian, karena lagi males menulis ulang untuk di ringkas, jadi screen shotnya saja saya tampilkan hehe..

Semoga bermanfaat.

Advertisements

2 thoughts on “Kenapa dalam MSE, error di pangkatkan 2? dan kenapa ada yang mengambil 2m (jumlah data) untuk mengambil mean

  1. sukasenyumm March 28, 2016 / 9:38 pm

    Saya tertarik dengan pembahasan ini..
    tapi masih bingung menyimpulkan hasil pertanyaan yang anda bahas.. jadi jawaban singkat mengapa 1/2m itu seperti apa? kemudian ini juga terkait dengan MSE pada jaringan syaraf.(misal training dengan backpropagation).. bagaimana mengaitkan dengan regresi linear dari penjelasan mengenai 1/2m?

    • situkangsayur March 29, 2016 / 11:14 pm

      Tadi di atas saya menulis “…untuk mempermudah membaca cost function dengan mengkalikan dengan setengah. hasilnya akan sama, terhadap proses minimisasi gradien…” Tujuannya adalah mempermudah dalam membaca dan memahami cost function atau loss function atau besaran galat yang muncul… CMIIW…

      Sejauh sepengetahuan saya, pada dasarnya Neural Network itu modifikasi dari linear regression (CMIIW) dimana NN lebih robust dalam menghadapi kondisi data yang non linear atau high nonlinearity… penggunaan neuron atau random variable jika dalam linear regression atau x dalam y = mx + c… lebih dari 1 random variable (dimensinya lebih tinggi). Sedangkan w atau weight yang ada pada synapsis pada NN sebenarnya adalah m pada linear regression.
      Dan untuk mendapatkan nilai m untuk setiap random variable yang ada digunakan Stochastic Gradient Descent.. dimana setiap langkahnya dibutuhkan perhitungan cost function yang di dapat pada saat w ke-i pada setiap iterasi… dan cost yang di dapat digunakan untuk melakukan update (memperbaiki) w atau m atau gradient yang ada pada model tersebut.

      Lalu untuk melihat apakah iterasi harus diteruskan atau model yang dihasilkan sudah cukup baik maka digunakan cost function yang 1/2m tadi dan membandingkan apakah MSE yang ada memenuhi threshold tertentu.

      dan Stochastic Gradient Descent tersebut dapat digunakan pada linear regression juga.

      CMIIW

      Semoga membantu.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s