Unsupervised Learning biasanya memiliki kata kunci clustering atau melakukan peng-klusteran terhadap sekelompok data atau sekelompok instances yang tidak memiliki label, sehingga memiliki informasi bahwa terdapat sekumpulan data yang membentuk cluster, namun kita belum tahu apa pengetahuan atau hipotesis yang membuat instances tersebut saling berkumpul (membuat kelompok) menjadi satu cluster atau lebih.
Expectation maximization algorithm merupakan algoritma unsupservised learningyang memiliki kemampuan untuk melakukan pencarian knowledge dari sekumpulan data yang tidak memiliki label atau target class tertentu, dengan cara melihat nilai setiap instances yang didistribusikan kedalam Gaussian distribution, lebih tepatnya adalah mixture Gaussian, lalu dilakukan iterasi menaik untuk mencari nilai likehood tertenggi untuk setiap instance (melihat kedekatan instances terhadap setiap kluster).
Expectation Maximization Algorithm (EM Algorithm) sendiri merupakan suatu algoritma yang memanfaatkan mixture dari Gaussian mixture. Pada dasarnya E-M Algorithm terdiri dari dua langkah yaitu, expectation dan maximization. Melakukan perhitungan expektasi terhadap suatu nilai probabilitas likelihood, lalu langkah kedua memperbaiki nilai probabilitas terebut dengan merubah parameter pada mixture Gaussian sehingga mencapai maximum likelihood.
Terdapat beberapa hal yang perlu ditekankan dalam EM Algorithm yaitu :
- Maximum Likelihood Estimation (MLE)
- Mixtures of Gaussians
- Estimation-Maximization (EM)
Selebihnya dapat dilihat pada dokumen catatan berikut ini :
*saya agak malas menulis equation didalam wordpressnya hehehe 😀
Contoh program clustering untuk segmentasi jaringan otak :
https://github.com/situkangsayur/SampleEMforBrainSeg