IEEE Indonesia Section Gathering, Januari 2016

Hari ini pertama kalinya saya mengikuti gathering member IEEE (Institute of Electrical and Electronics Engineers) Indonesia Section, atau di IEEE di tulis Indonesia masuk pada region 10. Saya daftar IEEE sekitar akhir Desember 2015, tujuannya agar kalau ikut konfrensi bisa dapet diskon (sepakat dengan yang lainnya pun begitu) hahaha.. dan lumayan dapet email dengan domain IEEE. :)))

Saya anggota baru, jadi masih blahbloh, gak tau itu acara apaan selain IEEE itu merupakan organisasi profesi dan memiliki journal IEEE yang terakreditasi dan di akui secara Internasional tentunya. Ternyata saya pun baru tau IEEE memiliki student ambasador juga Students Branch nya, mirip seperti MSP kalau di Microsoft. hhmm menarik dan saya waktu S1 gak tau yang begituan, dan banyak cewek juga yang ikut, ternyata sayang kurang gaul. Continue reading

Expectation Maximization Algorithm

Unsupervised Learning biasanya memiliki kata kunci clustering atau melakukan peng-klusteran terhadap sekelompok data atau sekelompok instances yang tidak memiliki label, sehingga memiliki informasi bahwa terdapat sekumpulan data yang membentuk cluster, namun kita belum tahu apa pengetahuan atau hipotesis yang membuat instances tersebut saling berkumpul (membuat kelompok) menjadi satu cluster atau lebih.

Expectation maximization algorithm merupakan algoritma unsupservised learningyang memiliki kemampuan untuk melakukan pencarian knowledge dari sekumpulan data yang tidak memiliki label atau target class tertentu, dengan cara melihat nilai setiap instances yang didistribusikan kedalam Gaussian distribution, lebih tepatnya adalah mixture Gaussian, lalu dilakukan iterasi menaik untuk mencari nilai likehood tertenggi untuk setiap instance (melihat kedekatan instances terhadap setiap kluster).

Expectation Maximization Algorithm (EM Algorithm) sendiri merupakan suatu algoritma yang memanfaatkan mixture dari Gaussian mixture. Pada dasarnya E-M Algorithm terdiri dari dua langkah yaitu, expectation dan maximization. Melakukan perhitungan expektasi terhadap suatu nilai probabilitas likelihood, lalu langkah kedua memperbaiki nilai probabilitas terebut dengan merubah parameter pada mixture Gaussian sehingga mencapai maximum likelihood.

Terdapat beberapa hal yang perlu ditekankan dalam EM Algorithm yaitu :

  1. Maximum Likelihood Estimation (MLE)
  2. Mixtures of Gaussians
  3. Estimation-Maximization (EM)

Selebihnya dapat dilihat pada dokumen catatan berikut ini :

Catatan-kecil-EM-Algorithm

*saya agak malas menulis equation didalam wordpressnya hehehe 😀

Contoh program clustering untuk segmentasi jaringan otak :

https://github.com/situkangsayur/SampleEMforBrainSeg

Infrastruktur Big Data

Ketika membicarakan Big Data tentunya kita akan tersadar terhadap kebutuhan infrastruktur untuk menopang teknologi Big Data tersebut. Dalam infrastruktur teknologi Big Data sendiri memiliki karakteristik yang berbeda dengan traditional data, yaitu :

Screenshot from 2014-01-04 17:33:50

Pada awalnya tahun 1970-2000 data yang dibangun meruapakan data dengan model terstruktur dan merupakan relational database seperti MySQL, oracle, dan lain-lain. Lalu pada tahun 1995 berikutnya mulai dibangun suatu business intelligence yang menggunakan structured dan relational database dengan system seperti cognos, pentaho dan lain-lain. Pada 2010 hingga sekarang dibangun suatu system yang memiliki tujuan 3V (volume, velocity, varity) atau 4V (ditambah value), dan dengan bermacam teknologinya seperti map reduce, high performance computers cluster dan lain-lain. Continue reading

Big Data dalam Social Media Analysis

Social Media merupakan issue yang sangat hangat diperbincangkan dalam berbagai bidang, salah satunya pemerintahan dan juga eknonomi, karena perkembangan yang terjadi dalam social media dapat menjadi acuan atau bahkan dapa mempengaruhi kejadian yang mungkin terjadi dimasa yang akan dating.

Sesuai yang dikatakan gartner mengenai Big Data “high-volume, high-velocity and high variety information assets that demand cost-effective, innovative forms of information processing form enchanced insight and decision making” . Big data merupakan data yang memiliki volume yang sangat besar, memiliki velocity yang tinggi, dan verietas informasu yang tinggu pula, sehingga dibutuhkan suatu bentuk pemrosesan untuk meingkatkan pengetahuan dan pengembilan keputusan. Dan itulah yang dibutuhkan dalam intelijen bisnis. Continue reading

Big Data dalam Bidang Astronomi

Pada dasarnya orang-orang yang bergerak dibidang astronomi melihat langit yang sama, dan objek yang relative sama, namun tentunya dalam bidang astronomi objek yang dilihat jauh lebih detail dengan berbagai datanya yang kompleks. Kita ketahui bahwa benda langit atau objek langit itu sangat banyak ragamnya dan jumlah nya sangat banyak dan masih menyimpan banyak rahasia juga pengetahuan (termasuk rahasia jumlah objek) dan data-data tersebut masih terus berubah dalam berjalannya waktu.

Perubahan data yang terjadi dalam bidang astronomi atas benda-beda langit sendiri membutuhkan waktu yang cukup lama, mungkin ribuan tahun, jutaan tahun, ratusan juta tahun, atau bahkan miliyaran tahun. Sehingga tidak mungkin kita menduku perubahan tersebut sehingga dibutuhkan suatu system yang melakukan analisis atas berbagai benda langit yang ada pada saat ini, dan tentunya proses tersebut membutuhkan data yang sangat banyak dan juga objek yang dilakukan observasi sangat banyak mungkin para astronom berurusan dengan sekitar 10^7 objek tata suya, 10^9 objek bintang galaktik, 10^9 eksgalaksi, dan itu merupakan jumlah yang sangat besar. Continue reading