Big Data dalam Biology

Dalam bidang biologi terutama dalam kasus genome dan gen bank, perang big data cukup besar, dan pemanfaatan dimasa yang akan dating sangat penting dan memiliki value yang cukup besar. Jumlah memori data genome pada suatu individu memiliki sequence yang cukup panjang sehingga dapat ditampung dalam beberapa GB dalam memori, belum lagi genome pada setiap mahluk hidup baik hewan, tumbuhan bahkan bakteri dan virus dapat disimpan dan menjadi informasi yang bermanfaat dimasa yang akan dating.

Di negara maju seperti amerika, melakukan pengumpulan sequence genome berbagai individu manusia juga berbagai mahluk hidup di dunia ini, bahkan bakteri dan virus, mereka membuat menjadi seperti genbank. Apa manfaat dari gen bank tersebut, kita dapat mencari berbagai genome yang terdapat didunia dan memanfaatkanya untuk melakukan ekstraksi informasi baik untuk penelitian ataupun pemanfaatan lainnya diberbagai bidang.

Genome sendiri merupakan suatu data yang berbentuk raw, lalau dilakukan assembly dan annotation untuk menyusun genome dan melakukan pembersihan untuk beberapa data genome yang mungkin tidak dibutuhkan, lalu dimasukan kedalam proses genbank yaitu melakukan validasi kembali dan assembly menuju database, selanjutnya dapat melakukan access kedalam database jika memang data sudah tersedia. Setelah itu jika database sudah terbentuk dan gen bank telah memiliki berbagai informasi mengenai berbagai genome, maka setelah itu dapat diakses secara public. Memang value untuk mendapatkan uang tidak sebesar bidang perminyakan jika dilihat ternyata hasil dari genbank dapat diakses secara public, tapi hasil pengolahan informasi yang dilakukan oleh public ini berpotensi memberikan value yang lebih besar dalam bidang biology ataupun bidang lainnya.

Ketika kita dapat mengetahui suatu genome dari mahluk hidup, kita dapat mengekstrak berbagai informasi, seperti riwayat penyakit atau potensi terjangkit suatu penyakit tertentu, dapat juga kita mengetahui mahluk tersebut keturunan dari siapa. Sehingga genome sendiri merupakan sequence unik untuk setiap mahluk hidup didunia. Kita tentunya ketika telah mendapatkan informasi seperti itu dapat melakukan banyak hal, mungkin antisipasi terhadap suatu penyakit yang memiliki potensi yang cukup besar terhadap suatu individu manusia dimasa yang akan dating. Dalam issue teknologi terbaru, genome dapat digunakan dalam suatu teknologi computer seperti IPad untuk melakukan identifikasi, sehingga setiap orang akan memasukan sequence genomenya kedalam komputer pad milik masing-masing dan informasi tersebut akan diolah ada beberapa kemungkinan, komputer tersebut dapat melakukan identifikasi pengguna dengan melakukan rekognisi terhadap genome penggunanya ataupun komputer dapat memberikan informasi kepada setiap orang yang melakukan input sequence genome terhadap komputer tersebut, dan informasi ini dapat bermanfaat untuk orang tersebut untuk melakukan predikasi banyak hal atau melakukan perencanaan selanjutnya terhadap kehidupannya.

Dapat genbank yang ada sekarang memiliki pergerakan pertumbuhan data yang cukup besar, diperkirakan hingga tahun 2010 sequence yang terkumpul adalah lebih dari 100 juta sequence genome mahluk hidup yang ada didunia ini termasuk bakteri dan virus. Genbank tersebut dapat diakses secara public oleh masyarakat luas. Namun tentunya data dari genbank tersebut perlu pengolahan lebih lanjut, karena ketika kita membuka data dari genome bank, kita tidak akan langsung paham apa sebenarnya informasi yang dikandung oleh suatu sequence genome.

Ini pun memiliki konsep yang sama seperti intelijen bisnis, artinya tujuan utamnya adalah menyediakan informasi yang dapat digunakan untuk mendukung pengambilan keputusan berdasarkan informasi yang telah didapatkan. Informasi yang disediakan merupakan hasil pengolahan sedemikian rupa dari mulai ekstraksi, transform, dan load, tentunya dalam bentuk dan tahapan yang mungkin akan berbeda, namun tujuan dilakukannya hal tersebut adalah untuk melakukan analisis sehingga dapat mendukung dalam proses pengambilan keputusan tertentu.

Sebenarnya kita dapat membuat genbank sendiri, namun tentunya itu sulit karena hari ini sudah banyak beberapa situs genbank yang memiliki database yang cukup besar, terutama amerika. Namun tetap kita dapat memiliki potensi/peluang untuk ikut memberikan layanan public untuk membangun situs database gen bank dan genome. Sedangkan pertumbuhan data genome sangat pesat terutama di Indonesia, Indonesia memiliki kekayaan keberagaman hewani, hayati, manusia (suku dan ras) dan juga berbagai kondisi alam yang mungkin mempengaruhi keberadaan berbagai bakteri ataupun virus yang ada di Indonesia, sehingga kita dapat melakukan eksplorasi lebih mudah dan lebih banyak.

references :

Workshop Big Data, ITB, 29 NOvember 2013.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s