BIOINFORMATIKA
Kali ini
saya akan membahas sedikit mengenai Bioinformatika. Definisi dari
Bioinformatika adalah ilmu yang mempelajari penerapan teknik komputasional
untuk mengelola dan menganalisis informasi biologis. Bidang ini mencakup
penerapan metode-metode matematika, statistika, dan informatika untuk
memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA
dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama
bidang ini meliputi basis data untuk mengelola informasi biologis, penyejajaran
sekuens (sequence alignment), prediksi struktur untuk meramalkan bentuk
struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan
analisis ekspresi gen.
Bioinformatika mempunyai sejarah awal yang mulai dikemukakan pada
pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi.
Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan
basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah
dilakukan sejak tahun 1960-an. Kemajuan teknik biologi molekular dalam
mengungkap sekuens biologis dari protein (sejak awal 1950-an) dan asam nukleat
(sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens
biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di
Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada akhir
1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology
Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing
DNA yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya
ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an,
menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom,
meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya
menyebabkan lahirnya bioinformatika. Perkembangan Internet juga mendukung
berkembangnya bioinformatika. Basis data bioinformatika yang terhubung melalui
Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data
tersebut maupun memperoleh sekuens biologis sebagai bahan analisis. Selain itu,
penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan
ilmuwan mengakses program-program tersebut dan kemudian memudahkan
pengembangannya.
Penerapan
utama bioinformatika, yaitu :
ð Basis data sekuens biologis
Sesuai dengan jenis informasi biologis yang disimpannya,
basis data sekuens biologis dapat berupa basis data primer untuk menyimpan
sekuens primer asam nukleat maupun protein, basis data sekunder untuk menyimpan
motif sekuens protein, dan basis data struktur untuk menyimpan data struktur
protein maupun asam nukleat. Basis data utama untuk sekuens asam nukleat saat
ini adalah GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data
Bank of Japan, Jepang). BLAST (Basic Local Alignment Search Tool) merupakan
perkakas bioinformatika yang berkaitan erat dengan penggunaan basis data
sekuens biologis. PDB (Protein Data Bank, Bank Data Protein) adalah basis data
tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat
hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR
dan mikroskopi elektron).
ð Penyejajaran sekuens
Penyejajaran sekuens (sequence alignment) adalah
proses penyusunan/pengaturan dua atau lebih sekuens sehingga persamaan
sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut juga disebut
sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu
alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa
sehingga kolom-kolomnya memuat karakter yang identik atau sama di antara
sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari dua sekuens
pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac"
(tanda "|" menunjukkan kecocokan atau match di antara kedua sekuens).
ccat---caac
| | |
| | | |
caatgggcaac
Clustal adalah program bioinformatika untuk
alignment multipel (multiple alignment), yaitu alignment beberapa sekuens
sekaligus. Dua varian utama Clustal adalah ClustalW dan ClustalX.
ð Prediksi struktur protein
Model protein hemaglutinin dari virus influensa
Secara kimia/fisika, bentuk struktur protein diungkap dengan
kristalografi sinar-X ataupun spektroskopi NMR, namun kedua metode tersebut
sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing
protein relatif lebih mudah mengungkapkan sekuens asam amino protein. Prediksi
struktur protein berusaha meramalkan struktur tiga dimensi protein berdasarkan
sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan
struktur sekunder berdasarkan struktur primer protein). Secara umum, metode
prediksi struktur protein yang ada saat ini dapat dikategorikan ke dalam dua
kelompok, yaitu metode pemodelan protein komparatif dan metode pemodelan de
novo.
Pemodelan protein komparatif (comparative protein
modelling) meramalkan struktur suatu protein berdasarkan struktur protein lain
yang sudah diketahui. Salah satu penerapan metode ini adalah pemodelan homologi
(homology modelling), yaitu prediksi struktur tersier protein berdasarkan
kesamaan struktur primer protein.
Dalam pendekatan de novo atau ab initio, struktur
protein ditentukan dari sekuens primernya tanpa membandingkan dengan struktur
protein lain.
ð Analisis ekspresi gen
Analisis klastering ekspresi gen pada kanker
payudara
Ekspresi
gen dapat ditentukan dengan mengukur kadar mRNA dengan berbagai macam teknik
(misalnya dengan microarray ataupun. Teknik-teknik tersebut umumnya diterapkan
pada analisis ekspresi gen skala besar yang mengukur ekspresi banyak gen
(bahkan genom) dan menghasilkan data skala besar. Metode-metode penggalian data
(data mining) diterapkan pada data tersebut untuk memperoleh pola-pola
informatif. Sebagai contoh, metode-metode komparasi digunakan untuk
membandingkan ekspresi di antara gen-gen, sementara metode-metode klastering
(clustering) digunakan untuk mempartisi data tersebut berdasarkan kesamaan
ekspresi gen.
sumber : http://www.wikipedia.org/