Genome
Memetakan
genom hanyalah awal dari rentetan kisah penelitian ilmiah yang panjang. Tugas
para ilmuwan selanjutnya adalah harus bisa memahami makna dan fungsi setiap
deretan kode genom yang telah berhasil dipetakan tersebut. Sejak itulah sains
genetika manusia mengalami perkembangan yang sangat
pesat.
Setiap makhluk hidup apapun, termasuk
manusia (Homo Sapiens), memiliki “kitab” genom masing-masing.
Kitab genom ini berisi seluruh informasi tentang individu yang bersangkutan.
Semuanya, mulai dari identitas biologis, warisan leluhur, dugaan masa depan,
sifat dasar, bentuk tubuh, model rambut, kecerdasan, dan lain sebagainya
tercatat lengkap tanpa ada satu pun yang terlupakan. Ridley menggambarkan deret
genom sebagai buku yang menceritakan hidup (dan mati) pemiliknya, atau semacam
buku otobiografi manusia. Kitab genom terdiri dari 23 bab yang disebut kromosom
(chromosome). Setiap bab terdiri dari ribuan alinea yang
disebut gen (gene). Setiap alinea terdiri dari kalimat-kalimat yang
disebut ekson (exon) dan intron (intron). Setiap kalimat terdiri dari kata-kata yang
disebut kodon (codon). Dan setiap kata terdiri
dari huruf-huruf yang disebut basa (base).
Ada sekitar 1 milyar kata dalam kitab genom, yang jika
dicetak mungkin bisa jadi buku otobiografi paling lengkap dan tebal di dunia.
Namun seluruh isi kitab genom tersebut bisa muat dalam inti sel (nukleus) yang
sangat kecil (berukuran mikroskopik). Huruf dalam genom (basa) hanya ada 4
saja, yaitu berupa protein dasar A (adenin), C (cytosine), G (guanin), dan T (thymin). Setiap kata dalam genom (kodon) selalu terdiri
dari kombinasi 3 huruf dari 4 huruf yang tersedia. Setiap huruf dalam genom
“dicetak” di atas rantai senyawa gula dan fosfat yang sangat panjang yang
disebut DNA (deoxyribo-nucleic acid). Setiap bab dalam genom
(kromosom) terdiri dari sepasang rantai DNA berbentuk seperti tangga terpilin (double helix) dengan pasangan huruf sebagai anak
tangganya. Setiap anak tangga DNA terdiri dari pasangan huruf yang tetap.
Setiap huruf A selalu berpasangan dengan huruf T dan setiap huruf C selalu
berpasangan dengan huruf G.
Tidak seperti kitab biasa, genom adalah kitab yang
“hidup”. Genom mampu membaca dirinya sendiri yang disebut penerjemahan (translation) dan juga mampu menggandakan diri yang
disebut penggandaan (replication). Proses penggandaan
dilakukan dengan cara pembalikan huruf (letter swapping).
Misalnya kata asli di DNA berupa AGT disalin menjadi TCA, lalu salinan ini
digunakan untuk membentuk DNA baru dengan cara yang sama, menjadi AGT kembali
seperti asalnya. Proses penerjemahan sedikit lebih rumit, karena membutuhkan
bantuan komponen lain, terutama RNA (ribo-nucleic acid).
Secara sederhana, prosesnya dimulai dari DNA digandakan ke RNA pembawa (messenger), lalu ribosom membaca isi RNA pembawa untuk
menghasilkan asam amino sesuai kode yang diberikan RNA, selanjutnya asam amino
dibawa oleh RNA pengangkut (transfer) untuk
kemudian diubah menjadi protein. Dengan dua kemampuan tersebut, penerjemahan
dan penggandaan, genom mampu menjaga kelangsungan hidupnya sendiri.
Genom berada di setiap inti sel makhluk hidup, kecuali
sel darah merah yang tidak punya inti, serta sebagian kecil di mitokondria.
Genom mengendalikan nyaris seluruh proses makhluk hidup melalui protein atau
gabungan protein. Segala hal di tubuh organisme hidup, dari rambut hingga
hormon, dibuat oleh atau terbuat dari protein. Nyaris seluruh protein adalah
hasil dari perintah atau instruksi dalam genom melalui proses penerjemahan dan
penggandaan. Setiap reaksi kimiawi dalam organisme hidup didorong oleh enzim
yang juga berupa protein. Bahkan proses penggandaan dan penerjemahan, juga atas
instruksi dari genom. Protein juga berperan dalam memilih gen-gen dalam DNA,
terutama dalam proses kombinasi dalam reproduksi. Dari proses itu maka wajar
saja jika bapak dan ibunya berkulit gelap, lalu anaknya berkulit terang, karena
genom si anak “memutuskan” untuk memilih gen kulit terang dari neneknya yang
terbawa dalam gen ibunya.
Dalam proses penggandaan atau penerjemahan DNA, kadang
juga terjadi kesalahan. Kesalahan ini yang disebut dgn mutasi. Contoh kesalahan
misalnya ada huruf yang terlompati, ada huruf yang terabaikan, ada huruf yang
digandakan lebih dari sekali, ada kata yang diproses secara terbalik, dan
sebagainya. Rata-rata secara statistik, hanya terjadi sekitar 100 kesalahan
kata dalam setiap pembelahan sel. Dibandingkan dengan 1 milyar kata dalam
genom, 100 kata adalah jumlah yang sangat kecil, secara umum bisa diabaikan.
Namun demikian, jika mutasi terjadi di lokasi yang salah, dampaknya bisa sangat
berbahaya. Apalagi jika kesalahan yang terjadi lebih dari 100 kata. Secara
kumulatif dan berjalannya waktu (yang sangat panjang melalui ratusan hingga
ribuan generasi selama ribuan hingga jutaan tahun), mutasi mampu menghasilkan
ragam baru pada generasi selanjutnya hingga akhirnya menjadi spesies yang sama
sekali berbeda dengan leluhur asalnya.
Dari penelusuran genom berbagai
makhluk hidup yang telah dilakukan, termasuk manusia, ditemukan fakta ilmiah
adanya evolusi. Fakta pertama adalah seluruh makhluk hidup berasal dari satu
leluhur yang sama, yang disebut dengan LUCA (last universal common ancestor)
atau leluhur terdahulu dari semua makhluk. Fakta kedua, setiap spesies termasuk
manusia modern juga berasal dari satu leluhur yang sama, baik dari garis ibu (matrilineal) maupun dari garis ayah (patrilineal). Sejumlah penelitian telah membuktikan
adanya leluhur manusia perempuan melalui penelusuran DNA di mitokondria atau
secara populer disebut mitochondrial eve.
Sejumlah penelitian lain juga membuktikan adanya leluhur manusia laki-laki
melalui penelurusan kromosom Y atau secara populer disebut y-chromosomal adam. Istilah eve (hawa) dan adam merujuk pada Adam dan Hawa
yang disebut sebagai manusia pertama dalam kitab suci agama tertentu. Hipotesis
penelitian penelusuran DNA ‘adam’ dan ‘hawa’ ini masih perlu penelitian lebih
lanjut untuk bisa diakui sebagai teori ilmiah.
I.
Genom manusia
A.
Struktur genom manusia
Genom
manusia terdiri dari 46 kromosom yang membentuk pasangan menjadi 23 pasang
kromosom. Sejumlah 44 kromosom merupakan jenis autosom sedangkan 2 lainnya
merupakan gonosom. Dalam genom manusia terdapat
65.000-80.000 gen yang tersebar dalam 23 pasang kromosom.
Ukuran
gen bervariasi misalnya:
1.
Gen tRNA : 65-75 bp
2.
Gen histone H4 : 406 bp
3.
Gen dystrophin : 2400 kb (sekuen yang dikode hanya 0,6%)
Dalam
genom manusia, gen-gen dapat terletak berdekatan atau tersebar dalam kromosom
yang berbeda
1.
Gen-gen berada pada satu posisi dalam genom
Contoh :
famili gen hormon pertumbuhan terletak pada kromosom 17
2.
Pada famili lain, gen tersebar di dalam genom.
Contoh : 5
anggota famili gen aldolase berada pada kromosom 3, 9, 10, 16, dan 17
3.
Pada famili gen yang banyak/besar, dapat berada pada satu
lokasi atau menyebar dalam genom
Contoh : 280
kopi unit transkripsi rRNA berkelompok 50-70 unit. Tiap kelompok berada pada
lengan pendek kromosom 13, 14, 15, 21, dan 22
B.
Gene Relics (Gen yang sudah mengalami perubahan)
Relic:
sesuatu yang berhasil survival dari masa lampau. Pada famili multigen, kadang
salah satu atau beberapa anggotanya berubah sampai kehilangan fungsinya Pada gen tersebut biasanya terdapat mutasi
seperti nonsense mutation yang menyebabkan terminasi dini
Pseudogene
adalah gen yang sudah kehilangan fungsinya
1.
Conventional pseudogene : Gen yang kehilangan fungsinya dengan akibat mutasi
seperti nonsense mutation
2.
Processed pseudogenes : adalah salinan DNA dari mRNA,
sehingga tidak mempunyai intron dan promoter, akibatnya gen ini tidak dapat
ditranskripsi
Gen yang terpotong (truncated gene
fragments).
Fragmen ini tidak mempunyai ujung 5’
atau 3’ dari gen yang lengkap. Kemungkinan karena mutasi yang menghilangkan
ujung DNA. Atau rekombinasi yang menyebabkan gen asalnya membelah menjadi 2.
C.
DNA Extragenik
Genom
manusia terdiri dari 30% gen dan sekuen yang berhubungan dengan gen Termasuk :
1.
exon, intron, segmen leader dan trailer
2.
Promoter, sekuen lain upstream dari gen
3.
Pseudogenes, gene relics
70%
sisanya adalah DNA Extragenik. Sebagian besar belum diketahui fungsinya.
Sebagian lagi merupakan sekuen berulang (repetitive DNA)
Dispersed
repetitive DNA
Terdapat
2 kategori dispersed repetitive DNA :
1.
SINE (short interspersed nuclear elements)
Contoh : Alu
family, Panjang sekitar 280 bp, terdapat berulang 700 000 – 1000 000 kali di
dalam genom, kemungkinan berasal dari processed pseudogenes, Berasal
dari 7SL RNA (berfungsi dalam sekresi protein), Pseudogenes tersebut
kemungkinan mempunyai aktivitas seperti transposon
2.
LINE (long intersperses nuclear elements)
Panjang
sekitar 6.1 kb (6100 bp), biasanya terpotong-potong menjadi 1.4kb, terdapat
berulang 60 000-100 000 kali di dalam genom, suatu non-viral retroelement
(transposon yang dapat replikasi dan berpindah dalam genom dengan cara reverse
transcriptase
3.
HERV (Human Endogenous Retroviruses)
Elemen
seperti retrovirus, benang virus yang masuk ke dalam genom tapi tidak
menyebabkan penyakit
Clustered repetitive DNA
1.
Classical satellite DNA
Panjang 100
– 5000 kb
Contoh :
sekuen alpha berulang pada sentromer
2.
Minisatellite DNA
Panjang 100
bp – 20 kb
Contoh :
sekuen berulang pada telomere
3.
Microsatellite DNA
Biasanya
lebih pendek daripada minisatellite , kurang dari 150 bp
Contoh :
Dinucleotide
repeats (0,5% dari genom): 5’- CACACACACACACACACACACA-3’
3’-GTGTGTGTGTGTGTGTGTGTGTG-5’
Mononucleotide
repeats (0,3% dari genom) : 5’-AAAAAAAAAAAAAAAAAAAAAA-3’
3’-TTTTTTTTTTTTTTTTTTTTTTTT-5’
Istilah
satellite : saat sentrifugasi, ada band/pita yang berada di atas band DNA
(mengandung 40.3% GC). Satellite DNA mengandung fragmen berulang seperti ATTAC
yang mengandung sedikit C / G
II.
Asal-usul Genetis Populasi Manusia Modern
Pengetahuan
mengenai genom manusia dapat memberi gambaran ttg asal-usul manusia
Perlu
dipahami beberapa konsep terlebih dahulu
A.
Polimorfisme
Tidak
ada 2 org yang mempunyai genom sama
Beberapa
bagian genom bersifat polimorfik (mempunyai lebih dari satu bentuk)
Extragenic
region – biasanya polimorfik
Gen
juga polimorfik – allele
Contoh
:
Major
histocompatibility complex
Terletak
pada kromosom 6
Terdiri
dari gen-gen penyandi protein dalam sistem imun
Beberapa
gen tersebut sangat polimorfik misalnya HLA-DRB1 mempunyai 59 allele dan HLA-B
mempunyai 60 allele
Seorang
individu hanya mempunyai 2 allele tersebut
B.
Distribusi allele menentukan kelompok populasi
Dalam
suatu populasi dapat dikelompokkan berdasar allele yang dimiliki
Dapat
dilihat common ancestor suatu populasi. Tapi analisis data yang tepat belum
ditemukan
III.
THE HUMAN GENOME PROJECT
Human
genome : study dari bidang biokemis, genetik, dan biologi molekuler
Menyusun
DNA gen dan extragenic
Untuk
mengetahui lokasi gen-gen tertentu seperti penyebab penyakit
Gabungan
beberapa negara : USA, Eropa, Jepang…dll
Penggunaan
mesin sequencer untuk bisa memetakan sampai 100kb / hari
Para ilmuwan dalam
proyek genom MANUSIA memerlukan waktu selama 13 tahun untuk membaca seluruh 3
milyar urutan abjad DNA
dari 23 pasang kromosom manusia (genom
manusia). Dana sebesar 1 milyar dollar amerika diperlukan untuk
mengawali proyek tersebut di tahun 1990.
Kini, 29 tahun sejak
dicanangkannya pembacaan genom manusia, sekuensing atau pengurutan DNA baik
dari sisi teknologinya, bidang kajiannya, maupun penerapannya telah berkembang
amat pesat. Jika 29 tahun yang lalu biaya untuk melakukan sequencing
atau pemetaan terhadap genome manusia adalah sebesar 100 juta US$ (dana yang
digunakan pada Human Genome Project, yang di-launch di tahun 1986 dan selesai
pada 2003), maka saat ini biaya pemetaan genome manusia adalah sekitar 1000 US$
dan kita bisa membaca 3 milyar basa DNA dalam
waktu beberapa hari saja. Saat ini, dalam pusat data GenBank telah terkumpul
ribuan sekuen genom manusia dan ribuan genom organisme lainnya, dari bakteri
hingga tanaman.
Penurunan biaya dan waktu pemrosesan menjadikan pemetaan
genome menjadi sebuah proses yang terjangkau, sehingga banyak pihak dapat turut
memanfaatkan dan mengembangkannya. Sebagai akibatnya, genomics pun menjadi
sebuah bidang yang mengalami perkembangan yang sangat cepat pada dekade
terakhir ini.
IV. Genomics
Genomics adalah bidang yang mempelajari genome, untuk
memahami bagaimana suatu organisme bekerja, dan apa akibat dari interaksi antar
gen serta pengaruh lingkungan terhadapnya. Sedangkan genome adalah materi
genetik yang menjadi cetak biru atau rancangan dari suatu mahluk hidup.
Informasi ini diwariskan secara turun temurun dan tersimpan dalam DNA, atau
pada beberapa jenis virus, dalam RNA.
Saat ini genomics memiliki peran yang besar dalam berbagai
bidang, mulai dari kesehatan, pertanian, lingkungan, industri maupun
perkembangan ilmu pengetahuan. Dengan mempelajari gen, manusia dapat menemukan
solusi dari banyak permasalahan mendasar di banyak bidang kehidupan.
Misalnya, di bidang medis, genomics
dapat membantu dalam meningkatkan kualitas diagnosis penyakit, mengidentifikasi
predisposisi terhadap penyakit tertentu (misalnya diabetes tipe 2, penyakit
huntington, dll), mendeteksi virus dan bakteri penyebab penyakit, mengembangkan
obat yang disesuaikan dengan informasi genetik seseorang (disebut juga
‘personalized medicine’, misalnya penggunaan penanda genetik untuk membantu
menentukan dosis Warfarin, obat anti penggumapalan darah, menentukan jenis dan
dosis obat untuk kanker, dll), atau memantau pengaruh gaya hidup dan lingkungan
terhadap genome dan kesehatan manusia.
Di bidang lingkungan, genomics membantu untuk menemukan
sumber-sumber energi yang lebih sustainable seperti biofuels, mengendalikan
polusi, melakukan dekontaminasi daerah yang terkena limbah (disebut juga bioremediation,
seperti misalnya mikroba yang digunakan untuk membantu membersihkan tumpahan
minyak di teluk Meksiko), memantau keragaman hayati dan identifikasi spesies
baru.
Dalam bidang pertanian genomics dapat digunakan untuk
mengembangkan tanaman yang lebih tahan terhadap serangan hama, penyakit,
dan lingkungan, dapat juga digunakan untuk membantu mengidentifikasi hama,
mengembangkan tanaman pangan yang lebih kaya kandungan gizi, ataupun
mengembangkan ternak yang lebih berkualitas dan tahan terhadap serangan
penyakit, dan lain sebagainya.
Perkembangan bidang
kajian genomika yang terus tumbuh semenjak proyek genom manusia dimulai tidak
hanya menghasilkan banjir data sekuen saja. Bidang kajian lainnya terkait
genomika, seperti bioinformatika yang
menjadi tulang punggung dalam mengelola dan menganalisa besarnya data yang
dihasilkan, juga ikut berkembang pesat.
Dengan semakin
banyaknya urutan genom yang berhasil dibaca maka semakin banyak pula marka DNA
yang bisa dimanfaatkan untuk pemuliaan. Tentu saja, selesainya pembacaan genom
suatu organisme tidak serta merta menjadikan ilmuwan tahu segalanya tentang
organisme bersangkutan. Sejalan dengan waktu, mereka mulai bisa memahami fungsi
dari tiap abjad DNA dan menelaah interaksi antar komponen genom serta kaitannya
dengan penampakan luar atau sifat-sifat dari suatu makhluk hidup. Para ilmuwan
mulai bisa melihat latar belakang genomis dari suatu sifat agronomis, semisal
ketahanan atau kerentanan tanaman terhadap penyakit. Dari sana, mereka bertolak
untuk bisa merancang tanaman baru yang lebih bermanfaat. Jika hari ini berbagai
penemuan genomis telah dan sedang berjalan, maka sepuluh tahun ke depan
penemuan-penemuan semacam itu akan menghasilkan era baru: pemuliaan genomis dan pengobatan genomis
Teknologi di Balik Perkembangan Genomics
Peran genomics yang besar tersebut dimungkinkan dengan
berkembangnya teknologi dalam bidang pemetaan gen dan pengolahan data.
Next Generation Sequencing
Dengan hadirnya teknologi yang disebut dengan Next
Generation Sequencing, maka biaya untuk melakukan pemetaan genetik juga
mengalami penurunan yang sangat ekstrim.
Big Data
Pemetaan dan analisis genome menghasilkan dan membutuhkan
data yang sangat besar. Data hasil sequencing dapat mencapai 130 GB lebih per
genome. Dengan semakin banyaknya genome yang dipetakan dan dianalisis,
terjadilah ledakan di sisi data yang dihasilkan.
Tantangan selanjutnya adalah bagaimana data yang sedemikian
besar dapat diproses dan dianalisis, sehingga semakin banyak penelitian maupun
pemanfaatan data genomics dapat dilakukan.
Salah satu pendekatannya adalah dengan cara meningkatkan
kecepatan prosesor. Teknologi seperti GPU ataupun FPGA (Field Programmable Gate
Arrays) menjadi beberapa alternatif dalam hal ini. Solusi lain adalah
penggunaan cloud computing, di mana data yang akan digunakan diproses
di cloud, sehingga para peneliti tidak perlu membangun sendiri
infrastruktur yang mereka gunakan. Namun permasalahannya adalah ketika
diperlukan analisis seperti variant calling untuk mendeteksi mutasi gen,
sejumlah data yang sangat besar perlu diakses dan dipindahkan ke environment
analisis yang sesuai. Transfer data yang sangat besar melalui jaringan menjadi
sebuah permasalahan berikutnya.
Dengan kehadiran big data, khususnya Hadoop sebagai
solusi komputasi dan penyimpanan data terdistribusi, para peneliti memiliki
alternatif baru yang lebih terjangkau. Hadoop menjadi alternatif bagi
penyimpanan dan pemrosesan data genome dengan memberikan solusi berupa : biaya
yang lebih terjangkau dengan pemanfaatan commodity hardware, peningkatan
kapasitas komputasi dengan penggunaan banyak mesin secara paralel, mengurangi
data movement dengan melakukan komputasi secara lokal, di mana data tersebut
disimpan secara fisik.
Di samping itu, saat ini telah banyak teknologi yang
dikembangkan di atas ataupun melengkapi Hadoop ekosistem, seperti
misalnya Hive, Pig, Mahout, Yarn, dan lain sebagainya. Terlebih
lagi setelah munculnya Spark sebagai platform pemrosesan in memory
secara terdistribusi, big data menjadi sebuah alternatif solusi yang tidak
dapat diabaikan lagi. Salah satu pemanfaatan
teknologi big data dalam bidang genomics ini adalah ADAM, yaitu platform
analisis genomik dengan format file khusus. Dibangun menggunakan
Apache Avro, Apache Spark dan Parquet. ADAM pada awalnya
dikembangkan oleh Universitas Berkeley dan berlisensi Apache 2
Referensi :
http://staffnew.uny.ac.id/upload/197810222010122001/pendidikan/2the-human-genome.pdf