Wednesday, September 25, 2019

Genom


Genome

Genom (Ing. genome), dalam genetika dan biologi molekular modern, adalah keseluruhan informasi genetik yang dimiliki suatu sel atau organisme, atau khususnya keseluruhan asam nukleat yang memuat informasi tersebut. Secara fisik, genom dapat terbagi menjadi molekul-molekul asam nukleat yang berbeda (sebagai kromosom atau plasmid), sementara secara fungsi, genom dapat terbagi menjadi gen-gen  Istilah genom diperkenalkan oleh Hans Winkler dari Universitas HamburgJerman, pada tahun 1920, mungkin sebagai gabungan dari  kata gen dan kromosom atau dimaksudkan untuk menyatakan kumpulan gen 
Memetakan genom hanyalah awal dari rentetan kisah penelitian ilmiah yang panjang. Tugas para ilmuwan selanjutnya adalah harus bisa memahami makna dan fungsi setiap deretan kode genom yang telah berhasil dipetakan tersebut. Sejak itulah sains genetika manusia mengalami perkembangan yang sangat pesat.
Setiap makhluk hidup apapun, termasuk manusia (Homo Sapiens), memiliki “kitab” genom masing-masing. Kitab genom ini berisi seluruh informasi tentang individu yang bersangkutan. Semuanya, mulai dari identitas biologis, warisan leluhur, dugaan masa depan, sifat dasar, bentuk tubuh, model rambut, kecerdasan, dan lain sebagainya tercatat lengkap tanpa ada satu pun yang terlupakan. Ridley menggambarkan deret genom sebagai buku yang menceritakan hidup (dan mati) pemiliknya, atau semacam buku otobiografi manusia. Kitab genom terdiri dari 23 bab yang disebut kromosom (chromosome). Setiap bab terdiri dari ribuan alinea yang disebut gen (gene). Setiap alinea terdiri dari kalimat-kalimat yang disebut ekson (exon) dan intron (intron). Setiap kalimat terdiri dari kata-kata yang disebut kodon (codon). Dan setiap kata terdiri dari huruf-huruf yang disebut basa (base).
          Ada sekitar 1 milyar kata dalam kitab genom, yang jika dicetak mungkin bisa jadi buku otobiografi paling lengkap dan tebal di dunia. Namun seluruh isi kitab genom tersebut bisa muat dalam inti sel (nukleus) yang sangat kecil (berukuran mikroskopik). Huruf dalam genom (basa) hanya ada 4 saja, yaitu berupa protein dasar A (adenin), C (cytosine), G (guanin), dan T (thymin). Setiap kata dalam genom (kodon) selalu terdiri dari kombinasi 3 huruf dari 4 huruf yang tersedia. Setiap huruf dalam genom “dicetak” di atas rantai senyawa gula dan fosfat yang sangat panjang yang disebut DNA (deoxyribo-nucleic acid). Setiap bab dalam genom (kromosom) terdiri dari sepasang rantai DNA berbentuk seperti tangga terpilin (double helix) dengan pasangan huruf sebagai anak tangganya. Setiap anak tangga DNA terdiri dari pasangan huruf yang tetap. Setiap huruf A selalu berpasangan dengan huruf T dan setiap huruf C selalu berpasangan dengan huruf G.
Tidak seperti kitab biasa, genom adalah kitab yang “hidup”. Genom mampu membaca dirinya sendiri yang disebut penerjemahan (translation) dan juga mampu menggandakan diri yang disebut penggandaan (replication). Proses penggandaan dilakukan dengan cara pembalikan huruf (letter swapping). Misalnya kata asli di DNA berupa AGT disalin menjadi TCA, lalu salinan ini digunakan untuk membentuk DNA baru dengan cara yang sama, menjadi AGT kembali seperti asalnya. Proses penerjemahan sedikit lebih rumit, karena membutuhkan bantuan komponen lain, terutama RNA (ribo-nucleic acid). Secara sederhana, prosesnya dimulai dari DNA digandakan ke RNA pembawa (messenger), lalu ribosom membaca isi RNA pembawa untuk menghasilkan asam amino sesuai kode yang diberikan RNA, selanjutnya asam amino dibawa oleh RNA pengangkut (transfer) untuk kemudian diubah menjadi protein. Dengan dua kemampuan tersebut, penerjemahan dan penggandaan, genom mampu menjaga kelangsungan hidupnya sendiri.
Genom berada di setiap inti sel makhluk hidup, kecuali sel darah merah yang tidak punya inti, serta sebagian kecil di mitokondria. Genom mengendalikan nyaris seluruh proses makhluk hidup melalui protein atau gabungan protein. Segala hal di tubuh organisme hidup, dari rambut hingga hormon, dibuat oleh atau terbuat dari protein. Nyaris seluruh protein adalah hasil dari perintah atau instruksi dalam genom melalui proses penerjemahan dan penggandaan. Setiap reaksi kimiawi dalam organisme hidup didorong oleh enzim yang juga berupa protein. Bahkan proses penggandaan dan penerjemahan, juga atas instruksi dari genom. Protein juga berperan dalam memilih gen-gen dalam DNA, terutama dalam proses kombinasi dalam reproduksi. Dari proses itu maka wajar saja jika bapak dan ibunya berkulit gelap, lalu anaknya berkulit terang, karena genom si anak “memutuskan” untuk memilih gen kulit terang dari neneknya yang terbawa dalam gen ibunya.
Dalam proses penggandaan atau penerjemahan DNA, kadang juga terjadi kesalahan. Kesalahan ini yang disebut dgn mutasi. Contoh kesalahan misalnya ada huruf yang terlompati, ada huruf yang terabaikan, ada huruf yang digandakan lebih dari sekali, ada kata yang diproses secara terbalik, dan sebagainya. Rata-rata secara statistik, hanya terjadi sekitar 100 kesalahan kata dalam setiap pembelahan sel. Dibandingkan dengan 1 milyar kata dalam genom, 100 kata adalah jumlah yang sangat kecil, secara umum bisa diabaikan. Namun demikian, jika mutasi terjadi di lokasi yang salah, dampaknya bisa sangat berbahaya. Apalagi jika kesalahan yang terjadi lebih dari 100 kata. Secara kumulatif dan berjalannya waktu (yang sangat panjang melalui ratusan hingga ribuan generasi selama ribuan hingga jutaan tahun), mutasi mampu menghasilkan ragam baru pada generasi selanjutnya hingga akhirnya menjadi spesies yang sama sekali berbeda dengan leluhur asalnya.
Dari penelusuran genom berbagai makhluk hidup yang telah dilakukan, termasuk manusia, ditemukan fakta ilmiah adanya evolusi. Fakta pertama adalah seluruh makhluk hidup berasal dari satu leluhur yang sama, yang disebut dengan LUCA (last universal common ancestor) atau leluhur terdahulu dari semua makhluk. Fakta kedua, setiap spesies termasuk manusia modern juga berasal dari satu leluhur yang sama, baik dari garis ibu (matrilineal) maupun dari garis ayah (patrilineal). Sejumlah penelitian telah membuktikan adanya leluhur manusia perempuan melalui penelusuran DNA di mitokondria atau secara populer disebut mitochondrial eve. Sejumlah penelitian lain juga membuktikan adanya leluhur manusia laki-laki melalui penelurusan kromosom Y atau secara populer disebut y-chromosomal adam. Istilah eve (hawa) dan adam merujuk pada Adam dan Hawa yang disebut sebagai manusia pertama dalam kitab suci agama tertentu. Hipotesis penelitian penelusuran DNA ‘adam’ dan ‘hawa’ ini masih perlu penelitian lebih lanjut untuk bisa diakui sebagai teori ilmiah.


I.        Genom manusia
A.    Struktur genom manusia
Genom manusia terdiri dari 46 kromosom yang membentuk pasangan menjadi 23 pasang kromosom. Sejumlah 44 kromosom merupakan jenis autosom sedangkan 2 lainnya merupakan gonosom. Dalam genom manusia terdapat  65.000-80.000 gen yang tersebar dalam 23 pasang kromosom.
Ukuran gen bervariasi misalnya: 
1. Gen tRNA : 65-75 bp
2. Gen histone H4 : 406 bp
3. Gen dystrophin : 2400 kb (sekuen yang dikode hanya 0,6%)

Dalam genom manusia, gen-gen dapat terletak berdekatan atau tersebar dalam kromosom yang berbeda
1.    Gen-gen berada pada satu posisi dalam genom
Contoh : famili gen hormon pertumbuhan terletak pada kromosom 17
2.    Pada famili lain, gen tersebar di dalam genom.
Contoh : 5 anggota famili gen aldolase berada pada kromosom 3, 9, 10, 16, dan 17
3.    Pada famili gen yang banyak/besar, dapat berada pada satu lokasi atau menyebar dalam genom
Contoh : 280 kopi unit transkripsi rRNA berkelompok 50-70 unit. Tiap kelompok berada pada lengan pendek kromosom 13, 14, 15, 21, dan 22

B.    Gene Relics (Gen yang sudah mengalami perubahan) 
Relic: sesuatu yang berhasil survival dari masa lampau. Pada famili multigen, kadang salah satu atau beberapa anggotanya berubah sampai kehilangan fungsinya  Pada gen tersebut biasanya terdapat mutasi seperti nonsense mutation yang menyebabkan terminasi dini
Pseudogene adalah gen yang sudah kehilangan fungsinya
1.    Conventional pseudogene : Gen yang kehilangan fungsinya dengan akibat mutasi seperti nonsense mutation
2.    Processed pseudogenes : adalah salinan DNA dari mRNA, sehingga tidak mempunyai intron dan promoter, akibatnya gen ini tidak dapat ditranskripsi

Gen yang terpotong (truncated gene fragments).
Fragmen ini tidak mempunyai ujung 5’ atau 3’ dari gen yang lengkap. Kemungkinan karena mutasi yang menghilangkan ujung DNA. Atau rekombinasi yang menyebabkan gen asalnya membelah menjadi 2.

C.   DNA Extragenik
Genom manusia terdiri dari 30% gen dan sekuen yang berhubungan dengan gen  Termasuk :
1. exon, intron, segmen leader dan trailer
2. Promoter, sekuen lain upstream dari gen
3. Pseudogenes, gene relics
70% sisanya adalah DNA Extragenik. Sebagian besar belum diketahui fungsinya. Sebagian lagi merupakan sekuen berulang (repetitive DNA)
Dispersed repetitive DNA
Terdapat 2 kategori dispersed repetitive DNA :
1.    SINE (short interspersed nuclear elements)
Contoh : Alu family, Panjang sekitar 280 bp, terdapat berulang 700 000 – 1000 000 kali di dalam genom, kemungkinan berasal dari processed pseudogenes, Berasal dari 7SL RNA (berfungsi dalam sekresi protein), Pseudogenes tersebut kemungkinan mempunyai aktivitas seperti transposon
2.    LINE (long intersperses nuclear elements)
Panjang sekitar 6.1 kb (6100 bp), biasanya terpotong-potong menjadi 1.4kb, terdapat berulang 60 000-100 000 kali di dalam genom, suatu non-viral retroelement (transposon yang dapat replikasi dan berpindah dalam genom dengan cara reverse transcriptase
3.    HERV (Human Endogenous Retroviruses)
Elemen seperti retrovirus, benang virus yang masuk ke dalam genom tapi tidak menyebabkan penyakit

Clustered repetitive DNA
1.    Classical satellite DNA
Panjang 100 – 5000 kb
Contoh : sekuen alpha berulang pada sentromer
2.    Minisatellite DNA
Panjang 100 bp – 20 kb
Contoh : sekuen berulang pada telomere
3.    Microsatellite DNA
Biasanya lebih pendek daripada minisatellite , kurang dari  150 bp
 Contoh :
Dinucleotide repeats (0,5% dari genom): 5’- CACACACACACACACACACACA-3’ 3’-GTGTGTGTGTGTGTGTGTGTGTG-5’
Mononucleotide repeats (0,3% dari genom) : 5’-AAAAAAAAAAAAAAAAAAAAAA-3’ 3’-TTTTTTTTTTTTTTTTTTTTTTTT-5’

Istilah satellite : saat sentrifugasi, ada band/pita yang berada di atas band DNA (mengandung 40.3% GC). Satellite DNA mengandung fragmen berulang seperti ATTAC yang mengandung sedikit C / G

II. Asal-usul Genetis Populasi Manusia Modern
Pengetahuan mengenai genom manusia dapat memberi gambaran ttg asal-usul manusia
Perlu dipahami beberapa konsep terlebih dahulu
A.    Polimorfisme
Tidak ada 2 org yang mempunyai genom sama
Beberapa bagian genom bersifat polimorfik (mempunyai lebih dari satu bentuk)
Extragenic region – biasanya polimorfik
Gen juga polimorfik – allele
Contoh :
Major histocompatibility complex
Terletak pada kromosom 6
Terdiri dari gen-gen penyandi protein dalam sistem imun
Beberapa gen tersebut sangat polimorfik misalnya HLA-DRB1 mempunyai 59 allele dan HLA-B mempunyai 60 allele
Seorang individu hanya mempunyai 2 allele tersebut

B.    Distribusi allele menentukan kelompok populasi
Dalam suatu populasi dapat dikelompokkan berdasar allele yang dimiliki
Dapat dilihat common ancestor suatu populasi. Tapi analisis data yang tepat belum ditemukan

III. THE HUMAN GENOME PROJECT
Human genome : study dari bidang biokemis, genetik, dan biologi molekuler
Menyusun DNA gen dan extragenic
Untuk mengetahui lokasi gen-gen tertentu seperti penyebab penyakit
Gabungan beberapa negara : USA, Eropa, Jepang…dll
Penggunaan mesin sequencer untuk bisa memetakan sampai 100kb / hari
Para ilmuwan dalam proyek genom MANUSIA memerlukan waktu selama 13 tahun untuk membaca seluruh 3 milyar urutan abjad DNA dari 23 pasang kromosom manusia (genom manusia). Dana sebesar 1 milyar dollar amerika diperlukan untuk mengawali proyek tersebut di tahun 1990.
Kini, 29 tahun sejak dicanangkannya pembacaan genom manusia, sekuensing atau pengurutan DNA baik dari sisi teknologinya, bidang kajiannya, maupun penerapannya telah berkembang amat pesat. Jika 29 tahun yang lalu biaya untuk melakukan sequencing atau pemetaan terhadap genome manusia adalah sebesar 100 juta US$ (dana yang digunakan pada Human Genome Project, yang di-launch di tahun 1986 dan selesai pada 2003), maka saat ini biaya pemetaan genome manusia adalah sekitar 1000 US$ dan  kita bisa membaca 3 milyar basa DNA dalam waktu beberapa hari saja. Saat ini, dalam pusat data GenBank telah terkumpul ribuan sekuen genom manusia dan ribuan genom organisme lainnya, dari bakteri hingga tanaman.  
Penurunan biaya dan waktu pemrosesan menjadikan pemetaan genome menjadi sebuah proses yang terjangkau, sehingga banyak pihak dapat turut memanfaatkan dan mengembangkannya. Sebagai akibatnya, genomics pun menjadi sebuah bidang yang mengalami perkembangan yang sangat cepat pada dekade terakhir ini.

IV. Genomics
Genomics adalah bidang yang mempelajari genome, untuk memahami bagaimana suatu organisme bekerja, dan apa akibat dari interaksi antar gen serta pengaruh lingkungan terhadapnya. Sedangkan genome adalah materi genetik yang menjadi cetak biru atau rancangan dari suatu mahluk hidup. Informasi ini diwariskan secara turun temurun dan tersimpan dalam DNA, atau pada beberapa jenis virus, dalam RNA.
Saat ini genomics memiliki peran yang besar dalam berbagai bidang, mulai dari kesehatan, pertanian, lingkungan, industri maupun perkembangan ilmu pengetahuan. Dengan mempelajari gen, manusia dapat menemukan solusi dari banyak permasalahan mendasar di banyak bidang kehidupan.
            Misalnya, di bidang medis, genomics dapat membantu dalam meningkatkan kualitas diagnosis penyakit, mengidentifikasi predisposisi terhadap penyakit tertentu (misalnya diabetes tipe 2, penyakit huntington, dll), mendeteksi virus dan bakteri penyebab penyakit, mengembangkan obat yang disesuaikan dengan informasi genetik seseorang (disebut juga ‘personalized medicine’, misalnya penggunaan penanda genetik untuk membantu menentukan dosis Warfarin, obat anti penggumapalan darah, menentukan jenis dan dosis obat untuk kanker, dll), atau memantau pengaruh gaya hidup dan lingkungan terhadap genome dan kesehatan manusia.
Di bidang lingkungan, genomics membantu untuk menemukan sumber-sumber energi yang lebih sustainable seperti biofuels, mengendalikan polusi, melakukan dekontaminasi daerah yang terkena limbah (disebut juga bioremediation, seperti misalnya mikroba yang digunakan untuk membantu membersihkan tumpahan minyak di teluk Meksiko), memantau keragaman hayati dan identifikasi spesies baru.
Dalam bidang pertanian genomics dapat digunakan untuk mengembangkan tanaman yang lebih tahan terhadap serangan hama, penyakit, dan lingkungan, dapat juga digunakan untuk membantu mengidentifikasi hama, mengembangkan tanaman pangan yang lebih kaya kandungan gizi, ataupun mengembangkan ternak yang lebih berkualitas dan tahan terhadap serangan penyakit, dan lain sebagainya.
Perkembangan bidang kajian genomika yang terus tumbuh semenjak proyek genom manusia dimulai tidak hanya menghasilkan banjir data sekuen saja. Bidang kajian lainnya terkait genomika, seperti bioinformatika yang menjadi tulang punggung dalam mengelola dan menganalisa besarnya data yang dihasilkan, juga ikut berkembang pesat.
Dengan semakin banyaknya urutan genom yang berhasil dibaca maka semakin banyak pula marka DNA yang bisa dimanfaatkan untuk pemuliaan. Tentu saja, selesainya pembacaan genom suatu organisme tidak serta merta menjadikan ilmuwan tahu segalanya tentang organisme bersangkutan. Sejalan dengan waktu, mereka mulai bisa memahami fungsi dari tiap abjad DNA dan menelaah interaksi antar komponen genom serta kaitannya dengan penampakan luar atau sifat-sifat dari suatu makhluk hidup. Para ilmuwan mulai bisa melihat latar belakang genomis dari suatu sifat agronomis, semisal ketahanan atau kerentanan tanaman terhadap penyakit. Dari sana, mereka bertolak untuk bisa merancang tanaman baru yang lebih bermanfaat. Jika hari ini berbagai penemuan genomis telah dan sedang berjalan, maka sepuluh tahun ke depan penemuan-penemuan semacam itu akan menghasilkan era baru: pemuliaan genomis dan pengobatan genomis

Teknologi di Balik Perkembangan Genomics
Peran genomics yang besar tersebut dimungkinkan dengan berkembangnya teknologi dalam bidang pemetaan gen dan pengolahan data.

Next Generation Sequencing
Dengan hadirnya teknologi yang disebut dengan Next Generation Sequencing, maka biaya untuk melakukan pemetaan genetik juga mengalami penurunan yang sangat ekstrim.
       Big Data
Pemetaan dan analisis genome menghasilkan dan membutuhkan data yang sangat besar. Data hasil sequencing dapat mencapai 130 GB lebih per genome. Dengan semakin banyaknya genome yang dipetakan dan dianalisis, terjadilah ledakan di sisi data yang dihasilkan.
Tantangan selanjutnya adalah bagaimana data yang sedemikian besar dapat diproses dan dianalisis, sehingga semakin banyak penelitian maupun pemanfaatan data genomics dapat dilakukan.
Salah satu pendekatannya adalah dengan cara meningkatkan kecepatan prosesor. Teknologi seperti GPU ataupun FPGA (Field Programmable Gate Arrays) menjadi beberapa alternatif dalam hal ini. Solusi lain adalah penggunaan cloud computing, di mana data yang akan digunakan diproses di cloud, sehingga para peneliti tidak perlu membangun sendiri infrastruktur yang mereka gunakan. Namun permasalahannya adalah ketika diperlukan analisis seperti variant calling untuk mendeteksi mutasi gen, sejumlah data yang sangat besar perlu diakses dan dipindahkan ke environment analisis yang sesuai. Transfer data yang sangat besar melalui jaringan menjadi sebuah permasalahan berikutnya.
Dengan kehadiran big data, khususnya Hadoop sebagai solusi komputasi dan penyimpanan data terdistribusi, para peneliti memiliki alternatif baru yang lebih terjangkau. Hadoop menjadi alternatif bagi penyimpanan dan pemrosesan data genome dengan memberikan solusi berupa : biaya yang lebih terjangkau dengan pemanfaatan commodity hardware, peningkatan kapasitas komputasi dengan penggunaan banyak mesin secara paralel, mengurangi data movement dengan melakukan komputasi secara lokal, di mana data tersebut disimpan secara fisik.
Di samping itu, saat ini telah banyak teknologi yang dikembangkan di atas ataupun melengkapi Hadoop ekosistem, seperti misalnya Hive, Pig, Mahout, Yarn, dan lain sebagainya. Terlebih lagi setelah munculnya Spark sebagai platform pemrosesan in memory secara terdistribusi, big data menjadi sebuah alternatif solusi yang tidak dapat diabaikan lagi. Salah satu pemanfaatan teknologi big data dalam bidang genomics ini adalah ADAM, yaitu platform analisis genomik dengan format file khusus. Dibangun menggunakan Apache Avro, Apache Spark dan Parquet. ADAM pada awalnya dikembangkan oleh Universitas Berkeley dan berlisensi Apache 2

Referensi :
http://staffnew.uny.ac.id/upload/197810222010122001/pendidikan/2the-human-genome.pdf


No comments:

Post a Comment