Menyang kontèn

Bioinformatika

Saka Wikipédia Jawa, bauwarna mardika basa Jawa
Owahan 6 Fèbruari 2018 10.07 déning Kunirasem (parembugan | pasumbang) (clean up, replaced: protein → protéin (55) using AWB)
Sequence alignment; salah siji aplikasi dhasar bioinformatika. Sekuens biologis sing dianalisis ing bab iki ya iku sekuens asam amino saka papat protéin hemoglobin.

Bioinformatika (basa Inggris: bioinformatics) iku (èlmu sing nyinaoni) panrapan tèhnik komputasional kanggo nglola lan nganalisis informasi biologis. Babagan iki nyakup panrapan métodhe-métodhe matématika, statistika, lan informatika kanggo mecahaké masalah-masalah biologis, mligi kanthi migunakaké sekuens DNA lan asam amino sarta informasi sing ana kaitané. Conto topik utama babagan iki ngambah basis data kanggo ngemunah informasi biologis, panyejajaran sekuens (sequence alignment), prédiksi struktur kanggo ngramalaké wangun struktur protéin uga struktur sékundhèr RNA, analisis filogenetik, lan analisis èksprèsi gen.

Sajarah

Istilah bioinformatics wiwit diwedharaké ing tengah éra 1980-an kanggo ngacu panrapan komputer ing biologi. Éwadéné mangkono, panrapan babagan-babagan ing bioinformatika (kaya panggawéan basis data lan pangembangan algoritma kanggo analisis sekuens biologis) wis dilakokaké wiwit taun 1960-an.

Kamajuan tèhnik biologi molekular kanggo ndungkap sekuens biologis saka protéin (wiwit awal 1950-an) lan asam nukleat (wiwit 1960-an) miwiti mekaring basis data lan tèhnik analisis sekuens biologis. Basis data sekuens protéin wiwit dikembangaké taun 1960-an ing Amérika Sarékat, sauntara basis data sekuens DNA dikembangaké akir 1970-an ing Amérika Sarékat lan Jerman (ing European Molecular Biology Laboratory, Laboratorium Biologi Molekular Éropah). Panemon tèhnik sekuensing DNA sing luwih rikat ing tengah taun 1970-an dadi landhesan dumadiné ledakan cacahé sekuens DNA sing kasil didungkapaké ing taun 1980-an lan 1990-an, dadi salah sawijining pambuka dalan kanggo proyèk-proyèk pandungkapan genom, ngundhakaké kabutuhan marang panglolaan lan analisis sekuens, lan pungkasané njalari lairé bioinformatika.

Mekaré internèt uga ndhukung mekaré bioinformatika. Basis data bioinformatika sing gumandhéng liwat internèt nggampangaké èlmuwan nglumpukaké asil sekuensing nuju basis data mau uga antuk sekuens biologis minangka bahan analisis. Saliyané iku, panyebaran program-program aplikasi bioinformatika liwat internèt nggampangaké èlmuwan ngakses program-program mau lan banjur nggampangaké pangembangané.

Panrapan utama bioinformatika

Basis data sekuens biologis

Selaras kaliyan jinis informasi biologis sing disimpen, basis data sekuens biologis bisa arupa basis data primer kanggo nyimpen sekuens primer asam nukleat utawa protéin, basis data sékundhèr kanggo nyimpen motif sekuens protéin, lan basis data struktur kanggo nyimpen data struktur protéin utawa asam nukleat.

Basis data utama kanggo sekuens asam nukleat saiki ya iku GenBank (Amérika Sarékat), EMBL (Éropah), lan DDBJ (DNA Data Bank of Japan, Jepang). Katelu basis data mau makarya bebarengan lan ijol-ijolan data saben dina kanggo njaga kawiyaran cakupan saben basis data. Sumber utama data sekuens asam nukleat ya iku submisi langsung saka periset individual, proyèk sekuensing genom, lan pandaftaran paten. Isi saliyané sekuens asam nukleat, entri ing basis data sekuens asam nukleat lumrahé ngandhut informasi ngenani jinis asam nukleat (DNA utawa RNA), jeneng organisme sumber asam nukleat mau, lan pustaka sing ana kaitané karo sekuens asam nukleat mau.

Sauntara iku, conto sapérangan basis data wigati sing nyimpen sekuens primer protéin ya iku PIR (Protein Information Resource, Amérika Sarékat), Swiss-Prot (Éropah), lan TrEMBL (Éropah). Katelu basis data mau wis digabungaké ing UniProt (sing dana mligi saka Amérika Sarékat). Entri ing UniProt ngandhut informasi ngenani sekuens protéin, jeneng organisme sumber protéin, pustaka sing ana kaitané, lan komentar sing lumrahé isiné panjlasan ngenani fungsi protéin mau.

BLAST (Basic Local Alignment Search Tool) arupa perkakas bioinformatika sing gumandhéng raket karo panggunaan basis data sekuens biologis. Panlusuran BLAST (BLAST search) ing basis data sekuens mungelaké èlmuwan kanggo nggolèki sekuens asam nukleat uga protéin sing mèmper karo sekuens tinentu sing diduwèni. Bab iki migunani umpamané kanggo nemu gen sajenis ing sapérangan organisme utawa kanggo mriksa kaabsahan asil sekuensing uga kanggo mriksa fungsi gen asil sekuensing. Algoritma sing ndhasari makarya BLAST ya iku panyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) ya iku basis data tunggal sing nyimpen modhèl struktural telung dhimènsi protéin lan asam nukleat asil panemton eksperimental (kanthi kristalografi sinar-X, spektroskopi NMR lan mikroskopi èlèktron). PDB nyimpen data struktur minangka koordinat telung dhimènsi sing nggambaraké posisi atom-atom ing njero protéin utawa asam nukleat.

Panyejajaran sekuens

Panyejajaran sekuens (sequence alignment) ya iku prosès panyusunan/pangaturan loro utawa luwih sekuens saéngga pepadhan sekuens-sekuens mau katon nyata. Asil saka prosès mau uga ingaran minangka sequence alignment utawa alignment waé. Larik sekuens ing sawijining alignment diwènèhi sisipan (lumrahé kanthi tandha "–") saéngga kolom-kolomé ngamot karakter sing identik utawa padha ing antarané sekuens-sekuens mau. Ing ngisor iki conto alignment DNA saka rong sekuens cendhak DNA sing béda, "ccatcaac" lan "caatgggcaac" (tandha "|" nedahaké kacocokan utawa match ing antarané loro sekuens iku).

 ccat---caac
 | ||   ||||
 caatgggcaac

Sequence alignment arupa métodhe dhasar ing analisis sekuens. Métodhe iki minangka nyinaoni évolusi sekuens-sekuens saka leluhur sing padha (common ancestor). Ora cocoké (mismatch) ing alignment diasosiasikaké kanthi prosès mutasi, éwadéné kasenjangan (gap, tandha "–") diasosiasikaké kanthi prosès insersi utawa delesi. Sequence alignment mènèhi hipotèsis marang prosès évolusi sing dumadi ing sekuens-sekuens mau. Umpamané, loro sekuens ing conto alignment ing ndhuwur bisa dadi évolusi saka sekuens sing padha "ccatgggcaac". Ing kaitané karo bab iki, alignment uga bisa nedahaké posisi-posisi sing dipertahankan (conserved) suwéné évolusi ing sekuens-sekuens protéin, sing nedahaké yèn posisi-posisi mau bisa dadi wigati kanggo struktur utawa fungsi protéin mau.

Saliyané iku, sequence alignment uga dipigunaaké kanggo nggolèki sekuens sing mèmper utawa padha ing basis data sekuens. BLAST ya iku métodhe alignment sing asring dipigunaaké ing panlusuran basis data sekuens. BLAST migunakaké algoritma heuristik ing panyusunan alignment.

Sapérangan métodhe alignment liya sing ndhisiki BLAST ya iku métodhe "Needleman-Wunsch" lan "Smith-Waterman". Métodhe Needleman-Wunsch minangka nyusun alignment global ing antarané loro utawa luwih sekuens, ya iku alignment kanggo sadawané sekuens mau. Métodhe Smith-Waterman ngasilaké alignment lokal, ya iku alignment kanggo pérangan-pérangan njero sekuens. Kaloro métodhe mau nerapaké pamrograman dinamik (dynamic programming) lan mung efektif kanggo alignment rong sekuens (pairwise alignment)

Clustal ya iku program bioinformatika kanggo alignment multipel (multiple alignment), ya iku alignment sapérangan sekuens sisan. Loro varian utama Clustal ya iku ClustalW lan ClustalX.

Métodhe liya sing bisa ditrepaké kanggo alignment sekuens ya iku métodhe sing gegandhéngan karo Hidden Markov Modhèl ("Modhél Markov Kadhelikaké", HMM). HMM iku modhèl statistika sing mula bukané dipigunaaké ing èlmu komputer kanggo ngenali wicaraning Manungsa (speech recognition). Saliyané dipigunaaké kanggo alignment, HMM uga dipigunaaké ing métodhe-métodhe analisis sekuens liyané, kaya prediksi laladan pawènèh kodhe protéin ing genom lan prédhiksi struktur sékundhèr protéin.

Prédhiksi struktur protéin

Modhèl protéin hemaglutinin saka virus influensa

Sacara kimia/fisika, wangun struktur protéin didungkap kanthi kristalografi sinar-X utawa kanthi spektroskopi NMR, nanging rong métodhe iki banget ngentèkaké wektu lan rélatif larang. Sauntara iku, métodhe sekuensing protéin rélatif luwih gampang ndungkap sekuens asam amino protéin. Prédhiksi struktur protéin ngupaya ngramalaké struktur telung dhimènsi protéin adhedhasar sekuens asam aminoné (kanthi tembung liya, ngramalaké struktur tersier lan struktur sékundhèr adhedhasar struktur primer protéin). Lumrahé, métodhe prédhiksi struktur protéin sing ana saiki bisa dikategoriaké dadi rong golongan, ya iku métodhe pamodhèlan protéin komparatif lan métodhe pamodhèlan de novo.

Pamodhèlan protéin komparatif (comparative protéin modelling) ngramalaké struktur sawijining protéin adhedhasar struktur protéin liya sing wis dingertèni. Salah siji panrapan métodhe iki ya iku pamodhèlan homologi (homology modelling), ya iku prédhiksi struktur tersier protéin adhedhasar pepadhan struktur primer protéin. Pamodhèlan homologi didhasaraké ing téyori yèn rong protéin sing homolog duwé struktur sing mèmper banget siji lan sijiné. Ing métodhe iki, struktur sawijining protéin (ingaran protéin target) ditemtokaké adhedhasar struktur protéin liya (protéin templat) sing wis dingertèni lan duwé kamèmperan sekuens karo protéin target mau. Saliyané iku, panrapan liya pamodhèlan komparatif ya iku protéin threading sing didhasaraké ing kamèmperan struktur tanpa kamèmperan sekuens primèr. Latar wingking protéin threading ya iku struktur protéin luwih dikonservasi tinimbang sekuens protéin suwéné évolusi; laladan-laladan sing wigati kanggo fungsi protéin dipertahankan strukturé. Ing pandekatan iki, struktur sing paling kompatibel kanggo sawijining sekuens asam amino dipilih saka kabèh jinis struktur telung dhimènsi protéin sing ana. Métodhe-métodhe sing kagolong ing protéin threading ngupaya nemtokaké tingkat kompatibilitas mau.

Ing pandekatan de novo utawa ab initio, struktur protéin ditemtokaké saka sekuens primèré tanpa mbandhingaké karo struktur protéin liya. Ana akèh kamungelan ing pandekatan iki, umpamané kanthi nirokaké prosès panglipetan (folding) protéin saka sekuens primèré dadi struktur tersieré (umpamané kanthi simulasi dinamika molekular), utawa kanthi optimisasi global fungsi ènergi protéin. Prosedur-prosedur iki luwih mbutuhaké prosès komputasi sing intens, saéngga saiki mung dipigunaaké nalika nemtokaké struktur protéin-protéin cilik. Sapérangan usaha wis dilakokaké kanggo ngatasi kakurangan sumber daya komputasi mau, umpamané kanthi superkomputer (umpamané superkomputer Blue Gene [1] saka IBM) utawa komputasi kadistribusi (distributed computing, umpamané proyèk Folding@home) uga komputasi grid.

Analisis èksprèsi gen

Analisis klastering èksprèsi gen ing kanker payudara

Ekspresi gen bisa ditemtokaké kanthi ngukur kadar mRNA kanthi manéka warna tèhnik (umpamané kanthi microarray utawa uga Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-tèhnik mau lumrahé diterapaké ing analisis èksprèsi gen skala gedhé sing ngukur èksprèsi akèh gen (malah uga genom) lan ngasilaké data skala gedhé. Métodhe-métodhe panggolèkan data (data mining) ditrepaké ing data mau supaya antuk pola-pola informatif. Minangka conto, métodhe-métodhe komparasi dipigunaaké kanggo mbandhingaké èksprèsi ing antarané gen-gen, sauntara métodhe-métodhe klastering (clustering) dipigunaaké kanggo martisi data mau andhedhasar pepadhan èksprèsi gen.

Bioinformatika ing Indonésia

Saiki mata ajaran bioinformatika uga mata ajaran kanthi momotan bioinformatika wis diwulangaké ing sapérangan pawiyatan luhur ing Indonésia. Sekolah Èlmu lan Teknologi Hayati ITB nawakaké mata kuliah "Pengantar Bioinformatika" kanggo program Sarjana lan mata kuliah "Bioinformatika" kanggo program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta nawakaké mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diwulangaké ing Program Pascasarjana Kimia Fakultas MIPA Universitas Indonésia (UI), Jakarta. Mata kuliah "Proteomik lan Bioinformatika" kalebu ing kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika kalebu ing njeron silabus sapérangan mata kuliah kanggo program sarjana uga pascasarjana biokimia,biologi, lan bioteknologi ing Institut Pertanian Bogor (IPB). Saliyané iku, riset-riset sing ngarah ing bioinformatika uga wis ditindakaké déning mahasiswa program S1 Èlmu Komputer uga program pascasarjana biologi sarta bioteknologi IPB.

Riset bioinformatika protéin ditindakaké minangka péranganing aktivitas riset rékayasa protéin ing Laboratorium Rekayasa Protein, Pusat Panlitèn Bioteknologi Lembaga Èlmu Pangetauan Indonésia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, kanthi mirunggan nduwé laboratorium bioinformatika minangka fasilitas panunjang kagiyatan riseté. Saliyané iku, basis data sekuens DNA mikroorganisme asli Indonésia gèk dikembangaké ing UI.

Pirsanana uga

Réferénsi lan wacan terusan

  • Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala njaba