SIMAP
Similarity Matrix of Proteins nebo častěji SIMAP je BOINC projekt, který slouží k výzkumu funkcí proteinů. Aplikace simap hledá pomocí FASTA heuristiky (jejíž výsledky jsou zpřesněny pomocí Smith-Watermanova algoritmu[1][2]) podobnosti v primární struktuře proteinů, aplikace hmmer využívající skryté Markovovy modely (Hidden Markov Models) lokalizuje v proteinu jednotlivé domény.[3] Zdroje dat pro SIMAP@home představují veřejně přístupné vědecké databáze jako UniProt, RCSB PDB, GenBank nebo RefSeq shromažďující informace o struktuře a funkci dosud objevených proteinů. Pro odhad proteinových domén se využívá informací o známých doménách a sekvenčních vzorech z databáze InterPro.[4] Výsledky výpočtů se ukládají do veřejně přístupné vědecké databáze.
Význam projektu
[editovat | editovat zdroj]Studium proteinů je základem pro pochopení biologických procesů v živých organismech. Má uplatnění v medicíně a farmaceutickém průmyslu, molekulární biologii, biochemii, genetice, bioinženýrství, nanotechnologiích, atd.[5] Počet každoročně objevených proteinů velmi rychle roste, avšak jen u zlomku z nich je známo jejich působení v organismu.[6] Experimentální ověřování funkcí proteinů je zdlouhavé a velmi nákladné. Velké množství proteinů má však podobné funkce.[7] SIMAP@home vytváří databázi, v které jsou uloženy informace o vzájemné podobnosti známých i nově objevených proteinů. Tato databáze pak slouží jako základ k dalšímu výzkumu.
Proteiny
[editovat | editovat zdroj]Obecná charakteristika
[editovat | editovat zdroj]Proteiny (bílkoviny) jsou základní stavební jednotkou organismu. Jsou tvořeny řetězci aminokyselin (tj. molekul obsahující funkční skupiny -NH2 a -COOH) spojených navzájem peptidickou vazbou. V organismu plní důležité funkce[8], mimo jiné:
- transportní (např. hemoglobin v červených krvinkách váže kyslík)
- regulační (např. insulin - snižuje koncentraci glukózy v krvi)
- strukturní (např. kolagen v pojivových tkáních),
- katalytickou (např. enzym DNA polymeráza při replikaci DNA)
- ochranné (různé protilátky)
- skladovací (např. ferritin skladující železo)
Struktura proteinů
[editovat | editovat zdroj]Primární struktura
[editovat | editovat zdroj]proteinů je tvořena pořadím aminokyselin, které protein tvoří. Pořadí aminokyselin je zakódováno v DNA. SIMAP@home se snaží pomocí shody v pořadí aminokyselin (=sekvenční shoda) u proteinů najít tzv.homologní proteiny. Sekvence jsou homologní, jestliže jsou odvozeny od stejné původní sekvence. Například pokud se nějaká linie živočichů v průběhu evoluce rozdělí na dvě vývojové větve, bude každá vývojová větev zprvu obsahovat podobné geny kódující podobné proteiny s podobnou nebo stejnou funkcí.[11] Pokud je sekvenční shoda dvou proteinů vyšší než 45 %[12], lze předpokládat, že proteiny budou mít podobnou i prostorovou strukturu a funkci.
Sekundární struktura
[editovat | editovat zdroj]Sekundární struktura proteinů vzniká lokálním "sbalením" částí proteinů v důsledku vytváření vodíkových můstků mezi karbonylovými a imidovými skupinami v proteinu. Je určena typickým tvarem částí proteinů, nejčastěji:
- Alfa-helix: α-helix[nedostupný zdroj], 310-helix[nedostupný zdroj] nebo π-helix Archivováno 3. 12. 2005 na Wayback Machine. (vypadají jak šroubovice)
- Beta-skládaný list: β-struktura[nedostupný zdroj] neboli struktura skládaného listu (vypadá jak harmonika, zpřekládaný list papíru)
- ohyby (vypadají jak šňůrka), které mění směr aminokyselinového řetězce
Terciární struktura
[editovat | editovat zdroj]Terciární strukturu proteinů v SIMAP@home počítá aplikace hmmer. Rozlišují se supersekundární struktura a proteinové domény.
- supersekundární struktura (sekvenční motivy) - prostorové uspořádání po sobě jdoucích elementů sekundární struktury. Např.: alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý), atd.
- proteinové domény (proteinové sbalení) - opakovaně se vyskytující kombinace supersekundární struktury. Domény tvoří navzájem propojené a více či méně strukturně a funkčně nezávislé části proteinu. Na rozdíl od kvartérní struktury je zatím vše v rámci jednoho aminokyselinového (polypeptidického) řetězce.
Kvartérní struktura
[editovat | editovat zdroj]vzniká když je protein tvořen dvěma nebo více polypeptidickými řetězci, které jsou spojeny nekovalentními vazbami. Příkladem může být hemoglobin, který je tvořen čtyřmi vlákny (viz obrázek - otevře se po kliknutí na odkaz u hemoglobinu).
Databáze SIMAP
[editovat | editovat zdroj]Databáze obsahovala v roce 2007 více než 17 milionů proteinů. Databáze SIMAP je aktualizována každý měsíc, a proto jsou nové jednotky pro SIMAP@home připraveny obvykle vždy k začátku nového měsíce. V současnosti má projekt dostatečnou počítačovou kapacitu, avšak potřeba výpočetního času (především pro aplikaci hmmer) se postupně stále zvyšuje.
Software
[editovat | editovat zdroj]Aplikace SIMAP@home běží pod systémy Windows, Macintosh a Linux.
Reference
[editovat | editovat zdroj]- ↑ Roland Arnold, Thomas Rattei, Patrick Tischler, Minh-Duc Truong, Volker Stümpflen and Werner Mewes: SIMAP—The similarity matrix of proteins, Bioinformatics 2005 21(Suppl 2):ii42-ii46; doi:10.1093/bioinformatics/bti1107
- ↑ C. Miccio, T. Ratter: Global statistical analysis of the protein homology network, arXiv:q-bio/0703053v1
- ↑ Similarity Matrix of Proteins: Frequently asked questions about the BOINCSIMAP project. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-06-19.
- ↑ Thomas Rattei, Patrick Tischler, Roland Arnold, Franz Hamberger, Jörg Krebs, Jan Krumsiek, Benedikt Wachinger, Volker Stümpflen and Werner Mewes: SIMAP—structuring the network of protein similarities, Nucleic Acids Res., 36, D289–D292.. www.pubmedcentral.nih.gov [online]. [cit. 2008-07-16]. Dostupné v archivu pořízeném z originálu dne 2020-07-20.
- ↑ NordProt: Importance of protein science. www.nordprot.org [online]. [cit. 2008-07-16]. Dostupné v archivu pořízeném dne 2009-04-21.
- ↑ Antonín Pavelka: Funkční anotace proteinových segmentů, Masarykova Univerzita, bakalářská práce
- ↑ Similarity Matrix of Proteins: About SIMAP. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-07-19.
- ↑ Bílkoviny=proteiny, ÚSTAV BIOCHEMIE A MIKROBIOLOGIE, Vysoká škola chemicko-technologická v Praze[nedostupný zdroj]
- ↑ RNDr. Tomáš Obšil, PhD.: Struktura proteinů a funkce enzymů, Katedra fyzikální a makromulekulární chemie, Přírodovědecká fakulta UK v Praze[nedostupný zdroj]
- ↑ Vladimír Kopecký Jr.: Úvod do struktury proteinů I, Fyzikální ústav Matematicko-fyzikální fakulty UK. biomolecules.mff.cuni.cz [online]. [cit. 2007-08-18]. Dostupné v archivu pořízeném dne 2007-08-18.
- ↑ Similarity Matrix of Proteins: Glossary. webclu.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném z originálu dne 2008-06-02.
- ↑ Bioinformatika a funkční studie, Fakulta vojenského zdravotnictví UO v Hradci Králové[nedostupný zdroj]