Der genetische Code ist eine Anleitung, nach der Dreiergruppen - Tripletts oder Codons - aufeinanderfolgender Nukleotide (oder Nukleobasen) während der Protein-Biosynthese in Aminosäuren übersetzt werden.
Als Voraussetzung dieses Prozesses werden die Basen der DNA eines Gens zunächst in ein mRNA-Molekül umgeschrieben (Transkription); danach können bestimmte Teile dieser mRNA gezielt entfernt werden (Spleißen). Schließlich, während der Translation, werden die Aminosäuren der zu den Codons passenden tRNAs miteinander zu einer Polypeptidkette verknüpft. Einige Codons stehen nicht für eine Aminosäure, sondern werden als STOPP-Zeichen behandelt, welches die Translation beendet.
So gut wie alle Lebewesen benutzen den selben genetischen Code. Die gebräuchlichste Version ist in den folgenden Tabellen angegeben. Sie zeigen, welche Aminosäuren von den 4³=64 möglichen Codons kodiert werden (Tabelle 1), und welche Codons jede der 20 in der Translation verwendeten Aminosäuren kodieren (Tabelle 2). So steht zum Beispiel GAU für die Aminosäure Asp (Asparagin), und Cys (Cystein) wird von den Codons UGU und UGC kodiert. Die in der Tabelle verwendeten Basen sind Adenin, Guanin, Cytosin und Uracil der mRNA; in der DNA wird statt Uracil Thymin verwendet.
2. Base | |||||
---|---|---|---|---|---|
U | C | A | G | ||
1. Base | U | UUU Phenylalanin UUC Phenylalanin |
UCU Serin |
UAU Tyrosin UAC Tyrosin |
UGU Cystein UGC Cysteine |
C | CUU Leucin |
CCU Prolin |
CAU Histidin |
CGU Arginin | |
A | AUU Isoleucin |
ACU Threonin |
AAU Asparagin |
AGU Serin | |
G | GUU Valin |
GCU Alanin |
GAU Asparaginsäure GAC Asparaginsäure |
GGU Glycin |
1Das Triplett AUG dient sowohl als Codon für Methionin als auch als Startsignal der Translation; das erste AUG-Triplett auf der mRNA wird das erste Codon, das zu Protein translatiert wird.
Ala | GCU, GCC, GCA, GCG | Leu | UUA, UUG, CUU, CUC, CUA,
CUG |
Arg | CGU, CGC, CGA, CGG, AGA,
AGG |
Lys | AAA, AAG |
Asn | AAU, AAC | Met | AUG |
Asp | GAU, GAC | Phe | UUU, UUC |
Cys | UGU, UGC | Pro | CCU, CCC, CCA, CCG |
Gln | CAA, CAG | Ser | UCU, UCC, UCA, UCG, AGU,
AGC |
Glu | GAA, GAG | Thr | ACU, ACC, ACA, ACG |
Gly | GGU, GGC, GGA, GGG | Trp | UGG |
His | CAU, CAC | Tyr | UAU, UAC |
Ile | AUU, AUC, AUA | Val | GUU, GUC, GUA, GUG |
START | AUG, GUG | STOP | UAG, UGA, UAA |
Den drei STOP-Codons wurden ursprünglich Namen gegeben - UAG war amber (bernsteinfarben), UAG war opal, und UAA war ochre (ocker). Die Namen gehen zurück auf den ersten Entdecker (Bernstein), die nachfolgenden Codeworte sind Verballhornungen seines Namens.
Während das mRNA-Codon UGA zumeist als STOPP gelesen wird, kann es unter bestimmten Bedingungen für eine 21te Aminosäure stehen: Selenocystein (Sec). Die Biosynthese und der Einbaumechanismus von Sec in Proteine unterscheidet sich stark von dem aller anderen Aminosäuren: seine Insertion erfordert einen neuartigen Translationsschritt, bei dem ein UGA im Rahmen einer bestimmten Sequenzumgebung und zusammen mit bestimmten Cofaktoren anders interpretiert wird. Hierzu ist eine strukturell einzigartige, Selenocystein spezifische tRNA (tRNASec) erforderlich, die bei Vertebraten mit drei verschiedenen, allerdings verwandten Aminosäuren beladen werden kann: Serin, Selenocystein und Phosphoserin.
Die Translation beginnt mit einem Kettenstarter- oder START-Codon, aber dies alleine ist nicht ausreichend, um den Prozess zu beginnen. Bestimmte Initiationssequenzen nahe des START-Codons sind ebenfalls notwendig, um die Transkription in mRNA und deren Bindung am Ribosom herbeizuführen. Das wichtigste Startcodon ist AUG, das auch für Methionin codiert. CUG und UUG, sowie GUG und AUU in Prokaryoten, funktionieren ebenfalls.
Fehlertoleranz
Wird während der Translation ein Codon falsch dekodiert (eine falsche Aminosäure verwendet), so stimmt die Struktur des hergestellten Eiweißes nicht mehr, und es funktioniert nicht mehr wie vorgesehen. Offenbar war es daher sehr früh in der Evolutionsgeschichte notwendig, den genetischen Code mit einer gewissen Fehlertoleranz auszustatten: Er ist ein so genannter degenerierter Code, das heißt, dass eine semantische Einheit durch mehrere unterschiedliche syntaktische Symbole codiert wird: Abzüglich der Stopp-Codons stehen ja 61 unterschiedliche Codons zu Verfügung, es müssen aber nur 20 Aminosäuren codiert werden. Wie in der Tabelle oben ersichtlich, werden also für manche Aminosäuren mehrere Codes verwendet. Diese unterscheiden sich dann in der Regel in nur einer der drei Basen. (Sie haben dadurch einen minimalen Abstand im Coderaum (siehe: Hammingdistanz). Wird also eine der Basen falsch gelesen, liegt die Wahrscheinlichkeit, dass trotzdem die richtige Aminosäure ausgewählt wird, noch immer bei 60%. Meist unterscheiden sich die betroffenen Codons zudem in der letzten (dritten) Base eines Codons, die bei der Translation am häufigsten falsch gelesen wird.
Darüber hinaus haben Aminosäuren, die häufiger in Proteinen vorkommen als andere, mehr Codons, die für sie kodieren.
Bemerkenswert ist die Tatsache, dass der Charakter einer Aminosäure weitgehend durch die mittlere Position eines Tripletts bestimmt wird:
- U - hydrophob
- C - polar bis neutral
- A - geladen
- G - geladen, neutral bis polar
Daraus folgt, dass Radikalsubstitutionen (Tausch gegen Aminosäuren eines anderen Charakters) in erster Linie Folge von Mutationen in dieser zweiten Position sind. Mutationen in der ersten, besonders aber in der dritten Position ("wobble") erhalten dagegen häufig die Aminosäure oder zumindest ihren Charakter "konservative Substitution". Berücksichtigt man ferner, dass TransitionenUmwandlung von Purinen bzw. Pyrimidinen ineinander) aus mechanistischen Gründen häufiger auftreten als Transversionen (Umwandlung eines Purins in ein Pyrimidin und umgekehrt; dieser Prozess setzt zumeist eine Depurinierung voraus), so ergibt sich eine weitere Erklärung für den konservativen Charakter des Codes.
Universalität des Codes
Grundprinzip
Bemerkenswert ist, dass der genetischer Code im Prinzip für alle Lebewesen gleich ist, alle Lebewesen sich also der gleichen "genetische Sprache" bedienen. Da also ein bestimmtes Codon immer für die gleiche Aminosäure steht ist es möglich, in der Gentechnik z.B. das Gen für menschliches Insulin in Bakterien einzuschleusen, damit diese Insulin produzieren. Dieses Prinzip wird als "Universalität des Codes" bezeichnet. Dies erklärt sich aus der Evolution so, dass der genetische Code schon sehr früh in der Entwicklungsgeschichte des Lebens ausgestaltet und an alle sich entwickelnden Arten weitergegeben wurde. Eine solche Generalisierung schließt nicht aus, dass die Häufigkeit verschiedener Codewörter (die sog. Codon Usage) sich zwischen den Organismen unterscheiden kann.
Ausnahmen
Es gibt auch offensichtliche Ausnahmen von der Universalität des genetischen Codes: So wird in den Mitochondrien, energieumsetzenden Organellen, die vermutlich von symbiotischen Bakterien abstammen, und die eine eigene Erbsubstanz (neben der DNA des Zellkerns) tragen, eine leicht abgewandelte Form des Codes benutzt.
Auch die Ciliaten zeigen Abweichungen vom Standard-Code: UAG, und häufig auch UAA, kodieren für Glutamin; diese Abweichung findet sich auch in einigen Grünalgen. UGA steht auch manchmal für Cystein. Eine weitere Variante findet sich in der Hefe Candida, wo CUG Serin kodiert.
Des weiteren gibt es einige Varianten von Aminosäuren, die von Bakterien und Archaea verwendet werden; das STOPP-codon UGA kann, wie oben beschrieben, Selenocystein und UAG Pyrrolysin kodieren. Es ist nicht auszuschließen, dass weitere Codierungs-Varianten existieren, die bislang noch nicht entdeckt wurden.