Zum Inhalt springen

Genom

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 2. Februar 2005 um 08:31 Uhr durch Hati (Diskussion | Beiträge) (Weitere besondere DNA-Sequenzen). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Ein Genom ist die Gesamtheit der DNA eines Virus, einer Zelle oder eines Organismus.

Das Genom enthält die Informationen, die zur Entwicklung (Ontogenese) der Bau- und Leistungsmerkmale eines Lebewesens oder eines Virus notwendig sind. Diese Informationen sind in der Basensequenz der DNA verschlüsselt. Daneben enthält es Basensequenzen, die struturelle Bedeutung für die Organisation der DNA haben oder deren Bedeutung noch nicht bekannt ist.

Bei mehrzelligen Organismen ist das Genom die Gesamt-DNA einer Zelle. Das Genom der einzelnen, ausdifferenzierten Zelle ist weitgehend dem Genom der Zygote, aus der sie durch mitotischer Zellteilung entstanden sind, identisch. Es gibt jedoch durch Mutationen und mitotische Rekombinationen kleine Veränderungen.

Bei Organismen mit Kernphasenwechsel unterscheidet sich das Genom der Keimzellen vom Genom der Zygote ebenfalls durch Mutationen sowie durch meiotische Rekombinationen (siehe Meiose).

Chemische Grundlagen

Die für die Vererbung von Eigenschaften erforderlichen und auf der Ebene der Zellen und der Individuen weitergegebenen Informationen sind in den Desoxyribonukleinsäuren (DNA, von englisch "desoxyribonucleic acids") enthalten, und zwar in Form von Sequenzen der DNA-Basen Adenin, Guanin, Cytosin und Thymin. Die DNA-Moleküle können in Abschnitte mit kodierenden und nicht-kodierenden Sequenzen eingeteilt werden. Die kodierenden Abschnitte Gene enthalten die Erbinformationen für bestimmte Proteine. Daneben gibt es DNA-Abschnitte, die der Genregulation dienen. Pseudogene sind durch Mutationen funktionslos gewordene und vom Organismus nicht mehr abgelesene Gene. Bei Eukaryoten findet durch das alternative Splicing eine Datenkompression statt, so dass die Genomgröße (in Basenpaaren gemessen) kleiner sein kann als die Anzahl der durch das Genom codierten Merkmale.

Bei allen Organismen, die komplexer als Viren sind, gibt es außerhalb der chromosomalen DNA (bei Eukaryoten "Karyom" genannter Teil des Genoms) weitere Genombestandteile in anderen Zellteilen. So finden sich bei Bakterien und Archaebakterien essentielle Plasmide, bei Eukaryoten (Pflanzen, Tiere, Pilze) gibt es selbstständig vererbte DNA-Sequenzen in den Mitochondrien ("Mitochondriom") und Plastiden ("Plastidom"), die aber zum Gesamtgenom der Zellen gehören.

Typische Genomgrößen

Lebewesen Genomgröße (in Basenpaaren)
λ-Phage 5×104
Darmbakterium Escherichia coli 4×106
Bäckerhefe Saccharomyces cerevisiae 2×107
Fadenwurm Caenorhabditis elegans 8×107
Taufliege Drosophila melanogaster 2×108
Kugelfisch Fugu rubripes 3,65×108
Mensch Homo sapiens sapiens 3×109
Molch 4×1010

Bei Eukaryoten beziehen sich die Zahlenangaben auf den haploiden Chromosomensatz.
Anmerkung 1: Die DNA einer einzelnen menschlichen Zelle ist ca. 1,80 m lang.
Anmerkung 2: Ein Basenpaar hat einen Informationsgehalt von 1 bit, das Genom des Menschen hat einen Informationsgehalt von ca. 400 MByte.

Ein Vergleich der Genom-Größe mit der Komplexität und des Organisationsgrades des Organismus ergibt einen direkten Zusammenhang: Je größer das Genom, um so komplexer ist der Organismus:

Datei:GenomMenge.png
Genom-Größe

Ausnahmen bilden hierbei weniger komplexe Organismen mit hoher DNA-Menge (als „C-Wert-Paradoxon“ bezeichnet): einige Samenpflanzen, die Salamander und urtümliche Fische wie Stör, Hornhecht und Quastenflosser.

Die höchste DNA-Menge weisen einfache Eukaryoten wie einige Amöben und die Urfarne (Psilopsida) mit rund einer Billion Basenpaare auf.

Diese Arten enthalten einzelne Gene als tausendfache Kopien, und lange, nicht-Protein-codierende Abschnitte. Auch im menschlichen Genom kommt ein etwa 300 Basenpaare langes DNA-Stück, die alu-Sequenz in ungefähr 300000 Kopien vor und macht damit 3 % der gesamten DNA aus.

Bestandteile des menschlichen Genoms

Die Zahlen beziehen sich auf den haploiden Chromosomensatz des Menschen ohne mitochondrialer DNA (mtDNA). Mb = 3·106 Basen

Die Gesamtmenge des menschlichen Genoms beträgt 3000 Mb, das sind 3·109 Basenpaare.

Gene

Ein Teil des Genoms besteht aus Sequenzen, die in einem Transkription genannten Vorgang in eine RNA übertragen werden. Diese Sequenzen werden auch als Gene bezeichnet.

A) Protein codierende Gene

Das RNA-Transkript enthält Basensequenzen, welche die Aminosäuresequenz von Proteinen codieren. Die RNA wird dann als mRNA bezeichnet. Bei den Eukaryota ist sie aus Exons und Introns zusammengesetzt und wird in diesem Zustand als prä-mRNA oder hnRNA bezeichnet. Sie wird noch vor der Translation bearbeitet (prozessiert), in dem die nicht-codierenden Introns herausgeschnitten werden. Die mRNA der Prokaryota weist nie Introns auf.

B) Von Genen abstammende Sequenzen

Einige Basensequenzen stammen zwar von Genen ab, das Transkript wird aber nicht in eine Aminosäuresequenz übersetzt. Diese nicht codierende DNA ist 810 Mb groß.

  1. Pseudogene sind veränderte Kopien funktionell aktiver Gene, die deren Expression steuern können.
  2. Introns werden noch im Zellkern der Eukaryoten aus der prä-mRNA herausgeschnitten. Ihre Funktion ist nicht vollständig geklärt. Einige enthalten Erkennungssequenzen für Replikationsfaktoren, die die Aktivität der RNA-Polymerase beeinflussen. Eine häufig geäußerte Vermutung ist, dass durch die zwischen die codierenden Exons eingestreuten Introns die Mutationshäufigkeit in den codierenden Sequenzen herabgesetzt ist. Dagegen spricht aber, dass auch in den Introns hochkonservierte consense-Sequenzen (siehe unten) zu finden sind. Eine andere Vermutung besteht darin, dass durch gelegentlich ungenaues Spleißen der prä-mRNA Eiweiße entstehen, die sich an bestimmten Stellen in nur wenigen Aminosäuren unterscheiden und somit etwas veränderte Eigenschaften aufweisen. Auf die Weise könnte bewerkstelligt werden, dass von einem Enzym-Typ stetes mehrere Versionen bereitgestellt werden, die etwas unterschiedliche Eigenschaften (tum Beispiel im pH- oder Temperatur-Optimum) aufweisen.
  3. Genfragmente entstehen dann, wenn es von einem Gen mehrere Kopien im Genom gibt und eine dieser Kopien durch Mutationen unbrauchbar wird.

C) RNA-codierende Gene

Das RNA-Transkript enthält Basensequenzen, welche die Basensequenz von RNAs codieren. Diese Moleküle werden auch als ncRNAs (nc von engl. non coding = nicht kodierend) bezeichnet und erfüllen zahlreiche Aufgaben bei der Proteinbiosynthese. Einige davon sind erst vor kurzem bekannt geworden und noch nicht genauer erforscht. Es wird vermutet, dass die ncRNAs molekulare Fossilien aus der RNA-Welt sind (siehe chemische Evolution) und damit von Bedeutung für das Verständnis der Evolution der Lebewesen sind.

  1. tRNAs transportieren Aminosäuren zu den Ribosomen.
  2. rRNAs sind Bestandteile der Ribosomen und erfüllen dort strukturelle und katalytische Aufgaben.
  3. snRNAs sind Bestandteile der Spleißosomen, welche aus der prä-mRNA die Introns herausschneiden.
  4. Ebenfalls ein junges Forschungsgebiet ist die RNA-Interferenz (RNAi), eine weitere Möglichkeit der Regulation der Proteinbiosynthese, wobei kleinere RNA-Moleküle mit Teilen der mRNA reagieren und dadurch in der Regel die Translation verhindern. Solche RNA-Moleküle sind siRNAs (si von engl. short interfering), microRNAs, von welchen das menschlichen Genom mehrere Hundert aufweist. Es gibt auch Interaktionen von RNAs mit der DNA, mit Proteinen und mit niedermolekularen Substanzen.
    1. Mikro-RNA: Manche Introns enthalten zueinander komplementäre Abschnitte, so dass die prä-RNA nach der Transkription Haarnadelschleifen bilden kann. Diese werden durch spezielle Proteine des „Zensursystems“ (ursprünglich ein Abwehr-System gegen virale Doppelstrang-RNA) erkannt und so abgebaut, dass einsträngige RNA-Abschnitte entstehen, die an andere mRNAs binden und somit zerstören können.
  5. Antisense-RNA: Die mRNA entsteht am codogenen (Matrizen-) Strang der DNA. Wird auch der komplementäre Strang abgelesen, entsteht eine zur mRNA komplementäre RNA. Verbinden sich mRNA und Antisense-RNA zu einem Doppelstrang, kann kein Protein mehr bei den Ribosomen gebildet werden. Auch dies stellt eine Möglichkeit der Regulation der Proteinbiosynthese dar. Beim Menschen gibt es mindestens 1600 antisense-Gene.
  6. SRP-RNA ist Bestandteil der signal recognition particles, das sind Protein-RNA-Komplexe, welche den zielgerichteten Transport von Proteinen in der Zelle gewährleisten.

Nichtkodierende Sequenzen

Der übrige Teil des Genoms besteht aus Sequenzen, die nicht transkribiert werden. Er wird als extragenische DNA bezeichnet und weist ein Länge von insgesamt 2100 Mb auf.

Davon besteht der größte Teil (1680 Mb) aus einzelnen, individuellen oder nur selten wiederholten Basensequenzen. Dies sind in der Regel Sequenzen, an welche bestimmte Enzyme binden und dadurch die Replikation und Transkription steuern:

  • An die Promotor-Sequenzen (TATA-Box) bindet die RNA-Polymerase
  • Initiations- und Terminations-Sequenzen, markieren Beginn und Ende eines Gens
  • Consense-Sequenzen sind hochkonservierte Sequenzen, die die Grenzen zwischen Exons und Introns markieren
  • An Operator-Sequenzen oberhalb (engl. upstream) und unterhalb (engl. downstream) von Genen, an welche Regulatorproteine binden, um die Transkription zu beschleunigen oder zu verzögern und damit ihre Feinregulation übernehmen.
  • Palindrome sind Erkennungssequenzen für Restritktionsendonukleasen.
  • Bei den Abstandshaltern kommt es nicht auf die Sequenz, sondern die Zahl der Basen an. Deshalb können hier die Mutationsraten ohne Auswirkungen sehr hoch sein, solange es nicht zu Baseneinschub, oder Basenverlust kommt. Diese DNA-Abschnitte sorgen dafür, dass die Operator-Sequenzen im Falle der Transkription bei der Schleifenbildung in die richtige Position zu den Promotoren gebracht werden, und so die RNA-Polymerase beeinflussen können.

Der Rest der DNA von 420 Mb besteht aus hoch repetitiven Sequenzen.

1. disseminierte (verstreute) genomweite Wiederholungen

  • LTR-Elemente
  • Transposone
  • LINE-Sequenzen (LINE 1, LINE 2)
  • SINE-Sequenzen(z. B. Alu-Sequenz) (short interspersed repetitive element) ermöglichen eine Verlagerung einer Sequenz an eine andere Stelle des Genoms. Sie sind 70 bis ca. 500 Basen lange Retroposons, d.h. Elemente, deren Ortswechsel über eine transkribierte RNA-Sequenz erfolgt, deren cDNA-Produkt an anderer Stelle ins Genom integriert wird. In Genomen von Eukaryoten findet man bis zu 104 Kopien.

2. Tandemwiederholungen

Die Anzahl der Wiederholungen variiert von Individuum zu Individuum, die Abweichungen sind vom Verwandtschaftsgrad abhängig. Deshalb sind sie für den genetischen Fingerabdruck geeignet. Die von der Norm abweichende Zahl an Wiederholungen kann Krankheiten auslösen.

  • Mikrosatelliten-DNA, z. B. (CA)n, mit einer repetitiven Einheit von 2 bis 7 Basenpaaren. Sie sind im ganzen Genom verteilt, und werden auch zur genetischen Kartierung verwendet. Mikrosatelliten weisen eine hohe Mutationsrate auf und haben damit auch eine Bedeutung in der Evolution von Organismen.
  • Minisatelliten-DNA, mit einer repetitiven Einheit von 20 bis 100 Basenpaaren sind ebenfalls im ganzen Genom verteilt.
  • Satelliten-DNA tritt nur im Bereich der Centromere auf. Sie besteht aus kurzen Basensequenzen, die mehrfach hintereinander wiederholt werden. (Beim Menschen 100000).

Weitere besondere DNA-Sequenzen

  • Telomere: Bei Wirbeltieren befinden sich am Ende des 3’-Stranges der DNA 250 bis 15600 repetitive Sequenzen TTAGGG, da sonst die Replikation am anderen Strang vorzeitig abbrechen würde. Diese Abschnitten werden mit jeder Zelteilung kürzer. Sie schützen auch die Chromosomen vor dem Zusammenkleben oder vor Abbau. Bei Bruch der Chromosomen kann erkannt werden, welche Enden wieder zusammengefügt werden müssen.
  • Der kurzer Arm von Chromosom 22 (HSA22p), enthält nur Heterochromatin, das praktisch nur aus repetitiver DNA bestehen.
  • Fremdgene, können von einem inaktiven (temperente) Virus stammen, der in das Genom integriert ist. 1998 wurde eine Mutation entdeckten, die typisch für Menschenaffen ist und auch bei Menschen vorkommt: Eine Kopie eines Stücks des mitochondrialen Genoms (Kontrollregion) ist auf ungeklärte Weise in den Zellkern gelangt und dort auf Chromosom Nr. 9 zu finden (nachgewiesen bei Gibbon, Orangutan, Gorilla, Schimpanse, Mensch).

Sogenannte Junk-DNA

Mit dem heutigen Wissenstand ist es problematische Sequenzen als „bedeutungslos“ oder „junk“ zu bezeichnen. Für den Organismus tatsächlich bedeutungslose Sequenzen dürften im Laufe der Evolution sehr bald verloren gegangen sein. (Siehe die Evolution des Y-Chromsoms). Erklärungsmöglichkeiten für bedeutungslos erscheinende Sequenzen.

Organisation des Genoms

  • Bei den Prokaryota (Eubakteria und Archaea) besteht das Genom aus einem großen, ringförmigen Chromosom und mehreren kleineren, in ihrer Zahl variierenden DNA-Ringen, den Plasmiden. Diese können sich unabhängig von der Haupt-DNA verdoppeln und an andere Bakterienzellen weitergegeben werden (siehe Konjugation). Sie enthalten in der Regel nur wenige Gene, die Resistenzen gegen Antibiotika oder Fertilität (die Fä-higkeit zur Konjugation) vermitteln. Manche Plasmide sind reversibel in die Haupt-DNA in-tegriert und werden dann als Episome bezeichnet.
  • Bei den Eukaryota (Pflanzen, Pilze und Tiere) ist das Genom in mehrere strang-förmige Chromosomen unterteilt, die nur im Zellkern vorkommen und deshalb als Karyom bezeichnet werden. Außerhalb des Zellkerns besitzen Plastiden und Mitochondrien eine jeweils eine eigene, relativ kleine DNA, die als Plasmid organisiert ist.

Sequenzierte Genome im Internet

Mittels der DNA-Sequenzierung wurden annähernd vollständige Genome von verschiedenen Organismen, die entweder für die medizinisch-pharmazeutische oder anwendungsorientierte Forschung oder auch für die Grundlagenforschung relevant sind, entschlüsselt und über das Internet vom NCBI bereitgestellt.

Archaea - http://www.ncbi.nlm.nih.gov/genomes/static/a.html
Bacteria - http://www.ncbi.nlm.nih.gov/genomes/static/eub.html
Escherichia coli (Colibakterien) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=562
Eukaryota - http://www.ncbi.nlm.nih.gov/genomes/static/euk.html
Homo sapiens (Mensch) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=9606
Felis catus (Hauskatze) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=9685
Mus musculus (Hausmaus) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=10090
Drosophila melanogaster (Fruchtfliege) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=7227
Arabidopsis thaliana (Ackerschmalwand) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=3702
Oryza sativa (Reis) - http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=4530

Siehe auch

Genetik - Molekularbiologie - Molekularbiologische Datenbanken - Proteinbiosynthese - DNA-Sequenzanalyse - Gen