Zum Inhalt springen

Nukleotidsequenz

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 1. Mai 2003 um 13:07 Uhr durch Stefan Kühn (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Sequenz der genomischen DNA ist die Abfolge ihrer Nukleotide in Symbolform, wie sie aus der DNA-Sequenzierung erschlossen wird, also z.B.

...AGGATTAGGCCTG...

Diese Repräsentation der DNA-Sequenz wird zur Abspeicherung in den großen öffentlichen genomischen Datenbanken, wie z.B. GenBank verwendet. Aufgrund der Darstellung als Symbolfolge lässt sich die DNA so sehr einfach statistisch untersuchen. Dabei wird die Häufigkeit sogenannter n-Tupel untersucht, d.h. der Vorkommen von Teilwörtern der Länge n. So taucht im menschlichen Genom im Mittel die Folge "CG" deutlich seltener auf als alle anderen 2-er Worte. Die lokalen Häufigkeitsverteilungen verschiedener Nukleotidworte können erste Hinweise auf die Funktionen bestimmter DNA-Abschnitte geben (Intron, Exon, CpG-islands).

Siehe auch Gen;Genetik;Molekulargenetik;genetischer Code;Proteinbiosynthese