„Gap (Bioinformatik)“ – Versionsunterschied
[gesichtete Version] | [gesichtete Version] |
Artikel vollständig überarbeitet, belegt und bebildert, Baustein entfernt |
Aka (Diskussion | Beiträge) K Tippfehler entfernt, Kleinkram |
||
Zeile 2: | Zeile 2: | ||
Ein '''Gap''' ([[englische Sprache|engl.]], zu deutsch: ''Lücke'') bezeichnet in der [[Bioinformatik]] eine Lücke oder Leerstelle in einer Sequenz, insbesondere beim [[Sequenzalignment]] in der [[Genetik]]. Liegt beim Vergleichen zweier verwandter Sequenzen (z. B. den [[Genom]]-Codes zweier verwandter [[Art (Biologie)|Spezies]]) in der einen Sequenz eine Lücke vor, während dort in der anderen Sequenz weitere Elemente stehen, spricht man von einem Gap. |
Ein '''Gap''' ([[englische Sprache|engl.]], zu deutsch: ''Lücke'') bezeichnet in der [[Bioinformatik]] eine Lücke oder Leerstelle in einer Sequenz, insbesondere beim [[Sequenzalignment]] in der [[Genetik]]. Liegt beim Vergleichen zweier verwandter Sequenzen (z. B. den [[Genom]]-Codes zweier verwandter [[Art (Biologie)|Spezies]]) in der einen Sequenz eine Lücke vor, während dort in der anderen Sequenz weitere Elemente stehen, spricht man von einem Gap. |
||
Gaps können durch verschiedene Arten von [[Mutation]]en entstehen: Bei einer [[Insertion (Genetik)|Insertion]] wurde ein zusätzliches Element eingefügt, der Gap besteht dann in der älteren Sequenz. Bei einer [[Deletion]] wurde umgekehrt ein Element gelöscht, sodass der Gap in der jüngeren Sequenz entsteht. Da meist nicht bekannt ist welche Sequenz [[Evolution|evolutionär]] älter ist, werden Mutation auch mit dem neutralen [[Kofferwort| |
Gaps können durch verschiedene Arten von [[Mutation]]en entstehen: Bei einer [[Insertion (Genetik)|Insertion]] wurde ein zusätzliches Element eingefügt, der Gap besteht dann in der älteren Sequenz. Bei einer [[Deletion]] wurde umgekehrt ein Element gelöscht, sodass der Gap in der jüngeren Sequenz entsteht. Da meist nicht bekannt ist welche Sequenz [[Evolution|evolutionär]] älter ist, werden Mutation auch mit dem neutralen [[Kofferwort|Portemanteau]] ''indel'' oder ''insdel'' (von „<u>ins</u>ert“ und „<u>del</u>ete“) bezeichnet. |
||
== Informatische Bewertung == |
== Informatische Bewertung == |
||
In der [[Algorithmus|algorithmischen]] Bioinformatik wird die Ähnlichkeit zweier Sequenzen danach bewertet, an wie vielen Stellen diese sich durch Ersetzungen (wenn beide Sequenzen an einer Stelle unterschiedliche Werte haben) und Lücken (Gaps) unterscheiden. Das Maß dafür ist die [[Distanzfunktion|Distanz]], eine Kostenfunktion, welche abstrahiert wie viele Änderungen nötig wären, um eine Sequenz in die andere zu überführen. Je höher dies Distanz (= die „Kosten“ der Überführung von einer Sequenz in die andere), desto geringer ist die Ähnlichkeit beider Sequenzen. |
In der [[Algorithmus|algorithmischen]] Bioinformatik wird die Ähnlichkeit zweier Sequenzen danach bewertet, an wie vielen Stellen diese sich durch Ersetzungen (wenn beide Sequenzen an einer Stelle unterschiedliche Werte haben) und Lücken (Gaps) unterscheiden. Das Maß dafür ist die [[Distanzfunktion|Distanz]], eine Kostenfunktion, welche abstrahiert wie viele Änderungen nötig wären, um eine Sequenz in die andere zu überführen. Je höher dies Distanz (= die „Kosten“ der Überführung von einer Sequenz in die andere), desto geringer ist die Ähnlichkeit beider Sequenzen. |
||
Aufgrund [[Biochemie|biochemischer]] Gegebenheiten wird in der Bioinformatik davon ausgegangen, dass die Existenz eines Gaps wesentlich mehr über die Distanz zweier Sequenzen aussagt, als dessen Länge. Beim Vergleich zweier Sequenzen fallen in der Distanzfunktion daher hohe Kosten für die Entstehung eines Gaps an (die sogenannte ''gap opening penalty'', GOP), während jede weitere Stelle des Gaps teils deutlich weniger harsch gewertet wird (die ''gap extension penalty'', GEP). |
Aufgrund [[Biochemie|biochemischer]] Gegebenheiten wird in der Bioinformatik davon ausgegangen, dass die Existenz eines Gaps wesentlich mehr über die Distanz zweier Sequenzen aussagt, als dessen Länge. Beim Vergleich zweier Sequenzen fallen in der Distanzfunktion daher hohe Kosten für die Entstehung eines Gaps an (die sogenannte ''gap opening penalty'', GOP), während jede weitere Stelle des Gaps teils deutlich weniger harsch gewertet wird (die ''gap extension penalty'', GEP). |
||
== Literatur == |
== Literatur == |
Aktuelle Version vom 11. Dezember 2024, 18:56 Uhr

Ein Gap (engl., zu deutsch: Lücke) bezeichnet in der Bioinformatik eine Lücke oder Leerstelle in einer Sequenz, insbesondere beim Sequenzalignment in der Genetik. Liegt beim Vergleichen zweier verwandter Sequenzen (z. B. den Genom-Codes zweier verwandter Spezies) in der einen Sequenz eine Lücke vor, während dort in der anderen Sequenz weitere Elemente stehen, spricht man von einem Gap.
Gaps können durch verschiedene Arten von Mutationen entstehen: Bei einer Insertion wurde ein zusätzliches Element eingefügt, der Gap besteht dann in der älteren Sequenz. Bei einer Deletion wurde umgekehrt ein Element gelöscht, sodass der Gap in der jüngeren Sequenz entsteht. Da meist nicht bekannt ist welche Sequenz evolutionär älter ist, werden Mutation auch mit dem neutralen Portemanteau indel oder insdel (von „insert“ und „delete“) bezeichnet.
Informatische Bewertung
[Bearbeiten | Quelltext bearbeiten]In der algorithmischen Bioinformatik wird die Ähnlichkeit zweier Sequenzen danach bewertet, an wie vielen Stellen diese sich durch Ersetzungen (wenn beide Sequenzen an einer Stelle unterschiedliche Werte haben) und Lücken (Gaps) unterscheiden. Das Maß dafür ist die Distanz, eine Kostenfunktion, welche abstrahiert wie viele Änderungen nötig wären, um eine Sequenz in die andere zu überführen. Je höher dies Distanz (= die „Kosten“ der Überführung von einer Sequenz in die andere), desto geringer ist die Ähnlichkeit beider Sequenzen.
Aufgrund biochemischer Gegebenheiten wird in der Bioinformatik davon ausgegangen, dass die Existenz eines Gaps wesentlich mehr über die Distanz zweier Sequenzen aussagt, als dessen Länge. Beim Vergleich zweier Sequenzen fallen in der Distanzfunktion daher hohe Kosten für die Entstehung eines Gaps an (die sogenannte gap opening penalty, GOP), während jede weitere Stelle des Gaps teils deutlich weniger harsch gewertet wird (die gap extension penalty, GEP).
Literatur
[Bearbeiten | Quelltext bearbeiten]- Volkhard Helms: Vorlesungsskript – Softwarewerkzeuge der Bioinformatik. (PDF; 27 MB) Universität des Saarlandes, 2010, S. 6–8, 22–38, abgerufen am 29. Januar 2024.
- Olivier Woumpe Dounla: Lokales Sequenz Alignment, beliebige und affine Gap kosten. (PDF; 2,2 MB) TU Dortmund, 5. Mai 2009, S. 7–12, abgerufen am 29. Januar 2024.