Bioinformatik
Die Bioinformatik (englisch bioinformatics) ist ein relativ junges Fachgebiet, dass sich mit den informatischen Grundlagen und Anwendungen der Speicherung, Organisation und Analyse von biologischen Daten, speziell aus der Genetik, befasst.
Die ersten reinen Bioinformatikanwendungen wurden für die DNA-Sequenzanalyse entwickelt. Dabei geht es primär um das schnelle Auffinden von Mustern in langen DNA-Sequenzen und die Lösung des Problems, wie man zwei oder mehrere ähnliche Sequenzen so übereinander legt, dass man eine möglichst optimale Anpassung findet (alignment). Zur Anwendung kommen dabei Algorithmen der Dynamischen Programmierung.
Seltener benötigt man bei biologischen Fragestellungen die Suche nach exakten Übereinstimmungen von kurzen Sequenzenabschnitten, typischerweise für hochkonservierte Signale wie Start- oder Stoppcodons.
Desweiteren wurden Methoden zum Auffinden von Genen in unbekannten DNA-Sequenzen entwickelt (Genvorhersage, engl. gene finding oder gene prediction). Dieses Problem wird mit verschiedenen Rechenmethoden und Algorithmen angegangen, darunter statistische Sequenzanalyse, Markow-Ketten, künstliche neuronale Netze zur Mustererkennung, etc.
Mit der Aufklärung und weitreichenden Funktionsanalyse verschiedener vollständiger Genome (z.B. des Fadenwurms Caenorhabditis elegans) verlagert sich der Schwerpunkt bioinformatischer Arbeit auf Fragestellungen der Proteomik, wie z.B. dem Problem der Proteinfaltung also der Frage nach der Sekundär- oder Tertiärstruktur bei gegebener Aminosäuresequenz.
Ein nicht unerheblicher Teil der Arbeit eines Bioinformatikers besteht neben mathematisch anspruchsvollen Analysen in der Datenaufbereitung und Speicherung in geeignet indizierten und verlinkten Datenbanken. Die verwirrende Vielfalt von DNA- (z.B. GenBank) und Proteindatenbanken (z.B. PROSITE) weltweit führte bisher oft zu redundanter und damit fehlerlastiger Datenhaltung, zumal DNA-Sequenzen teils in Fragmenten, teils in vollständig assemblierten Genomen vorliegen. Idealerweise würde die Speicherung von Genom- und Proteomdaten eine Rekonstruktion der Regelwerke eines gesamten Organismus erlauben. Die gewünschte Abbildung von identifizierten Proteinen zu "ihrem" Gen und umgekehrt sowie die Zuordnung von Proteinen zu einem metabolischen Pfad ist aber noch nicht in Sicht. Ein wesentlicher Punkt neben fehlerbehafteten Einträgen und doppelter Datenhaltung unter unterschiedlichen Schlüsseln ist die weitgehende Abwesenheit von kontrollierter Vokabularien und Ontologien, die eine Zuordnung von Funktionsbezeichnungen quer durch alle Ebenen ermöglichen.
Der Bioinformatik wird im englischen Sprachraum oft die computational biology gegenübergestellt, die einen weiteren Bereich als die klassische Bioinformatik abdeckt, meist benutzt man beide Begriffe jedoch synonym.