Umlaut

Der Umlaut (Pl.: Umlaute) ist eine Veränderung derjenigen Vokale, auf die eine Beugungs- oder Ableitungssilbe folgt oder früher folgte, die den Vokal i oder den Halbvokal j enthält. Diese Vokaländerung ist typisch für die jüngeren germanischen Sprachen. Umlaute werden in der Schriftkunde von den diakritischen Zeichen mit Trema unterschieden, die identisch aussehen können, aber verschiedene Bedeutungen haben (zum Beispiel die getrennte Aussprache der Vokale „A“ und „e“ in „Aëlita“). Zur in der Datenverarbeitung gelegentlich notwendigen Unterscheidung von Umlaut und Trema siehe Trema. Zu unterscheiden sind die Umlaute auch von den Ablauten.

Ursache der Vokaländerung

Der helle Vokal i übt eine assimilierende Wirkung aus, indem er den Vokal der vorausgehenden Silbe sich selbst ähnlich, also heller macht. Im Althochdeutschen tritt diese Wirkung nur beim a ein, das durch den Einfluss eines i in der darauf folgenden Silbe zum helleren Vokal wird. Im Mittelhochdeutschen dagegen beeinflusst ein folgendes i alle Vokale der vorausgehenden Silbe, die nicht i-ähnlich sind (die dunklen Vokale). So werden die kurzen Vokale a, o, u zu e, ö, ü, die langen a, o, u zu ae, oe, iu, die Diphthonge uo und ou zu üe und öu. Der Umlaut bleibt, auch wenn das i oder j ausgefallen ist.

Die Umlaute ö und ü werden gegenüber dem dazugehörigen Vokal mit spitzerem Mund, bzw. weiter vorne im Mund gebildet, das heißt ö ist eine mit runden Lippen artikuliertes e und ü ein mit runden Lippen artikuliertes i.

So heißt es im Mittelhochdeutschen ich valle, aber du vellest (fällst), weil die zweite Person ursprünglich ein i hatte (althochdeutsch vellis); von ruom (Ruhm) wird gebildet ruemen (rühmen), weil es im Althochdeutschen ruomjen hieß. Doch kommt es auch anderseits nicht selten vor, dass mit dem Verlust des i oder j auch seine Wirkung, der Umlaut, verschwindet, wie z. B. im Mittelhochdeutschen und Neuhochdeutschen im Infinitiv für gotisch brannjan brennen gesagt wird, aber im Imperfekt mittelhochdeutsch brante (jetzt brannte), obwohl die entsprechende gotische Form brannida lautet.

Umlautvokale im Neuhochdeutschen

Im Neuhochdeutschen gelten als Umlautvokale und Diphthonge in der Regel ä, ö, ü, äu; ä, äu werden im allgemeinen da geschrieben, wo ein verwandtes Wort oder eine verwandte Form mit a vorhanden oder auch ohne historische Sprachkenntnis leicht zu vermuten ist, z. B. Mann - Männer, Haus - Häuser.

Der Umlaut hat auch für die deutsche Flexion immer größere Bedeutung erlangt; so dient er jetzt zur Bezeichnung der Mehrzahl, z. B. in Männer, zum Ausdruck von Verkleinerungsformen, z. B. in Häuschen. Übrigens ist er keineswegs konsequent durchgeführt, und einzelne Mundarten haben ihn fast gar nicht.

Der Name Umlaut rührt von Jacob Grimm her, der auch den Ausdruck Brechung erfand. In den skandinavischen Sprachen hat auch das u die gleiche assimilierende Kraft. Auch andere Sprachen haben dem Umlaut verwandte Erscheinungen, dahin gehört insbesondere die im Griechischen und der Zendsprache häufige Epenthese des i.

Vorlage: Meyers Konversationslexkion, 4. Auflage 1888/89

Weitere Beispiele:

arm - ärmlich
Hof - höfisch auch Höfe
barfuß - barfüßig

Darstellung von Umlauten

Entstehung der Umlautpunkte am Beispiel des ä

In Frakturschriften wurden die Umlaute durch ein nachgestelltes oder über den Buchstaben gestelltes kleines "e" geformt. Die Konvention, Umlaute mit zwei Punkten über dem Buchstaben auszuzeichnen, entwickelte sich im Deutschen aus einer vertikalen Ligatur von Vokal und einem darüber angedeuteten Kurrent-e, das wie zwei verbundenen Aufstrichen (etwa wie 11) geschrieben wurde. In einigen Frakturschriften ist das übergeschriebene e auch heute noch zu finden. Die Darstellung eines Umlauts mit e ist inzwischen bis auf wenige Ausnahmen nur noch üblich, wenn der verwendete Zeichensatz keine entsprechenden Buchstaben zur Verfügung stellt. (Beispiele: ä->ae, Ä -> AE oder Ae). In deutschsprachigen Kreuzworträtseln werden Umlaute dagegen meistens als AE, OE und UE geschrieben.

In der Schreibschrift gibt es neben den zwei übergestellten Punkten auch noch andere Schreibweisen (allographische Varianten). Die beiden häufigsten Varianten sind a) zwei kurze vertikale Striche anstelle der Punkte (daher ist in Österreich, wo diese Schreibweise bevorzugt wird, auch von ü-/ä-/ö-Stricherl die Rede), b) ein horizontaler Strich über dem Buchstaben, der gerade oder leicht nach unten durchgebogen ist. Letztere Schreibweise hat den Nachteil, dass sie dem u-Strich ähnelt, mit dem manche in der Schreibschrift den Kleinbuchstaben u versehen, um ihn vom Buchstaben n zu unterscheiden. Somit besteht bei dieser Schreibweise eine Verwechselungsgefahr zwischen u und ü.

Im Ungarischen sind dagegen zwei Formen der Umlautkennzeichnung jeweils als graphematisches Merkmal zu werten, d.h. sie haben bedeutungsunterscheidende Funktion. Von den Punkten (Trema) zu unterscheiden ist der so genannte Doppelakut (zwei nebeneinanderstehende Akut-Akzente), der wie der einfache Akut-Akzent auf anderen Vokalbuchstaben der Kennzeichnung der langen Aussprache dient.

Im Nauruischen werden die Umlaute mit einer Tilde dargestellt (ä=ã, ö=õ, ü=ũ). Die Schreibung der Tilden ist heutzutage jedoch nicht mehr üblich, sodass Wörter mit Umlauten in der Regel ohne Tilden geschrieben werden.

Darstellung in Computersystemen

Da große Teile der Computertechnologie im englischsprachigen Raum entwickelt werden, waren früher in vielen Bereichen Umlaute nicht vorgesehen, beispielsweise in der Textkodierung ASCII. Umlaute mussten daher häufig nachträglich als Ausnahmen behandelt werden und verursachten hohen Entwicklungsaufwand. Dasselbe gilt für alle anderen Schriften, die spezielle Sonderzeichen haben.

Im Computerbereich wird oft das "ß" ebenfalls als Umlaut bezeichnet, da es die gleiche Art von Problemen aufwirft wie die echten Umlaute.

Kodierung

Die Umlaute werden im heute allgemein Übliche Unicode-Zeichensatz folgendermaßen definiert und kodiert:

Internationaler Zeichenkodierungsstandard Unicode
und Kodierung im Internet-Dokumentenformat HTML
Zeichen	Unicode Position	Unicode Bezeichnung	Bezeichnung	HTML hexadezimal	HTML dezimal	HTML benannt
Ä	U+00C4	Latin capital letter A with diaeresis	Lateinischer Großbuchstabe Ä	Ä	Ä	Ä
Ö	U+00D6	Latin capital letter O with diaeresis	Lateinischer Großbuchstabe Ö	Ö	Ö	Ö
Ü	U+00DC	Latin capital letter U with diaeresis	Lateinischer Großbuchstabe Ü	Ü	Ü	Ü
ä	U+00E4	Latin small letter a with diaeresis	Lateinischer Kleinbuchstabe ä	ä	ä	ä
ö	U+00F6	Latin small letter o with diaeresis	Lateinischer Kleinbuchstabe ö	ö	ö	ö
ü	U+00FC	Latin small letter u with diaeresis	Lateinischer Kleinbuchstabe ü	ü	ü	ü

Im veralteten ASCII-Zeichensatz aus dem Jahr 1963 sind die Umlaute nicht enthalten, weshalb viele ältere Computersysteme sie nicht darstellen konnten. Allerdings enthält schon die ASCII-Erweiterung ISO 8859-1 (auch als Latin-1 bekannt) alle Umlaute, auf den gleichen Codenummern wie im Unicode. Fast alle modernen Computer benutzen den im Jahr 1991 erstmals veröffentlichten Unicode-Standard und können Umlaute daher problemlos verarbeiten und darstellen. Eine wichtige Ausnahme stellt weiterhin das Eingabeaufforderungs-Fenster von Microsoft Windows dar; dort wird aus Kompatibilitätsgründen immer noch der alte IBM-PC-Zeichensatz verwendet, sodass Umlaute und ß andere Codenummern erhalten.

HTML

Weil man im normalen HTML-Flusstext ursprünglich nicht die Zeichenkodierung festlegen konnte, musste man Umlaute mittels so genannter benannter Zeichen (named entities) verwenden, die aus einem einleitenden &, einem symbolischen Namen und einem schließenden ; bestehen. Heute ist es möglich, jedes beliebige Unicode-Zeichen darzustellen, indem man die dezimale Nummer mit &# und ; bzw. die hexadezimale Nummer mit &#x und ; umschließt. Ferner gibt es nun die Möglichkeit, den Zeichensatz per Meta-Anweisung (<meta ... />) im HTML-Dokument festzulegen, wodurch die Darstellung der Umlaute mittels benannter Zeichen meist nicht nötig ist.

Allgemein gilt, dass ein Vokal mit zwei Punkten darüber in HTML nach folgendem Schema gebildet wird: & gefolgt vom Vokal gefolgt von uml;. Siehe nachstehende Tabelle:

Zeichen	HTML-Code
ä Ä	`ä Ä`
ë Ë	`ë Ë`
ï Ï	`ï Ï`
ö Ö	`ö Ö`
ü Ü	`ü Ü`
ÿ Ÿ	`ÿ &Yuml;`

Andere Bereiche

In Domainnamen können Umlaute mittels des Kodierungsverfahrens IDNA genutzt werden. In URLs werden sie ebenfalls kodiert, dort erkennbar am %.

Die Bezeichnung der deutschen Umlaut-Buchstaben lautet in den Unicode-Spezifikationen:

Ä/ä heißt „A mit Diärese“
Ö/ö heißt „O mit Diärese“
Ü/ü heißt „U mit Diärese“

Linguistisch gesehen ist diese Benennung jedoch nicht korrekt, da eine Diärese (ein Trema) das getrennte Sprechen von Vokalen bezeichnet.

Unicode kennt zwei kanonisch äquivalente Formen der Kodierung der Umlaut-Buchstaben, precomposed und decomposed. Die decomposed-Form wird mit dem Zeichen U+0308 COMBINING DIAERESIS gebildet.

Bei Schreibmaschinen gibt es neben der üblichen Bauform mit separaten Umlauten auch Bauformen, bei denen die Umlaute aus separaten Zeichen für die Buchstaben und die Umlautpunkte zusammengesetzt wurden.

Siehe auch: Wikipedia:Sonderzeichen, Heavy-Metal-Umlaut

Vorlage:Lateinisches Alphabet