Leerzeichen
Vorlage:Satzzeichen Das Leerzeichen, auch Wortzwischenraum, korrekte Bezeichnung laut Duden: Leerschritt, bes. schweiz. Leerschlag, dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines zusammenhängenden Fließtextes. Man erhält ein Leerzeichen auf der Schreibmaschine und der Computertastatur durch Betätigen der Leertaste, der größten Taste unten auf der normalen Computertastatur. Für einen guten Schriftsatz werden Leerzeichen unterschiedlicher Breite verwendet.
Breite des Leerzeichens
Schreibmaschinenschriften waren überwiegend nichtproportional, also dicktengleich – das heißt jedes Zeichen besaß die gleiche Breite, auch das Leerzeichen. Bei solchen Monospace-Schriften können daher Leerzeichen auch zur Ausrichtung von Tabellen anstelle des Tabulators verwendet werden.
Im Bleisatz wurden Leerzeichen in verschiedenen Breiten mit Hilfe des sogenannten Blindmaterials (z. B. Gevierte, Spatien) erzeugt. Leerzeichen sind eine Form des typografischen Weißraums.
Daneben gibt es auch ein schmales Leerzeichen, um für zusammengehörende Texteinheiten einen erkennbaren Unterschied gegen den normalen Wortabstand zu setzten (etwa in Abkürzungen wie »z. B.«, als Tausendertrenner, oder zwischen Maßzahl und Maßeinheit).
Verwendung von Leerzeichen
Leerzeichen sind zum einen notwendig, um eine Zeile zum Blocksatz zu strecken. Darüber hinaus werden sie in Abkürzungen wie z. B. verwendet. Auch die korrekte Schreibweise von Zahlen wird mit Hilfe der Leerzeichen erreicht (Bsp. 123 456 789). Der Wortzwischenraum entspricht bei den meisten Schriftarten etwa dem Raum, den ein kleines „i“ einnehmen würde. Die Größe der Wortzwischenräume bleibt im Flattersatz konstant, während sie im Blocksatz variieren kann.
In der modernen Textverarbeitung trifft die Schreibmaschinentastatur auf die Typographie. Der typographisch weniger geschulte Computernutzer ist mit der Verwendung der richtigen Leerzeichen meist überfordert, da sie je nach Anwendung unterschiedlich eingegeben werden müssen. Teilweise werden auch vom Textverarbeitungsprogramm selbstständig die passenden Leerzeichen erkannt. Neben den unterschiedlichen Breiten gibt es noch geschützte Leerzeichen, an deren Position am Zeilenende nicht umbrochen werden darf.
Drei Typische Fehler der Leerzeichensetzung haben in der Typographie eigenständige Namen bekommen:
- Klempen: fehlendes Leerzeichen nach Satzzeichen
- Plenk: überflüssiges Leerzeichen vor Satzzeichen
- Deppenleerzeichen (Agovis): fehlerhaftes Leerzeichen innerhalb zusammengesetzter Substantive
Entwicklung des Leerzeichens
In antiken Texten war eine Trennung der Wörter nicht üblich. Die dichte Anordnung des Textes zwang den Leser zur sorgfältigen und in den meisten Fällen lauten Lektüre. Erst im 7. Jahrhundert wurde die Wortteilung eingeführt. Die klaren Wortabstände erleichterten das schnelle Erkennen und Verstehen der Texte.
Johannes Gutenberg kannte nur einen richtigen Wortabstand. Den Randausgleich der Zeilen in seiner 42-zeiligen Bibel erzielte er mit Hilfe verschieden breiter Buchstaben. Der gute Wortabstand entsprach dem Innenraum des kleinen „n“. An ihm orientierten sich von nun an die guten Schriftsetzer.
Die Erfindung der Schreibmaschine brachte einen weiteren Wortabstand. Er entsprach der immer gleichen Buchstabenbreite und ließ das Gefühl für den richtigen Zwischenraum verschwinden.
Jan Tschichold, der Erneuerer der Typografie des 20. Jahrhunderts, griff die mittelalterliche Idee des guten Wortabstands wieder auf. Sein Biograf Werner Lemke berichtet, dass Tschichold kleine Florpapierstückchen in seiner Geldbörse aufbewahrte, um die Buchstaben- und Wortabstände ideal auszugleichen, wo die feinsten Spatien der Schriftsetzer nicht ausreichten.
Dementsprechend sollte bei Drucksachen auf den guten Wortabstand geachtet werden. Denn zu große Wortabstände erzeugen, wie der präraffaelitische Buchkünstler William Morris sagt: „Hässliche sich windende weiße Linien im Text“, die senkrecht oder schräg zu den Zeilen verlaufen. In der bilderreichen Sprache der Buchdrucker heißt dieser typografische Fehler „Gießbach“ oder „Gasse“. Gießbäche lassen das Auge aus dem Text irren und erschweren das Lesen.
Darstellung des Leerzeichens
In der Darstellung der Datenverarbeitung ist das Leerzeichen im allgemeinen ein Leerraum (Whitespace).
Für die Zwecke des Zeilenumbruchs gibt es zwei Typen von Leerzeichen:
- Umbrechendes Leerzeichen
- Geschütztes Leerzeichen, das einen automatischen Umbruch unterbindet
HTML
In HTML wird das geschützte Leerzeichen durch
(non-breaking space) eingegeben, für Abkürzungen und Zahlengruppen kann  
(thin space) verwendet werden „z. B.“, „12 345 000“. Allerdings ist das schmale Leerzeichen zurzeit in vielen Fonts nicht definiert und wird daher nicht korrekt dargestellt. Weitere Hinweise finden sich unter Typografie für HTML.
ASCII und andere Kodierungen
Das Leerzeichen hat den ASCII-Code 32. Für bestimmte Zwecke gibt es besondere Leerzeichen, zum Beispiel das nicht-umbrechende oder geschützte Leerzeichen, in ISO 8859-1 mit dem Zeichencode 160:
Um ein Leerzeichen im Text sichtbar darzustellen, gibt es in Unicode auch ein gesondertes Zeichen, das Zeichen „␣“ (U+2423, in HTML-Codierung darstellbar mit ␣
).
Code | Kein Umbruch | HTML | Name | Codeblock | Beispiel | Beschreibung |
---|---|---|---|---|---|---|
U+0020 |   | Space | Basic Latin | Normales Leerzeichen, vergleichbar mit dem ASCII-Zeichen 0x20 | ||
U+00A0 | Vorlage:Unicode | | No-Break Space | Latin-1 Supplement | Wie U+0020, aber die Zeile darf hier nicht umgebrochen werden. | |
U+1680 |   | Ogham Space Mark | Ogham | Wird für Wortzwischenräume in Ogham-Texten benutzt. Benötigt eine Ogham-Schriftart. | ||
U+2002 |   | En Space, or Nut |
General Punctuation | So breit wie ein en (halb so breit wie ein em) | ||
U+2003 |   | Em Space, or Mutton |
General Punctuation | So breit wie ein em | ||
U+2004 |   | Three-Per-Em Space, or Thick Space |
General Punctuation | So breit wie 1/3 des em | ||
U+2005 |   | Four-Per-Em Space, or Mid Space |
General Punctuation | So breit wie 1/4 des em | ||
U+2006 |   | Six-Per-Em Space | General Punctuation | So breit wie 1/6 des em. In der computergestützten Typografie oft gleich mit U+2009. | ||
U+2007 | Vorlage:Unicode |   | Figure Space | General Punctuation | In Schriften mit Ziffern fester Breite entspricht Figure Space der Breite einer Ziffer. | |
U+2008 |   | Punctuation Space | General Punctuation | In Schriften mit Ziffern fester Breite entspricht Punctuation Space der Breite eines Punktes. | ||
U+2009 |   | Thin Space | General Punctuation | So breit wie 1/5 des em (manchmal auch gleich wie U+2006) | ||
U+200A |   | Hair Space | General Punctuation | Noch dünner als U+2009 | ||
U+200B | ​ | Zero-Width Space | General Punctuation | | Nicht sichtbarer Abstand. Wird für Computersysteme verwendet um Wortgrenzen anzuzeigen, wenn die Wörter nicht getrennt geschrieben werden. Im Blocksatz können aber Leerräume zwischen den Wörtern entstehen. In HTML kann man dieses Zeichen als optionalen Umbruch in sehr langen Wörtern verwenden. Vergleichbar mit dem veralteten Tag <wbr>. Das Zeichen wird aber nicht von allen Browsern unterstützt. | |
U+202F | Vorlage:Unicode |   | Narrow No-Break Space | General Punctuation | Nicht umbrechend wie U+00A0 jedoch schmaler | |
U+205F |   | Medium Mathematical Space | General Punctuation | Für mathematische Formeln | ||
U+2060 | Vorlage:Unicode | ⁠ | Word Joiner | General Punctuation | | Wie U+200B aber ohne Zeilenumbruch. Dieses Zeichen wurde in Unicode 3.2 eingeführt um die Funktion von U+FEFF als „Wortverbinder“ zu übernehmen. |
U+3000 |   | Ideographic Space | CJK Symbols and Punctuation | So breit wie ein chinesisches, japanisches bzw. koreanisches Schriftzeichen. | ||
U+FEFF | Vorlage:Unicode |  | Zero Width No-Break Space = Byte Order Mark (BOM) |
Arabic Presentation Forms-B | Wird vorwiegend für die Darstellung der Byte Order Mark verwendet. Die Verwendung als Leerzeichen mit Nullbreite ohne Umbruch wird seit Unicode 3.2 nicht mehr empfohlen. Siehe auch U+2060. |
Der Unicode-Block Symbole für Steuerzeichen definiert auch zwei visuelle Symbole, die Leerzeichen darstellen, selbst jedoch keine sind.
Code | Zeichen | Name | Beschreibung |
---|---|---|---|
U+2422 | ␢ | blank symbol | Das kleine b mit Strich steht für blank (englisch „Leerzeichen“). Es wurde in den 1960er Jahren von IBM eingeführt und nicht mehr verwendet. |
U+2423 | ␣ | open box | Die offene Schachtel wird beispielsweise in Softwaredokumentation verwendet, um ein Leerzeichen grafisch darzustellen. |
TeX, LaTeX
Für die manuelle Einstellung der Abstände zwischen Zeichen stellt TeX bzw. LaTeX folgende Befehle zur Verfügung:
Darzustellender Zwischenraum | Syntax | Länge | So sieht’s gerendert aus |
---|---|---|---|
2 quad | a \qquad b
|
2 quad | |
1 quad | a \quad b
|
1 quad | |
normaler Textabstand | a\ b
|
? | |
großer Zwischenraum | a\;b
|
5/18 quad | |
kleiner Zwischenraum | a\,b
|
3/18 quad | |
kein Zwischenraum | ab
|
0 quad | |
kleiner negativer Zwischenraum | a\!b
|
−3/18 quad |
Die Länge 1 quad (auch em genannt) wird im Deutschen mit Geviert bezeichnet.
Leerzeichen in 8.3-Dateinamen
Im FAT-Dateisystem sind sind Leerzeichen in Dateinamen nicht zulässig. Die Dateinamen kürzer als acht Buchstaben (und Dateinamenserweiterungen kürzer als drei Buchstaben) werden in den Verzeichniseinträgen mit Leerzeichen aufgefüllt, welche aber nicht zum Dateinamen gehören. Im ISO-9660-Dateisystem können Leerzeichen in Dateinamen durch Unterstriche („_“) ersetzt werden.
Leerzeichen in URIs
Da das Leerzeichen in URIs als Sonderzeichen zählt, wird es, wie auch beispielsweise deutsche Umlaute und eckige oder geschweifte Klammern, kodiert. Die Kodierung besteht aus dem Zeichen % und dem Zeichencode in zwei Hexadezimal-Ziffern (bei Multibytezeichen entsprechend für jedes Byte), für das Leerzeichen wäre das (gemäß ISO 8859-1) %20
. In der älteren Codierung application/x-www-form-urlencoded wird ein Leerzeichen durch ein „+“ ersetzt.
Siehe auch