„HTML-Entität“ – Versionsunterschied
[gesichtete Version] | [gesichtete Version] |
K →Beispiele: Tabellenkopf-Hintergrundfarbe weniger aufdringlich |
Warnung vor Windows-Codepunkten 128–159; weiteres, weniger exotisches Beispiel ohne benannte Entität |
||
Zeile 5: | Zeile 5: | ||
* <code>&#''nnn'';</code> – ''nnn'' repräsentiert hier den Codepunkt als Dezimalzahl (ohne führende Nullen). |
* <code>&#''nnn'';</code> – ''nnn'' repräsentiert hier den Codepunkt als Dezimalzahl (ohne führende Nullen). |
||
* <code>&#x''hhhh'';</code> – ''hhhh'' repräsentiert hier den Codepunkt als [[Hexadezimalzahl]], also so, wie der Unicode-Codepunkt üblicherweise angegeben wird (ohne das einleitende „U+“). Führende Nullen können angegeben werden und sind bei weniger als vierstelligen Werten üblich, um den Wert gleichlautend zur üblichen vierstelligen Unicode-Codepunkt-Angabe anzugeben. |
* <code>&#x''hhhh'';</code> – ''hhhh'' repräsentiert hier den Codepunkt als [[Hexadezimalzahl]], also so, wie der Unicode-Codepunkt üblicherweise angegeben wird (ohne das einleitende „U+“). Führende Nullen können angegeben werden und sind bei weniger als vierstelligen Werten üblich, um den Wert gleichlautend zur üblichen vierstelligen Unicode-Codepunkt-Angabe anzugeben. |
||
Unabhängig davon, in welchem Code („[[charset]]“) das HTML-Dokument vorliegt, gilt immer nur der Codepunkt in Unicode. Damit sind Entities im Bereich <code>&#128;</code> bis <code>&#159;</code> oder hexadezimal <code>&#x0080;</code> bis <code>&#x009F;</code> falsch, wenn damit Zeichen dargestellt werden sollen, die im Code [[Windows-1252]] Codepunkte in diesem Bereich haben. Dazu gehören u. a. die Zeichen € und ‰, die Buchstaben Œ, œ, Š, š, Ÿ, Ž und ž sowie verschiedene [[Anführungszeichen]] und [[Gedankenstrich]]e. Zeichen mit diesen ''Unicode''-Codepunkten kommen in Texten normalerweise nicht vor. |
|||
== Benannte Entitäten == |
== Benannte Entitäten == |
||
Zeile 28: | Zeile 30: | ||
| &#x00B7; |
| &#x00B7; |
||
| &middot; |
| &middot; |
||
|---- |
|||
| style="text-align:center;" | ſ |
|||
| style="text-align:center;" | U+017F |
|||
| {{Kapitälchen|latin small letter long s}} |
|||
| [[langes s]] |
|||
| 0383 |
|||
| &#383; |
|||
| &#x017F; |
|||
| <small>''(keine)''</small> |
|||
|---- |
|---- |
||
| style="text-align:center;" | ‰ |
| style="text-align:center;" | ‰ |
||
Zeile 33: | Zeile 44: | ||
| {{Kapitälchen|per mille sign}} |
| {{Kapitälchen|per mille sign}} |
||
| [[Promillezeichen]] |
| [[Promillezeichen]] |
||
| 8240 |
| 8240 |
||
| &#8240; |
| &#8240; |
||
| &#x2030; |
| &#x2030; |
||
Zeile 47: | Zeile 58: | ||
| <small>''(keine)''</small> |
| <small>''(keine)''</small> |
||
|} |
|} |
||
Dass das Promillezeichen unter Windows auch mit dem Dezimalcode 0137 geschrieben werden kann, lässt sich nicht für HTML-Entitäten nutzen. |
|||
== Einzelnachweise == |
== Einzelnachweise == |
Version vom 8. August 2020, 11:52 Uhr
Eine HTML-Entität ist eine Entität (also eine eindeutig abgrenzbare Zeichenfolge mit spezieller Bedeutung), die in HTML verwendet wird (also der textbasierten Auszeichnungssprache, in der beispielsweise Webseiten formuliert werden können). Häufig verwendet werden dort numerische Entitäten und benannte Entitäten, um Schriftzeichen zu bezeichnen (speziell wenn sie in der für die Webseite gewählten Codierung oder für die zur Erstellung verwendeten Eingabemethode nicht zur Verfügung stehen.) Auch bestimmte Steuerzeichen können so im Text sichtbar dargestellt werden.
Numerische Entitäten
Eine numerische Entität bezeichnet ein Zeichen durch seinen Unicode-Codepunkt. Hierfür sind zwei Formate definiert:
&#nnn;
– nnn repräsentiert hier den Codepunkt als Dezimalzahl (ohne führende Nullen).&#xhhhh;
– hhhh repräsentiert hier den Codepunkt als Hexadezimalzahl, also so, wie der Unicode-Codepunkt üblicherweise angegeben wird (ohne das einleitende „U+“). Führende Nullen können angegeben werden und sind bei weniger als vierstelligen Werten üblich, um den Wert gleichlautend zur üblichen vierstelligen Unicode-Codepunkt-Angabe anzugeben.
Unabhängig davon, in welchem Code („charset“) das HTML-Dokument vorliegt, gilt immer nur der Codepunkt in Unicode. Damit sind Entities im Bereich €
bis Ÿ
oder hexadezimal €
bis Ÿ
falsch, wenn damit Zeichen dargestellt werden sollen, die im Code Windows-1252 Codepunkte in diesem Bereich haben. Dazu gehören u. a. die Zeichen € und ‰, die Buchstaben Œ, œ, Š, š, Ÿ, Ž und ž sowie verschiedene Anführungszeichen und Gedankenstriche. Zeichen mit diesen Unicode-Codepunkten kommen in Texten normalerweise nicht vor.
Benannte Entitäten
Eine benannte Entität hat das Format &aaa;
– aaa repräsentiert hier einen aus Groß- und Kleinbuchstaben des lateinischen Grundalphabets und Ziffern bestehenden Namen, der das zu bezeichnende Zeichen eindeutig identifiziert. Groß- und Kleinschreibung ist exakt zu verwenden und kann bedeutungsunterscheidend sein. Die Namen werden vom W3C (World Wide Web Consortium) festgelegt.[1][2]
Beispiele
Zeichen | Unicode Position |
Unicode Name |
Bezeichnung | Dezimalcode | Numerische Entität (dezimal) |
Numerische Entität (hexadezimal) |
Benannte Entität |
---|---|---|---|---|---|---|---|
· | U+00B7 | middle dot | Halbhochpunkt | 0183 | · | · | · |
ſ | U+017F | latin small letter long s | langes s | 0383 | ſ | ſ | (keine) |
‰ | U+2030 | per mille sign | Promillezeichen | 8240 | ‰ | ‰ | ‰ |
🖷 | U+1F5B7 | fax icon | Faxsymbol | 128439 | 🖷 | 🖷 | (keine) |
Dass das Promillezeichen unter Windows auch mit dem Dezimalcode 0137 geschrieben werden kann, lässt sich nicht für HTML-Entitäten nutzen.
Einzelnachweise
- ↑ W3C (World Wide Web Consortium): Character entity references in HTML 4 – Liste der benannten Entitäten, die in HTML 4 (und somit beispielsweise für die Erstellung von Wikipedia-Artikeln) verfügbar sind
- ↑ W3C (World Wide Web Consortium): Character entity reference chart – Liste der benannten Zeichen-Entitäten, die in HTML 4 und in HTML5 verfügbar sind