Dieses FAQ ist noch nicht gültig, sondern erst dann, wenn die Umstellung auf Unicode stattgefunden hat.
Allgemein
Windows allgemein
Warum werden statt Sonderzeichen Rechtecke/Fragezeichen angezeigt?
Problem: Einige Sprachen können nicht dargestellt werden (z. B. Chinesisch, Arabisch). Stattdessen zeigt der Internet Explorer/Opera kleine Rechtecke an, etwa □□ statt 北京, bzw. Mozilla zeigt Fragezeichen an. Hier fehlen Schriftarten, die die entsprechende Sprache anzeigen können.
Lösung: Bei der Windows-Installation werden standardmäßig nicht alle verfügbaren Schriften (Fonts) installiert, um Speicherplatz zu sparen. Die meisten benötigten Schriften lassen sich aber nachträglich installieren. Allerdings fehlen Windows Schriften für einige Sprachen, etwa für Malayalam. Hilfreich ist es, auch die Schrift Arial Unicode MS zu installieren; diese ist etwa bei Microsoft Office 2000, Microsoft FrontPage 2000 und neueren Versionen enthalten. Wer keins dieser Produkte besitzt, kann auch (teilweise kostenpflichtige) Schriften aus anderen Quellen herunterladen; siehe etwa ml:Wikipedia:Welcome, newcomers.
Hier die Anleitung, wie man in verschiedenen Versionen von Windows Schriften nachinstalliert:
- Unter Windows 2000: In der Systemsteuerung findet sich ein Symbol Ländereinstellungen. Im Feld Allgemein gibt es eine Liste Spracheinstellungen für das System. Hier müssen bei allen Sprachfamilien Häkchen gemacht werden, die angezeigt werden sollen.
Was muss ich beachten, wenn ich die benötigten Zeichensätze nicht installiere?
„Da von dem Darstellungsporblem ja nur exotische Sonderzeichen betroffen sind, die ich in der Regel doch nicht verstehe, habe ich mir bisher nicht die Mühe gemacht, zusätzliche Zeichen zu installieren. Mit welchen Komplikationen muss ich rechnen?“
- Beim Lesen in der Wikipedia ist nichts weiter zu beachten. Für nicht installierte Zeichen werden dann einfach die oben erwähnten Platzhalter (□ oder ?) angezeigt.
- Beim Bearbeiten von Artikeln dürfen diese Platzhalter nicht verändert werden, damit die zugehörigen Sonderzeichen bei den anderen Benutzern weiterhin agezeigt weden können. Auch wenn der eigene Browser diese Zeichen nicht darstellen kann, so weiß er doch, welche Zeichen sich dahinter verbergen. (D.h. Auch wenn z.B. statt des Katagana-Zeichens WI (ヰ) ein Platzhalter wie □, oder ? erscheint, so behandelt der Browser doch wie das Katagana-Zeichen WI, und Benutzer, die japanische Zeichensätze installiert haben bekommen ea auch noch der Bearbeitung weiterhin korrekt angezeigt.
- Hier müssen dann noch die erkannten Betriebssystem-Browser-Kombinationen behandelt werden, die beim Speichern von Texten mit nicht installierten Zeichen Probleme bereiten. Also die Erklärungen, die jetzt unter #Internet Explorer, #Lynx und #Linus folgen würden hier rein passen,
Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?
Problem: Statt Sonderzeichen werden unlesbare Zeichenketten angezeigt, etwa ð£ð¥Ðüð║ð▓ð░ statt Москва oder ├ñ statt ä. Dabei handelt es sich um Unicode-Zeichen, die von der Eingabeaufforderung nicht als solche interpretiert werden, sondern als Windows Codepage 850 oder Codepage 437. Die Sonderzeichen werden zwar beim Speichern nicht zerstört, jedoch ist es schwierig, den Text zu lesen und zu bearbeiten.
Lösung: Keine. Beim Bearbeiten können Sonderzeichen notfalls als HTML-Entitäten geschrieben werden, etwa ä für ein ä, Ö für ein Ö oder ß für ein ß. Bitte auf keinen Fall den vorhandenen "Zeichensalat" ändern!
Linux allgemein
Muß ich irgendetwas installieren/konfigurieren?
Programme, die GTK+2.0 oder höher verwenden, verwenden intern UTF-8 und unterstützen somit UTF-8 sehr gut, sie müssen dazu in der Regel keine speziellen Einstellungen vornehmen. Wenn Sie UTF-8 in einem Terminal-Fenster verwenden wollen (z.B. mit Lynx), müssen Sie ein passende Locale installieren. Sehen Sie sich auch die Browser-spezifischen Fragen an.
Wenn sie mehr über Linux und UTF-8 wissen wollen, interessiert Sie vielleicht die Step by step introduction to switching your debian installation to utf-8 encoding.
Warum werden manche Zeichen nicht angezeigt?
Wenn Zeichen nicht angezeigt werden, sondern stattdessen z.B. � oder ? angezeigt wird, liegt es wahrscheinlich daran, dass der Browser keine passende Schrifttype für das Zeichen findet. Es gibt zahlreiche freie Font-Pakete, die zusammen viele Schriften umfassen. Allerdings müssen Sie die Fonts (Schriftarten) nur installieren, wenn sie die entsprechnden Schriften auch interessieren, sie können aber auch ohne die entsprechende Schriftart Artikel der Wikipedia bearbeiten.
Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?
Problem: Wenn das Terminal, in dem der Textbrowser (z.B. Lynx, w3m) läuft, einen anderen Zeichensatz verwendet, werden statt Sonderzeichen unlesbare Zeichenketten angezeigt, etwa Ð?оÑ?ква statt Москва oder ä statt ä. Dabei handelt es sich um Unicode-Zeichen, die von der Konsole nicht als solche interpretiert werden, sondern als Latin-1. Die Sonderzeichen werden zwar beim Speichern nicht zerstört, jedoch ist es schwierig, den Text zu lesen und zu bearbeiten.
Lösung:
- Auf der Linux-Konsole: die Konsole enthalten das Skript unicode_start. Es schaltet die Konsole in den UTF-8-Modus. Damit lässt sich dann schon mit Lynx die Wikipedia bearbeiten, evtl. werden aber einige Zeichen nicht angezeigt, dazu kann man die entsprechenden Konsolen-Schriften installieren. (Evtl. bietet sich auch die verwendung von dynafont an.)[1]
- Im Terminal-Fenster: Manche Terminals (z.B. das gnome-terminal) lassen sich mit echo -e '\e%G' in den UTF-8-Modus schalten, wenn Sie eine UTF-8-Locale verwenden ist das i.A. nicht nötig. Xterm sollten sie mit dem Skript uxterm aufrufen.[2]
Internet Explorer
Warum zerstört der IE unter Mac OS beim Abspeichern Sonderzeichen?
Problem: Beim Speichern von Artikeln werden einige Sonderzeichen, etwa japanische und griechische, durch Fragezeichen ersetzt und die Seite somit zerstört.
Lösung: Keine. Der Internet Explorer für Mac OS wird von Microsoft nicht weiterentwickelt. Mit dem Internet Explorer unter Mac OS kann die Wikipedia nicht bearbeitet werden, bitte erst gar nicht versuchen. Stattdessen sollte ein funktionierender Browser verwendet werden, etwa Safari, der Bestandteil neuerer Versionen von Mac OS X ist und für ältere Versionen (aber nicht für Mac OS 9.x oder früher) kostenlos von Apple heruntergeladen werden kann oder Mozilla Firefox, der hier für Mac OS X kostenlos heruntergeladen werden kann. (Eine Version für Mac OS 9 gibt es hier.)
Lynx
Warum werden Sonderzeichen transkribiert (in lateinische Buchstaben umgewandelt)?
Problem: Sonderzeichen werden automatisch in lateinische Umschrift gewandelt. So wird etwa aus dem kyrillischen Text Архангельск automatisch Arhangel'sk. Beim Abspeichern wird diese Umwandlung nicht rückgängig gemacht, so dass die kyrillischen Zeichen verloren gehen und die Seite damit zerstört wird.
Lösung: In den Optionen (über die Taste O erreichbar) findet sich eine Option Display character set. Hier muss UNICODE (UTF-8) eingestellt werden. Danach bleiben Sonderzeichen beim Speichern erhalten. Dies muss unbedingt gemacht werden, um die Wikipedia mit Lynx zu bearbeiten.
w3m
Warum werden Sonderzeichen falsch angezeigt?
Problem: Einige Akzente werden falsch angezeigt, z.B. Espan~ol statt Español. Andere Sonderzeichen (z.B. chinesisch) werden durch Fragezeichen ersetzt.
Lösung: In den Optionen (über die Taste o erreichbar) muss in der Kategorie Charset Settings die Option Display Charset auf Unicode (UTF-8) gestellt werden.
Außerdem muss die Konsole in der Lage sein, Unicode-Zeichen anzuzeigen. Siehe hierzu Linux allgemein: Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?