Zum Inhalt springen

Wikipedia:Technik/Archiv/Hilfe:UTF-8-Probleme

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 24. August 2004 um 07:40 Uhr durch Rainer Bielefeld (Diskussion | Beiträge) (UTF8- Problem bei Verweis auf anderssprachige Wikipedias). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Bekannte Probleme finden sich unter Wikipedia:Browser-FAQ. Hier bitte nur Probleme eintragen, für die sich dort keine Lösung findet und bei denen auch der nachfolgende Hinweis nicht weiterhilft. Hierbei bitte, wenn irgendwie möglich, den verwendeten Browser (inkl. Version) und das Betriebssystem sowie eine möglichst exakte Fehlerbeschreibung angeben. Zusätzlich können auch Screenshots hilfreich sein.


  • Benutzer mit Umlaut im Namen müssen den lokalen Cookie der Wikipedia löschen, damit ein neuer mit korrekter Codierung angelegt wird - vorher funktioniert die Anmeldung nicht!
    • Wenn das nicht hilft, bei Head melden.
  • Bitte auf keinen Fall die Umlaute in den Artikeln durch "ä" oder "ae" ersetzen!!!
  • Falls du einen "Privoxy" benutzt: UPDATE, sonst Haue (Macht Ä und Ö kaputt)


Aktuell

Wieso werden Umlaute im Artikel nicht richtig dargestellt?

Hierbei handelt es sich vermutlich um ein Caching-Problem (nicht browserspezifisch): einige Artikel werden vom Server zwischengespeichert, um schneller "ausgeliefert" werden zu können. Diese Versionen sind mitunter nicht in UTF-8 kodiert. Dem kann abgeholfen werden, indem man die alte Version mit folgendem Link aus dem Cache entfernt: http://de.wikipedia.org/w/wiki.phtml?title=Titel&action=purge (Titel ist dabei durch den Titel der Seite zu ersetzen).


Darstellung als "Fragezeichenraute"

Ä und Ö - Privoxy läuft amok

Ich benutze Linux Redhat 9 mit KDE und Mozilla 1.7b. Ä (Groß-ä) und Ö (Groß-ö) werden bei mir nicht angezeigt, statt dessen ?, und ?- . Bestimmt sind auch andere Sonderzeichen kaputt, aber diese stören mich besonders. Hat jemand eine Idee, woran das liegen könnte? Ich habe bereits UTF-8-Fonts heruntergeladen, installiert und in Mozilla eingestellt, aber das hilft alles nichts.--Jah 10:21, 30. Jul 2004 (CEST)

Und die übrigen Hinweise auf dieser Seite halfen dir nicht weiter? -- RainerBi 10:29, 30. Jul 2004 (CEST)
Leider nicht. Am Cache kann es nicht liegen, denn auch auf der sicher nicht gecachten Seite der letzten Änderungen ist das Groß-ä kein Groß-ä sondern ?,,. Auch bei der Vorschau (und sicherlich beim Speichern) werden die Groß-ä-s und Groß-ö-s in Zeichensalat umgewandelt.--Jah 11:20, 30. Jul 2004 (CEST)
Dein Browser scheint die Sonderzeichen zu zerstören: [1] - bist du dir sicher, dass auch wirklich UTF-8 als Zeichensatz verwendet wird? (Ansicht->Zeichenkodierung) --Henning.H 11:24, 30. Jul 2004 (CEST)
Das Problem tritt auch mit IE 5 und 6 auf, der Zeichensatz ist korrekt, außerdem werden die falschen Sonderzeichen ebenfalls im Quellcode angezeigt. DasBee 11:26, 30. Jul 2004 (CEST)
Ja, es wird UTF-8 verwendet. Die Sonderzeichen werden zerstört, wenn ich bestehenden Text bearbeite. Wenn ich die Zeichen neu eingebe, werden sie wohl richtig gespeichert, ohne dass ich sie allerdings richtig sehen kann.--Jah 11:37, 30. Jul 2004 (CEST)
Um es genauer zu sagen: Die Sonderzeichen werden auch im Eingabefenster als Zeichensalat angezeigt, wenn der Text vom Server geladen wurde. Ich kann aber diese Zeichen eingeben, und dann sehen sie ganz normal aus (bis zur nächsten Vorschau).--Jah 11:40, 30. Jul 2004 (CEST)

Das Problem muss wohl bei Mozilla liegen, denn mit Konqueror funktionieren die Sonderzeichen.--Jah 13:31, 30. Jul 2004 (CEST)

mal ein neues Mozilla-Profil versuchen? Evtl. hast du fest eingestellt, ISO zu benutzen, auch wenn was anderes angegeben ist? Irgendwo hat Mozilla so eine sinnlose Einstellung... TheK 13:34, 30. Jul 2004 (CEST)
Jetzt ist mir ein Licht aufgegangen: Unter Mozilla habe ich immer einen Werbeblocker-Proxy benutzt (Privoxy). Der war im Konqueror nicht eingestellt. Nachdem ich ihn auch in Mozilla deaktiviert habe, funktioniert auch da alles korrekt. Jetzt muss ich mich mal um den Privoxy kümmern, aber das ist ja kein Wikipedia-Problem mehr.--Jah 13:38, 30. Jul 2004 (CEST)
Das kann ich bestätigen. Ich benutze Privoxy beim Konqueror und habe das gleiche Problem. Bei Mozilla hingegen habe ich den Werbeblocker nicht drin und deswegen keine Probleme. Vielleicht bringt ein Update des Privoxys Lösung. --80.139.44.102 15:30, 30. Jul 2004 (CEST)
es ist der Privoxy - deiner hat eben wieder die Umlaute zerkloppt :/ TheK 15:34, 30. Jul 2004 (CEST)
und da sagt der Autor was dazu: [2]. Kurzfassung: UPDATE!!! TheK 15:37, 30. Jul 2004 (CEST)
Ein Update ist nicht unbedingt notwendig. Man kann diesen Filter auch einfach ausstellen (die erste Regel in default.action bearbeiten).--Jah 15:44, 30. Jul 2004 (CEST)
Mozilla auf W2K funktioniert. Kannst Du vielleicht mal die ursprüngliche UTF-8 Testseite probieren: http://fr.wikipedia.org/wiki/Utilisateur:Head/Unicode-Test -- Pjacobi 13:37, 30. Jul 2004 (CEST)



Anmeldung - Sonderzeichen in Benutzernamen

Fall 1

Teilweise hierher verschoben von Wikipedia:Ich brauche Hilfe

Hallo zusammen, bei der Umstellung auf UTF-8 scheinen die Sonderzeichen in den Benutzernamen nicht mehr zu funzen und noch viel schlimmer: Mein Benutzerraum ist nicht mehr da! Weiß da jemand näheres drüber? --Markus Schwei? 07:03, 30. Jul 2004 (CEST)

Ich habe mal Benutzer:Markus Schweiß manuell in der Adressleiste eingegeben und man kommt dann tatsächlich zu der Seite, gelöscht ist sie also zumindest nicht. Versuch doch mal Dich aus- und dann wieder einzuloggen! Stern !? 09:07, 30. Jul 2004 (CEST)

Hilft nix, da bekomme ich nur diese Meldung: Der Benutzername "Markus Schweiß" existiert nicht. Überprüfen Sie die Schreibweise, oder melden Sie sich als neuer Benutzer an. --217.255.47.195 14:24, 30. Jul 2004 (CEST)
Astrein, jetzt kann man sich noch nicht einmal mehr anmelden! :'-((( Wer hat denn bloß diesen Mist verzapft? :-X -- Markus Schweiß
Cookie gelöscht? TheK 14:31, 30. Jul 2004 (CEST)
Ja und hat leider auch nichts gebracht. Sämtliche Cookies löschen will ich nicht, die Dinger brauche ich ja schließlich.... -- Markus Schweiß

Ich habe mir unter dem gleichen Namen einen neuen Account angelegt, der sofort und ohne Widerrede akzeptiert wurde. Auch mein Benutzerraum ist wieder erreichbar. Nur die Admin-Tools sind wech..... --Markus Schweiß 15:16, 30. Jul 2004 (CEST)

aber deine Benutzerbeiträge scheinen verlorengegangen zu sein ... -- Schusch
Die habe ich bereits wieder gefunden, nur meine Beobachtungsliste müsste im Falle eines Falles rekonstruiert werden. --Markus Schweiß 15:32, 30. Jul 2004 (CEST)
kannst du die vielleicht holen, indem du versuchst, per Copy&Paste dieses Sonder-Frage-Zeichen aus deiner alten Beobachtungliste zu nehmen und dich damit anzumelden? (Grausamer Workaround, aber besser als nix - vielleicht schließt du dich auch noch mal mit Head kurz ...) -- Schusch 15:54, 30. Jul 2004 (CEST)

Shaihulud hat deinen neuen Account gelöscht und deinen alten Account korrigiert, jetzt sollte bei dir wieder alles OK sein. Wenn bei jemandem ähnliche Probleme auftreten, bitte bei mir oder bei Shaihulud melden. --Head Diskussion 16:13, 30. Jul 2004 (CEST)

Isso :-))) danke auch an Shaihulud! --Markus Schweiß 18:12, 30. Jul 2004 (CEST)

Ich gehe davon aus, dass damit dieser spezielle "Fall 1" erledigt ist und kein nachvollziehbares allgemeines Problem mehr besteht, so dass diese Geschichte archiviert werden kann? -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 11:25, 13. Aug 2004 (CEST)

Fall 2

Ich bin Benutzer Hansjörg. Mein Benutzername erscheint als Hansj? und dann folgt HTML Code. Überschreiben durch Hansjörg nutzte nichts. Stattdessen erscheint der Unsinnscode wieder. Fehlermeldung: Beide Passwörter stimmen nicht überein. Was soll ich tun um mich anzumelden? Benutzer Hansjörg 3o Juli gegen 9:32 Nachtrag: zugang über AOL 8.0, Windows XP 2000-2001, Laptop Toshiba. Zweiter Versuch: bei der Anmeldung wird gar nicht mehr nach Anmeldung gefragt, sondern ich soll neuen Benutzeraccount anlegen. Ist das so, oder lohnt es sich zu warten bis, die Taskforce dieses Problem behoben hat? Hansjörg um 9:45

Benutzer:Hansjörg existiert. Das gleiche Problem wie bei dem ß, s. oben. Stern !? 09:52, 30. Jul 2004 (CEST)

Das Anmeldeformular zwingt mich einen neuen Benutzer anzulegen, stellt also den Button Anmelden nicht zur Verfügung. Soll ich einen neuen Benutzernamen anlegen und dann versuchen meine ursprüngliche Benutzerseite und Diskussionsseite dahin rüberzukopieren? Hansjörg gegen 10:07

Das halte ich für keine gute Idee - dann warte lieber einen Tag oder so. Wenn es ein Fehler auf Seiten der Wikipedia sein sollte, wird er dann hoffentlich lokalisiert und behoben sein - dann hättest du umsonst einen neuen Nutzeraccount. Ich kann den Fehler allerdings nicht nachvollziehen - der Button Anmelden sollte immer zugänglich sein.
Kannst du testweise mal einen anderen Browser verwenden oder ist man bei AOL auf den mitgelieferten angewiesen? -- Avatar 10:16, 30. Jul 2004 (CEST)
Ich vermute, daß das Problem Folgendes ist: Hansjörg hat sich seinerzeit mit 8859-1 angemeldet. Wenn er das jetzt tut, schickt er aber ein UTF8-ö und kein 8891-1-ö. Für einen Menschen ist das gleich, aber nicht dem auswertendenden php-Skript. Sollte dem so sein, wäre die einzige Möglichkeit, das zu korrigieren, die direkte Änderung des "ö" in der Datenbank von ISO-8859-1 auf UTF-8 vorausgesetzt, die werden nicht verschlüsselt abgelegt... --Ulrich Leipold 10:26, 30. Jul 2004 (CEST)

Noch ne Beschreibung: Wenn ich über die Browserleiste http://..Benutzer:Hansjörg suche dann wird mir meine Benutzerseite korrekt angezeigt. Wenn ich über die Funktion Suche Hansjörg am linken Rand eingebe: dann wird Benutzer:Hansj"GroßesATilde""Paragrafenzeichen"rg gefunden,aber die Benutzerseite korrekt angezeigt. in der Browserleiste steht aber Atildeetc, das überdie Browserleiste abgeschickt "Diese seite existiert noch nicht.."liefert.

Auch wenn es ev. fast frech ist: Hast du, Hansjörg, mal deine Cookies gelöscht, den lokalen Cache geleert und die gespeicherten "automatisch Formulare ausfüllen" Einstellungen gelöscht? Hast du Benutzername UND Passwort von Hand eingetippt? --193.47.104.38 10:51, 30. Jul 2004 (CEST)
Habe alle meine Cookies gelöscht und bereinigungsprogramm laufen lassen Computer neu gestartet. Jetzt funktioniert es. Aber wie der lokale Cache gelöscht wird weiß ich nicht war offensichtlich auch nicht nötig.--Hansjörg 12:09, 30. Jul 2004 (CEST)

Kann mich auch nicht anmelden, da im Passwort ein Umlaut ist, das jetzt nicht akzeptiert wird. What to do?????????? 217.234.92.212 11:47, 30. Jul 2004 (CEST)

Ich rede gerade mit einem Developer über das Problem. Wenn du beim Anmelden deine E-Mail-Adresse angegeben hast, ist es wohl am einfachsten, dir ein neues Passwort zuschicken zu lassen. --Head Diskussion 11:53, 30. Jul 2004 (CEST)
Bitte nochmal probieren, Tim hat einen Patch für das Passwort-Problem eingespielt. Wenn es immer noch nicht klappt, bitte hier melden oder direkt im Chat in #mediawiki bei TimStarling melden. --Head Diskussion 13:10, 30. Jul 2004 (CEST)
Anmeldung mit Umlaut im Passwort geht wieder. Danke RolfS 21:57, 3. Aug 2004 (CEST)


Sonderzeichen im Querverweis

Ich hatte beim Portal Südamerika das Problem, dass ein Bild mit [[Bild:Flagge_S%FCdgeorgien_und_die_S%FCdlichen_Sandwichinseln.png]] anstatt mit [[Bild:Flagge_Südgeorgien_und_die_Südlichen_Sandwichinseln.png]] verlinkt war. Das Bild wurde dann natürlich nicht gefunden. --ALE! 11:46, 30. Jul 2004 (CEST)

Der Fehler wird wahrscheinlich häufiger auftauchen. In dem Fall wäre das eine Aufgabe für einen Bot. Danke für den Hinweis! --Daniel Beyer 12:07, 30. Jul 2004 (CEST)
Der Fehler tritt bei Links mit Sonderzeichen häufiger auf, hab heut schon mehrere korr., z.B. den Link neuen Löschkandidat hinzufügen auf der Löschkandidatenseite, der einen Abschnitt in einer neuen Seite mit korroptem Lemma aufmachte. -- srb

Logbücher

Auf Wikipedia:Archiv:Lösch-Logbuch sind m.E. seit der Umstellung die Dateien defekt. Ich komme zumindest nich mehr ran. --Wiki Wichtel 14:01, 14. Aug 2004 (CEST)

Habe mal gleich den Obersten Link nach Wikipedia:Archiv:Lösch-Logbuch/20040809 angeklickt, kein Problem mit Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514 -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 14:46, 14. Aug 2004 (CEST)

Linkprobleme

Solche Fälle hatte ich heute bereits öfters:

Wenn ich in Sibirien im 2. Absatz auf Nördliches Eismeer (kein roter Link) klicke, glaubt der Server, dass sich hinter diesem Link noch keine Seite bzw. kein Artikel verbirgt; dies ist allerdings ein Trugschluss, den dahinter steckt normalerweise das Nordpolarmeer - Benutzer:MIBUKS


Kann ich mit "Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514" nicht bestätigen, Weiterleitung funktionierte bei mir einwandfrei. Dein Browser? -- RainerBi 19:32, 30. Jul 2004 (CEST)


Internetexplorer 6 (muss jetzt weg; melde mich morgen wieder, es sei denn du antwortest schnell)

Sehe gerade ein ähnliches Problem: Alle Links in den Wikipedia-Namensraum, die Umlaute enthalten zeigen ins Leere, zumindest die auf meiner Benutzerseite Benutzer:Wolfgangbeyer (ganz unten). Dort stehen im Quellkode die Umlaute mit Prozent-Steuerkodes (habe vergessen, ob ich die selbst dort eingetragen hatte oder ob die jetzt erst bei der Umstellung dort erzeugt wurden) und müssten aber wohl direkt eingetragen werden. Ich lasse das vorerst mal zu Beweiszwecken dort so stehen. Wäre das was für einen Bot? --Wolfgangbeyer 22:33, 30. Jul 2004 (CEST)

jein. Es kann zwar ein Bot schnell korrigieren, ABER: es ist nahezu unmöglich, diese Dinger aufzutreiben. Das einfachste ist wohl, jeden für sich zu korrigieren. Allzuviele scheinen es ja zum Glück nicht zu sein. TheK 22:40, 30. Jul 2004 (CEST)
Was ist schwer aufzutreiben - ein Bot, oder die Umlautlinks? -- srb 22:45, 30. Jul 2004 (CEST)
Diese kaputten Links. Es trifft Links, die vorher mit den Prozent-Steuerkodes eingetragen waren. Diese passen jetzt nicht mehr. Sieht man aber eben nirgendwo. TheK 22:51, 30. Jul 2004 (CEST)
Und was stört es, wenn man die Links, bei denen die %Steuercodes eingetragen waren, gleich mitumwandelt? Welchen Sinn sollen die machen? -- srb 23:21, 30. Jul 2004 (CEST)
Ein einzeles %XY im Link mit XY > 0x7F, ist immer ungültiges UTF-8 und muß korrigiert werden. Wenn doch unerwarted viele davon gibt, vielleicht doch ein Fall für ein Programm? -- Pjacobi 12:12, 31. Jul 2004 (CEST)
Auf meiner Benutzerseite (bzw. auf einer Unterseite, da ich momentan auf meiner Hauptseite keine Umlautlinks habe) passen - aber ich habe heute im Laufe des Tages im normalen Namensraum einige fehlerhafte Links korrigiert - darunter auch einige sehr ärgerliche wie die Hinzufügenlinks auf den Löschkandidatenseiten. Ach ja, ich verwende Mozilla - so wie es aussieht, macht der IE hier anscheinend mehr Probleme, da ich den Fehler in Sibirien nicht reproduzieren kann. -- srb 22:45, 30. Jul 2004 (CEST)


Wiki-Software zerstört Artikelnamen (µ-Rekursion)

Der Artikel existierte mal und ist auch in Kategorie:Theoretische Informatik verzeichnet. Klickt man auf den Verweise gelangt man zu sowas ähnlichem wie µ. Mhh. Ist das dann ein großes µ? Irgendwas haut da nicht hin. Stern !? 23:58, 3. Aug 2004 (CEST)

Vielleicht ließe sich aus dieser Wikipedia-Kopie der Inhalt rekonstruieren: http://www.uni-protokolle.de/Lexikon/%B5-Rekursion.html --Pythagoras1 15:24, 4. Aug 2004 (CEST)
Habe ich erledigt, der Artikel hat jetzt den Titel My-Rekursion. Der alte Artikel wird wohl irgendwo in den Tiefen der Datenbank verschollen bleiben -- stw (Talk) 18:27, 4. Aug 2004 (CEST)
Ich halte das für eine schlechte Lösung. Es heißt ja eben nicht My-Rekursion, sondern µ-Rekursion. Das ist ein offensichtlicher Softwarefehler, der behoben werden muss. Stern !? 19:34, 4. Aug 2004 (CEST)
Sehr schlechte Lösung. Ersteinmal ist die Versionsgeschichte verlorengegangen. Und dann ist es nunmal ein Softwarefehler, der behoben werden muss. Es gibt z.B. noch den Fall σ-Algebra, der als Σ-Algebra in der Datenbank verlustig gegangen ist: http://de.wikipedia.org/wiki/Spezial:Search?search=algebra&fulltext=Suche
Problem ist, dass einerseits griechische Buchstaben am Artikelanfang (wie alle anderen auch) von der MediaWiki-Software in Großbuchstaben konvertiert werden, aber wohl nicht überall.
Wer meldet es einem Developer? --Head Diskussion 02:12, 5. Aug 2004 (CEST)
Beide Artikel wurden zurück verschoben. -- JeLuF 08:20, 11. Aug 2004 (CEST)

Bitte mit anpacken

Ich habe auf Wikipedia:Umstellung auf Unicode/Prozent-Links mal eine entsprechende Liste gezaubert, allerdings ist sie nicht vollständig, ich versuche rauszukriegen, warum der Bot abgeschmiert ist. Es sind 213 Seiten, bitte packt mit an. --Head Diskussion 00:06, 31. Jul 2004 (CEST)

Ich hab grad stichprobenartig ein paar Artikel aus der Liste ausprobiert - waren alles % in Interwiki-Links - die müßten sich doch über einen Abgleich mit anderen wikis (ohne diese Umkodierung) per Bot entschlüsseln lassen. Wäre sicherlich sinnvoller als manuell irgendwelche japanischen Links zu korrigieren. -- srb 01:02, 31. Jul 2004 (CEST)
Ich habs auch mal durchgeschaut, aber es sind schon einige dabei, die keine interwiki-links sind... --Rdb 15:43, 31. Jul 2004 (CEST)
Vielleicht sollte ein Bot erst mal die Interwikilinks korrigieren. Ich hätte ja keine Anhnung, wie man das manuell überhaupt macht. Vielleicht erst Hexadezimalwandlung und dann per Alt + rechtes Zifferntastenfeld eingeben? Uff! Das dürfte zu einigen Prozent Eingabefehlern führen. Und dann schaun wir mal, was dann noch übrig ist, oder? --Wolfgangbeyer 18:56, 31. Jul 2004 (CEST)

Sorry, meine Abfrage war falsch: statt %[A-F0-9][A-F0-9] habe ich %[A-F0-6][A-F0-6] gesucht. Die neue Liste liegt jetzt auf Wikipedia:Umstellung auf Unicode/Prozent-Links. --Head Diskussion 21:51, 9. Aug 2004 (CEST)

... funktionieren nicht, wenn der Artikel Zeichen außerhalb von US-ASCII enthält. Gehe z.B. von Saarbrücken auf den englischen Artikel. Die englische Wikipedia interpretiert die UTF-8-Codierung von "ü" als ISO-8859-1 und sucht den Artikel "Saarbrücken", der natürlich nicht existiert. Was tun? --Langec 11:56, 13. Aug 2004 (CEST)

Bei mir (Firefox 0.9.3/Linux) keine Probleme. --Head Diskussion 13:34, 13. Aug 2004 (CEST)
Aha, auch daran ist der Privoxy schuld... Den Demoronizer hab ich zwar ausgeschaltet, aber das Programm hat wohl noch mehr Probleme mit Unicode. --Langec 13:49, 13. Aug 2004 (CEST)
Nicht nur - ich habe mit w2k/moz1.7 die gleichen Probleme bei den englischen interwikilinks. -- srb 14:03, 13. Aug 2004 (CEST)
Kein Problem mit Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514 beim Beispiellink auf Saarbrücken

Verweis auf anderssprachige Wikipedias

Ich bin nicht völlig sicher, ob das ein UTF8- Problem ist, stelle das aber trotzdem erst mal hier 'rein: Auf Saturn (Planet) ist der Link minnan:Thó·-chheⁿ nicht korrekt unter "Andere Sprachen" eingeordnet, probehalber löschen und wieder einsetzen gab keine Besserung. -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 07:40, 24. Aug 2004 (CEST)

Wiki-Suche

Wenn ich eine Suchanfrage nach einem Keyword mit Umlauten per Hand eingebe also z.B. http://de.wikipedia.org/wiki/Spezial:Search?search=Löschen&go=Los dann führt das nicht zu dem gewünschten Ergebnis. Die Wiki-Suche erkennt dann nur als Ergebnis im Firefox "L�schen" und im IE 6.0 gar nur "L?en". Wenn man dagegen http://de.wikipedia.org/wiki/Löschen in die Adressleiste manuell eingibt, wird er korrekt in Unicode umgewandelt, also in http://de.wikipedia.org/wiki/L%C3%B6schen .

Die Browser schicken den Link bei manueller Eingabe scheinbar nicht in Unicode raus. Jedoch sollte die Linkanfrage seitens der Wikipedia leicht konvertierbar sein, so wie es mit http://de.wikipedia.org/wiki/Keyword ja schon der Fall ist.

Kann ich nicht reproduzieren (Firefox 0.9.1, Linux). Das heißt auch, dass man an der Software nichts ändern darf, weil es ja für einige (zumindest für mich) so bleiben muss. --Head Diskussion 02:06, 5. Aug 2004 (CEST)
Also ich hab das ganz unter Windows getestet. Kann ja sein das es unter Linux funktioniert (hast du auch wirklich die genannten Adressen über die Adressleiste aufgerufen also nicht als Link meine ich?). Wenn man die Software ändert sollte das heißen, dass falls die Suchanfrage im falschen Format komm z.B. nicht Unicode, sie serverseitig konvertiert werden soll. Für dich würde sich dann ja nichts ändern, wenn dein Browser die Suchanfrage im richtigen Format raussendet. --Andrejb 12:51, 5. Aug 2004 (CEST)
kann ich reproduzieren (w2k, moz 1.7): bei der manuell eingegebenen Suchanfrage wird das ö in %F6 statt in %C3%B6 umgewandelt. -- srb 13:22, 5. Aug 2004 (CEST)


Ich habe das mal mit Mozilla/5.0 (Windows; U; Windows NT 5.1; de-AT; rv:1.7) Gecko/20040514 getestet. 1. Versuch: ich Kopiere mit rechter Maustaste die Linkadresse [3], setze den bei der URL-Eingabe ein, <ENTER>, und ich lande auf Löschung /Weiterleitung von "Löschen". Das ist wohl oK. Nächster Versuch: Ich setze die URL noch einmal ein, ersetze aber '%C3%B6' durch ein 'ö',. <ENTER>, und ich lande auf [http://de.wikipedia.org/wiki/Spezial:Search?search=L%F6schen&go=Los "Für die Suchanfrage "L�schen" ...]. Das ist weniger gut. Das 'ö' wird also einmal mit '%C3%B6' (nach Eingabe von "Löschen" in's "Suchfenster") und ein anderes Mal (nach Direkteingabe in URL-Fenster) mit '%F6' codiert, das scheint mir inkonsequent. Für mich stellt sich die frage: Wer macht die Codierung '%F6' - Mein Browser oder die WIKIPEDIA- Software? -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 13:27, 5. Aug 2004 (CEST)
Dein Browser. Bei der Wikipedia kann dein ö gar nicht mehr ankommen, weil URIs nur ASCII-Zeichen beinhalten. --Head Diskussion 15:52, 7. Aug 2004 (CEST)
Und welche Schlussfolgerungen sind für WIKIPEDIA daraus zu ziehen - welche Maßnahmen müssen ergriffen werden? -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 17:44, 10. Aug 2004 (CEST)
siehe Wikipedia:Umstellung auf Unicode/Nachbetrachtung

Bilder mit Umlauten

Ich hatte gerade ein Bild mit einem Ä im Namen hochgeladen. Ich konnte es in keine Seite einbauen, das Ä hat den Namen zerschossen. Vor der UTF-8-Umstellung hatte ich nie Probleme mit Umlauten in Bildnamen. Stern !? 20:57, 5. Aug 2004 (CEST)

Welcher Browser? --Head Diskussion 15:52, 7. Aug 2004 (CEST)
Konqueror. Stern !? 17:19, 10. Aug 2004 (CEST)

Ich wollte grade ein Bild mit ö drin hochladen, das wurde kommentarlos verweigert. --Wiki Wichtel 17:16, 10. Aug 2004 (CEST)

Im Artikel Königsforst sollte das Bild Königsforst_Waldlehrpfad_Rath.png erscheinen. Ich habe das Bild hochgeladen und kann es bei den letzten Änderungen auch aufrufen. Browser Konqueror. Warum nicht im Artikel? --Jan Wellem 21:20, 10. Aug 2004 (CEST)

Ich habs grade mit w2k/moz1.7 nochmal hochgeladen, da gehts - anscheinend machen da einige Browser noch Probleme. Vielleicht sollten alle, die Probleme haben, mal ihre Browser angeben. -- srb 22:49, 10. Aug 2004 (CEST)
und die Version angeben. Konqueror 3.2.2 -> Bild is da. Oder Cache? [[Benutzer:TheK|TheK(?!)]] 22:52, 10. Aug 2004 (CEST)

Umlaute in Upload-Dateinamen

Ebenfalls hier her gehört wohl ein Problem, das derzeit bei Wikipedia:Ich_brauche_Hilfe#Umlaute_in_Upload-Dateinamen erörtert wird (evtl. sollten wir die Diskussion hier her verschieben?) -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 08:56, 16. Aug 2004 (CEST)

UTF-8, Unicode, NFC, NFD

Hierher verschoben von Wikipedia:Ich_brauche_Hilfe#Umlaute_in_Upload-Dateinamen

Habe vorhin mal ein Bild mit einem Umlaut im Dateinamen hochgeladen. Ich hatte gehofft, dass das seit UTF-8 problemlos geht, habe auf der anderen Seite aber auch befürchtet das UTF-8 nur für die Darstellung in html und nicht für die im Wikipedia-(Linux-)Dateisystem eine Rolle spielt.
Beim Hochladen bekommt man eine Meldung das der Name geändert wird und ob man die Datei trotzdem hochladen möchte. Optisch sieht der geänderte Dateiname genauso aus, wie auch lokal auf meinem Computer („ü“ = „ü“). Irgendwas ist aber anders. Über die Bildersuche wird das Bild nicht gefunden, weder in der einen (mit „ü“) noch in der anderen (auch mit „ü“ ?!) Schreibweise. Gerade das wollte ich aber erreichen, wer sucht schon nach „Inbusschluessel“ statt „Inbusschlüssel“. Außerdem ist nun ein weiteres Problem hinzu gekommen. Wie kann ich das „Wikipedia-ü“ über meine Tastatur (Mac OS X) eingeben? Aus der Upload-Meldung heraus kopieren ist nicht gerade Benutzerfreundlich. Hat irgendjemand eine Idee? Eine Erklärung wie das zusammenhängt wäre auch nicht schlecht. Ups, ganz schön groß diese Seite, kann die mal jemand archivieren? — KMJ Benutzer Diskussion:KMJ 22:35, 15. Aug 2004 (CEST)

Unter welchem Namen hast du die Datei hochgeladen? (also "Impusschlüssel.jpg"?) -- da didi | Diskussion 08:01, 16. Aug 2004 (CEST)
Browser- Screenshot
Screenshot der Downloadliste
Ich fand Inbusschlüssel_01_KMJ.jpg . . 50126 Byte . . KMJ . . 19:10, 15. Aug 2004 (GNU-FDL, selbst fotografiert), die tatsächlich etwas vertrackt ist. Wie der screenshot zeigt, sind die Ü-Pünktchen halbwegs über das "s" hinter dem "ü" gewandert. Auf der Upload-Liste lautet der Dateiname http://de.wikipedia.org/upload/a/aa/Inbusschlu%CC%88ssel_01_KMJ.jpg Es wäre möglichwer Weise hilfreich, wenn du eine kleine Datei geleichen Namens irgendwo in's Netz stellen könntest, damit das näher untersucht werden kann. Evtl. gehört das eher auf die Seite Wikipedia:UTF8-Probleme? -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 08:48, 16. Aug 2004 (CEST)
Ich schätze, die Dateinammensänderungs-Warnung, die KMJ sah, bezog sich darauf, dass die Leerzeichen im Namen durch Unterstriche ersetzt wurden - das hatte nichts mit dem 'ü' zu tun. Ich bin mir zu 99% sicher, dass das Problem auf KMJ's Rechner und nicht bei Wikipedia liegt. Ich habe mal testhalber eine Bilddatei erstellt und hochgeladen [4]. Den Dateinamen habe ich von Bild:Inbusschlüssel 01 KMJ.jpg übernommen, aber das 'ü' gelöscht und neu eingegeben, dann sieht's ganz normal aus. Ich schätze, KMJ's Rechner benutzt ein inkompatibles 'ü'. Solche Probleme kenne ich aus dem ASCII <-> ANSI - Spannungsfeld. Für bestimmte technische Anwendungen benötige ich öfters ASCII- Dateien. Wenn ich die mit einem ANSI- Editor (Notepad) erstelle, sind die deutschen Umlaute ASCII- unverträglich codiert. -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 09:13, 16. Aug 2004 (CEST)
Ich kann übrigens auch keine Abbildungen mit Umlauten mehr hochladen. Stern !? 12:02, 16. Aug 2004 (CEST)
Die Warnung bezog sich höchstwahrscheinlich nicht auf die Leerzeichen, da ich alle Dateien schon mit dem Unterstrich statt Leerzeichen auf meinem Rechner habe und sie dann auch so hochlade. Die Meldung kommt also wirklich nur wenn Umlaute vorhanden sind, ansonsten sehe ich die Meldung nie (bei keinem Bild). Mein System Mac OS X Server 10.3.5 (also quasi BSD UNIX) — inkompatibles „ü“ kann ich nicht glauben, hatte noch nie Probleme damit. Hallo da didi, die Datei um die es geht heißt genau „Inbusschlüssel_01_KMJ.jpg“ und kann auch unter Benutzer:KMJ/Bilder/G angeschaut werden. Ich bin mir nicht sicher ob es wirklich mit UTF-8 zusammenhängt. Wenn ich das „ü“ über die Tastatur eingebe wird das Bild nicht gefunden, kopiere ich es aus dem Quelltext der obigen Adresse dann schon. Guckst Du hier:
1. kopiert Inbusschlüssel 2004-08-15 GNU-FDL
2. nochmal kopiert nur das „ü“ per Tastatur ausgetauscht: Inbusschlüssel 2004-08-15 GNU-FDL was RainerBi schon demonstriert hat. — KMJ Benutzer Diskussion:KMJ 00:52, 17. Aug 2004 (CEST)
Habe die Datei auf Wunsch von RainerBi noch mal auf einen Server geladen (mit GoLive CS). Beim Versuch sie anzuschauen gibt es die folgende Meldung The requested URL /Inbusschlüssel 01 KMJ.jpg was not found on this server. In die URL-Zeile des Browsers hatte ich den Text aus dem Wikipedia-Quellcode kopiert. Gebe ich das „ü“ per Hand ein lautete die Fehlermeldung The requested URL /Inbusschlüssel 01 KMJ.jpg was not found on this server.. Ob Unterstrich oder Leerzeichen spielt auf diesem Server natürlich keine Rolle. Was nun??? — KMJ Benutzer Diskussion:KMJ 01:13, 17. Aug 2004 (CEST)
Erst mal zwei Screenshots (Safari und Mozialla mit dem Mauszeiger über dem obige Wort/Link Server


Sieht doch beides gut aus. Jetzt wird es aber ganz komisch. Ich habe mal keinen Screenshot gemacht, sondern beschreibe die Darstellung mal. Gehe ich mit dem Mauszeiger auf den hier (korrekt) abgebildeten Inbusschlüssel (1. kopiert) erscheint die URL in der Statuszeile des Browsers. Das gleiche gilt für die mißglückte Darstellung unter 2. Beide Darstellungen zeigen exakt den gleichen Text, der eine Text (1.) ist aber kürzer als der andere (2.). Der auf das korrekt dargestellte Bild scheint die Statuszeile des Browsers zu irritieren. Der Text steht 1 Pixel höher als gewöhnlich. Ist da irgendwo versteckt noch ein Zeilenvorschub mit drin? Das gilt für Safari als Browser, Mozilla stellte beide Links in der Statuszeile identisch dar — merkt also quasi nicht das da irgendein Unterschied ist. *ratlos*— KMJ Benutzer Diskussion:KMJ 02:20, 17. Aug 2004 (CEST)


UTF-8, Unicode, NFC, NFD Technische Details zum Uploadproblem. Es ging um das Beispiel:

http://de.wikipedia.org/upload/a/aa/Inbusschlu%CC%88ssel_01_KMJ.jpg

"u%CC%88" in einer URL repräsentiert die Bytefolge 0x75 0xCC 0x88. Interpretiert als UTF-8 ist das in Unicode:

U+0075 LATIN SMALL LETTER U
U+0308 COMBINING DIAERESIS

Dies ist die sogenannte NFD-Form (Unicode normalization form D)


"%C3%BC" in einer URL repräsentiert die Bytefolge 0xC3 0xBC. Interpretiert als UTF-8 ist das in Unicode:

U+00FC LATIN SMALL LETTER U WITH DIAERESIS

Dies ist die sogenannte NFC-Form (Unicode normalization form C)

Beide Formen sind canonically equivalent. Und jeder Unicode-konforme Anwendung sollte es egal sein, welche Form benutzt wird. Wenig überraschend, war hier an irgendeiner Stelle eine nicht-Unicode-konforme Anwendung im Spiel.

Schlußfolgerung:

  • Wer Dateinamen in anderer Form als NFC erzeugt, sollte sich mit ASCII Dateinamen begnügen.
  • Die mediaWiki Software sollte in einer zukünftigen Version alle Upload Dateinamen in NFC umwandeln

Weblinks: [5], [6], [7], [8], [9]

217.227.9.44 10:19, 17. Aug 2004 (CEST) == Pjacobi 10:25, 17. Aug 2004 (CEST)




Archiv für Erledigtes

... bitte hier entfernen <cntrl-x> und hier in nachvollziehbarer Form, das heißt ggf. mit Überschriften, per <cntrl-v> wieder einfügen, damit sich erledigte Probleme noch einmal nachvollziehen lassen!

Neue Probleme bitte oberhalb der Überschrift "Archiv für Erledigtes" einfügen! -- [[Benutzer:Rainer Bielefeld|RainerBi ]] 17:36, 4. Aug 2004 (CEST)