Portal Diskussion:Unicode/Archiv/2008
Name des Code-Blocks U0000
Hi. Der Unicode-Block Basis-Lateinisch enthält auch die Steuerzeichen und heißt im Original C0 Controls and Basic Latin. Wäre eventuell „Unicode-Block C0-Steuerzeichen und Basis-Lateinisch“ eine bessere Übersetzung? Bin mir auch nicht sicher, ob das Basic nicht als Adjektiv gedacht ist, im Sinne von „einfaches Lateinisch“, „elementares Lateinisch“ oder „grundlegendes Lateinisch“. --j ?! 14:44, 2. Jan. 2008 (CET)
- Sowohl meine Zeichentabelle als auch decodeunicode nennen den Block Basic Latin, der Name dürfte auch gebräuchlicher sein. Aber "Basic" mit "Basis" zu übersetzen, ist so nicht korrekt. Ich wäre für die letzte Option (grundlegendes Lateinisch), da einfaches Lateinisch irreführend ist (die Zeichen sind nicht unbedingt einfach), genau wie elementares Lateinisch (also ist z. B. das Þ nicht mehr elementar?). -- Prince Kassad 14:55, 2. Jan. 2008 (CET)
- Also das Original-PDF [1] hat die Überschrift „C0 Controls and Basic Latin“. --j ?! 15:22, 2. Jan. 2008 (CET)
- Ebenfalls vom Unicode-Konsortium: [2] - da wird auch die Bezeichnung Basic Latin verwendet. -- Prince Kassad 13:19, 3. Jan. 2008 (CET)
- Ich sehe da die C0 Controls links neben Basic Latin. --j ?! 14:30, 3. Jan. 2008 (CET)
- Ebenfalls vom Unicode-Konsortium: [2] - da wird auch die Bezeichnung Basic Latin verwendet. -- Prince Kassad 13:19, 3. Jan. 2008 (CET)
- Also das Original-PDF [1] hat die Überschrift „C0 Controls and Basic Latin“. --j ?! 15:22, 2. Jan. 2008 (CET)
Verlinkung
Hi. Mir ist bewusst, dass man in Fließtexten einen Begriff normalerweise nur beim ersten Auftreten verlinkt. Bei sortierbaren Tabellen handhabe ich das anders, weil nicht vorhersehbar ist, welcher der Begriffe nach Sortierung oben steht. Ich hoffe, das ist okay so. --j ?! 14:26, 2. Jan. 2008 (CET)
(von Diskussion:Unicode-Block Lateinisch, erweitert-A verschoben.--Τιλλα 2501 ± 13:49, 6. Jan. 2008 (CET))
Suche 2 Zeichen
Hallo, ich suche diese 2 Zeichen: [3] Wenn jemand sagt wo man diese Zeichen als Textzeichen hier auf wikipedia oder woanders finden kann, bin ich sehr dankbar. mfg (Der vorstehende, nicht signierte Beitrag stammt von 89.55.226.172 (Diskussion • Beiträge) 19:55, 18. Dez 2007) --Τιλλα 2501 ± 14:15, 6. Jan. 2008 (CET)
- Das sind Han-Ideographen, da brauchst du die Tabelle im Unicode-Block Vereinheitlichte CJK-Ideogramme. Das rechte Zeichen ist 七, das linke hab ich bisher noch nicht finden können. -- Prince Kassad 20:20, 18. Dez. 2007 (CET) (Nachtrag: Das linke Zeichen hab ich auch noch gefunden, es ist 去)
danke dir für die schnelle Hilfe! (Der vorstehende, nicht signierte Beitrag stammt von 89.55.226.172 (Diskussion • Beiträge) 20:30, 18. Dez 2007) --Τιλλα 2501 ± 14:15, 6. Jan. 2008 (CET)
(von Diskussion:Unicode-Block Hiragana verschoben.--Τιλλα 2501 ± 14:15, 6. Jan. 2008 (CET))
Đ und đ
Hi. In Ð ist von einem „durchgestrichenen D“ die Rede. Daher frage ich mich, ob latin capital letter D with stroke nicht besser als „Lateinischer Großbuchstabe D, durchgestrichen“ zu übersetzen ist, statt als „Lateinischer Großbuchstabe D mit Strich“. Analog đ. Was meint Ihr? --j ?! 14:30, 2. Jan. 2008 (CET)
- Zwischen Đ und
Dgibt es allerdings einen kleinen Unterschied. "Strich" hört sich trotzdem merkwürdig an, da sollte ein besserer Begriff gefunden werden. -- Prince Kassad 14:34, 2. Jan. 2008 (CET)
(von Diskussion:Unicode-Block Lateinisch, erweitert-A verschoben.--Τιλλα 2501 ± 13:49, 6. Jan. 2008 (CET))
- Nennen wir D mit Querstrich. Siehe Übersetzungsvereinbarungen auf dieser Seite. Ich hab's im Artikel entsprechend geändert. Gismatis 14:57, 6. Jan. 2008 (CET)
- Oh, die Übersetzungsvereinbarungen hatte ich noch gar nicht gesehen. Sollten die nicht auf der „Vorderseite“ stehen statt hier in der Diskussion? --j ?! 17:44, 6. Jan. 2008 (CET)
- Meinst du mit Vorderseite Wikipedia:WikiProjekt Unicode? Vielleicht. Ursprünglich ging es ja nur um die Listen. Inwiefern diese Vereinbarungen auch Eingang in die Einzelartikel finden sollen, ist noch gar nicht festgelegt worden. ich habe es ersetzt, weil "durchgestrichen" wirklich nicht optimal war. Aber zwingend ist das nicht. Das kam in meinem vorherigen Beitrag wohl falsch rüber. Gismatis 21:22, 6. Jan. 2008 (CET)
- Ja, ich meine genau das mit Vorderseite. Soll ja auch kein Zwang sein, sondern eine Empfehlung. In Unicode-Block Lateinisch, erweitert-A habe ich jetzt sechsmal „Querstrich“ und zweimal „Schrägstrich“ verwendet und das gefällt mir so ganz gut. --j ?! 15:33, 7. Jan. 2008 (CET)
- Danke für den Vorschlag. Hab ihn umgesetzt. Gismatis 11:38, 9. Jan. 2008 (CET)
Schutzschrift gegen erneutes Löschen?
Hallo Leute, mir ist in den Sinn gekommen, dass alle wiederhergestellten Artikel eigentlich einen Hinweis über Löschung und Wiederherstellung vertragen könnten. Es gibt ja die Vorlage:War Löschkandidat. Die passt aber in diesem Fall weniger. Benutzer:Manuel Heinemann machte auf hier den Vorschlag für eine Vorlage:Wurde wiederhergestellt. Das wäre doch etwas für uns. Dadurch könnten potenzielle Löschwütige gleich abschätzen, ob sich ein neuer Löschantrag lohnt. Gismatis 12:01, 6. Jan. 2008 (CET)
- Wenn alle wiederhergestellten Artikel diesen Baustein erhalten sollen, kann man ihn gleich in Vorlage:Unicodediskussionszentralisierungshinweis einbauen. Prinzipiell bin ich für den Vorschlag. -- Prince Kassad 12:06, 6. Jan. 2008 (CET)
Erledigt. Habe die neue Vorlage:Wurde wiederhergestellt bei allen betroffenen Artikeln eingefügt. Gismatis 21:40, 13. Jan. 2008 (CET)
griechische Buchstaben in Unicode-Block Lateinisch, erweitert-B
Hallo, dass die Zeichen dorthin gehören und die Nummern stimmen, glaube ich. Dass Sigma und Lambda hier als "lateinische" Buchstaben bezeichnet werden, verwundert mich aber.--Ulamm 22:19, 18. Jan. 2008 (CET)
- Das Esh (dein sogenanntes "Sigma") wird in einigen lateinischen Alphabeten verwendet und kann daher durchaus als lateinischer Buchstabe bezeichnet werden. Das Lambda mit Querstrich allerdings ist nur ein phonetischer Buchstabe. Trotzdem würde ich es weiterhin "lateinischer Buchstabe" nennen, analog zu den IPA-Buchstaben im darauffolgenden Block, die auch nicht wahlweise "lateinisch", "griechisch" oder "kyrillisch" sind. -- Prince Kassad 22:34, 18. Jan. 2008 (CET)
- Ich glaube, die Bezeichnung “Latin letter” ist hier ein Hinweis auf die typographische Gestaltung in Schriftarten. In den meisten Schriftarten werden nämlich in der Tat z. B. das griechische Gamma (γ) und der „lateinische Kleinbuchstabe Gamma“ als IPA-Zeichen (ɣ) unterschiedlich dargestellt, Letzterer halt mit einem an das lateinische Alphabet angepassten Schriftduktus. --Daniel Bunčić 06:20, 19. Jan. 2008 (CET)
Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B aufteilen
Nachdem es in den Fragen zur Wikipedia aktuell gerade um die Probleme, die lange Artikel verursachen, geht (Wikipedia:Fragen zur Wikipedia#Probleme mit sehr langen Artikeln) und der Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B mit 285.319 Bytes zurzeit der zweitlängste Artikel überhaupt ist, möchte ich das Problem jetzt ein für allemal entschärfen. Ich möchte die Tabelle aufteilen und in zwei Unterseiten verschieben. Unter dem eigentlichen Lemma verbleiben würden nur der Einleitungstext und die Links. Hinzu kämen einfach noch die Verweise auf die zwei Unterseiten, das heißt Lemma plus /20000 bis 2536F und /25370 bis 2A6DF. Wenn ihr damit einverstanden seid, werde ich das so umsetzen. Gismatis 20:59, 9. Jan. 2008 (CET)
- Nachdem sich niemand dagegen ausgesprochen hat, habe ich obigen Vorschlag soeben umgesetzt. Die Zeichentabelle befindet sich jetzt aufgeteilt unter
- Nachdem der Ursprungsartikel jetzt einige Tage längster Artikel überhaupt war, kann er jetzt nun auch bequem von denen aufgerufen werden, die nur der einleitende Text interessiert, bzw. die Zeichen gar nicht sehen können. Gismatis 05:15, 20. Jan. 2008 (CET)
Ich habe eben die Einleitung geändert: Die Sache mit den Bytes hat meines Wissens mit der Bezeichnung „breit“ nichts zu tun, auch wenn die halbbreiten Terminal-Zeichen ursprünglich aus 1-Byte-Zeichensätzen stammen. -- Olaf Studt 17:39, 7. Jan. 2008 (CET)
Formatvorlage für Code-Block
Hi. Gibt's schon irgendwo eine Formatvorlage für Artikel, die einen Code-Block beschreiben? Ich frage das, weil ich einen Ort suche, wo die Tabellenspalten diskutiert werden. --j ?! 14:17, 2. Jan. 2008 (CET)
- weil ich einen Ort suche, wo die Tabellenspalten diskutiert werden - Willkommen auf Portal Diskussion:Unicode/Archiv/2008. Die Codeblockartikel werden automatisch generiert, eine Formatvorlage ist bisher nicht erhältlich. -- Prince Kassad 14:37, 2. Jan. 2008 (CET)
- Na dann, hier meine Vorschläge:
- Die Dezimalzahl hinter die Unicode-Blocknummer in Klammern zu schreiben, widerspricht für mich der Idee einer Tabelle. Wie wäre es mit zwei Spalten?
- Die Semantik der Spalte Beschreibung ist unklar. Soll dort wirklich eine Beschreibung stehen? Oder nur die deutsche Übersetzung des offiziellen Namens inklusive Link? Wie wäre es statt dessen mit einer Spalte für den übersetzten deutschen Namen und einer anderen für eine echte Beschreibung mit Anwendungsbeispielen?
- --j ?! 15:35, 6. Jan. 2008 (CET)
- Na dann, hier meine Vorschläge:
- Zum ersten: da beides ja der Codepunkt ist (nur in einem anderen Format), sollten sie auch zusammen in einer Spalte auftauchen, um die Tabelle nicht unnötig aufzuteilen.
- Zum zweiten: Ursprünglich sollte in die Beschreibung wirklich nur die Übersetzung (mit Link). Daher wäre ich für eine neue Spalte "Beschreibung", wo man das Zeichen näher beschreiben kann. -- Prince Kassad 18:13, 7. Jan. 2008 (CET)
- Ich schliesse mich Jpp hinsichtlich der Kritik an der Klammernschreibweise an. Man sollte Tabellen datentechnisch lesbar halten, d. h. ein Wert pro Spalte und nix, was letztendlich nur auf eine Zeichenkette hinausläuft. – Simplicius ☺ 18:43, 7. Jan. 2008 (CET)
- Ursprünglich dachte ich auch an eine separate Spalte für echte Beschreibungen. Allerdings frage ich mich, ob eine Verlinkung auf einen Einzelartikel – sofern vorhanden – nicht ausreichend ist. Es beträfe dann nur noch diejenigen Zeichen, die keinen Einzelartikel hätten. Dann allerdings hätte man eine ganze Spalte, in der viele Zellen leer wären. Wie wäre es mit einer Spalte "Beschreibung/Beispiel", in der man auch ein erläuterndes Beispiel aus einer bestimmten Sprache mit diesem Zeichen aufführt, ähnlich wie in der Liste der IPA-Zeichen? Gismatis 17:50, 12. Jan. 2008 (CET)
Die Vorlage:Unicode-Block einbinden wird, sobald der neue Parser aktiviert ist, wohl nicht mehr ordentlich funktionieren. Die Gleichheitszeichen werden (der Beschreibung nach) wenn nur sofort und auch nur wenn sie am Anfang der Zeile stehen als Überschriften ausgewertet. Die bessere Alternative wäre vielleicht einen Parameter mit h1-h6 zu übergeben. So erstellte Überschriften sollten auch keine Bearbeiten-Links mehr tragen, was ja auch nicht weiter schlimm wäre. Soll ich es abändern? Gruß, --Revolus Echo der Stille 04:27, 6. Feb. 2008 (CET)
- Danke für den Hinweis; ja, gern! --Daniel Bunčić ? ♥ ± 06:14, 6. Feb. 2008 (CET)
- Habe es abgeändert; es sollte keine merkbaren Änderungen geben. --Revolus Echo der Stille 14:53, 6. Feb. 2008 (CET)
Schützen der Seiten
Evtl. sollte mal drüber nachgedacht werden, ob die Unicode-Seiten nach und nach vor weiteren Bearbeitungen geschützt werden sollten, wenn wir uns hier über deren definitive Form einig geworden sind. Ich fände z.B. gut, falls wir uns darauf verständigen könnten, dass sie später nur dann bearbeitet werden dürfen, wenn hier auf dieser Seite ein solider Änderungsvorschlag unterbreitet wurde. --Reiner Stoppok 22:03, 5. Mär. 2008 (CET)
- Ich bin ein Anhänger des Wikiprinzips. Lasst uns verschiedene Varianten ausprobieren und in einem Jahr nochmal über einen Standard diskutieren. Einheitlichkeit ist kein Heiligtum. --j ?! 22:38, 5. Mär. 2008 (CET)
- Bei einigen Blöcken hier gibt es aber m.E. schon nicht mehr besonders viel dran zu rütteln. --Reiner Stoppok 23:11, 5. Mär. 2008 (CET)
Problem mit Komma im Blocknamen
Liste der Unicode-Zeichen/3400 bis 9FFF landet zweimal auf der selben ausgelagerten Seite.
- Ich kann auf der Seite keinen Fehler entdecken. Was soll falsch sein? -- Prince Kassad 15:40, 19. Mär. 2008 (CET)
- „in einem eigenen Artikel.“ zeigt beide Male auf die selbe Seite. Rainer Seitel 16:00, 19. Mär. 2008 (CET)
- Sollte jetzt behoben sein. -- Prince Kassad 16:04, 19. Mär. 2008 (CET)
Arabisch-Blöcke
Bei den "Arabisch"-Unicode-Blöcken stockt seit längerem der Arbeitsprozess (siehe Arabisch, Arabisch, Ergänzung, Arabische Präsentationsformen-A und Arabische Präsentationsformen-B).
Nach reiflicher Überlegung würde ich vorschlagen, die Buchstabenbenennungen alle nach der englischen Unicode-Version zu übernehmen (!) und nur das "Drumherum" um die eigentlichen Buchstabenbezeichnungen jeweils zu übersetzen (so wie hier gerade: Benutzer:Buncic/Unicode/Arabische Präsentationsformen-A ). Daneben kann man ja in Klammern weitere nützliche Hinweise (bzw. die deutschen Namen für die Wörter setzen (soweit vorhanden!) - mit Angabe ob die Benennung des Buchstabens/diakritischen Zeichens aus dem Pers./Urdu/Arab./Sindhi/einer afrikan.Sprache usw. stammt - versteht sich. Ferner halte ich die Anlage einer Liste arabisch-basierter Alphabete (nach dem Vorbild der Liste lateinisch-basierter Alphabete und der Tabellen in Indische Schriften für wünschenswert.
Wie findet ihr diesen Vorschlag? --Reiner Stoppok 17:16, 12. Mär. 2008 (CET)
- Von einem Stocken beim Übersetzungsprozess hab ich noch nichts bemerkt (zwei Blöcke sind vorhin sogar fertig geworden). Ich würde weiterhin alles übersetzen, um uns nicht noch mehr LAs einzufangen. Eine Liste arabisch-basierter Alphabete halte ich deswegen nicht für sinnvoll, weil die meisten arabischen Zeichen nur in einer einzigen Sprache verwendet werden. -- Prince Kassad 17:27, 12. Mär. 2008 (CET)
- Dann sollte aber auch immer dazugeschrieben werden, in welcher! --Reiner Stoppok 18:15, 12. Mär. 2008 (CET)
- Nur wenn es gar nicht anders geht, z. B. falls wir nicht herausfinden, wofür die originale Schreibung steht (ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM), sollten wir die englische Form übernehmen. Wobei ich den Eindruck habe, dass das Unicode-Konsortium bei den Einzelbuchstaben die ein oder andere Schreibweise erfunden hat, um keine Diakritika verwenden zu müssen. Ein noch ungelöstes Problem sind unterschiedliche Buchstaben, die in der Umschrift identisch sind, bzw. sich nur durch ein Diakritikum unterscheiden. So werden in Meyers großem Taschenlexikon Ha und Ta jeweils zweimal aufgeführt. Vorschlag:
- U+062A ت ARABIC LETTER TEH: Arabischer Buchstabe Ta
- U+062D ح ARABIC LETTER HAH: Arabischer Buchstabe pharyngales Ha
- U+0637 ط ARABIC LETTER TAH: Arabischer Buchstabe emphatisches Ta
- U+0647 ه ARABIC LETTER HEH: Arabischer Buchstabe Ha
- Auf diese Weise könnten wir das Schmema mit -a wahren und müssten trotzdem keine Diakritika verwenden. Gegenvorschläge? Außerdem schlage ich vor, englisches -eh immer mit -a und -eheh entsprechend mit -aha wiederzugeben, also auch Pa, Tscha, Taha etc. Noch etwas: Müsste es nicht eher Initialform, Medialform und Finalform statt initiale Form etc. heißen? Gismatis 09:35, 17. Mär. 2008 (CET)
- als Laie: ohne zusätzliche Zeichen kann man keine Umschrift in diesen Fällen machen Ha und Ta für ه bzw. ت ist in Ordnung. Beim Rest geht es nicht. Auch bei ظ werdet Ihr Probleme haben.--Orientalist 16:43, 19. Mär. 2008 (CET)
- Vergessen wir doch mal kurz die ganze bisherige verbildete und verquere akademische Transkriptionsscheiße: Auf zu neuen Ufern! --Reiner Stoppok 20:36, 19. Mär. 2008 (CET)
- Also ظ heißt Za oder Tsa. Da kommt es zu keinem Konflikt. Und ich schließe mich Reiner an. Zwar habe ich nichts gegen exakte Transkriptionen. In bestimmten Fällen haben sie ihre Berechtigung. Jedoch halte ich sie für laienfeindlich, wenn sich Schreibweisen nur aufgrund diaktritischer Zeichen unterscheiden. Undeutliche Zeichen wie z. B. untergesetzte Punkte können leicht übersehen werden. Gismatis 01:20, 20. Mär. 2008 (CET)
- Bei Hatschek und Cedille ist uns das schließlich auch gelungen ... --Reiner Stoppok 16:26, 20. Mär. 2008 (CET)
- Zu Initialform etc.: das würde ich so machen, wenn es nicht auch die isolierte Form gäbe, die man nicht zusammenschreiben kann. -- Prince Kassad 07:07, 19. Mär. 2008 (CET)
- Das spielt doch keine Rolle! Jedenfalls kommen mir die zusammengesetzten Formen bekannt vor, weshalb ich dachte, es seien die offiziellen Bezeichnungen. Gismatis 01:20, 20. Mär. 2008 (CET)
- Ich schließe mich dem vollinhaltlich an. Ist es denn ok, wenn wir jetzt z.B. Ta und emphatisches Ta unterscheiden? Diese Bezeichnung ist ja nicht aus den Fingern gesogen, sondern entspricht dem, was man im Arabischunterricht lernt. -- Arne List 14:08, 20. Mär. 2008 (CET)
- Genau das war ja Gismatis’ Vorschlag, den finde ich auch optimal. --Daniel Bunčić ? ♥ ± 15:35, 20. Mär. 2008 (CET)
- Wir müssen natürlich ausschließen, dass gleiche deutsche Namen für unterschiedliche Zeichen verwendet werden (richtig: Arabischer Buchstabe Ta z.B. wird gerade noch für "U+062A (1578) ت ARABIC LETTER TEH" und "U+0637 (1591) ط ARABIC LETTER TAH" verwendet). Das muss bei anderen Blöcken (auch blockübergreifend) natürlich auch gewährleistet sein. --Reiner Stoppok 16:13, 19. Mär. 2008 (CET)
- Mir scheinen Initialform, Medialform, Finalform und isolierte Form aber tatsächlich die üblichen Termini zu sein, auch wenn ich gerade kein Buch zur Hand habe, aus dem ich sie zitieren könnte. Hier sollten wir nicht andere Termini prägen, nur weil diese vier nach unterschiedlichen Wortbildungsmustern gebildet sind. --Daniel Bunčić ? ♥ ± 09:08, 19. Mär. 2008 (CET)
- Korrekt -- Arne List 14:11, 20. Mär. 2008 (CET)
- Ok. Ich ändere das um. --Reiner Stoppok 16:00, 20. Mär. 2008 (CET)
Übersetzungsvereinbarungen
(Nach Wikipedia Diskussion:WikiProjekt Unicode#Übersetzungsvereinbarungen verschoben. Gismatis 11:36, 9. Jan. 2008 (CET))
Löschantrag auf Unicode-Block Pfeile
War ja zu erwarten, dass sobald ein neuer Block eingerichtet wird, der nicht zu den wiederhergestellten gehört, ein Löschantrag dazu eingereicht wird: Wikipedia:Löschkandidaten/16._Februar_2008#Unicode-Block_Pfeile. Gismatis 04:56, 17. Feb. 2008 (CET)
"Arabisch"-Blöcke
Bitte kommt mal rüber zur Diskussion:Liste der Unicode-Zeichen. Gruß --Reiner Stoppok 17:18, 12. Mär. 2008 (CET)
- Jetzt weiter unten auf dieser Seite. – Simplicius ☺ 15:03, 14. Apr. 2008 (CEST)
Ich möchte darauf aufmerksam machen, dass sich der Unicode-Block inzwischen in der Löschprüfung befindet. --Reiner Stoppok 16:52, 7. Mär. 2008 (CET)
- Unicode-Block Pfeile sind vorhanden. Typischer Löschantrag von P.Birken. – Simplicius ☺ 15:00, 14. Apr. 2008 (CEST)
Hinweis an die Mitarbeiter:
- Bislang fanden die Besprechungen vor allem auf der Diskussionsseite der Liste der Unicode-Zeichen statt. Die neun Listen, generiert über Vorlagen, wurden mit Billigung des redaktionellen Teams heute gelöscht.
- Damit entfällt auch der Sinn für die alte Übersicht über die Listen (damit auch der Mittelpunkt für die Arbeit, die Diskussionen und die Diskussionsarchive).
- Ich habe die Vorlage für die einzelnen Artikel überarbeitet, einen Verweis auf das Portal eingefügt und dieses Portal erstellt.
- Auf der bisher weniger genutzten Projektseite lag die Zusammenstellung von Aufgaben, Mitarbeitern, Hinweise usw. Sie befindet sich nun auf Übereinkünfte. Das ist auch ganz oben neben den Archiven für 2007 und 2008 noch einmal verlinkt.
- Die Diskussionsbeiträge von dort habe ich auf dieser Seite eingefügt. Somit sind fast sämtliche Diskussionen hier an 1 Stelle vereint.
Ich hoffe, das war jetzt nicht zu kompliziert... – Simplicius ☺ 21:50, 13. Apr. 2008 (CEST) ergänzt
Kritik
Unabhängig vom Ergebnis finde ich, Du hättest diese Vorgehensweise vorher mal an den üblichen Stellen ansprechen können. --Reiner Stoppok 00:58, 14. Apr. 2008 (CEST) PS: Die Übersichtsleiste unten sollte auf die ganze Breite gebracht werden, so wie sonst überall auch.
- Ich habs am 11. April 2008 16:41 Uhr angesprochen. Du findest es hier auf der Seite unter ...#Gesamtliste. Vielleicht war das ja nicht deutlich genug formuliert.
- Aber soweit kann man ja mitdenken, dass der Übersichtsartikel [4] durch den Löschantrag durch Prince Kassad, der auch deine Unterstützung fand [5], somit zwangsläufig wegfällt und die Diskussionen samt Archiv dann verloren gehen würden.
- Auf der verwiesenen Diskussionsseite von Prince Kassad steht es jedenfalls. – Simplicius ☺ 01:24, 14. Apr. 2008 (CEST)
- Danke für die Anregung. Irgendwie muss man ja halt erst einmal anfangen. Unten ist es nun breit. – Simplicius ☺ 01:30, 14. Apr. 2008 (CEST)
- Mitdenken ist nicht meine Stärke ... Das Beispiel Dingbats ist schlecht gewählt, da die noch größtenteils unübersetzt auf der Benutzerseite Buncic stehen. --Reiner Stoppok 14:07, 14. Apr. 2008 (CEST) PS: Wer sich drum kümmern möchte: hier die notwendigen Infos.
Qualitätssicherung Portale
Bitte erstellt die Unterseite Portal:Unicode/Info und tragt alle notwendigen Informationen ein, siehe Anleitung ff. -- Cherubino 17:27, 13. Apr. 2008 (CEST)
Zur Relevanz von Portalen siehe Wikipedia:Portale/Wikipedia:Portale#Relevanzkriterien und Wikipedia:WikiProjekt_Portale/Baustelle#Portal:Unicode -- Cherubino 18:07, 13. Apr. 2008 (CEST)
- Der Kommentar, dem man dort hinterherklicken soll, lautet:
- Die Liste der Unicode-Zeichen (16. Sep. 2007 erstellt) wurde von Simplicius zum Portal:Unicode verschoben. Die Relevanzkriterien für Portale sind nicht erfüllt. Cherubino 18:05, 13. Apr. 2008 (CEST).
- Grüsse, – Simplicius ☺ 20:02, 13. Apr. 2008 (CEST)
- Hinterherklicken wär ratsam, denn das ist die Seite wo alle(!) neue Portale zur Diskussion gestellt werden. Leider hat kein Listen/Portal-Verantwortlicher dort reagiert (nur keine Angst). Also dann hier das Wesentliche freundlicherweise nochmal vorgekaut: Die Relevanzkriterien für Portale wurden per Meinungsbild festgelegt. Hier greifen sie nicht automatisch. Bleibt entweder Formalitätendingsbums-2 wie jüngst vom Portal:Inseln oder Portal:BDSM problemlos gemacht (siehe „Ist dein Thema nicht enthalten?“ Wikipedia:Portale#Ein_Portal_gründen - Schritt 1 - Punkt 2. Kurz: drei feste Betreuer und eine Mehrheit von mindestens zehn Befürwortern), zurückverschieben zur Liste oder ein LA. Bitte jetzt nicht groß lamentieren, Formalitätendingsbums-2 läuft regelmäßig und meist ohne Probleme.
- Grüsse Cherubino 23:58, 13. Apr. 2008 (CEST)
- Könnte man das nicht umbenennen in "Unicode deutsch" oder so ähnlich? --Reiner Stoppok 16:34, 14. Apr. 2008 (CEST)
- Keine Ahnung was du meinst. Ist aber nicht normal, dass sich beim Wikiprojekt:Portale keiner äußert. Bei eurem Projekt seid ihr doch schon sieben Mitarbeiter, wo ist der Haken? -- Cherubino
- Es gibt keinen. Es will sich nur aus irgendwelchen Gründen keiner äußern. -- Prince Kassad 22:10, 15. Apr. 2008 (CEST)
- Jo. Und ich bin nicht von Adel... ☺ – Simplicius ☺ 23:34, 15. Apr. 2008 (CEST)
Neue Gestaltung Vorlage
Die Vorlage:Navigationsleiste Unicode wurde von Caesium137 umstrukturiert, alt, neu. Sie allerdings auch nicht mehr so kompakt. Meinungen? – Simplicius ☺ 21:09, 15. Apr. 2008 (CEST)
Diese Fassung besonders neu ist riesengroß, trotz kleiner Schrift und es ist zuviel Fäche einfach weiss. Der Vorteil ist natürlich: Man sieht, wie ungeheuer viele Teillisten da sind. Einen Versuch war's ja wert. Ich find es trotzdem nicht so praktikabel. – Simplicius ☺ 23:52, 15. Apr. 2008 (CEST)
- Auf meinem heimischen Computer, der noch mit 1024 x 768 Pixeln Auflösung läuft, passen die beiden neuen Versionen der Navigationsleiste nicht einmal mehr auf den Bildschirm (Nachtrag: gilt übrigens auch für meinen Bürocomputer mit 1280 x 1024 Pixeln). Und scrollen innerhalb einer Navigationsleiste kann nun wirklich nicht der Sinn der Sache sein. Abgesehen davon sehe ich den Gewinn nicht. Die Liste ist nicht übersichtlicher, da immer noch alles kreuz und quer (in der Reihenfolge der Blöcke im Code) steht und man sich durch alle drei Spalten genauso durcharbeiten muss wie zuvor durch den Fließtext. Abgesehen davon finde ich diese neue Lösung, wenn ich mir die Spaltenbreiten ansehe, auch designmäßig nicht gelungen. Bitte revertieren. --Daniel Bunčić ? ♥ ± 07:18, 16. Apr. 2008 (CEST)
- Bin genau derselben Meinung. Ich würde nochmal revertieren, möchte mich aber nicht an einem Editwar beteiligen. -- Prince Kassad 07:33, 16. Apr. 2008 (CEST)
- +1, bitte revertieren. – Simplicius ☺ 09:38, 16. Apr. 2008 (CEST)
Na, dann habe ich das doch einfach mal gemacht. --Daniel Bunčić ? ♥ ± 09:44, 16. Apr. 2008 (CEST)
Fehlende Blöcke
Für Mitmacher, Neugierige & Besserwisser: Die noch fehlenden Blöcke stehen hier. --Reiner Stoppok 14:36, 14. Apr. 2008 (CEST)
- ...und die Möglichkeit, sich in die Liste der Mitwirkenden einzutragen, besteht hier. – Simplicius ☺ 11:58, 18. Apr. 2008 (CEST)
Halbleerschritt
Wie heisst der Unicode für einen Halbleerschritt, der untrennbar sein soll? Gibt e s so was in Unicode? Danke! – Simplicius ☺ 01:17, 18. Jan. 2008 (CET)
- Die Leerzeichen sind alle hier spezifiziert, vermutlich meinst Du das NARROW NO-BREAK SPACE. Morty 17:30, 18. Apr. 2008 (CEST)
Dingbats (2700–27BF)
Ich habe mich des Hinweise von Rainer in Sachen Dingbats mal angenommen. Folgende Fragen habe ich:
- die genannte zip-Datei existiert am genannten Ort nicht mehr
- der Artikel Benutzer:Buncic/Unicode/Dingbats enthält den Hinweis „Der Unicode-Block Dingbats (2700–27BF) enthält die Zapf-Dingbats.“ Ist das wirklich belegt, dass es sich um die Sammlung von Symbolen von Hermann Zapf handelt und nicht irgendwelche Symbole?
Danke – Simplicius ☺ 14:58, 14. Apr. 2008 (CEST)
- Benutzer:Prince Kassad hatte mir irgendwo mal geschrieben: "http://unicode.org/versions/Unicode5.0.0/ch15.pdf#G12378: „The Dingbats are derived from a well-established set of glyphs, the ITC Zapf Dingbats series 100.“" --Reiner Stoppok 15:12, 14. Apr. 2008 (CEST) PS: Wer die Dingbats bearbeiten möchte, soll sich bitte an Benutzer:Rainer Zenz wenden, der hat die Originalbezeichnungen irgendwoher.
- Auf deutsch? Ich fürchte, ich muss mir hier sonst mal ein technisches Wörterbuch besorgen. – Simplicius ☺ 16:11, 14. Apr. 2008 (CEST)
- So habe ich es in Erinnerung. --Reiner Stoppok 16:27, 14. Apr. 2008 (CEST)
- Ich habs bekommen und schon entpackt. Danke. Sieht nach einer verlässlichen Quelle aus. Ein Umarbeitung werde ich in den nächsten Tagen machen - gerade ist es für mich zeitlich etwas eng.
- Wenn ich das richtig sehe, wurde im gesamten Internet noch keine deutsche Übersetzung veröffentlicht, obwohl es sich bei Zapf-Dingsbats um einen Industriestandard (für Laserdrucker usw.) handelt.
- Somit ist das Portal eine Art Vorreiter, oder? – Simplicius ☺ 10:49, 15. Apr. 2008 (CEST)
- Du meinst eine deutsche Übersetzung der englischen Übersetzung der deutschen Bezeichnungen des Unicode-Konsortiums? --Reiner Stoppok 14:49, 15. Apr. 2008 (CEST)
- Nun ja, ich orientiere mich besser zusätzlich auch an [6] bzw. [7].
- Dies ist ein hartes Brot.
- Hier müsste man einen gelernten Schriftsetzer oder Typografen kennen.
- Gibt die ISO 10646 die Bezeichnungen in Deutsch her? Das wäre dann doch eine gute Referenz. – Simplicius ☺ 21:40, 18. Apr. 2008 (CEST)
- Wenn es die Unicode-Bezeichnungen auf Deutsch gäbe, könnten wir uns die ganze Mühe mit den Unicode-Tabellen sparen. Im Klartext: nein, gibt es nicht. -- Prince Kassad 22:53, 18. Apr. 2008 (CEST)
- Ok. Hab hier noch was gefunden, was sehr substantiert aussieht, von Rainer Seitel [8]. – Simplicius ☺ 23:57, 18. Apr. 2008 (CEST)
Mathematische Symbole (2200–22FF)
Im Portal:Mathematik habe ich mal auf der QS um Amtshilfe gebeten, hier. – Simplicius ☺ 11:18, 17. Apr. 2008 (CEST)
- Eine Diskussion mit den Mitarbeitern dort wurde schon mal geführt. Vermutlich habe ich da irgendeinen Hinweis übersehen, aus dem das schon hervorging. Die neuerliche Antwort hat bei mir einen Denkprozess ausgelöst:
- Ein Symbol kann mehrere Bedeutungen tragen und daher mehrere Namen.
- Darum ist es nach einer philosophischen Strömung (Nachweis?) besser, es trägt überhaupt keinen Namen.
- Zumal können ja auch mehrere Symbole das Gleiche ausdrücken.
- Es ist daher besser, wir schaffen die Listen über Unicode ab, Unicode selbst und Schriftsysteme generell. Diese Probleme erstrecken sich auch über unsere Sprachen, denn sie sind ebenfalls nicht eindeutig. Wir sollten also auch die Sprachen abschaffen. Ich werde gleich einen Schnelllöschantrag auf das Universum stellen, vorher aber noch zum Mittagstisch gehen. – Simplicius ☺ 12:23, 17. Apr. 2008 (CEST)
- Das habe ich schon mal getan (siehe hier und direkt darüber). Der Aufpasser dort ist ein wikipediabekannter Feind unseres Anliegens. --Reiner Stoppok 16:47, 17. Apr. 2008 (CEST)
- Die dortigen Argumente fand ich wenig substantiiert. Aber Löschantrag auf die Welt greift schon, merkst du wie hier seit 1 Tag die Datenbank immer mehr Probleme kriegt? – Simplicius ☺ 14:55, 18. Apr. 2008 (CEST)
Gesamtliste in 16er-Spalten
Ich kenne die genauen Motive nicht, die zum Wunsch nach einer Gesamtliste führten. Geht es vor alllem darum, zu sehen, welche Zeichen das eigene PC-System darstellen kann? Dies könnte ich auch lösen, in dem ich eine Tabelle generiere, die 16 Zeichen pro Tabellenzeile enthält (Beispiel Testseite, mit Plane 0, Rest noch aussen vor). Das ist mal nur 'ne Frage. – Simplicius ☺ 14:50, 17. Apr. 2008 (CEST)
- Nein, dafür gibt es andere Websites. Es gibt aber keinen Ort, an dem man nach deutschem Text suchen kann (und z.B. "Gravis" eingeben und dann alle Zeichen finden, die einen Gravis enthalten). Aber das ist wegen der technischen Beschränkungen derzeit wohl wirklich nicht zu machen. Einstweilen bin ich schon recht zufrieden damit, einzelne thematisch zusammenhängende Unicode-Blöcke in solchen Seiten wie Lateinische Buchstaben in Unicode oder Kyrillisch und Glagolitisch in Unicode zu sammeln, das ist für die meisten Zwecke wohl völlig ausreichend. --Daniel Bunčić ? ♥ ± 15:28, 17. Apr. 2008 (CEST)
- Ok, ich wusste gar nicht, dass wir solche Zusammenstellungen auch noch hatten.
- Eine wirklich vollständige Gesamtliste mit erläuternden Texte dürfte jedoch einen Artikel mit mehreren Megabyte Umfang ergeben.
- Die Tabelle für Plane 0 ohne Bezeichnungen ergibt bereits etwa 1 MB. – Simplicius ☺ 12:07, 18. Apr. 2008 (CEST)
- Diese Seiten gibt es ja auch erst seit kurzem. Und die Idee einer Gesamtliste mit deutschen Bezeichnungen ist (derzeit; aber warten wir mal drei Jahre...) einfach technisch unmöglich, während ich bei der Gesamtliste ohne Bezeichnungen noch den Verwendungszweck nicht sehe. --Daniel Bunčić ? ♥ ± 12:13, 18. Apr. 2008 (CEST)
- Mir hat sie gezeigt, dass ich dringend bessere Fonts brauche. – Simplicius ☺ 12:27, 18. Apr. 2008 (CEST)
- Kleine Nebenfrage: was hat es mit den beiden letzten Zeichen in Plane 0 auf sich?
- FFFE und FFFF laufen in der Darstellung aus dem Ruder. Werden sie von UTF beansprucht? – Simplicius ☺ 12:07, 18. Apr. 2008 (CEST)
- Zu der kleinen Nebenfrage schau mal unter Byte Order Mark. --Daniel Bunčić ? ♥ ± 12:13, 18. Apr. 2008 (CEST)
- Oh, danke. Und was ist mit FFFF? – Simplicius ☺ 12:27, 18. Apr. 2008 (CEST)
- Die letzten beiden Zeichen jeder Plane sind ausdrücklich als ungültige Zeichen ausgewiesen. Siehe Kapitel 2 des Unicode-Standards (bei Bedarf kann ich den Link suchen) -- Prince Kassad 13:47, 18. Apr. 2008 (CEST)
- FFFF ist EOF, Dateiende, meist −1. Nicht FFFD, sondern FFFE ist BOM. FFFE und FFFF dürfen nicht vorkommen! Rainer Seitel 13:50, 18. Apr. 2008 (CEST)
- Danke, mit dem FFFD habe ich mich in der Tabelle vertan.
- Das sind mentale Abnutzungserscheinungen. – Simplicius ☺
Fonts thematisieren
Können wir hier mal über Fonts sprechen? Mit was für Fonts habt ihr welche Erfahrungen gemacht? Wenn man eine Website betreibt, Seiten in XHTML und UTF-8, welche Fonts kann man den Lesern empfehlen? Und in Sachen Barrierefreiheit, wie gut kommen Sprachprogramme noch durch die Texte, wenn besondere Umlaute auftauchen? – Simplicius ☺ 23:39, 17. Apr. 2008 (CEST)
- Also hier mal was aus eigener Sicht (Win2K):
- In den Microsoft-Produkten dürfte man dem Trend soweit folgen, dass zumindest die europäischen Variationen angezeigt werden. Ferner gibt es den Arial Unicode MS, der in der englischsprachigen Wikipedia beschrieben wird (hier). Das Ganze ging wohl schon 2003 kommerziell in andere Hände über.
- Ich habe den Code2000 von James Kass runtergezogen (Website), in Windows installiert und im Firefox als Standard eingestellt. Er ist entpackt 8.377.136 Bytes groß. Bei regelmässigem Gebrauch möchte Kass eine einmalige Beihilfe in Höhe von 5 USD. Der Font ist auf der englischsprachigen Wikipedia beschrieben (hier). Es handelt sich um eine serifenbetonte Schrift, also so ähnlich wie Times. Ich musste zunächst noch folgenden Schritt manuell durchzuführen (Win2K): Desktop, Rechtsklick, Eigenschaften, Effekte, Bildschirmschriftarten glätten. Ich hab nun wieder eine andere Schrift als Standard einstellt, aber dieser Font hilft dort, wo er gebraucht wird. Das ist doch nett.
- Momentan bin ich bei der Lektüre auf einer Seite von Alan Wood, der sich viel mit dem Thema auseinandersetzt (Website). In der englischsprachigen WP gibt es eine schöne Seite über die Unicode Typefaces (hier).
- Mit besten Wünschen für das Wochenende – Simplicius ☺ 14:41, 18. Apr. 2008 (CEST)
Alte "Liste von Unicode-Zeichen" (erl.)
Die Versionsgeschichte der alten "Liste von Unicode-Zeichen" (die Ur-Liste) gehört hier m.E. auch noch irgendwo erwähnt bzw. hineinimportiert. Wo ist die eigentlich geblieben? --Reiner Stoppok 22:21, 20. Apr. 2008 (CEST)
- Wir sitzen drauf [9]. – Simplicius ☺ 15:48, 21. Apr. 2008 (CEST)
- Nein. Die ursprüngliche Liste hiess Liste von Unicode-Zeichen. Unter diesem Namen befanden sich auch die ganz alten Versionen der Liste. --Reiner Stoppok 16:08, 21. Apr. 2008 (CEST)
- Da sind Sachen auch in der Vorzeit mal angelegt, verschoben,
- zurückverschoben, gelöscht und wiederhergestellt worden:
- Die Versionshistorie hier reicht auf den 16. September 2007 zurück.
- Ich dachte schon, eine der älteren Sachen in der Versionshistorie bewahrt zu haben.
- Alles Weitere wäre noch mal eine Recherchefrage. – Simplicius ☺ 16:28, 21. Apr. 2008 (CEST)
- Die ursprüngliche "Liste von Unicode-Zeichen" war schätzungsweise ein halbes Jahr älter (d.h. ungefähr ein halbes Jahr vor dem 16. September 2007). Vielleicht holt das gelegentlich noch mal ein Admin aus dem Archiv. --Reiner Stoppok 16:44, 21. Apr. 2008 (CEST)
Erledigt. Danke, Tilla! --Reiner Stoppok 16:04, 26. Apr. 2008 (CEST)
- Also: History – Simplicius
Neuer Artikel: Unicode-Block Geometrische Formen
Hier habt ihr einen ehemaligen SLA-Kandidaten, ich hab mal das gröbste getan, um uns hier den üblichen Hexentanz aus Löschung, Wiederherstellungswunsch, … zu ersparen. Jetzt ist weitere Überarbeitung notwendig. --32X 15:25, 25. Apr. 2008 (CEST)
- Das sollte später aber mal aussehen wie hier angedeutet! --Reiner Stoppok 20:02, 25. Apr. 2008 (CEST)
- Was darf man sich unter „In der Tabelle sind lediglich alle html-Entities des genannten Unicode-Bereichs aufgeführt, sodass man – abhängig von den verfügbaren Fonts – wenigstens die graphische Darstellung auf dem jeweiligen Bildschirm sehen kann.“ denn genau vorstellen? Was bedeutet „lediglich alle html-Entities“? – Simplicius vier Jahre 13:34, 1. Mai 2008 (CEST)
- Ich hab das zuerst für nen Scherz gehalten. Ich finde, das sollte zurück auf die Benutzerseite. --Reiner Stoppok 02:15, 2. Mai 2008 (CEST)
- Ich bin auch der Meinung, dass nur übersetzte Tabellen in den Artikelraum geschoben werden sollten. – Simplicius vier Jahre 18:59, 6. Mai 2008 (CEST)
Unicode-Block Tags (E0000–E007F)
Was genau kann man sich darunter vorstellen? Sie befinden sich in Plane 14 (Ebene 14), die für für spezielle kodierungsinterne Aufgaben vorgesehen ist. Bedeutet das, dass die Zeichen nicht sichtbar sind? Wie genau werden diese Zeichen angewendet? – Simplicius vier Jahre 13:31, 1. Mai 2008 (CEST)
- Soweit ich weiß, handelt es sich hierbei um Sprachtags, um die Sprache in Textdateien zu markieren, was z. B. bei Nutzung von chinesischen und japanischen Schriftzeichen nebeneinander nötig ist. Dabei wird zunächst mit dem Sprachtag (U+E0001) eine Sprachangabe eingeleitet, und dann der ISO-Code der Sprache mit den Tags eingegeben. Der nachfolgende Text wird nun entsprechend der eingestellten Sprache z. B. in einer anderen Schrift angezeigt. -- Prince Kassad 15:37, 1. Mai 2008 (CEST) (Nachtrag: siehe Unicode 5.0, Kapitel 16.9)

- Das klingt interessant, aber ich fühle mich da selbst völlig überfordert.
- Ein erläuternder Text mit einem Beispiel wäre da vielleicht gut.
- Und wie ist in diesem Falle zum Beispiel TAG DIGIT TWO zu übersetzen? – Simplicius vier Jahre 19:42, 1. Mai 2008 (CEST)
- Hilft das Beispiel rechts? -- Prince Kassad 21:18, 1. Mai 2008 (CEST)
- Hilft das hier zum Verfassen eines "Sprach-Tags"-Artikels? Gruß --Reiner Stoppok 02:26, 2. Mai 2008 (CEST)
- Sorry, ich halte mich da lieber raus, das ist nicht genügend meine Materie. – Simplicius vier Jahre 18:56, 6. Mai 2008 (CEST)
Unicode-Zeichen VS HTML-entities
Beim bearbeiten einiger Artikel ist mir aufgefallen, dass manchmal Unicode-Zeichen, manchmal aber auch HTML-Entities verwendet werden. Gibt es da irgendeine Konvention, wann man was benutzt? Zeichen nur bis U+007F, U+00FF, U+FFFF und darueber HTML-Entities oder so etwas in der Art? Und wenn es eine Konvention gibt, wie ist diese begruendet? Ich habe Schwierigkeiten zu verstehen, warum man noch HTML-Entities benutzen sollte, wenn die Wikipedia doch eh Unicode verwendet. RedNifre 13:31, 6. Mai 2008 (CEST)
- Bei den Unicode-Listen werden aus technischen Gründen (das Skript, das die Tabellen generiert, mag keine Nicht-BMP-Zeichen) für Zeichen über U+FFFF HTML-Entitäten verwendet. Bei anderen Artikeln wird die Entität wohl entweder aus historischen oder ästhetischen Gründen benutzt, eine Regel gibt es nicht. -- Prince Kassad 13:35, 6. Mai 2008 (CEST)
- @RedNifre: Hier geht's vermutlich um den Quelltext der Wikipedia-Seiten. Für HTML-Entitiäten spricht ganz klar, dass sie von Browser, Server und Skripten nicht zerschossen werden können. Wenn ich etwa im Artikel ß das Zeichen für Großes ß einfügen will, gebe ich die HTML-Entität ein[13]. Du hast dann den HTML-Code durch das Zeichen ersetzt[14], was ich für sinnlos halte:
- Erstens wüsste ich nicht, wie ich das Zeichen sonst auf meinem Computer erzeugen könnte.
- Zweitens geht beim Editieren und Upload im Browser sowieso immer etwas schief. Manche Betriebssystems denken auch bei Copy-and-Paste mehr mit, als ich es haben will.
- Und wer weiß, ob auf den Wikipedia-Servern alles erhalten bleibt?
- Nebenbei erleichtern HTML-Entities die Berechnung von Diffs in der Versionsgeschichte.
- Vor allem erleichtert HTML die Fehlersuche. Wenn das große ß in meinem Browswer nicht angezeigt wird, könnte es ja auch an einem fehlerhaften Zeichen im Quelltext liegen! Aber wie sollte ich das herausfinden, wenn da nur ein nicht darstellbares Zeichen steht?
- HTML-Entitäten funktionieren. Zeichen würde ich nur für geläufige Buchstaben verwenden. Umlaute, griechische oder chinesische Buchstaben halte ich für kein Problem, solange aus dem Kontext klar wird, dass der jeweilige Text in einer dieser Sprachen geschrieben ist. Aber wenn ein exotisches Zeichen einzeln irgendwo im Text auftaucht, wäre mir eine HTML-Entity lieber. Da kann ich notfalls nachschlagen, was das eigentlich für ein Zeichen sein soll. --plauz 20:34, 6. Mai 2008 (CEST)
- Nimm eine geeignete Zeichentabelle und kopiere das Zeichen von dort ab.
- Bei mir geht nie etwas schief, alles klappt perfekt.
- Das Argument hat mich zum Aufheitern gebracht...
- Dafür sind HTML-Entitäten größer und machen den Quelltext in Massen unlesbar.
- In MS Word kopieren und Alt+C drücken, und tada, dir wird der Unicode-Codepunkt angezeigt.
- Netscape 4 z. B. mag keine HTML-Entitäten...
- Allerdings ist ein Editwar zwischen HTML-Entität und Zeichen absolut sinnlos. Man sollte es wie in der en.wp handhaben: Wer zuerst kommt, darf auch bleiben. -- Prince Kassad 21:05, 6. Mai 2008 (CEST)
- @RedNifre: Hier geht's vermutlich um den Quelltext der Wikipedia-Seiten. Für HTML-Entitiäten spricht ganz klar, dass sie von Browser, Server und Skripten nicht zerschossen werden können. Wenn ich etwa im Artikel ß das Zeichen für Großes ß einfügen will, gebe ich die HTML-Entität ein[13]. Du hast dann den HTML-Code durch das Zeichen ersetzt[14], was ich für sinnlos halte:
- "Erstens wüsste ich nicht, wie ich das Zeichen sonst auf meinem Computer erzeugen könnte."
- Das verstehe ich nicht. HTML-Entities funktionieren doch nur in sehr speziellen Bereichen?
- "Zweitens geht beim Editieren und Upload im Browser sowieso immer etwas schief. Manche Betriebssystems denken auch bei Copy-and-Paste mehr mit, als ich es haben will."
- Browser, die Unicode-Zeichen zerfetzen sind doch aus der Wikipedia ausgeschlossen. Schliesslich betrifft das alle Zeichen ueber U+007F, also sogar schon die Umlaute und das kleine Eszett. Wenn ein Browser die Umlaute nicht kaputt macht dann hat er auch keine Probleme mit anderen Unicode-Zeichen (korrigiert mich wenn ich mich irre)
- "Und wer weiß, ob auf den Wikipedia-Servern alles erhalten bleibt?"
- Die deutsche Wikipedia (und die meisten anderen) verwenden UTF-8, also gibt es auf den Servern keine Probleme
- "Nebenbei erleichtern HTML-Entities die Berechnung von Diffs in der Versionsgeschichte."
- Diesen Punkt verstehe ich nicht. Kannst du das noch etwas genauer erklaeren?
- "Vor allem erleichtert HTML die Fehlersuche. Wenn das große ß in meinem Browswer nicht angezeigt wird, könnte es ja auch an einem fehlerhaften Zeichen im Quelltext liegen! Aber wie sollte ich das herausfinden, wenn da nur ein nicht darstellbares Zeichen steht?"
- Ich glaube nicht, dass die Wikipedia der geeignete Ort ist, um zu ueberpruefen, ob man eine Schriftart richtig installiert hat. Ich wuerde erst sicherstellen, dass die Schrift installiert ist und danach den passenden Wikipedia-Artikel lesen.
- "HTML-Entitäten funktionieren. Zeichen würde ich nur für geläufige Buchstaben verwenden. Umlaute, griechische oder chinesische Buchstaben halte ich für kein Problem, solange aus dem Kontext klar wird, dass der jeweilige Text in einer dieser Sprachen geschrieben ist. Aber wenn ein exotisches Zeichen einzeln irgendwo im Text auftaucht, wäre mir eine HTML-Entity lieber. Da kann ich notfalls nachschlagen, was das eigentlich für ein Zeichen sein soll. "
- Fuer benannte HTML-Entities mag das stimmen aber meistens findet man doch HTML-Entities die statt eines Namens bloss eine Unicode-Nummer enthalten. Ob man die jetzt auf unicode.org nachschlaegt, oder das Zeichen selbst, macht doch keinen Unterschied? RedNifre 01:24, 8. Mai 2008 (CEST)
- Ich habe in 25 Jahren Informatik zu oft erlebt, wie Murphys Gesetz zuschlägt. Wenn ich also mit wenig Aufwand eine potentielle Fehlerquelle ausschließen kann, tue ich das auch. Wenn bei dem Zusammenspiel aus Benutzer, Betriebssystem und Browser auf Endnutzerseite, Betriebssystem, Server und Skripten auf Wikipedia-Seite etwas schief geht, bist du für jede Arbeitserleichterung dankbar. Es macht das Leben so viel einfacher, wenn dann im Quelltext der Wikipedia etwas steht, was ich unabhängig von meinen (fehlerhaften?) Browsereinstellungen zuverlässig und einfach prüfen kann.
- Mit HTML-Entity meine ich beides, benannte Zeichen wie ß und Unicode-Zeichen wie ẞ.
- Die Frage, wie ich etwa ein großes ß in Wikipedia eingeben soll, ist nicht so trivial, wie sie klingen mag. Wo soll ich das Zeichen denn kopieren? Ich habe keine Zeichentabelle, die funktioniert. Oder soll ich's aus der Wikipedia kopieren, wo aber vielleicht ein falsches Zeichen steht, ich es aber nicht gemerkt habe?
- Wenn ich statt dessen ẞ eingebe, kann ich selbst und andere im Quelltext auf einen Blick erkennen, dass das richtige Zeichen da steht. Beim Versionsvergleich ist das auch hilfreich. Denn wenn im Diff steht "?" wurde durch "?" ersetzt, sagt mir das garnix. Wenn dort aber steht "ẞ" wurde durch "ẟ" ersetzt, sehe ich sofort, dass da einer das Zeichen verhunzt hat.
- Mir geht's hier ja nur um einzelne, freistehende, unübliche oder leicht verwechselbare Zeichen, wie großes ß oder langes s. Ich würde also auch kyrillische oder chinesische Einzelzeichen in einem deutsch- oder englischsprachigen Text in der Form &#x....;" codieren. In einem chinesisch-sprachigen Artikel fände ich dagegen Zeichen für den chinesischen Text passender. Diese Vorgehensweise erleichtert einfach die Korrektur.
- Die Probleme mit Copy and Paste dürftest du vielleicht von Texteditoren kennen. Hast du schon mal einen 15 Jahre alten DOS-Text unter Linux oder Mac OS X geöffnet? Und dann versucht zu konvertieren, dass alle Sonderzeichen und Umlaute hinterher wieder stimmen? Da geht einfach sehr schnell sehr viel schief. Oder hast du schon mal in deinem Browser von Hand eine andere Textcodierung einstellen müssen, weil die Webseite anders codiert war, als es der Header behauptet? Meine Meinung ist also: im Zweifel eine Notation verwenden, die mit simplen ASCII-Zeichen auskommt. --plauz 16:30, 8. Mai 2008 (CEST)
- Fuer benannte HTML-Entities mag das stimmen aber meistens findet man doch HTML-Entities die statt eines Namens bloss eine Unicode-Nummer enthalten. Ob man die jetzt auf unicode.org nachschlaegt, oder das Zeichen selbst, macht doch keinen Unterschied? RedNifre 01:24, 8. Mai 2008 (CEST)
- "Erstens wüsste ich nicht, wie ich das Zeichen sonst auf meinem Computer erzeugen könnte."
Steuerzeichen
Hi. Ich bin noch nicht ganz glücklich mit der Behandlung der Steuerzeichen in Unicode-Block Basis-Lateinisch, Unicode-Block Lateinisch-1, Ergänzung. Es ist zwar korrekt, dass diese keine offizielle Bezeichnung haben, aber sie haben zumindest Alternativnamen. Jetzt stelle ich mir folgende Fragen:
- Ist es sinnvoll, in der Spalte „Offizielle Bezeichnung“ den Alternativnamen einzutragen? Vielleicht mit erläuternder Fußnote oder sonstiger Markierung?
- Ist es sinnvoll, in der Spalte „Zeichen“ das passende Code-Kürzel hinzuschreiben (z. B. „NUL“ oder „STX“)? Vielleicht mit erläuternder Fußnote oder sonstigem Hinweis? -- j ?! 12:55, 4. Jan. 2008 (CET)
Probleme mit Quellenangaben
Liste der Unicode-Zeichen/1000 bis 1FFF#1800–18AF Mongolisch - wie man sieht, werden alle Quellen einer Übersichtsseite immer in dem Block angezeigt, in dem als letztes Quellen verwendet werden, was aber sicherlich nicht gewünscht ist. Wie beheben wir das Problem? Mein Vorschlag wäre, mit einem <references/> die Referenzen ganz unten auf der Seite anzuzeigen, nur da wäre wiederum keine Abgrenzung vom letzten Block sichtbar. -- Prince Kassad 07:16, 11. Feb. 2008 (CET)
Bitte weiter vervollständigen. --Reiner Stoppok 20:43, 15. Mär. 2008 (CET)
Ich bitte um Korrekturvorschläge (ich habe U+A71B bis U+A71F entfernt). --Reiner Stoppok 20:45, 15. Mär. 2008 (CET)
www.decodeunicode
Bitte nur anführen, wenn dort auch was steht. Wenn nicht, dann bitte löschen. --Reiner Stoppok 22:55, 15. Mär. 2008 (CET)
UTF-8-Byte-Sequenzen in Zeichen-Artikeln komplett sinnlos?
(Ich habe das hier gerade von Wikipedia:Fragen zur Wikipedia hierher kopiert, da es hier wohl besser hinpasst) RedNifre 13:05, 6. Mai 2008 (CEST)
In vielen Wikipedia-Artikeln die sich mit Schriftzeichen befassen finden sich UTF-Hexadezimal-Sequenzen (hauptsaechlich UFT-8). Ich halte das fuer vollkommen sinnlos und wuerde mir eine Wikipedia-weite Richtlinie zur Vermeidung von UTF-Sequenzen wuenschen. Wo ist der richtige Ort, um darueber zu diskutieren? Hier? RedNifre 20:39, 5. Mai 2008 (CEST)
- Vorerst kann man darüber ja mal hier sprechen (ob es überhaupt Änderungsbedarf gibt), ansonsten vielleicht Wikipedia Diskussion:UTF-8-Probleme; falls eine Entscheidung der Community notwendig sein sollte vllt. auch ein Meinungsbild. Für die technisch weniger versierten: Was genau meinst du denn mit UTF-Hexadezimal-Sequenzen? So lustige Sonderzeichen wie in meiner Signatur? Oder die &irgendwas;, wie z.B.
†
bzw.
? --Church of emacs ツ ⍨ 21:14, 5. Mai 2008 (CEST)
- Hier ist mal ein Zitat aus dem Eszett-Artikel:
Zeichen | Unicode Position |
Unicode Bezeichnung |
Bezeichnung | HTML hexadezimal |
HTML dezimal |
HTML benannt |
UTF-8 hexadezimal |
---|---|---|---|---|---|---|---|
ß | U+00DF | LATIN SMALL LETTER SHARP S | Lateinischer Kleinbuchstabe Eszett | ß | ß | ß | C3 9F |
ẞ | U+1E9E | LATIN CAPITAL LETTER SHARP S | Lateinischer Großbuchstabe Eszett | ẞ | ẞ | - |
Ich beziehe mich hier auf das "C3 9F" in der letzten Spalte, bzw. die komplette UTF-8-Spalte. In sehr vielen Artikeln zu Sonderzeichen steht die UTF-8-Byte-Sequenz. Ich halte das aus folgenden Gruenden fuer unsinnig:
- In der Praxis wird diese Sequenz von einem Programm automatisch aus dem Unicode-Zeichen generiert und auch wieder automatisch dekodiert. Ein Benutzer sieht diese Sequenz eigentlich nie.
- Man kann solche Sequenzen auch nirgends eingeben. Moechte man ein Unicode-Zeichen eingeben, so gibt man dessen Nummer ein und nicht eine Byte-Folge aus irgend einem UTF
- Mir leuchtet auch nicht ein, warum man gerade UTF-8-Bytes schreibt, nicht aber die zugehoerige UTF-16-Sequenz oder UTF-32
- Man kann bei UTF-8-Sequenzen auch kaum nachvollziehen, wie diese Byte-Sequenz mit dem Zeichen zusammenhaengt. Dies vermittelt meiner Meinung nach den Eindruck, als haette jedes Zeichen eine wahllos festgelegte Byte-Folge zugewiesen bekommmen. (Was ja Unsinn ist)
- Ich kann mir absolut keine Situation vorstellen, in der man diese Byte-Folge gebrauchen koennte.
RedNifre 23:20, 5. Mai 2008 (CEST)
- Verstehe ich es richtig, dass du die Angaben der UTF-8-codierten Bytefolgen in solchen Zeichentabellen für unnötig hältst? Du hast natürlich recht, dass dies nur eine Umkodierung der Unicode-Angabe ist und somit überflüssig. Auch die Wahl von UTF-8 (und nicht UTF-16 oder -32) ist natürlich in gewisser Hinsicht willkürlich. Wenn man aber bedenkt, dass vermutlich 95% aller Unicode-Texte in UTF-8 kodiert werden, ergibt dies wieder halbwegs Sinn. Ich finde, die Angabe stört nicht wirklich und kann daher ruhig stehen bleiben, da sie ja nicht stören. --APPER\☺☹ 23:26, 5. Mai 2008 (CEST)
- Hm, wenn ich es richtig verstehe ist deine Einstellung "Wenn es nicht schadet kann es bleiben". Ich hingegen bin der Meinung "Wenn es niemandem nuetzt sollte es weg". Wenn ich dich richtig verstehe wuerde es dich auch nicht stoeren, wenn da auch UTF-16 und UTF-32 stehen wuerde.
- "Wenn man aber bedenkt, dass vermutlich 95% aller Unicode-Texte in UTF-8 kodiert werden, ergibt dies wieder halbwegs Sinn." Das sehe ich nicht so. Man liest ja UTF-8-Texte nicht, indem man sich die Bytes anschaut, sondern indem man es automatisch konvertieren laesst.
- Und selbst WENN man sich die Bytes als Hexadezimalwerte anschaut: Man wuerde dann auch nicht die UTF-8-Sequenzen in der Wikipedia nachschlagen (Wie auch?). Wenn man keinen Dekoder hat wuerde man es von Hand dekodieren um auf das Unicode-Zeichen zu kommen und dann wuerde man das dekodierte Zeichen direkt nachschlagen.
- Also, ich bin jedenfalls der Meinung, dass "schadet nicht" nicht ausreicht um etwas in die Wikipedia zu schreiben. Es sollte "mindestens irgendjemandem in irgendeiner Situation nuetzlich sein". Und ich kann mir beim besten Willen keine Situation vorstellen, in der man zu einem ganz bestimmten Zeichen die zugehoerige UTF-8 Sequenz nachschlagen wollte. RedNifre 23:54, 5. Mai 2008 (CEST)
- So what? Es gibt hier keinen Speicherplatzmangel, so dass es wegmüsste, und soweit ich weiß haben wir hier noch immer die Prämisse, dass wir Informationen behalten, als dass wir sie einfach auslassen und jemand kommt und dann Fragen stellt. --87.168.54.114 01:02, 6. Mai 2008 (CEST)
- What? That: wir haben als Enzyklopädisten die Aufgabe, aus der Masse an Information das relevante Wissen herauszuarbeiten und für unsere Leser verständlich und sinnvoll aufzubereiten. Sinnlose und irrelevante Information (wenn das hier der Fall ist, zum konkreten Fall habe ich keine Meinung) sollte selbstverständlich verschwinden, damit es weniger rauscht. --elya 07:04, 6. Mai 2008 (CEST)
- Ich bin normalerweise auch immer für Behalten, aber in dem Falle kommt mir das auch recht unnütz vor. Außerdem müsste das sonst noch jemand für das große Eszett ausrechnen.
- Wenn jemand einen UTF-8-Codierten Text lesen wollte, würde er seine Werkzeuge habe, um die Zeichen zu (de)kodieren. Allerdings macht das Lesen als Sedezimalcode wenig Sinn, wenn man nicht gerade irgendwelche Steuerzeichen bearbeiten will, die nicht angezeigt werden. Ansonsten ist das Bearbeiten mit einem normalen Plaintexteditor viel einfacher und effektiver. --Nico Düsing (Diskussion) 12:12, 6. Mai 2008 (CEST)
- @RedNifre: "Ich kann mir absolut keine Situation vorstellen, in der man diese Byte-Folge gebrauchen koennte." -- Geht mir auch so. Die eigentliche Unicode-Nummer ist wichtig, um das Zeichen zu identifizieren. Die HTML-Codes sind praktisch, wenn man die Zeichen in Webseiten einbauen will. Beides brauche ich häufiger. Aber UTF-8? Ich kann mir auch keine Situation vorstellen, wo ich UTF-8 von Hand codieren oder decodieren würde.
- @elya: Volle Zustimmung. Ich sehe den Wert einer Enzyklopädie ebenfalls in der klugen Auswahl relevanter Informationen.
- Von mir aus kann die UTF-8 Darstellung aus Zeichenbeschreibungstabellen durchaus weg, solange keine konkreten Anwendungsfälle bekannt sind. --plauz 18:49, 6. Mai 2008 (CEST)
Da ich mir momentan ziemlich sicher bin, dass UTF-8-Hexadezimal-Byte-Sequenzen niemandem etwas nuetzen, werde ich sie in Zukunft loeschen und einen Link auf diese Diskussion als Edit-Kommentar angeben. Falls es jemanden gibt, der einen Sinn im UTF-8-Kram erkennt, wird er so auf diese Diskussion aufmerksam gemacht und kann seine Argumente hier einbringen. RedNifre 01:07, 8. Mai 2008 (CEST)
- Ich finde die Diskussion sehr seltsam; meiner Ansicht nach sind gerade die UTF8-Sequenzen die Form, in der einem diese Unicode-Zeichen am häufigsten unterkommen. Beispielsweise in den URLs in der Wikipedia: http://de.wikipedia.org/wiki/%C3%9F ist eben das ß, und wenn mir mal bei einem Artikel statt eines Zeichens nur ein Kästchen dargestellt wird, weil mir irgendein Font fehlt, kann ich mit der UTF8-Sequenz aus der URL wunderbar nachschlagen, welches Zeichen denn da zu sehen sein soll. Damit wäre bewiesen, dass diese Angaben nicht sinnlos sind, q.e.d., und ich hoffe das massenhafte Entfernen entfällt nun und mit der Zeit wird was besseres angefangen? — PDD — 19:07, 8. Mai 2008 (CEST)
- Aehm, wie kannst du denn nachschlagen, was eine UTF-8 Sequenz bedeutet? (Die umgekehrte Richtung ist mir klar) RedNifre 21:19, 8. Mai 2008 (CEST)
- So wie ich alles in der Wikipedia nachschlage, mit Google (in diesem Fall z. B. mit [15]). — PDD — 00:38, 9. Mai 2008 (CEST)
- Ah, okay. Dann gibt es wohl doch eine Moeglichkeit, einen Nutzen aus den UTF-8-Sequenzen zu ziehen. Ich habe mich geirrt. RedNifre 01:14, 9. Mai 2008 (CEST)
Wenn ich nach eigentlich schon abgeschlossener Diskussion auch noch meinen Senf dazugeben darf: Zufällig schreibe ich gerade an einem CGI-Skript in Perl, das ein Formular auswerten und die Daten in einer in UTF-8 kodierten E-Mail versenden soll (und dies inzwischen auch tut). Dabei war ich sehr froh, dass unter UTF-8 eine Tabelle verlinkt ist, in der die UTF-8-Werte für alle Zeichen aufgelistet sind, weil das Skript zum einen die UTF-8-kodierten Eingaben teilweise ‚von Hand‘ in HTML-Entities zur Anzeige auf einer automatisch generierten Antwortseite oder in entsprechende ASCII-Zeichen zur Erzeugung von Dateinamen umwandeln (also z. B. aus dem UTF-8-Kode von <č> ein <c> machen) muss und weil ich zum anderen gern selbst Text in ein UTF-8-kodiertes E-Mail schreiben würde, wozu ich folgende Variablen festgelegt habe:
$Ae = chr(0xc3) . chr(0x84); $Oe = chr(0xc3) . chr(0x96); $Ue = chr(0xc3) . chr(0x9c); $ae = chr(0xc3) . chr(0xa4); $oe = chr(0xc3) . chr(0xb6); $ue = chr(0xc3) . chr(0xbc); $ss = chr(0xc3) . chr(0x9f);
Ich weiß nicht, ob diese Informationen deshalb unbedingt auch in der Wikipedia stehen müssen, aber dass es sie irgendwo gibt, fand ich jedenfalls sehr sinnvoll. --Daniel Bunčić ? ♥ ± 10:16, 11. Mai 2008 (CEST)
Ich musste die UTF-8-Sequenzen schon benutzten, es gibt gelegentlich Texte, die sind als UTF-8 deklariert aber tatsächlich als ISO-8859 oder CP1252 gespeichert. Da hilf nur noch ein HEX-Editor um nachzuschauen (oder zumindest abzuschätzen) in welcher Kodierung der Text vorliegt. Wernfried 14:24, 30. Mai 2008 (CEST)
Gesamtzahl an Zeichen (NICHT Code-Points)
Oft liest man, Unicode haette Platz fuer 1.114.112 "Zeichen". Das ist aber auf jeden Fall falsch, es sind definitiv weniger. Zieht man die Surrogates (2048) und die Nonchars(66) ab bleiben maximal 1.111.998 Unicode-Zeichen. Allerdings bin ich mir auch nicht sicher, ob 1.11998 wirklich die korrekte Anzahl an theoretisch moeglichen Zeichen darstellt, oder ob es noch weniger sind. Was meint ihr? RedNifre 00:36, 8. Mai 2008 (CEST)
- Im Standard steht: "The Unicode Standard contains 1,114,112 code points, most of which are available forencoding of characters." So ähnlich sollte man es auch hier schreiben. Der grösste Teil der verfügbaren Code-Points ist ja nicht definiert, d. h. man weiss heute noch gar nicht ob dafür später einmal Zeichen oder anderes definiert werden. Aktuell werden diese Zahlen aufgelistet:
- Graphic: 100.507, Format: 141, Control: 65, Private Use: 137.468, Surrogate: 2.048, Noncharacter: 66, Reserved: 873.817, Summe: 1.114.112 :http://www.unicode.org/versions/Unicode5.1.0/
- Im Artikel Unicode steht, es seien 100.713 Zeichen, weshalb "Format" und "Control" dazu gezählt sind weiss ich nicht.
- Wernfried 11:20, 14. Mai 2008 (CEST)
- 100713 ist aber bloss die Anzahl der bereits definierten Zeichen. Ich frage mich nur, wie viele Zeichen man maximal definieren koennte. 1.111.998 oder weniger? RedNifre 13:33, 14. Mai 2008 (CEST)
- Es sind 1.114.112 Code-Points definiert, davon sind noch 873.817 frei. Es ist also noch Platz für 873.817 Zeichen, obwohl man davon ausgehen kann, dass auch noch "Noncharacters" oder "Surrogates" definiert werden. Wernfried 14:39, 30. Mai 2008 (CEST)
- 100713 ist aber bloss die Anzahl der bereits definierten Zeichen. Ich frage mich nur, wie viele Zeichen man maximal definieren koennte. 1.111.998 oder weniger? RedNifre 13:33, 14. Mai 2008 (CEST)
Pressemitteilung auf Wikipedia:Kurier
Hab's gerade gelesen. Tolle Sache. – Simplicius 2004-2008 19:18, 5. Jun. 2008 (CEST)
- 축하합니다, 恭喜恭喜, Glückwunsch --chrislb 13:57, 7. Jun. 2008 (CEST)
Da ich so eine Liste vermisste (die die handlichen Kurzbezeichnungen mit dem Zugriff auf die ausführlichen Artikel verbindet), habe ich sie gestern kurzerhand selber gebastelt, ohne mich vorher mit dem Procedere vertraut zu machen – zuerst ohne deutsche Bezeichnungen, aber dann hat mich Reiner überzeugt, die enlischen zu übersetzen. Dabei bin ich bei folgenden Übersetzungen noch unsicher:
- Radikal 23 hiding enclosure „Versteck“
- Radikal 29 again „erneut“
- Radikal 34 go „gehen, fahren“, Radikal 162 walk „gehen“
- Radikal 35 go slowly „langsam gehen / fahren“ vgl. Radikal-Einträge!
- Radikal 37 big „groß“, Radikal 189 tall „hoch“
- Radikal 49 oneself „selber“, Radikal 132 self „selbst“
- Radikal 58 snout „Schnauze, Schweinerüssel“
- Radikal 66 rap „klopfen“
- Radikal 77 stop „Halt“, Radikal 138 stopping „aufhören“
- Radikal 91 slice „Schnitte“
- Radikal 113 spirit „Geist“, Radikal 194 ghost „Gespenst“
- Radikal 149 speech „Sprache, Rede“
Ein oder zwei davon habe ich auch in Benutzer:Buncic/Unicode/CJK-Radikale, Ergänzung verwendet. Da interessiert mich aber mehr, ob die Zusätze „(links), (rechts), (oben), (unten)“ so verständlich sind oder näher erläutert werden müssen. -- Olaf Studt 16:58, 15. Apr. 2008 (CEST)
- Langfristig sollte sich die Übersetzung noch stärker an den englischen Originalbezeichnungen orientieren, also immer mit "Kangxi-Radikal" davor. (Es gibt ja viele weitere Radikalsysteme mit x, y, z Radikalen, z.B. im Cihai, im Xiandai Hanyu cidian usw.) Auch sollte m.E. bei stärkeren Abweichungen von Unicode - die fachlich berechigt sein mögen - dann in Klammern o.ä. darauf hingewiesen werden. --Reiner Stoppok 15:36, 18. Mai 2008 (CEST)
Fragwürdige Übersetzung
Ich habe mir erlaubt, am 17. Juni 2008 so einfach etwas zu ändern, wie ich meinte zum Deutlicheren; damit habe ich Missfallen erregt, siehe die Versionsgeschichte (Radikal 44 bedeutet in 1.Linie Körper vs. "corpse" ist eindeutig "Leiche"). Nach wie vor bin ich der Meinung, dass die Semantik unter "Offizielle Bezeichnung (KANGXI RADICAL)" wohl nicht so ganz dogmatisch eng genommen werden darf; und "Leiche" finde ich als zu eng gefasst für Radikal 44. Deshalb wollte ich zur Diskussion stellen, ob gelegentlich eine grosszügigere Interpretation besser sei als die wörtliche Übersetzung; siehe auch Diskussion:Liste_traditioneller_Radikale#Radikal_44_bedeutet_in_1.Linie_K.C3.B6rper_.3F.
Viele Zeichenverbindeungen mit 尸 haben überhaupt nichts mit "Leiche" zu tun, aber sehr wohl mit "Körper". Zum Beispiel die Glyphen 尿 (Wasser 水 unter 尸) für Miktion, und 屎 (Reis 米 unter 尸) für Defäkation beschreiben Vorgänge, die doch nun wirklich mehr mit (lebenden) Körpern, als mit Leichen zu tun haben.
Ich kann gut damit leben, wenn 尸 für tot erklärt wird; aber stur, wie ich bin, meine ich einstweilen immer noch, dass "Körper; Leiche" oder dgl. besser sei als nur "Leichnam". Freundliche Grüsse, wdh --193.196.166.161 13:20, 20. Jun. 2008 (CEST)
Weblinks nach decodeunicode
Hiermit schlage ich vor, die Weblinks nach Grafische Informationen des Wiki-Projekts decodeUnicode überall herauszunehmen. Ich habe einfach zu oft dabei in informationslose Leere geklickt. --Reiner Stoppok 21:54, 26. Jun. 2008 (CEST)
- Auf einzelne Zeichen verweisen wir ja nicht, und zu den Blöcken ist in den allermeisten Fällen dort etwas eingetragen (auch wenn vor allem die neuen Blöcke aus Unicode 5.1 noch fehlen). Aber um den Text geht es mir gar nicht so sehr, der Link-Text sagt ja deutlich: "Grafische Informationen". Das ist der Mehrwert für die Wikipedia-Leserin: ein schönes, großes Bild jedes einzelnen Zeichens, ohne dass man erst umständlich ein PDF herunterladen, den Adobe Reader starten (oder gar erst noch installieren?) und dort die entsprechende Stelle heranzoomen muss. (Außerdem: Allein schon weil es auch ein Wiki ist, sollte man solidarisch sein... ;-) ) --Daniel Bunčić 07:28, 27. Jun. 2008 (CEST)
- Das bekommt man woanders doch genauso. Entweder, die da strengen sich etwas mehr an und bringen da wesentlich mehr Vollzähligkeit rein, oder es sollte verschwinden. --Reiner Stoppok 23:44, 28. Jun. 2008 (CEST)
- In den Unicode 5.1-Blöcken kann der Link wirklich raus (was ich größtenteils bereits erledigt habe), aber in den anderen Blöcken bietet der Link einen Mehrwert gegenüber den PDFs, vor allem, da auch die Zeicheneigenschaften erwähnt werden (das vermisse ich in den Unicode.org-PDFs) -- Prince Kassad 00:34, 29. Jun. 2008 (CEST)
- Das bekommt man woanders doch genauso. Entweder, die da strengen sich etwas mehr an und bringen da wesentlich mehr Vollzähligkeit rein, oder es sollte verschwinden. --Reiner Stoppok 23:44, 28. Jun. 2008 (CEST)
- Wenn man es anderswo genauso bekommt, können wir meinetwegen auch gern auf eine andere Seite verlinken. Wo gibt es das denn noch? --Daniel Bunčić 07:56, 29. Jun. 2008 (CEST)
- Wenn ich es richtig sehe, gibt es das hier doch auch. Mich hat einfach der zu kleine Zeichenbestand gestört. --Reiner Stoppok 13:09, 29. Jun. 2008 (CEST)
Unicode-Block Vai
Ich bin mit den jüngsten Versionen des Unicode-Block Vai nicht einverstanden. Wir hatten doch bereits darüber den Konsens erzielt, die Sonderzeichen gänzlich zu vermeiden (oder falls unumgänglich, in Klammern eine wissenschaftliche Transkription dahinter zu setzen, vgl. Unicode-Block Kyrillisch). --Reiner Stoppok 03:30, 13. Jun. 2008 (CEST)
- Ich dachte nur, weil die deutsche Spalte 1:1 gleich der englischen war ... -- Olaf Studt 08:53, 27. Jun. 2008 (CEST)
- Tja. - Was nun? --Reiner Stoppok 23:35, 28. Jun. 2008 (CEST)
- So, wie du es jetzt gemacht hast, finde ich es ganz gut. Eine Variante wäre höchstens, dass man die "Afrika-Schreibweise" übernimmt, solange sie keine Sonderzeichen enthält. Allerdings wäre die Benennung dann bemerkbar uneinheitlich. Aber warum sind die Namen in Klammern denn kleingeschrieben? Muss das so sein? Und noch etwas: Hieltet ihr es für sinnvoll, die Tabelle in den Artikel Vai-Schrift zu integrieren? Ein Unicode-Listen-Gegner (weiß nicht mehr wer's war) forderte dies ja bereits für einen anderen Block, der so wie dieser hier nur eine einzige und wenig bekannte Schrift enthielt. In einem solchen Fall wäre die Abhandlung in einem einzigen Artikel ja durchaus möglich. Oder soll alles besser separat bleiben? Gismatis 00:59, 29. Jun. 2008 (CEST)
- Die Buchstabennamen sollten auch in den Klammern groß geschrieben werden. Auf keinen Fall darf ein Durcheinander entstehen zwischen den verschiedenen Schreibweisen, da ist die jetzige Lösung m.E. optimal. In einigen Artikeln sind die entsprechenden Unicode-Tabellen ja bereits integriert. Der Block sollte aber auch für sich bestehen bleiben. (Ich nehme an, das war hier auch so gemeint.) --Reiner Stoppok 13:17, 29. Jun. 2008 (CEST)
Von Benutzer Diskussion:Olaf Studt#Unicode-Block Vai kopiert --Gismatis 02:50, 8. Jul. 2008 (CEST): Hallo Olaf, ich bin das ganze Silbenalphabet durchgegangen und habe deine eingetragenen Schreibweisen mit den angegebenen Quellen verglichen. Dabei habe ich viele Unterschiede ausgemacht. Einige Schreibweisen habe ich überhaupt nicht gefunden. Die beiden Übersichten unterscheiden sich ebenfalls. Wie war es dir also möglich, diese Schreibweisen einzutragen? Gismatis 01:03, 7. Jul. 2008 (CEST)
- Meine Version ist sozusagen einen Synthese aus SIL (ɔ, ɛ, ~, ŋ) und Omniglot (mɓ, ɖ); für das bei Omliglot als c und bei SIL als ch angegebene Phonem habe ich in Afrika-Alphabet in der Spalte LR das č gefunden. Da ich mit der Schrift nicht vertraut bin, können mir dabei Fehler unterlaufen sein. Wie ich grad sehe, müssten nach Omniglot die ndV-Silben eigentlich nɖV lauten. -- Olaf Studt 10:58, 7. Jul. 2008 (CEST)
- Wenn das so ist, würde ich die Schreibweisen lieber wieder herausnehmen, wenn du nicht wahnsinnig daran hängst. Denn es bleibt unklar, inwieweit das Afrika-Alphabet als Transkription der Vai-Schrift überhaupt eine Rolle spielt, bzw. ob es überhaupt einen Standard für die Transkription gibt. Gismatis 02:50, 8. Jul. 2008 (CEST)
- Tja, da ist mir die Recherche wohl unter der Hand zur Theoriefindung ausgeartet. Ich werde dann mal ein paar Beispiele zur Umschrift in Vai-Schrift ein- und die Afri-Klammern aus Unicode-Block Vai ausbauen. -- Olaf Studt 09:36, 9. Jul. 2008 (CEST)
- Wenn das so ist, würde ich die Schreibweisen lieber wieder herausnehmen, wenn du nicht wahnsinnig daran hängst. Denn es bleibt unklar, inwieweit das Afrika-Alphabet als Transkription der Vai-Schrift überhaupt eine Rolle spielt, bzw. ob es überhaupt einen Standard für die Transkription gibt. Gismatis 02:50, 8. Jul. 2008 (CEST)