Zum Inhalt springen

„Diskussion:Unicode“ – Versionsunterschied

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 17 Jahren von Cäsium137 in Abschnitt Doppelung der Blöcke-Liste
Inhalt gelöscht Inhalt hinzugefügt
Cäsium137 (Diskussion | Beiträge)
Cäsium137 (Diskussion | Beiträge)
Zeile 192: Zeile 192:
Lieber Cäsium137, was soll denn diese Änderung? Wozu brauchen wir denn plötzlich wieder eine [[Liste der Unicode-Blöcke]] mit den (nun plötzlich per Vorlageneinbindung gedoppelten) gleichen Informationen wie im Artikel [[Unicode]]? Diese Liste war ja vorher im gleichnamigen Artikel drin und ist dann nach Diskussion hierher verschoben worden, woraufhin der Spezialartikel [http://de.wikipedia.org/w/index.php?title=Spezial:Logbuch&page=Liste_der_Unicode-Bl%C3%B6cke gelöscht] wurde; nun haben wir plötzlich eine völlig unnötige Redundanz. --[[Benutzer:Buncic|Daniel Bunčić]] <sup>[[Benutzer Diskussion:Buncic|?]]&nbsp;[[Benutzer:Buncic/Vertrauenslink|♥]]&nbsp;[[Benutzer:Buncic/Bewertung|±]]</sup> 06:09, 15. Mär. 2008 (CET)
Lieber Cäsium137, was soll denn diese Änderung? Wozu brauchen wir denn plötzlich wieder eine [[Liste der Unicode-Blöcke]] mit den (nun plötzlich per Vorlageneinbindung gedoppelten) gleichen Informationen wie im Artikel [[Unicode]]? Diese Liste war ja vorher im gleichnamigen Artikel drin und ist dann nach Diskussion hierher verschoben worden, woraufhin der Spezialartikel [http://de.wikipedia.org/w/index.php?title=Spezial:Logbuch&page=Liste_der_Unicode-Bl%C3%B6cke gelöscht] wurde; nun haben wir plötzlich eine völlig unnötige Redundanz. --[[Benutzer:Buncic|Daniel Bunčić]] <sup>[[Benutzer Diskussion:Buncic|?]]&nbsp;[[Benutzer:Buncic/Vertrauenslink|♥]]&nbsp;[[Benutzer:Buncic/Bewertung|±]]</sup> 06:09, 15. Mär. 2008 (CET)


Weil nicht auszuschließen ist, dass jemand irgendwann den Titel des Abschnitts ändert. Dann funktioniert das Redirect nicht mehr. Ich halte es für sinnvoller, die Liste separat zu halten. <span class="signaturcaesium137">[[Benutzer:Cäsium137|Cäsium137]]&nbsp;[[Benutzer_Diskussion:Cäsium137|(D.)]]</span> 09:52, 15. Mär. 2008 (CET)
Da sowieso revertiert wurde, ist das hinfällig. eigentlich ist es mir auch ....egal. <span class="signaturcaesium137">[[Benutzer:Cäsium137|Cäsium137]]&nbsp;[[Benutzer_Diskussion:Cäsium137|(D.)]]</span> 09:54, 15. Mär. 2008 (CET)

Version vom 15. März 2008, 10:54 Uhr

Diese Diskussionsseite dient dazu, Verbesserungen am Artikel „Unicode“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.

Code Points

Der Artikel zu Unicode sagt nichts über Code Points aus, die aber ein essentielles Konzept des Standards sind.


Kann Unicode auch Zeichen aus dem Vietnamesischen, mit zwei diakritischen Zeichen darstellen? --Jan G 08:08, 5. Mai 2004 (CEST)Beantworten

Aber selbstvverständlich. Für Vietnamesisch stehen kombinierte Zeichen in U+1E00 - U+1EFF zur Verfügung. Zum Stapeln beliebiger Diakritika braucht man OpenType, sollte in M$-Office klappen. - J

(mit leerzei...

Auf dem Weg zur Exzellenz?

Ich habe jetzt so einiges am Artikel getan. Wesentliches fällt mir im Moment nicht mehr ein, vielleicht noch ein bißchen Kleinkram und ein paar Illustrationen, siehe OpenType. Noch tiefer in die Materie einzusteigen hat meines Erachtens wenig Sinn. Ich habe mich bemüht, einige Aspekte repräsentativ abzuhandeln. Das Unicode-Buch umfaßt schlappe 1500 Seiten, und selbst da steht nicht alles Wichtige drin. Im übrigen bin ich nicht ganz sicher, ob ich alle Leerzeichen gefunden habe. Fehlt da noch was?

0020 SPACE
00A0 NO-BREAK SPACE
2000 EN Quad
2001 EM Quad
2002 EN SPACE
2003 EM SPACE
2004 THREE-PER-EM SPACE
2005 FOUR-PER-EM SPACE
2006 SIX-PER-EM SPACE
2007 FIGURE SPACE
2008 PUNCTUATION SPACE
2009 THIN SPACE
200A HAIR SPACE
200B ZERO WIDTH SPACE
202F NARROW NO-BREAK SPACE
205F MEDIUM MATHEMATICAL SPACE
2060 WORD JOINER
3000 IDEOGRAPHIC SPACE
FEFF ZERO WIDTH NO-BREAK SPACE --Jirret 05:25, 31. Jan 2005 (CET)

Was noch fehlt

In ähnlicher Weise wie über die Kodierungskriterien gedenke ich, einen Überblick über das zum Unicode gehörende Regelwerk einzufügen. Das ist ziemlich viel Stoff, und eine vernünftige Auswahl will wohl überlegt sein. Einserseits hat es keinen Zweck, sich in Details zu verlieren, andererseits muß eine angemessen knappe Darstellung ausreichend exakt sein. Vermutlich werde ich im April dazu kommen.

Den Abschnitt „Geschichte“ gedenke ich um die Entstehungsgeschichte des Unicode-Consortiums zu ergänzen und nach Unicode Consortium zu verlagern. --Jirret 18:24, 10. Feb 2005 (CET)

Schriftart

Gibts eigentlich keine kostenlose Unicodeschriftart, die den kompletten chinesischen / japanischen Schriftsatz beinhaltet? Suche verzweifelt danach.

Danke, Abdull

Wenn Du mit "komplett" meinst, einschließlich der Erweiterungen in en:GB 18030 ist es etwas eng. Ansonsten empfehle ich wegen der universellen Nützlichkeit en:TITUS Cyberbit Basic, die Downloadseite ist leider öfter mal überlastet. Weitere Möglichkeiten stehen ausführlich auf Alans Seite http://www.alanwood.net/unicode/fonts.html --Pjacobi 22:25, 19. Mai 2005 (CEST)Beantworten

Altgriechisch mit Unicode

ich habe den abschnitt in den artikel eingefügt, weil ich die ergebnisse meines "rumprobierens" nutzbar machen wollte. ich hoffe, das ist nicht zu praxisbezogen - wenn ja, kann es ja jemand auf die diskussionsseite stellen. ich denke aber, dass es nicht wenige benutzer gibt, die altgriechische wörter und sätze in der Wikipedia lesen und schreiben wollen. -- NeumonD 17:14, 31. Okt 2005 (CET)

Meiner Meinung gehört die Anleitung wie man Altgriechisch auf dem IE darstellt definitiv nicht hierher. Insbesondere als dass Du hierfuer ISO-8859-7 als Codetabelle benutzt und den IE dazu bringst die als Default zu benutzen. Das hat definitiv nichts mit Unicode zu tun. Im folgenden der originale Absatz. -- anonymous, 2005-12-14

Altgriechisch mit Unicode

Die meisten Unicode-Schriften stellen nur diejenigen Buchstaben und Zeichen dar, die im Neugriechischen Verwendung finden (Unicode-Tabelle "Greek and Coptic" PDF). Es handelt sich um folgende Zeichen:

Α α Ά ά Β β Γ γ Δ δ Ε ε Έ έ Ζ ζ Η η Ή ή Θ θ Ι ι Ί ί Ϊ ϊ ΐ Κ κ Λ λ Μ μ Ν ν Ξ ξ Ο ο Ό ό Π π Ρ ρ Σ σ ς Τ τ Υ υ Ϋ ϋ Ύ ύ ΰ Φ φ Χ χ Ψ ψ Ω ω Ώ ώ ; ·

Die Eingabe dieser Zeichen kann z.B. so erfolgen, dass eine passende Unicode-Schriftart gewählt wird und dann das Tastenlayout auf Griechisch umgestellt wird.

Für das Schreiben und Darstellen altgriechischer Texte werden aber Sonderzeichen benötigt (Unicode-Tabelle "Greek Extended" PDF), die in vielen Unicode-Schriftarten nicht vorhanden sind. In der folgenden Testtabelle finden sich Beispiele – nur das oberste Zeichen gehört zum "normalen" Zeichensatz "Greek".

Zeichen hexadez. Code Beschreibung
ώ 03CE Omega mit Akut
1FF6 Omega mit Zirkumflex
1FF4 Omega mit Akut und iota subscriptum
1FA6 Omega mit Zirkumflex, spiritus lenis und iota subscriptum

Benötigt werden aber auch die anderen Zeichen, insgesamt mindestens die folgenden:

ἀ ἁ ὰ ᾶ ἂ ἃ ἄ ἅ ἆ ἇ ᾳ ᾀ ᾁ ᾴ ᾲ ᾷ ᾄ ᾅ ᾂ ᾃ ᾆ ᾇ ἐ ἑ ὲ ἔ ἕ ἒ ἓ ἠ ἡ ὴ ῆ ἤ ἢ ἣ ἥ ἦ ἧ ῃ ῄ ῂ ῇ ᾐ ᾑ ᾔ ᾒ ᾕ ᾓ ᾖ ᾗ ἰ ἱ ὶ ῖ ἴ ἲ ἵ ἶ ἷ ὀ ὁ ὄ ὅ ὂ ὃ ὐ ὑ ὺ ῦ ὔ ὕ ὒ ὓ ὖ ὗ ὠ ὡ ὼ ῶ ὤ ὢ ὥ ὣ ὦ ὧ ῴ ῲ ῷ ᾠ ᾡ ᾤ ᾢ ᾥ ᾣ ᾦ ᾧ ` ᾿ ῾ ῍ ῎ ῏ ῟ ῞ ῝ ῍ ῎

Zur Darstellung dieser Zeichen ist möglicherweise eine besondere Einstellung des Internet-Browsers nötig, wenn nicht z. B. mit <FONT face="Palatino Linotype">...</FONT> eine für diese Zeichen geeignete Schriftart festgelegt wurde.

  • Windows-Explorer: Unter "Extras" die "Internetoptionen" wählen, dann auf der Registerkarte "Allgemein" unter "Schriftarten" folgende Wahl treffen: "Sprachskript": Lateinischer Stamm; "Schriftart für Webseiten": Palatino-Linotype. Dann unter "Eingabehilfen" ein Häkchen setzen bei: "Schriftartangaben auf Webseiten ignorieren".

Kombinationszeichen (Combining characters)

Also wie das mit dem Kombinieren von Zeichen in Unicode ist, steht im Artikel nicht wirklich. Das Beispiel Combining Grapheme Joiner (CGJ) ist ein Spezialfall, der so speziell ist, dass er eher zur verwirrung beiträgt, weil die Grundlagen überhaupt nicht erklärt werden. In en gibt's wenigstens en:Combining character, wenn auch nicht Oma-tauglich und außerdem unvollständig. Hier einige Beispiele. Das Kombinationszeichen ist jeweils fett markiert:

Zeichenkodes Darstellung Beschreibung
U+0065 U+0337 Lange schräge Durchstreichung eines kleinen e
U+0078 U+0303 Tilde über kleinem x
U+0041 U+0361 U+0042 A͡B Bogen über großem A und dem folgenden B
U+0041 U+0361 U+0078 U+0303 A͡x̃ Bogen über großem A und dem folgenden x mit Tilde
U+007A U+0304 U+0308 z̄̈ Kleines z mit Trema und Makron kombiniert
U+0063 U+034F U+0068 ch Ch (Digraph) als zusammenhängend markiert

In vielen nicht-lateinischen Schriftarten tauchen weitere Kombinationszeichen auf.

Für Digraphen und Trigraphen gibt es das Kombinationszeichen "Combining Grapheme Joiner (CGJ)" (U+034F), wie leider etwas unverständlich schon im Artikel beschrieben.

-- Nichtich 12:06, 24. Okt. 2006 (CEST)Beantworten

Unicodeeingabe bei GNOME

Im Artikel stand folgender Abschnitt.

GNOME unterstützt die Eingabe über die Kombination Strg + Umschalttaste + <unicode> bzw. in neueren Versionen Strg+ U + <unicode>. Auch hier erfolgt die Eingabe in hexadezimaler Form.

Ich habe es unter einem aktuellen Gentoo mit Firefox 1.5.0.8 und gedit ausprobiert. Nur Strg + Umschalttaste + U + <unicode> funktioniert. Bei Strg + U + <unicode> wird beispielsweise in Firefox 1.5.0.8 die Seitenquelltextanzeige aufgerufen (Tataturkürzel Strg+U).

Ich habe Strg + Umschalttaste + U + <unicode> im Artikel ergänzt. Ob Strg + U + <unicode> irgendwann einmal irgendwie unter irgendwelchen Bedingungen funktionierte oder nicht, weiß ich nicht, weshalb ich es mal stehen gelassen habe. MfG Blaite 20:43, 2. Dez. 2006 (CET)Beantworten

Löschung von Lateinischer Buchstabe gestrecktes C (eigenes Lemma) und Lateinischer Buchstabe retroflexer Klick (Redirect auf Klick (Phonetik))

Leute, hier sind jede Menge Admins am werkeln, die systematisch deutsche Bezeichnungen kaputtmachen und die die Sache nicht im geringsten interessiert. Wie sollen wir denen mal den Unterschied zwischen "Wort" und "Begriff" klarmachen? --Reiner Stoppok 17:12, 5. Jul. 2007 (CEST) PS: Siehe auch aktuelle Löschprüfung.Beantworten

Junicode Schriftarten

Quellen von Unicode-Schriften siehe Weblinks.
Wo sind die denn hin? Ich sehe da keine Links zu Schriften. --Makkonen 12:28, 1. Aug. 2007 (CEST)Beantworten

Aus Diskussion:Liste der Unicode-Blöcke verschobene Diskussionen

Namen gesucht

Ich bemühe mich zwar redlich, jedoch wird es mir nicht unbedingt gelingen, die deutschen Namen verschiedener aufgeführter Zeichensysteme herauszufinden. Sicher weiß der eine oder andere Mitschreiberling hie und da mehr als ich. Wer das Editieren des im Editionsmodus reichlich unübersichtlichen Artikels scheut, möge seine Erkenntnisse einfach hier ablegen. --Jirret 07:41, 7. Feb 2005 (CET)

Einzelartikel zu Unicodeblöcken

Obwohl ich die roten Wikilinks zu den Einzelartikeln (auch aus Faulheit) belassen habe, heißt das keineswegs automatisch, dass diese in ihrer zur Zeit gelöschten Form wiederhergestellt werden sollen. Weitere Diskussion hierzu bitte auf Wikipedia Diskussion:WikiProjekt Unicode. --Pjacobi 23:19, 27. Dez. 2007 (CET)Beantworten

Spalte E

Statt der E/nicht-E Spalte würde ich vorschlagen, dort die Unicode-Version zu nennen, die diesen Block erstmals benutzte, statt "E" dann die erwartete Version. --Pjacobi 23:21, 27. Dez. 2007 (CET)Beantworten

Gute Idee. Wir haben hier ja einige Experten, einen davon sollte man insbesondere entsperren. Ob er überhaupt noch mal wiederkommt, ist eine andere Frage.
Es gibt eigentlich auch noch mehrere Entwurfsstadien, von angedacht bis nahezu umgesetzt, das könnte man in etwa von E1 bis E3 oder so ausdrücken, wenn man es mit der aktuellsten Situation abgleicht.
Bei den einzelnen Charts wäre noch zu erläutern, welche Fonts den Bereich überhaupt schon abdecken.
Nur zum Vergleich wären eigentlich auch für die einzelnen Blöcke - zusätzlich - Anschauungstafeln in Commons gut, wenn der Font das lizenzmässig zulässt.
Zum anderen würde ich auch gerne noch eine Spalte in die Tabelle einfügen, die den Sprachcode des korrespondierenden Schwesterprojekts anzeigt.
Letztendlich weiss ich aber nicht, ob man den Schwung noch mal hinkriegt. Insbesondere fanden die meisten Diskussionen auf einer Seite statt, die auch weggelöscht wurden. – Simplicius 00:01, 28. Dez. 2007 (CET)Beantworten
Unicodeblöcke sind keine Schriftsysteme, trotz der häufigen 1:1 Übereinstimmung. Es gibt deshalb keine "Schwesterprojekte" in bestimmten Unicodeblöcken -- was zum Schriftsystem zu sagen ist, gehört in den Artikel. In den Unicodeblockartikel (oder Listeneintrag) gehört nur Erwähnenswertes zur gewählten Kodierung. Z.B. grandfathered from ... --Pjacobi 00:06, 28. Dez. 2007 (CET)Beantworten
Vorweg, könntest du bei Benutzer:Prince Kassad vielleicht eine Nachricht hinterlassen, an welchen admin er sich da so wenden könnte, wenn er sich früher als in 60 Tagen wieder entsperren lassen könnte.
Ok, du hast Recht. Mein Gedanke war, wenn da steht "Hebräische Schrift", hätte man "he" vermerken können, bei "Tamilischer Schrift" "ta" usw. aber man muss jetzt erst mal sehen, wieviel Motivation weggelöscht wurde. Unicode ist definitiv ein Mehrpersonenprojekt. – Simplicius 00:36, 28. Dez. 2007 (CET)Beantworten

Codeblöcke <-> Sprachen

Es gibt Codeblöcke, die Alphabete enthalten, die nur von einer einzigen Sprache genutzt werden. Dieser Fakt kann jeweils in dem Artikel über diesen Codeblock (genauer: über dieses Alphabet) erwähnt werden. Andersrum wäre das schon eher möglich: Welche Zeichen aus welchen Codeblöcken werden von einer Sprache X benutzt. Je mehr von diesen "Verknüpfungsdaten" man aber reinnehmen will, um so mehr reift in mir der Wunsch nach einer richtigen relationalen Datenbank, die solche Zusammenhänge dann mit wenigen SQL-Abfragen ausspuckt, anstatt dass hier hunderte von Tabellen, verstreut über mindestens ebensoviele Artikel manuell gepflegt werden müssen. :-/ WikiData now! ;-( --RokerHRO 00:45, 28. Dez. 2007 (CET)Beantworten

Schriftsysteme. Sprachen != Schriftsytem und Schriftsyteme != Codeblöcke. Codeblöcke sind zwei "nicht wirklich das Gleiche"-Stufen von Sprachen entfernt. --Pjacobi 02:05, 28. Dez. 2007 (CET)Beantworten
Ich glaube, dass ist Roker auch einigermaßen klar.
In diesem Artikel (Liste der Unicode-Blöcke) sind die Unicode-Blöcke ja nun ganz gut verlinkt.
Generell könnte man eigentlich, wie von Prince Kassad vorgeschlagen,
auf die acht Artikel für die reinen Nummernbereiche eigentlich verzichten.
Sollte man das auch mal in Wikipedia:Löschprüfung so sagen?
Ich fürchte, es geht dort unter. – Simplicius 12:59, 28. Dez. 2007 (CET)Beantworten

Weitere mögliche Spalten für die Tabelle

(und/oder Fakten für die Einzelartikel). Hat jemand die Unicode-"Datenbank" in eine sinnvolle abfragbare Datenbank importiert? Dann könnte man z.B. den "Füllgrad" der einzelnen Blöcke -- in Einzelartikeln auch den Füllgrad im Laufe der Unicode-Versionen -- aufzeigen. --Pjacobi 13:11, 28. Dez. 2007 (CET)Beantworten

Doppelung der Blöcke-Liste

Lieber Cäsium137, was soll denn diese Änderung? Wozu brauchen wir denn plötzlich wieder eine Liste der Unicode-Blöcke mit den (nun plötzlich per Vorlageneinbindung gedoppelten) gleichen Informationen wie im Artikel Unicode? Diese Liste war ja vorher im gleichnamigen Artikel drin und ist dann nach Diskussion hierher verschoben worden, woraufhin der Spezialartikel gelöscht wurde; nun haben wir plötzlich eine völlig unnötige Redundanz. --Daniel Bunčić ?  ± 06:09, 15. Mär. 2008 (CET)Beantworten

Da sowieso revertiert wurde, ist das hinfällig. eigentlich ist es mir auch ....egal. Cäsium137 (D.) 09:54, 15. Mär. 2008 (CET)Beantworten