Wikipedia Diskussion:Kategorien/Archiv4
Bitte derzeit nichts kategorisieren, was irgendwie mit Ort und Zeit zu tun hat. Keine Kategorien wie "Hamburg", "Antike", "Orte in Bayern" etc. verwenden oder anlegen. Gerade wieder ist die Hamburger Aalsuppe unter den Orten in Deutschland aufgetaucht (weil in der Kategorie Hamburg, und das wiederum bei den Orten in Deutschland). Das sind nicht nur falsche Einordnungen, wir haben hier ein grundlegendes Problem, das wir erst in den Griff kriegen müssen. In diesem Sinne sind auch die folgenden Formulierungen bzgl. Ortsfixierung etc. zu verstehen; nicht als endgültige Lösung, sondern als Denkrichtung. Bitte bei der Diskussion mithelfen, und keine irgendwie gearteten Ortskategorien verwenden - sonst können wir das Fetaure wirklich endgültig vergessen. Uli 22:23, 15. Jun 2004 (CEST)
Ältere Beiträge ab 29.05.2004 siehe: Wikipedia Diskussion:Kategorien/Archiv1, Wikipedia Diskussion:Kategorien/Archiv2
Vorschlag Facettenklassifikation
Ich möchte hiermit einen Vorschlag machen und begründen, der aber in Wirklichkeit von Mw angeregt wurde. Er heisst analytisch-synthetische Klassifikation bzw. kurz Facettenklassifikation.
Problem: Nehmen wir als Gedankenspiel mal 100.000 Artikel. Wenn wir in einer Kategorie nicht mehr als 100 Artikel haben wollen, brauchen wir 1.000 Kategorien, eine gleichmässige Verteilung jetzt mal angenommen. Ein Katalog mit 1.000 Kategorien ist schon ziemlich unübersichtlich.
Nehmen wir den Vorschlag von Mw mit einem mehrdimensionalen System von 3 Facetten (Gruppen):
- Artikeltyp: Person, Unternehmen, Ort, Werk, Definition, chemischer Stoff, ....
- Sachgebiet: Philosophie, Medizin.... Basisklassifikation (BK)
- Landesbezug: China, Deutschland, ....
- Eher Ortsbezug: Berlin, Deutschland, Europa... -- Nichtich 01:48, 16. Jun 2004 (CEST)
Nehmen wir also nur 10 x 10 x 10 Eigenschaften, dann können wir damit die gleiche Anzahl von 1.000 Schubladen abbilden - mit einem Katalog von nur 10 + 10 + 10 = 30 Eigenschaften, also 30 mal weniger!
Das ist nur ein grober Vergleich, zeigt aber die Überlegenheit. Natürlich muss dann die Möglichkeit eines Selects in der SQL-Datenbank geschaffen werden, wo noch eine und-Verknüpfung dazukommt. Aber so ein System mit ein paar Kommentaren zu jedem Begriff ist für Nutzer und Autoren viel leichter definiert und nachvollziehbar, auch wenn man es auf den ersten Blick nicht so glaubt.
Es schützt uns vor den Kategorien "Markgrafen aus Deutschland" oder "Englische Uhrmacher" oder dergleichen.
Simplicius 00:00, 17. Jun 2004 (CEST)
- Danke Simplicius. Ich konnte es nicht so gut ausdrücken. Es war mir wohl auch noch gar nicht so klar. Der entscheidende Vorteil liegt tatsächlich darin, daß man mit 10x10x10x10 (Thema, Typ, Landesbezug, Zeitbezug) Kategorien 10.000 eindeutig definierte Schubladen erhält. Und auf 40 Kategorienamen kann man sich vorab einigen, auf 10.000 Subkategorien nicht. --Mw 01:08, 16. Jun 2004 (CEST)
Halleluja! Endlich jemand, der etwas von Klassifikation versteht (lustig, dass noch niemand über Wikipedia:Artikelklassifizierung gestolpert ist). Leider gibt es noch keinen guten Artikel zur Colon-Klassifikation (siehe z.B. [1], [2]). In der ursprünglichen CC von Shiyali Ramamrita Ranganathan sind folgende Facetten vorgesehen:
- Personality (Was?)
- Matter (Womit?, Woraus?)
- Enery (Wodurch?, Wie?)
- Space (Wo?)
- Time (Wann?)
Allerdings weiss ich nicht, ob uns dass endgültig weiter hilft, weil nicht festgelegt ist, welche Kategorien bei welcher Facette möglich sind. Es wäre aber schon mal eine Hilfe, wenn beispielsweise statt Kategorie:Baseball bei den Olympischen Sommerspielen mit Kategorie:Baseball (Was?) und Kategorie:Olympische Sommerspiele (Wann/Wo?) klassifiziert würde. Die Facetten sind dabei nicht als feste Schubladen zu sehen, sondern als Fragen, nach denen man einen Artikel kategorisieren kann. Wenn stattdessen fleissig sowas wie Kategorie:Ägypter angelegt wird, anstatt Kategorie:Person (Was?) und Kategorie:Ägypten (Wo?) zu verwenden, hat bald jeder Artikel seine eigene Kategorie (Bei einer etwas vorsichtigeren Schätzung 10 Artikel pro Kategorie ergibt "nur" 10.000 Kategorien) - und darauf bewegt sich die Sache gerade eindeutig zu. -- Nichtich 01:48, 16. Jun 2004 (CEST)
Einfache Rechnung
Wenn jeder Artikel durchschnittlich in 2 Kategorien steht (z.B. zwei aus Gegenstand, Zeit und Ort), anstatt in einer wie jetzt, kommt man für 100.000 Artikeln mit 100 Kategorien hin. Da in der Praxis die Artikel nicht gleichmäßig über Kategorien verteilt sind, werden zwar mehr Kategorien benötigt, aber die Anzahl nimmt rapide mit der Zahl der Kategorien pro Artikel ab (solange nicht andauern neue Kategorien erfunden werden, anstatt bereits existierende zu benutzen). "Eigentlich" sind nur zwei simple Forderungen zu erfüllen:
- Nicht nur eine Kategorie pro Artikel
- Nicht nur ein Artikel pro Kategorie
Dazu dürfen die Kategorien allerdings nicht zu speziell sein. Zur Zeit werden die Kategorien ja immer spezieller (Beispiel Kategorie:Alkoholhaltiger Cocktail und Kategorie:Alkoholhaltiges Getränk anstatt beides in Kategorie:Alkohol und Kategorie:Getränk. -- Nichtich 02:01, 16. Jun 2004 (CEST)
- Die Idee der Facettenklassifikation finde ich bestechend, vor allem weil sie einfach und verständlich ist, das ist gerade bei unerfahreneren Benutzern wichtig. Außerdem vermeidet sie kryptische Präfixe, lange Kataloge oder die fünftausendste exotischische Kategorie mit nur einem Eintrag. Wäre schön, wenn man sich auf so etwas einigen könnte. -- Sansculotte 02:11, 16. Jun 2004 (CEST)
- Ja, einleuchtende Sache (abgesehen dass 100x100 nur 10.000 und nicht 100.000 ergibt). Wenn wir längerfristig von einer Million Artikel ausgehen, müssten also alle Artikel in 3 und nicht in 2 Kategorien eingeordnet werden. Ausserdem ist die Einschränkung auf 100 Kategorien pro Dimension illusorisch; es gibt alleine 200 Länder, dazu Regionen, Bundesländer usw. Bei der sachthematischen Dimension wird es ebenfalls nicht möglich sein. Zur Eindämmung der Kategorienflut ist das System aber auf jeden Fall geeignet. --Napa 06:55, 16. Jun 2004 (CEST)
Grundproblem bei dieser Facettenklassifikation ist, dass wir die Schnittmengen derzeit nicht per Software abgreifen können. Dennoch erscheinen mir die Vorteile so eklatant, und die Nachteile dieser Schnittmengenkategorien so gravierend, dass wir in diese Richtung marschieren sollten. Dann müssen wir aber irgendwie auf die Programmierer hinwirken dass sie uns diese Schnittmengenbildung programmieren. Ich verliere dann zwar nen Kasten Bier, aber der wär's mir wert... Uli 07:57, 16. Jun 2004 (CEST)
Ich bin ebenfalls für eine Facettenklassifikation. -- Dishayloo 09:26, 16. Jun 2004 (CEST)
Ich finde es ja sehr schön, dass die Diskussion um Kategorien mittlerweile hier ein sehr hohes Niveau erreicht hat, ich bezweifle aber ernsthaft, dass man dieses Niveau gewöhnlichen, nicht in die Wikipedia verliebten Benutzern nahe bringen kann. Leider denken viele Leute ja bis heute in ganz einfachen, völlig simplifizierten Kategorien wie "Chemie=Schlecht", "Bio=Gut", "Gen=Böse". Die Biologie hat mehr als 200 Jahre gebraucht um die Welt der Lebewesen in allgemein akzeptierte Kategorien zu stecken (in der Biber nicht mehr in die Kategorie Fisch sondern in die Kategorie Säugetier gehört), und ist gerade dabei das gesamte System umzukrempeln (Siehe Kladistik!) womit dann plötzlich Tyrannosaurus rex und die Graugans in eine Kategorie gehören, die einer Kategorie gegenübersteht in die Kängurus und Waschbären gehören). Die Sprachwissenschaft ist noch lange nicht soweit und der angelsächsichen Welt sind Begriffe wie Ausbausprache zur Abgrenzung gegen Dialekt nur extrem widerwillig beizubringen. Glaubt ihr hier wirklich, diese übermächtige Aufgabe nicht nur bewältigen sondern auch gewöhnlichen Benutzern nahe bringen zu können? Ich freue mich schon auf die Diskussion ob Jesus Christus in die Kategorie Mensch oder Gott gehört oder in beide! -- Martin Sell 09:32, 16. Jun 2004 (CEST)
OpenCyc steht in den Startloechern, rund 60.000 Basiskategorien zu praesentieren (wovon allerdings die top-level-K. nicht sinnvoll auf konkrete Artikel anzuwenden waeren). Warum, verflixt, wird hier versucht, das Kategorie/Ontologie (Informatik)-Problem anders (oder gar: besser) zu loesen? Die Wiki-Diskussion um Kategorien ist mindestens 20 Jahre im Rueckstand!!! Die Woerter "Rad" "neu" und "Erfindung" draengen sich auf -- kakau 09:40, 16. Jun 2004 (CEST)
Ein bisschen Zeit braucht es noch
Facetten sind abhängig von Interessen: zum Beispiel wurde zum Ausdruck gebracht, dass in jedem Falle ein Bedürfnis an Informationen zu Raum und zu Zeit besteht. Also bedeutet das, das wir über alles diskutieren müssen, sonst können wir nicht feststellen, welche Bedürfnisse und Probleme bestehen. Aber das Echo ist ja ganz positiv.
Zum Thema Ort noch etwas: Der eine kommt halt aus Berlin, der nächste aus Wiesmoor (Ostfriesland). Müllers Grosses Ortsbuch nennt 105.000 Orte, es gibt 14 Dörfer, die Kreuzberg heissen, und dann gibt es noch die Stadtteile. Das Ausland haben wir dann noch nicht drin (New York, Neapel, Falludscha), auch nicht Gondwana und den Kopernikuskrater und immer noch keine Heimat für die Binomische Formel. Es wird also nicht einfach werden, mit der Facettenklassifikation alles zumindest grob, aber korrekt, vollständig und praktikabel zu erfassen. Ich bin mir aber ziemlich sicher, dass es funktionieren wird. -- Simplicius 17:56, 16. Jun 2004 (CEST)
Zwei Ebenen bei Personen
Bei Kategorie:Person ist ein Durcheinander, weil die Hälfte der Berufe als direkte Unterkategorie von "Person" erscheinen, die andere Hälfte aber als Unterkategorie von Kategorie:Personen nach Beruf, die ihrerseits eine Unterkategorie von Kategorie:Person ist. Ist das wirklich so gewollt? Weiteres Vorgehen? --Katharina 13:05, 16. Jun 2004 (CEST)
Einfache und selbsterklärende WP-Facettenklassifikation
Mein Vorschlag wäre ein sehr einfacher. Jeder Artikel darf eine vom Bearbeiter für passend gehaltene Subkategorie des jeweiligen Fachgebiets erhalten (Spaßfaktor und sinnvoll für gut systematisierte Fächer wie Biologie, Geographie usw.). Zusätzlich soll (d.h. darum wird gebeten) jeder Artikel, wenn möglich, folgende vier Grundkategorien erhalten:
1. Thematisches Sachgebiet
Das sind die noch zu konsolidierenden Hauptkategorien (Kategorie:!Hauptkategorie).
2. Artikeltyp
Jeder Artikel erhält eine Kategorie:*Person/*Werk/..., durch die er eindeutig einer bestimten Klasse von Artikeln zugeordnet wird. Die Anzahl und Terminologie der Artikeltypen ist nicht frei wählbar, sondern auf folgende im wesentlichen selbsterklärende Typen beschränkt (Vorschlag): *Person, *Werk, *Organisation, *Ding, *Begriff, *Ereignis, *Einrichtung. Werke sind gegenständliche Schöpfungen bestimmter Personen (Romane, Bilder), Einrichtungen reale, aber ungegenständliche menschliche Schöpfungen (Krankenversicherung, Schule), Begriffe sind rein abstrakte Vorstellungen (Liberalismus, Integral), Organisationen sind Gruppen und Verbände jeder Art (Rockbands, UNO, Bundesländer). Dinge sind körperliche Gegenstände jeder Art, natürliche und künstliche (ohne bestimmten Urheber).
3. Ortsbezug
Artikel, die Bezug zu einem bestimmten Ort haben, erhalten eine Kategorie:*Ort, wobei *Ort die jeweils einschlägige Ortsbezeichnung ist, also z.B. *England oder *Hamburg. Diese *Ortskategorien sind genauso wie die echten geographischen Ortskategorien hierarchisch strukturiert, d.h. *Hamburg ist Subkategorie von *Deutschland, dieses ist Subkategorie von *Ort. Der zulässige Namensraum muss nicht vorgegeben werden. Da zwischen geographischen Orten natürliche geographische Beziehungen bestehen (Kontinent-Land-Region-Stadt-Bezirk o.ä.), lassen sich alle frei gebildeten Angaben irgendwo ins System einordnen und wiederfinden. Es kann jedes Dorf eingegeben werden, wenn *Hintertupfingen nur ordentlich unter *Deutschland eingehängt wird. Zur Krönung sollte es noch eine Kategorie:*Fantasia geben. Damit kann man alle fiktiven Gestalten "verorten" und braucht keinen Artikeltyp *Fiktive Person mehr. Micky Maus, das ganze Startrek-Universum, die Pokemons usw. wären alle säuberlich über die "Ortskategorie" *Fantasia aufzuspüren.
4. Zeitbezug
Artikel, die Bezug zu einem Zeitpunkt oder Zeitabschnitt haben, erhalten eine Kategorie:*Zeit, wobei *Zeit entweder ein bestimmtes Jahr (für Ereignisse), ein bestimmtes Jahrhundert oder eine größere Epoche ist. Der Vorrat wählbarer zeitangaben ist auf natüröliche Weise begrenzt (4000 Jahre,40 Jahrhunderte). Vorabgestimmt sein müssen nur die Epochennamen (Vorschlag: Vorzeit, Altertum, Mittelalter, Neuzeit, Gegenwart). Alle Zeitangaben ordnen sich auf natürliche Weise in ein hierarchisches *Zeit-System ein.
Die Orts- und Zeitkategorie sind natürlich entbehrlich, wo es keinen Orts- oder Zeitbezug gibt, z.B. bei Artikeln wie Arsen, Altair, Knöterich. Das sind meist Artikel aus Wissengebieten, die eine ausgefeilte Klassifikation besitzen. Die kann dann natürlich verwendet werden. Die *Sterne dienen der Unterscheidung der Grundkategorien von den Sachkategorien. Kategorie:*Hamburg bedeutet, dass der Artikel irgendwas mit Hamburg zu tun hat (Hamburger Aalsuppe), dagegen sind in der Sachkategorie [[:Kategorie:Hamburg] nur alle geographischen Untereinheiten von Hamburg (z.B. Altona). Was haltet ihr davon?
Das System dürfte auf Wikipedia:Kategorien leicht zu erklären und anzuwenden sein. Sobald die Software Schnittmengen liefert, erhält man damit sehr übersichtliche und gut gegneinander abgegrenzte Teilmengen von Artikeln. Was haltet ihr davon? --Mw 18:33, 16. Jun 2004 (CEST)
Eine Meinung
Spricht etwas dagegen, den Dimensionen eigene Bezeichner zu geben, wie zum Beispiel "Objekttyp:", "Wissensbereich:", "Zeitraum:" oder "Raum:"? Die Nutzer werden sicher noch verstehen, dass es sich um das System der Kategorisierung handelt. -- Was die Jahreszahl "1492" oder den Ort "Hamburg" angeht: diese Angaben sind ja auch mit einem Link hinterlegt und wir haben dann immer noch die Funktion "was verweist hierher". Man muss Kategorisierungen also nicht unbedingt bis in eine unendliche Anzahl atomisieren. Eventuell reichen hier "15. Jahrhundert" und "Deutschland" aus. Man muss Martin Luther ja nicht einem Bundesland zuordnen können. -- "Kein Zeitbezug" sowie "Kein Raumbezug" sollten sicher auch möglich sein. -- Was die Wissensgebiete angeht, sollte man sich stärker an die Basisklassifikation halten, ist meine Meinung. Natürlich hätte ich schon gerne "Datenbanktheorie", "Verschlüsselungstechniken" oder "Geomorphologie", aber vielleicht muss man auch Abstriche machen. -- Auf jeden Fall sollte man noch nichts überstürzen. Simplicius 19:07, 16. Jun 2004 (CEST)