Zum Inhalt springen

Wikipedia Diskussion:Normdaten

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 16. August 2012 um 14:49 Uhr durch Make (Diskussion | Beiträge) (Jetzt als RFC in neuer Version: update). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Abkürzung: WD:ND
Archiv
Wie wird ein Archiv angelegt?
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind.

Programmierer gesucht

Hallo. Wie schon öfter erwähnt, wird die GND ab Juli wohl unter freier Lizenz verfügbar sein. Dass es sich lohnt, diese in irgendeiner Form auf dem Toolserver zur Verfügung zu haben, liegt auf der Hand. Mein Account hat inzwischen soviele Datenbanken, dass ich öfter an die 15-Verbindungen-Grenze komme... da ich auch nicht dauerhaft alles alleine machen will, stelle ich mal die Frage in den Raum, ob es hier jemanden gibt, der Programmiererfahrung hat und mit mir gemeinsam eine so genanntes Multi-Maintainer-Project (MMP) auf dem Toolserver erstellen will. Innerhalb dieses Toolserver-Accounts kann dann alles ablaufen, was Normdaten betrifft. Neue Sachen wie die GND-Datenbank aber über kurz oder lang auch das Normdaten-Bezogene, was bisher auf meinem Account läuft (also z.B. die Extraktion der Normdaten aus der Wikipedia und Redirects etc.). Also: gibt es interessierte Programmierer (idealerweise schon mit Toolserver-Erfahrung/-Account)? Grüße --APPER\☺☹ 19:19, 10. Mai 2012 (CEST)Beantworten

Wichtigste Arbeiten nach der Ersetzung der Vorlage

Hier kann ich nichts helfen, daher von mir erst mal nur einige Punkte (mit herzlichem Dank, wie lange es auch dauern mag): --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)Beantworten

  • Apper-Tool (Wikipedia-Personensuche) müsste auch die GND (mit Typ p) erfassen. Am besten alle, auch Mickey Maus und Adelsfamilien, standardmäßig suchen und finden könnte das Tool ja vielleicht weiterhin nur Männer und Frauen, aber über die GND angesprochen eben auch diese anderen.--AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)  OkBeantworten
Das hab ich grad implementiert, läuft grad ein erstes Mal, aber bei der aktuellen SQL-Performance auf dem Toolserver macht Entwicklung grad keinen Spaß. Hoffe einfach, dass es funktioniert. Alle Artikel, die jetzt schon eine GND hatten, sind leider erstmal nicht erfasst - wenn das ganze funktioniert werde ich mal einen Gesamtlauf machen, um auch die zu erfassen. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)Beantworten
Personeninfo-Tool sollte jetzt vollständig auf GND umgestellt sein. --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)Beantworten
Auch das ist erledigt: siehe http://toolserver.org/~apper/pd/person/gnd-redirect/de/1021397091 . Und auch wenn da "person" in der URL ist, funktioniert das mit allen GNDs: http://toolserver.org/~apper/pd/person/gnd-redirect/de/1006609-3 --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)Beantworten
  • Die Wikipedia-BEACON-Datei müsste auch die Artikel mit GND und Typ p enthalten, und natürlich weiterhin auch die vielen mit PND.
Ich weiß immer noch nicht, ob das sinnvoll ist. Was spricht denn im Fall "PND" dagegen, dass "PND=123" ein Kürzel ist für "TYP=p|GND=123"? Über 180.000 Artikel mit einem Bot... uiuiui. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)Beantworten
Wir könnten z. B. erst mal nur bei Bedarf ändern (also z. B. den Interwiki-Bots und Rechtschreibhelferlein sagen, dass sie bei Personen mit PND das grundsätzlich mit ändern sollen, wenn sie die Artikel ohnehin anfassen). Und wenn dann nächstes Jahr noch ein paar tausend übrig sind, kann man die immer noch irgendwie machen (das sind dann wohl eh so Artikelleichen, die anzusehen sich irgendwie lohnen wird). Sobald die Tools GND auslesen können und die dann auch sicher in den BEACON-Dateien landen und es einen Resolver gibt, könnten wir die Botbetreiber damit beauftragen. Wir würden uns zurücklehnen und könnten uns weiterhin auf Vorlage:PND, GKD, SWD usw. konzentrieren. Klingt eigentlich gut, ja. --AndreasPraefcke (Diskussion) 19:28, 11. Mai 2012 (CEST) PS: WP:Bots/Anfragen gestellt. --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)Beantworten
  • Wartungsliste: Artikel mit Normdaten, bei denen Felder GND _und_ PND befüllt sind. Geforderte Aktion dann: Prüfen und PND dann löschen. Alternativ könnte auch die Vorlage eine solche Wartungskategorie einfügen (soll ich das machen?) Theoretisch wäre das irgendwann mal auch für SWD, GKD etc. sinnvoll, aber durch die vielen Dubletten und die insgesamt viel geringere Verbreitung in der Wikipedia ist das sehr nachrangig. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)Beantworten

Alle können helfen dabei, die

  • Vorlagen DM, SWD, GKD, PND und auch PNDfehlt nach und nach umzustellen und überflüssig zu machen. Meist ergeben sich ja doch neue Möglichkeiten mit VIAF und der GND, so dass eine rein automatische Abarbeitung vielleicht gar nicht so sinnvoll ist. Wer Automatisierungsmöglichkeiten sieht, möge dennoch seine Bots anwerfen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)Beantworten

Klärungsbedarf mit der DNB?

Ich habe jetzt nicht jeden Diskussionsbeitrag durchgelesen, irgendwo tauchte aber mal mein Name auf mit der Bitte um Rückfrage bei der DNB auf. Könntet ihr hier bitte mal kurz notieren, was zu klären ist?

Konkret ist mir gerade eben ein GND/kiz-Duplikat aufgefallen: 4707542-9 und 2101563-6 zum NS-Dokumentationszentrum der Stadt Köln. — Raymond Disk. 12:03, 12. Mai 2012 (CEST)Beantworten

Hi Raymond, die Frage ist, ob wir die Liste Wikipedia:PND/Fehlermeldung zu "WP:GND/Fehlermeldung" erweitern können. Gibt es innerhalb der GND-Redaktion noch eine Trennung, wer Personen bzw. Geografika etc. bearbeitet? Außerdem könnte man die Umstellung auf die GND dazu nutzen, freundlich anzufragen, ob die Abarbeitung der gemeldeten Fehler nicht schneller möglich ist. Per E-Mail dauert das in der Regel nur einen Tag; unsere Liste dagegen hat mittlerweile eine Wartezeit von einem halben Jahr, was für beide Seiten auf die Dauer frustrierend ist. --Kolja21 (Diskussion) 16:04, 12. Mai 2012 (CEST)Beantworten
Bei mir ist immer noch die Frage offen, was mit Einträgen wie dem GND 174188625 passieren soll. So ein Eintrag ist zu dünn: Name und Geburtsjahr reicht einfach nicht, um davon ausgehen zu können, dass es die gleiche Person ist. So würde ich den Beitrag niemals Lothar Brandes zuordnen, obwohl es natürlich sein kann. Ich glaube, du hattest da schonmal angefragt... --APPER\☺☹ 23:48, 12. Mai 2012 (CEST)Beantworten

@APPER: Da legst du die Latte aber sehr hoch ;) Traditionell reicht für Bibliotheken das Geburtsjahr als Indikator aus. In den seltenen Fällen, dass zwei Autoren den gleichen Namen und das gleiche Geburtsjahr haben, ergänzt die LoC noch Tag und Monat der Geburt. Mehr war ursprünglich, in Zeiten des Zettelkatalogs, nicht vorgesehen. (Nicht mal das Todesjahr wurde nachträglich ergänzt, weil sich damit die Ansetzung geändert hätte.) Konkret heißt das: Der von dir erwähnte Fall sollte natürlich auf der PND/F-Seite eingetragen werden, nur wie prüft die GND-Redaktion die Zugehörigkeit? D.h. ich wüsste gerne von der DNB, welches Wissen sie nutzt, das der DNB-OPAC nicht anzeigt. Z.B.: Wer hat den Datensatz geliefert (PICA3-Feld 012 Nutzungskennzeichen) und vor allem, mit welchen Büchern, Schriftstücken etc. ist er verlinkt? Können wir mit dem nötigen Know-how selbst überprüfen, ob die Person unser "Lothar Brandes" ist oder müssen wir die Fehlermeldung blind abgegeben, in dem Sinne: Überprüft mal, ob das die gleiche Person ist, auf die sich euer Tp bezieht. --Kolja21 (Diskussion) 23:22, 13. Mai 2012 (CEST)Beantworten

Ein tagesgenaues Geburtsdatum reicht mir ja schon - oder halt Geburts- und Sterbejahr. Oder eine Jobbezeichnung... Bei den 17***er PND-Nummern sind leider Dutzende solche Einträge dabei (also auf die ich schon gestoßen bin - also mit Wikipedia-Eintrag). Bisher habe ich die nicht gemeldet - weil ich halt nicht weiß, ob die DNB da überhaupt was machen kann. --APPER\☺☹ 00:00, 14. Mai 2012 (CEST)Beantworten
VIAF nimmt deutlich die Literatur, die mit so einem Normsatz geliefert wird, als Informationsquelle für seine Bedeutung. In der PND scheint es ähnlich zu sein, der "Verursacher" eines Normsatzes (von ihm wird angenommen, dass er ihn mindestens einmal nutzt oder zumindest genutzt hat) wird in Prozesse zur Identitätsklärung oder Dublettenbereinigung eingebunden und muss sich äußern, welche Person bei der Anlage des Normsatzes wirklich gemeint gewesen ist. Speziell bei den 17er und 18er-Nummern, insgesamt bei den etwa 3.000.000 offline eingespielten Sätzen vom letzten Jahr (nur ein kleiner Teil davon Tp) ist bekannt, dass die DNB überhaupt nichts anderes darüber weiss als im Normsatz steht, also immer eine Fremdredaktion befragt werden muss. Um die nicht übermässig zu belasten wurde in PND-Redaktionskreisen die Devise ausgegeben, von Meldungen bezüglich Dubletten möglichst Abstand zu nehmen. An der Stelle ist die Wikipedia aber deutlich Nutzer der Normdaten, und ich z.B. finde nicht, dass wir von solchen Meldungen Abstand nehmen sollten: Bei den SWD- und GKD-Körperschaften z.B. ist angekündigt, dass maschinelle Abgleichsläufe sehr bald stattfinden sollen, für die Personen hingegen ist m.W. konkret nichts geplant, d.h. es kann nur über hartnäckiges Melden eine Verbesserung geben. -- Thomas Berger (Diskussion) 00:14, 14. Mai 2012 (CEST)Beantworten
Bislang hat die DNB solche Anfragen abgelehnt, da, wie Thomas eben schon geschrieben hat, die Masse von Neueinspielungen erst halbautomatisch nach Dubletten durchsucht werden soll. (Tagesgenaue Geburtsdaten gibt es übrigens aus Datenschutzgründen eher selten; in der Regel wird der Beruf als zweiter Indikator hinzugefügt.) Drei, vier Monate würde ich der DNB mindestens Zeit lassen, bevor wir alle 17er- und 18er-Nummern melden. Drängen würde ich dagegen auf den Abbau der alten Listen. (Es muss doch möglich sein, mal ein, zwei studentische Hilfskräfte zu finanzieren. Warum z.B. nicht aus dem Kreis der Wikipedianer?) --Kolja21 (Diskussion) 00:21, 14. Mai 2012 (CEST)Beantworten
Die Einspielungen erfolgten im April und Oktober 2011 (letztere wurden allerdings erst Anfang Dezember 2011 in der PND sichtbar). Dabei wurden Tn-Sätze stark maschinell abgeglichen, Tp-Sätze vorsichtshalber überhaupt nicht. Ich kenne keine Quelle dafür, dass ein maschineller Abgleich der Tp-Sätze geplant sein könnte und unterstelle, dass die Zurückhaltung beim gegenseitigen Melden nur aus Rücksichtnahme auf die Bearbeitungskapazitäten bei den Nicht-DNB-Redaktionen motiviert ist. -- Thomas Berger (Diskussion) 01:06, 14. Mai 2012 (CEST)Beantworten

Momentan ist der beim Parameter PND vorhanden, aber beim Parameter GND nicht. Als Begründung, den wegzulassen, konnte ich hier nur finden, dass bei http://dispatch.opac.d-nb.de oben drüber „Dieser Katalog wird nicht mehr weiterentwickelt.“ steht, aber das ist ja offenbar ein rein ästhetisches Problem; die Datensätze dort sind aktuell wie eh und je. Könnte man also den Link (oder einen äquivalenten, der direkt zu den Rohdaten führt) bitte auch bei GND wieder einbauen? PDD 16:49, 16. Mai 2012 (CEST)Beantworten

War m.E. eigentlich auch so beabsichtigt, zumindest aber auch von APPER so gewünscht worden. Könnte bei der Gelegenheit das kryptische "PICA" auf "Rohdaten" abgeändert werden, oder ist das zu raumgreifend breit? -- Thomas Berger (Diskussion) 18:30, 16. Mai 2012 (CEST)Beantworten
Es wird ohnehin nur für die angezeigt, die Metadaten angeschaltet haben. Da ist das raumgreifende eigentlich egal. --AndreasPraefcke (Diskussion) 21:19, 16. Mai 2012 (CEST)Beantworten
Hallo PDD, wenn ich die von dir verlinkte Seite anklicke, erhalte ich die fett und in rot gedruckte Meldung: "Diese Variante des DMA-Kataloges steht nicht mehr zur Verfügung. Für die Recherche in den Beständen und Normdaten des Deutschen Musikarchivs nutzen Sie bitte das Web-Portal der Deutschen Nationalbibliothek". Dieses "rein ästhetische" ;) Problem führte unter anderem dazu, dass die mittlerweile gelöschte "Vorlage:DM" nicht mehr funktioniert hat, da der alte OPAC Probleme mit den Redirects hat. Auch bei Datensätzen, mit denen keine Literatur verknüpft ist, erhalte ich öfters Fehlermeldungen. Ich finde, man sollte weder zu dem veralteten OPAC, den die DNB ja "vom Netz" nehmen will, verlinken, noch einen Sammelbegriff wie "Rohdaten" zu verwenden, da es die unterschiedlichsten Formate wie PICA+, PICA3 und MARC gibt. Wer entsprechende Daten sucht, wird auf die bekannte Weise (Klick unter das Personenicon) im OGND fündig. Gruß --Kolja21 (Diskussion) 22:56, 16. Mai 2012 (CEST)Beantworten
Aha, dann suche ich also die Person einfach nochmal im OGND (weil, der ist ja in den Normdaten nicht verlinkt) und wähle die richtige Person aus und klicke dann nochmal aufs unsichtbare Icon und schon kriege ich genau das, was ich vorher mit einem Klick in der Normdatenvorlage bekommen habe? Das ist tatsächlich ungeheuer praktisch :-) PDD 23:13, 16. Mai 2012 (CEST)Beantworten
Für Personen funktioniert der PICA-Link weiterhin (die rote Meldung kommt nur beim Aufruf der Basis-URL, nicht bei konkreten Aufrufen wie [1]). Allerdings beruht dieser Aufruf auf der internen Identnummer im ILTIS-System der DNB, die ist nur bei Personen und bei seit der GND-Einführung neu erezeugten Datensätzen identisch mit dem Normdaten-Identifier. Die Regensburger Verbundklassifikation muss man z.B. mit der Nummer 950181226 zur Anzeige bringen, wir kennen aber nur die offizielle Nummer 4449787-8. Da der fragliche PICA-Katalog der alte Katalog des DMA zu sein behauptet, sind Schlagworte dort konsequenterweise noch nicht einmal recherchierbar, der einzige mir bekannte Weg zum Feststellen der internen Nummer erfordert Registrierung und besteht darin, den Datensatz in MARC-Format über den Datenshop herunterzuladen (oder die SRU-Schnittstelle zu benutzen, die erfordert allerdings ebenfalls Registrierung).
Das soeben gesagte gilt in abgewandelter Form für den OGND-Katalog, da dort zwar eine Recherche nach echten Normdaten-Nummern prinzipiell möglich ist (die internen Nummern des "Zitierlinks" sind die des SWB und daher nirgendwo identisch mit den offiziellen Normdatennummern) und wir auch direkt eine Rohdaten-Anzeige zu 11875856X erzwingen können. Allerdings müssen wir der GND-Nummer vorher ansehen, ob sie Ex-PND, Ex-GKD, Ex-SWD ist, denn 4449787-8 benötigt derzeit Recherche über einen anderen Index! -- Thomas Berger (Diskussion) 00:20, 17. Mai 2012 (CEST)Beantworten
Ich würde daraus das Fazit ziehen, dass (da, um die gewohnte Funktionalität zu erzeugen, der PICA-Link sowieso nur bei TYP=p angezeigt werden soll und es dabei völlig gehupft wie gesprungen ist, ob das dann auf das alte oder das neue verlinkt) der PICA-bzw.-Rohdaten-Link jetzt also wieder eingefügt werden kann? PDD 00:40, 17. Mai 2012 (CEST)Beantworten

Sollte man die PICA/OGND etc.-Anzeigemöglichkeiten vielleicht lieber in die Wikipedia-Personensuche aufnehmen als in die Normdatenleiste? Oder nochmal anders gedacht: wieso zeigt die DNB eigentlich keine Rohdaten mehr an, oder wenigstens einen Link darauf? Einer dieser hirnrissigen "unsichtbaren" Links wie im alten OPAC würde es für unsere Zwecke ja auch schon tun. Das DNB-Portal ist in dieser Hinsicht einfach nicht vollständig. --AndreasPraefcke (Diskussion) 08:51, 17. Mai 2012 (CEST)Beantworten

Ich würde das so sehen: Sobald entweder DNB-Portal oder Toolserver-Personensuche aus der normalen Anzeige heraus mit einem Extra-Klick vollständige Rohdaten (möglichst sogar in einem vernünftigerem Format als das derzeitige PICA+-Internformat) zeigen, können wir auf den PICA-Link in der Normdatenleiste verzichten. -- Thomas Berger (Diskussion) 11:44, 17. Mai 2012 (CEST)Beantworten

"Universelle" OGND-Suchanfrage für die direkte Rohdatenanzeige "PICA" aller Normdatentypen: http://swb2.bsz-bw.de/DB=2.104/CMD?ACT=SRCHM&ACT0=SRCH&IKT0=2011&TRM0={ID}&ACT1=%2B&IKT1=2012&TRM1={ID}&ACT2=%2B&IKT2=2013&TRM2={ID}&PRS=PP

  1. SWD 4449787-8
  2. PND 118603701
  3. GKD 5149652-5
Frage zum OGND-Katalog: Sind das immer aktuelle Daten oder entsprechen die den GND-Lieferungen alle paar Monate? Beim DNB-Katalog (PICA) sind die Daten ja praktisch tagesaktuell... --APPER\☺☹ 13:35, 17. Mai 2012 (CEST)Beantworten
Der Katalog scheint eine "Auskopplung" aus der SWB-Verbunddatenbank, die wiederum per OAI-Schnittstelle die Änderungen in der GND eigentlich ~zeitnah~ nachverfolgen sollte. Konkret ist allerdings der heute gegen 10:00 angelegte 2118855-5 noch nicht sichtbar, die Vorgängerkörperschaft 2008801-2 in der OGND hat einen Link auf ihren Nachfolger, der führt aber ins Leere... -- Thomas Berger (Diskussion) 13:58, 17. Mai 2012 (CEST)Beantworten
Finde gerade den Link nicht, hatte aber gelesen, dass der OGND im 5-Minuten-Takt aktualisiert wird. Tagesaktuell sollte er auf jeden Fall sein (und kein Vergleich mit VIAF, wo bestenfalls 1x pro Monat neue Daten eingespielt werden). --Kolja21 (Diskussion) 15:21, 17. Mai 2012 (CEST)Beantworten
Vermutlich wird die SWB-Verbunddatenbank so häufig aktualisiert. VIAF bezieht GND-Daten auch recht aktuell (täglich, m.W. per OAI), nur die völlige Neuberechnung aller Cluster ist ca. einmal im Monat. -- Thomas Berger (Diskussion) 15:59, 17. Mai 2012 (CEST)Beantworten
VIAF: Es werden ein paar Buchtitel drangehängt, aber auf Neueinträge muss man mehrere Wochen warten. So die offizielle Auskunft eines VIAF-Mitarbeiters. (Aktuell habe ich zwei, drei Änderungen in der GND von Anfang April notiert, die bislang immer noch nicht in VIAF angezeigt werden.) Gruß --Kolja21 (Diskussion) 21:15, 17. Mai 2012 (CEST)Beantworten

Dublettenbereinigung

Die Technische Universität Berlin kommt in der GND zweimal vor: 2114678-0 und 4005079-8. Ich bin etwas ratlos, was in solchen Fällen passieren soll.

  • Beide Nummern aufnehmen? Allerdings wird dann nur die zuletzt aufgeführte ausgegeben.
  • Bei Wikipedia:PND/Fehlermeldung hinzufügen? Gilt dort die Beschränkung auf Personendaten eigentlich noch? Andererseits sind schon jetzt so viele Fehlermeldung aufgelaufen, die auf Bearbeitung warten ...
  • Abwarten, Tee trinken und hoffen, dass irgendwann (gibt es hierfür eigentlich einen konkreten Termin) im großen Stil Dubletten bereinigt werden?

--Monsieur Becker (Diskussion) 23:27, 19. Mai 2012 (CEST)Beantworten

Abwarten, Tee trinken und auf die angekündigte baldige große Dublettenbereinigung warten. Momentan ist die GND leider unbrauchbar für Nichtpersonen. Wie immer bei der DNB wird erstmal großflächig Müll auf die Benutzer geschüttet und dann irgendwann mal mit dem Putzen angefangen. --AndreasPraefcke (Diskussion) 00:02, 20. Mai 2012 (CEST)Beantworten

Holla Monsieur, sehe ich ähnlich, auch wenn nicht so drastisch. Die Chancen stehen gut, dass die SWD- / GKD-Dubletten noch in diesem Jahr zusammengeführt werden. In den betreffenden Fällen lasse ich die veralteten Vorlagen SWD und GKD stehen oder wähle eine der beiden Nrn. aus und vermerke die Dublette in den Anmerkungen (Parameter "REMARK"). Gruß --Kolja21 (Diskussion) 00:07, 20. Mai 2012 (CEST)Beantworten
Ja, war schon drastisch ausgedrückt. Aber wenn man eine "Normdatei" auf die Menschheit loslässt, sollte die halt auch etwas normieren, und nicht für jeden Pups fünf verschiedene Nummern anbieten. Wenigstens die 16 Bundesländer und die 100 größten deutsche Städte hätte man ja z. B. mal in ein, zwei Stunden mit Hand zusammenfassen können, bevor man großartig die GND mit "Geografika" einführt. --AndreasPraefcke (Diskussion) 00:24, 20. Mai 2012 (CEST)Beantworten
Was mich mehr stört ist, dass aus den Daten nicht mal hervorgeht, welche regionale GND-Redaktion die entsprechende Dublette angelegt hat. Habe aus Neugierde vor ein paar Tagen dem hbz-Verbundkatalog eine doppelten Eintrag gemeldet und erhielt am nächsten Morgen die positive Rückmeldung: "Der dublette Personennamensatz ist zur Bereinigung vorgemerkt, die Bearbeitung kann jedoch erst im Juni erfolgen." Wenn ich an die "Vielfalt" (um es freundlich auszudrücken) denke, die sich bei uns in Sachen GND-/PND-/DMA-/SWD-/GKD-Vorlagen im Laufe der Jahre entwickelt hat, sind vermutlich auch nicht alle Wiki-Autoren auf Anhieb von unserer Arbeit angetan ;) Fröhliches Schaffen --Kolja21 (Diskussion) 00:44, 20. Mai 2012 (CEST)Beantworten

Wozu die Aufregung? Das Schlagwort ist seit mindestens Juli 1988 in der SWD, der Körperschaftssatz seit Dezember 1990 in der GKD (viel früher wäre das auch kaum möglich gewesen, denn da war es die "Technische Universität <Berlin, West>"). [Man sieht sehr schön, dass hier die GKD zwei Entitäten kannte, und die SWD nur eine: Da muss dann nachträglich dort differenziert oder hier zusammengefasst werden, so genau kenne ich die Regeln nicht, so richtig automatisch wird es in diesem Fall jedenfalls nicht gehen können]. Bibliothekare haben jedenfalls lange geglaubt, dass sie mit der strikten Trennung der beiden Sphären der Formal- und Sacherschliessung mehr Probleme lösen können als sie sich durch die Dopplung von Datensätzen zur (tendenziell) gleichen "Entität" einfangen. Jetzt sind endlich die diversen Normdateien vereinigt und man hatte bei der Vorbereitung beschlossen, den komplexen Umstellungsprozess (da hingen ja auch noch die "Spiegel" der Normdateien in den bibliothekarischen Regionalverbünden und wiederum deren Sattelliten-Datenbanken in den teilnehmenden Bibliotheken dran) nicht auch noch mit einer gleichzeitigen Zusammenfassung zigtausender Datensätze zu überfrachten, sondern dies "live" ab etwa Juni zu tun, wenn die Regionalverbünde die Umstellung vom April fertig verdaut haben werden und wieder zu einem annähernden Normalbetrieb zurückgekehrt sind. -- Thomas Berger (Diskussion) 02:16, 20. Mai 2012 (CEST)Beantworten

Vielen Dank für die Rückmeldungen, ich werde dann erstmal vom weiteren (sporadischen) Einpflegen von GND-Daten absehen, um doppelte Arbeit zu vermeiden. Grüße --Monsieur Becker (Diskussion) 08:34, 20. Mai 2012 (CEST)Beantworten

Hallo. Ich sehe das anders: Wenn du Lust drauf hast, GNDs einzupflegen oder sowieso darüber stolperst: pack sie ruhig in die Artikel (also eine der GNDs). Werden später zwei GNDs zusammengelegt, gibt es immer eine Weiterleitung - und das lässt sich automatisiert prüfen. Aus GND 1 GND 2 zu machen, nachdem sie auf einer Wartungsliste aufgetaucht ist, macht ja weit weniger Arbeit als überhaupt erstmal eine GND zu recherchieren - im Zweifelsfall kann das (wenn es zuviel wird) sogar automatisiert gemacht werden (wobei ein kurzes Raufschauen natürlich nie schadet). Also: füge ruhig GNDs ein. --APPER\☺☹ 14:54, 20. Mai 2012 (CEST)Beantworten

Unpassende / kollidierende Typen

Ich wollte gerade mal schauen, zu welchen Nicht-Personen-Artikeln man denn direkt noch passende LCCN- und VIAF-Datensätze finden könnte. Bin dabei über die Georg-von-Neumayer-Station (eine Forschungsstation in der Antarktis) gestolpert. Passende VIAF-ID und LCCN existieren und weisen es als geographisches Objekt aus. In der DNB dagegen existieren zwei Datensätze ([2], [3]), aber beide (IMO nicht ganz korrekt) als Organisation. Was macht man am Besten in solchen Fällen? --Kam Solusar (Diskussion) 21:36, 20. Mai 2012 (CEST)Beantworten

Bei der Typ-Angabe orientieren wir uns an den DNB. Was die Dubletten betrifft, so stammt der eine Datensatz aus der SWD-, der andere aus der alten GKD-Normdatei. Wähle eine Nr. aus, ab Juni werden die Dubletten sukzessive von der DNB zusammengeführt. Gruß --Kolja21 (Diskussion) 21:55, 20. Mai 2012 (CEST)Beantworten
Mit den Dubletten hab ich kein Problem, halte mich mit der Eintragung derzeit aber ein bißchen zurück bis dann mal die Dubletten-Bereinigung erfolgt ist. Die unterschiedlichen Typen finde ich aber schon etwas problematisch. Sollten wir z. B. mal dazu kommen, auch zu anderen Typen als nur Personen eigene Tools und Link-Sammlungen wie die Personensuche anbieten zu können, sollten wir sehr bemüht sein, eine möglichst konsistente und fehlerfreie Datengrundlage zu haben. In diesem Fall frage ich mich schon, warum hier ein großer Container am Ende der Welt in der GND als Organisation klassifiziert ist und nicht eher als geografisches Objekt. Auch Expeditionen finden sich z. B. derzeit in der GND bunt verteilt auf Organisationen, Sachbegriffe (Historisches Einzelereignis) und Veranstaltungen. Nach den Renovierungsarbeiten infolge der Zusammenlegung mag das vielleicht dann anders aussehen, es wäre aber nicht schlecht, wenn es in solchen Fällen die Möglichkeit gäbe, direkt eine Korrekturanfrage zu stellen wie es etwa bei Personendatensätzen möglich ist. --Kam Solusar (Diskussion) 06:10, 22. Mai 2012 (CEST)Beantworten
Hi Kam, das Problem sehe ich eher auf unserer Seite. Ich wollte z.B. vorhin dem Euratom-Vertrag eine Werk-GND spendieren, landete dann aber per Weiterleitung auf der Organisation Europäische Atomgemeinschaft. Mal sehen, wie sich das weiter entwickelt. Bislang haben wir uns ja fast ausschließlich auf Personen beschränkt, und das wird vorerst auch der Schwerpunkt für die Normdaten bleiben. Gruß --Kolja21 (Diskussion) 07:35, 22. Mai 2012 (CEST)Beantworten
Ja mal schauen. Es scheint ja beispielsweise bei vielen geografischen Dingen die Möglichkeit zu geben, sie sowohl als Geografikum als auch als Körperschaft zu sehen (Städte, Kreise, Länder, etc..). Oder bei Flughafen vs Flughafenbetreibergesellschaft, Nationalpark vs Nationalparkbetreiber, etc. Da müssen wir mal schauen, wie wir so etwas am besten handhaben. Wahrscheinlich wirds nicht in allen Fällen einfach per Weiterleitung klappen. --Kam Solusar (Diskussion) 06:13, 25. Mai 2012 (CEST)Beantworten

Motivation erläutern

Bei Wikipedia Diskussion:Kurier gibt es wie schon manchmal zuvor die Frage, warum die Normdaten für alle angezeigt werden und was das überhaupt ist. Ich würde ja gerne auf Normdatei verweisen, aber der Artikel ist einigermaßen unverständlich und zeigt m. E. nicht, wozu Normdaten außerhalb eines einzelnen Bibliothekskatalogs überhaupt gut sein sollen. Auch WP:Normdaten zeigt die Ziele der Normdatenverknüpfung nicht recht auf. Da wäre einiges zu ergänzen. --AndreasPraefcke (Diskussion) 09:10, 21. Mai 2012 (CEST)Beantworten

PPNs einbinden?

Hallo, mit {{LBMV PPN}} und {{HessBib PPN}} gibt es noch zwei Vorlagen zu Landes-bibliographischen Normdateien. Können/sollen die irgendwie in die Normdaten integriert werden? --emha d|b 13:50, 29. Mai 2012 (CEST)Beantworten

Danke für den Hinweis. Ich habe die Kategorie:Vorlage:Datenbanklink Normdaten erstellt, damit diese selten genutzten Vorlagen nicht übersehen und demnächst aktualisiert (PND durch GND ersetzen) werden. --Kolja21 (Diskussion) 14:33, 29. Mai 2012 (CEST)Beantworten

In beiden Fällen handelt es sich um lokale PPNs (Pica Production Numbers) des jeweiligen Katalogisierungssystems, nicht um PND- oder GND-Nummern. -- Thomas Berger (Diskussion) 17:18, 29. Mai 2012 (CEST)Beantworten

Stimmt, aber auf den Dokumentationsseiten zu den lokalen Normdaten wird Bezug auf die PND genommen, daher müssten sie überarbeitet werden. Es gibt übrigens auch noch eine {{LBMV SWW}}, die sogar auf Englisch und Arabisch vorliegt. --Kolja21 (Diskussion) 17:50, 29. Mai 2012 (CEST)Beantworten

Als Nichtbibliothekar muss ich mal doof fragen, ob die Landesbibliotheken für Personen und Schlagwörter nicht auch die GND verwenden? --Monsieur Becker (Diskussion) 19:42, 29. Mai 2012 (CEST)Beantworten

Das sind Landesbibliographien: Da geht es dann zum Teil auch um Bücher und v.a. Aufsätze, die nicht "im Besitz" einer konkreten Bibliothek sind. Traditionell sind das eigene Abteilungen mit eigenen Mitarbeitern und präsentiert wird das in einem eigenen Katalog. Technisch ist das allerdings überall seit vielen Jahren in die allgemeinen Verbunddatenbanken integriert und daher stelle auch ich mir als bibliothekarisch eher vorbelasteter Mensch seit langem dieselbe Frage ... -- Thomas Berger (Diskussion) 21:17, 29. Mai 2012 (CEST)Beantworten

Die (regionale) PPN ist die interne Nummer, die es bereits vor der Einführung der GND gab. Sie wird weiterhin verwendet, ist jetzt aber mit der (überregionalen) GND verknüpft. Beispiel: Stephen King im Landesarchiv BW. Die PPNs der Bibliotheksverbünde sind es, die uns die Vielzahl an Dubletten beschert haben. --Kolja21 (Diskussion) 01:23, 30. Mai 2012 (CEST)Beantworten

Die Landesbibliographie BW ist da vorbildlich in der Hinsicht und verwendet GND und stellt auch eine BEACON-Datei bereit. Ich hoffe, dass die anderen da bald nachziehen, dann sollten wir die Vorlagen natürlich umstellen. --AndreasPraefcke (Diskussion) 08:55, 30. Mai 2012 (CEST)Beantworten

Aus dem Gesagten schließe ich, dass keine Notwendigkeit besteht, die PNNs einzubinden. Oder? Wie steht es eigentlich mit einer Seite analog zu GeoHack oder der ISBN-Suche, bloß für GND? --Monsieur Becker (Diskussion) 19:50, 30. Mai 2012 (CEST)Beantworten

Diese PPNs sind offensichtlich Nummern von Normdatensätzen ihrer jeweiligen Anwendungen, für die Normdaten-Vorlage hängen wir hier die Latte aber einige Löcher höher. Ich hatte vor einiger Zeit bei Vorlage_Diskussion:Normdaten/Archiv/2012#NEBIS_aufnehmen ein paar Kriterien zu formulieren versucht, eigentlich läuft aber alles darauf hinaus, ob solche Nummern den Anspruch erheben und das Potential haben, über die eigene Anwendung hinaus wahrgenommen zu werden.
Zur zweiten Frage: Mal abgesehen davon, wie sich Dbpedia und Wikidata entwickeln werden, ist die "Personensuche" auf dem Toolserver [4] eigentlich auf dem Weg, diese Funktion wahrzunehmen. Lt. Statistikseite werden da derzeit etwa 100 Quellen eingebunden, anders als bei der ISBN-Suche ist allerdings schon vorher bekannt, ob die Quelle eine konkrete Person nachweist, insofern gibt es da nie 100 Links. Die Sache ist noch ausbaufähig [5], denn http://beacon.findbuch.de/seealso/pnd-aks weist über 170 Quellen zu GND-Personen nach, die Liste [6] kennt noch mehr Datenbanken, bei denen immerhin eine Recherche nach Normdatennummern möglich ist (ohne dass durch eine BEACON-Datei vorab bekannt ist, ob sie sich lohnt) und auf dem Toolserver wären durch Auswertungen von Interwiki-Links und Live-Abfragen etwa an VIAF auch Ergebnisanzeigen möglich, bei denen im Hintergrund durch simultane Berücksichtigung weiterer Identifier-Systeme für dieselbe Person oder Ressource noch mehr herangeschafft werden kann. -- Thomas Berger (Diskussion) 23:07, 30. Mai 2012 (CEST)Beantworten

Vorlagen SWD und GKD ohne Vorlage Normdaten

Analog #Stand Auflösung der Vorlage:PND dasselbe für Vorlage:SWD und Vorlage:GKD (für Gebietskörperschaften etwa kamen tendenziell beide infrage): Die Liste Schlagworte, Geographika, Körperschaften mit Vorlage:SWD und/oder Vorlage:GKD ohne Vorlage:Normdaten führt alle Verwendungen dieser beiden Vorlagen auf.

Mir scheint da einiges an Quatsch drin zu stehen (etwa bei Geographie von Istanbul oder Geschichte der Sklaverei halte ich es ohne nachzusehen bereits für ausgeschlossen, dass es dazu Normsätze gibt), und im Fall von Verwaltungseinheiten wurde schon des öfteren diskutiert, ob die Normdaten-Nummer nicht eher in die Vorlage:Infobox Verwaltungseinheit in Deutschland bzw. ihre Derivate gehört und da auch einmal automatisiert eingetragen werden kann: Oft gibt es in der DNB keine Literatur über die Verwaltungseinheit und der Nachweis der von ihr herausgegebenen Literatur ist in der DNB uneinheitlich und fast nicht existent (vermutlich hebeln da die Archivgesetzte das Dépot legal aus, genaues weiss ich aber nicht).

Die Liste ist also eher zum anschauen gedacht, nicht zum abarbeiten! -- Thomas Berger (Diskussion) 12:59, 31. Mai 2012 (CEST)Beantworten

Hab gleich mal in die Liste reingeschaut. Die Normdaten (bzw. Literaturhinweise) für Geschichte der Sklaverei müssen nach Sklaverei verschoben werden.[7], [8] Bei den regulären Fällen können, falls nur {{GKD}} oder {{SWD}} vorliegen, selbige durch {{DNB-Portal}} ersetzt und {{Normdaten}} ergänzt werden.[9] Unkorrigiert würde ich vorerst nur jene Fälle lassen, wo GKD und SWD gemeinsam eingetragen sind (und warten, bis die DNB die Dubletten bereinigt hat). --Kolja21 (Diskussion) 13:21, 31. Mai 2012 (CEST)Beantworten

Umgang mit GND auf viaf.org

Wahrscheinlich ist es den meisten schon aufgefallen, die übrigen wollte ich nur kurz darauf hinweisen, dass auf viaf.org jetzt (seit der Umstellung?) erfreulicherweise Tn als undifferentiated markiert werden. --Mai-Sachme (Diskussion) 21:27, 1. Jun. 2012 (CEST)Beantworten

Super, das ist ein riesen Fortschritt. Mir war nur aufgefallen, dass beim letzten Update etliche Personen/Namen, die bereits zusammengeführt waren, getrennt wurden. Offenbar sind die Regeln, wann Personen gemergt werden, strenger geworden. --Kolja21 (Diskussion) 00:10, 2. Jun. 2012 (CEST)Beantworten

Frage nach einem "Normdatenkonsens"

Aufgrund einer Massenlöschung der GND-Daten zu Sachartikeln von Benutzer:Rainald62 hatte ich auf seiner Diskussionsseite nach den Grund gefragt. Meine Anfrage wurde gelöscht und in der Zusammenfassungszeile auf folgende Diskussionen Benutzer_Diskussion:Rainald62#Normdaten und Wikipedia_Diskussion:Richtlinien_Physik#Verlinkung_von_Normdaten_.28SWD.29 verwiesen. Rainald62 versteht den Sinn der Normdaten nicht und fragt nach einem Konsens bezüglich dieser Vorlage. Im Artikel Corioliskraft ist nun diesbezüglich ein Editwar entstanden. Konkret wird dabei Benutzer:Kam Solusar und seine fehlende Diskussionsbereitschaft angegriffen. (Aus meiner Sicht völlig aus der Luft gegriffen, da keiner die Diskussion im Portal Physik verfolgt und Kam Solusar auf seiner Benutzerseite nie angesprochen wurde.) Hinweise auf diese Diskussionsseite hat er auch bisher ignoriert. Ich bin nun ziemlich ratlos. Gibt es hier in der Wikipedia so eine Art Konsens oder was auch immer bezüglich der Normdaten, damit auch Rainald62 von der Sinnhaftigkeit der Normdaten überzeugt werden kann? Ziemlich ratlose Grüße --Silke (Diskussion) 23:40, 1. Jun. 2012 (CEST)Beantworten

Hallo Silewe, danke für den Hinweis. Ich habe mich auf "Richtlinien Physik" dazu geäußert. Gruß --Kolja21 (Diskussion) 00:24, 2. Jun. 2012 (CEST)Beantworten
Ich denke, Benutzer:Rainald62 ist ein Fall für die Vandalismusmeldung. Er interessiert sich weder dafür, was Normdaten sind, noch hat er Interesse an einer Diskussion. --Kolja21 (Diskussion) 00:56, 2. Jun. 2012 (CEST)Beantworten
Ad hominem-Beitrag entfernt. Kein Einstein (Diskussion) 22:18, 3. Jun. 2012 (CEST)Beantworten
Silke, ich verstehe deine Ratlosigkeit - allerdings gibt es da wohl ein Problem dergestalt, dass eine universelle Verlinkung wohl nirgends breit diskutiert wurde und nun genervte Reaktionen hervorrief. Es hat sich auf der dafür natürlich nicht eben optimal geeigneten Seite der Physiker eine einigermaßen konstruktive Diskusion entwickelt. (Woanders blieb das zwei Monate ohne Resonanz.) Thomas Berger hat imho eine praktikable Lösung vorgeschlagen. Ich möchte diese auch hier zur Diskussion stellen: Gibt es Einwände gegen „Normdaten vom Typ s (Sachbegriffe) sollen keine Anzeigebox erzeugen“? Damit wäre doch das Ärgernis (der einen) beseitigt, während die Vorteile noch vorhanden sind. Gruß Kein Einstein (Diskussion) 22:18, 3. Jun. 2012 (CEST)Beantworten
Ich selber hatte nicht bemerkt, dass diese Diskussion bereits im Februar zum Einsatz der Vorlage:SWD gestartet war und jetzt anlässlich intensiver Umstellung auf die Vorlage:Normdaten wieder aufgeflackert ist. Bezüglicher ersterer waren Beurteilungen nach WP:WEB legitim (ob für in Kategorie:Datenbanklinks eingestufte Vorlagenverwendungen ein anderes Mass angelegt werden sollte, wäre allerdings auch einmal eine Diskussion irgenwo wert), bezüglich letzterer laufen sie ins Leere ("Normdaten" ist so etwas ähnliches wie Kategorien). Das ist aber ein ziemlich formalistisches Argument und dürfte unserem Hauptanliegen, dass möglichst niemand sich durch die Vorlagenverwendung provoziert fühlen sollte diese aus Artikeln zu löschen, nicht hilfreich sein. Auch in den Bibliotheken gibt es unterschiedliche Communities, Mathematikern z.B. sind die Schlagworte herzlich egal, weil sie seit jeher eine international akzeptierte Fachklassifikation haben. Dementsprechend sind Vollständigkeit und Pflege der SWD-Begriffe gerade im Bereich der Sachschlagworte von Fach zu Fach durchaus unterschiedlich und wir hier können das weder leugnen oder kurz- oder mittelfristig "reparieren" noch ist es unsere Aufgabe, Stellvertreterdiskussionen zu führen: Ob die SWD Bibliotheken glücklich macht, interessiert uns nur insofern, als wir Wert auf Verlinkungen zu einem System legen, das von einer möglichst breiten Community aktiv gepflegt wird. Und ob die SWD der Wikipedia nutzt, ist eine sehr unscharf gestellte Frage, mögliche Antworten sind "Nein, niemand hat vor die Wikipedia zu verschlagworten" oder "Ja, denn die SWD ist partiell crosskonkordanziert".
Bezüglich Personen hat es sich im Laufe der Zeit so entwickelt, dass wir die ursprügnliche Vorlage:PND einerseits in ihre "zeige-den-Benutzern-Literatur"-Funktionalität als Vorlage:DNB-Portal und andererseits in eher abstrakte Verlinkungen mittels Vorlage:Normdaten aufgespalten haben. Die Links in letzterer dienen primär zur Überprüfung der Zuordnung, wobei (etwa im Fall von VIAF oder NDL) ein Zusatznutzen auch für Normalbenutzer nicht auszuschliessen ist. Wartungsvorlagen wie Vorlage:PNDfehlt sind in einen <div class="catlinks metadata"> gesetzt und werden für Benutzer ausgeblendet, die nicht MediaWiki:Gadget-Personendaten.css (Achtung: historischer Name, gemeint sind Metadaten) aktiviert haben. Für Normdaten (<div class="catlinks normdaten-typ-X">) fehlt eine solche differenzierte Oberflächenbehandlung, allerdings werden einige Parameter der Vorlage in ein <span class="metadata"> gesetzt und sind damit auch nur den Benutzern mit aktiviertem Gadget sichtbar. Denkbar wären nun:
  1. ein eigenes Gadget für Normdaten (Standard wäre dann allerdings "on"?)
  2. Für gewisse Normdatentypen X ein Ausblenden von div.normdaten-typ-X in der allgemeinen load.php plus Reaktivieren im Rahmen des vorhandenen Helferleins Gadget-Personendaten.css (scheint mir logisch am saubersten)
  3. Anpassung der Vorlage:Normdaten, so dass bei gewissen Normdatentypen das Normdaten-div komplett zusätzlich die CSS-Klasse metadata spendiert bekommt (lässt sich in rein lokaler Regie durchführen)
-- Thomas Berger (Diskussion) 23:57, 3. Jun. 2012 (CEST)Beantworten
Warum sollen wir die eigene Arbeit sabotieren: Normdaten eintragen, aber für den Typ s (Sachbegriff) nicht anzeigen? Ich wäre wohl nicht der Einzige, der in diesem Fall ganz auf den Eintrag verzichten würde. Dass sich bei einem Projekt dieses Umfangs sich ein, zwei Gegenstimmen finden, ist völlig normal. Niemand wird gezwungen, Normdaten einzutragen, aber wer sich die Arbeit macht, hat ein Recht darauf, dass sie nicht mit Kommentaren wie "Unsinn" oder "Wir wollen doch den Exzellenz-Status nicht gefährden" per Revert-Taste zerstört wird. --Kolja21 (Diskussion) 04:17, 4. Jun. 2012 (CEST)Beantworten
Ad hominem-Beitrag entfernt. Darf man KeinEinstein fragen, was ihn dazu berechtigt, meinen Diskussionsbeitrag durch eine themenfremde Überschrift als Verlinkung zu ersetzen?
Einen persönlichen Angriff nach Ad hominem kann ich in meinem Text nicht ausmachen, auch keinen persönlichen Angriff nach WP-Regeln.
Von mir wurden dort Verhältnisse beschrieben, die das befremdende Wirken einiger anonymer Mitautoren, Physik-Redakteure und Admins konkret im Zusammenhang mit realen Konflikten innerhalb der WP betrifft, insbesondere zu Rainald62 dessen Verhalten hier von Kolja angesprochen wurde.
Wenn zu Rainald62 der Hintergrund aufgezeigt werden kann, können die hier an der Diskussion beteiligten Mitautoren sich orientieren. Das KeinEinstein hierzu sofort verschleiernd aktiv wird, passt haarscharf in das Profil von ihm, welches bereits in meinem von ihm gelöschten Beitrag steht. --Carl von Canstein (Diskussion) 08:10, 4. Jun. 2012 (CEST)Beantworten

@Kolja21: Die Frage ist doch, wozu die Normdaten im Artikel nützlich sind. Das "taggen" der Artikel, beispielsweise zum automatisierbaren Verlinken ist wohl unbestritten sinnvoll. Wenn aber die für den Leser durch Anklicken sichtbaren Links von den Fachleuten als untauglich betrachtet werden, dann ist Bedarf für Verbesserung da. Kai-Martin hat ja Beispiele verlinkt, solche Angaben würden bei den Weblinks i.d.R. hochkant rausfliegen - und das zeigt das Problem für die Physiker auf, sichtbar stellen viele der Links eine Verschlechterung für den Leser dar. @Thomas Berger: So weit ich das verstehe, scheint deine Variante 2 gut. @Carl: Dein (übrigens wieder von sachlichen Fehlern garnierter) Beitrag geht am Thema vorbei. Es geht hier um eine inhaltliche Frage, die Normdaten. Kein Einstein (Diskussion) 14:02, 4. Jun. 2012 (CEST)Beantworten

Hallo Kein Einstein, natürlich können auch die Links wertvoll sein, müssen aber nicht. Der Punkt ist doch, dass sich Autor A Arbeit macht, die Autor B per Revers-Button löscht und ihm Kommentarfeld dazu noch vorhält, dass er nicht lesen könne, Unsinn mache und natürlich nur er, Autor B, ein Fachmann sei. Der Sinn von Normdaten liegt nicht darin, dass man leichter 20 Bücher bei der DNB findet, dafür gibt es die Vorlage {{DNB-Portal}}. Während offenbar die meisten Autoren das auf Anhieb verstehen, treten jetzt ein, zwei Autoren aus dem Portal:Physik mit dem Schlachtruf "Wir sind die Fachleute!" auf, die im Grunde behaupten, die Leser seinen zu dumm, um Normdaten zu verstehn und müssten daher vor diesem Wissen und "irreführenden Weblinks" geschützt werden. Mit Physik haben Normdaten aber herzlich wenig zu tun. Das zuständige Fachgebiet fällt in den Bereich der Bibliothekswissenschaft. Fazit: Egal, welche Beispiele man aus den Millionen von Datensätzen raussucht: Dass ein schlecht angelegter oder verlinkter Normdatensatz plötzlich dadurch besser wird, dass man ihn versteckt, wirst du mit keinem von ihnen beweisen können. Nicht umsonst teilen wir seit Jahren (erfolgreich) der DNB Verbesserungsvorschläge über die Liste WP:PND/F mit. Gruß --Kolja21 (Diskussion) 15:52, 4. Jun. 2012 (CEST)Beantworten
Ich stimme dir nur teilweise zu. Wenn ein Bibliothekswissenschaftler Einwände gegen die Normdaten eines Artikels oder eines Bereichs hat, dann ist das imho ebenso ein KO-Argument wie der Einwand eines Fachwissenschaftlers. Andersherum gesagt: Wenn nur einer von beiden zufrieden ist, dann liegt ein Problem vor.
Und ganz ernsthaft: Wenn der Sinn von (angezeigten) Normdaten nicht darin besteht, dass der Leser dieser anklickt und etwas davon hat - welchen Sinn hat die Anzeige denn dann? Da kann ich derzeit keinen Vorteil erkennen.
Die Seite WP:PND/F kannte ich noch nicht. Sie bezieht sich jedoch nur auf die (in diesem Zusammenhang viel leichter zu wartenden) Personen und hat einen Rückstand von einem dreiviertel Jahr. Ich sehe nicht, wie das im Bereich der Naturwissenschaften (für beide Seiten) machbar wäre, da kann ich mich aber auch irren. Kein Einstein (Diskussion) 17:52, 4. Jun. 2012 (CEST)Beantworten
Hallo Kein Einstein, wie schon gesagt, sind Normdaten keine Weblinks, auch wenn sie zur Verlinkung genutzt werden können. Wenn jetzt also ein Literaturwissenschaftler kommt und die Normdaten zu Thomas Mann löscht, weil da ein Buch verlinkt ist, dass den von ihm geschätzten Nobelpreisträger völlig missverstanden hat oder, schlimmer noch, ein Buch, dass gar nicht zu dem Thema gehört, geht das an der Sache vorbei. Die Normdaten verknüpfen Namen und Begriffe mit Identifikatoren, damit klar ist, ob sich das Wort "New York" auf das Geografikum New York (Bundesstaat), das Werk New York (Zeitschrift) oder die Person Tiffany Pollard bezieht. Ähnlich wie bei den Interwikilinks lautet die Frage also nicht: Ist der fremdsprachige Artikel fachlich fundiert geschrieben? Sondern: Beziehen sich die Lemmata auf das gleiche Thema, die gleiche Person, den gleichen Ort? Wenn du nur an den auf die {{Normdaten}} klickenden Leser vom 4. Juni 2012 denkst, hast du 95 Prozent des Potentials, das in den Normdaten steckt, ausgeblendet. Gruß --Kolja21 (Diskussion) 18:57, 4. Jun. 2012 (CEST)Beantworten
Aber das ist genau das Argument, warum es im Bereich der Sachbegriffe, wo derzeit wahrscheinlich ohnehin nur ein paar hundert Artikel mit der Normdaten-Vorlage versehen sind, nicht besonders weh tut, die nicht jedem zu zeigen. Wenn es irgendwann Abertausende sind und entsprechend weiterführende Anwendungen entstanden sein werden, wird der Nutzen einer Anzeige viel deutlicher aufscheinen. Es ist ja auch wirklich so, dass sich Erfahrungen mit der PND nicht zwangsläufig auf die SWD übertragen: Im Vergleich zur "Marke" PND führt die deutlich ältere SWD ein Nischendasein, wurde von nicht so vielen außerbibliothekarischen Projekten aufgegriffen (einzig mir bekannt: Museen überlegten, ob die SWD für ihre Dokumentationszwecke einsetzbar ist) und auch die internationale Vernetzung mit LCSH und Rameau steckt noch in den Anfängen. Wir wissen ohnehin, dass Akzeptanz und Erfolg von der Menge der Verlinkungen beeinflusst sind und hoffen zudem, dass in der Welt von Linked Open Data die Investition in die Erzeugung von Normdaten-Vorlagen in Sachartikeln sich irgendwann genau so auszahlen wird wie die in Personenartikel. In dieser Phase des Versprechens sind wir auf den Goodwill aller Bearbeiter angewiesen. Auf dieser Seite ist also die Frage, ob uns für jedermann sichtbare Normdaten-Boxen in Sachartikeln so viel mehr nutzen als unsichtbare (etwa weil das Interessenten anzieht oder dokumentiert, dass "die Wikipedia" da was tut), so daß wir das zwangsläufige Mehr an Konflikten inkauf nehmen wollen. -- Thomas Berger (Diskussion) 19:47, 4. Jun. 2012 (CEST)Beantworten
(Nach BK, war an Kolja21 gerichtet:) Du musst mir schon glauben, dass ich dich gerne verstehen will. Aber was ich noch nicht verstanden habe ist: Warum müssen die Normdaten sichtbar sein? Ich habe das Argument der Bevormundung verstanden - das man aber auch verwenden könnte, um WP:WEB auszuhebeln. Und ich sehe natürlich den Vorteil, wenn die angegebene Literatur weiterführend ist. Derzeit ist die Lage im Bereich der Naturwissenschaften aber eher so, dass - um bei deinem Beispiel zu bleiben - die zu Thomas Mann verlinkten Bücher nur manchmal etwas mit ihm zu tun haben, meist aber irgendwelche Zauberberge, Krankheitsepidemien in Venedig, Männer im Allgemeinen und so fort als Thema haben. Und da schaudert es den Thomas-Mann-Fachmann und er fragt, ob solche Verlinkungen sein müssen. Vermutlich aber sollten das Dritte entscheiden, wir kommen einander ja nicht wirklich näher. Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)Beantworten
Thomas Berger: Ja, so kann man es ausdrücken. Danke für deine vermittelnden Worte (Hier und bei WD:RLP). Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)Beantworten
"die Leser seinen zu dumm, um Normdaten zu verstehn" (Kolja21) – die meisten werden schlau genug sein, nach dem ersten Ausprobieren diese Links zu meiden, aber selbst das bedeutet immense Zeitverschwendung und millionenfaches Kopfschütteln. – Rainald62 (Diskussion) 00:33, 5. Jun. 2012 (CEST)Beantworten
Entschuldige Dich lieber dafür, dass Du als Auslöser dieser Diskussion ohne Rücksicht auf Vorautoren revertiert hast. Du kennst die Regeln genau, hältst Dich aber nur dann daran, wenn das allgemeine Augenmerk gerade auf Dich und Deine Beitragsliste gerichtet ist. Dein Verhalten bedeutet angesichts der langen Liste von VM´s, Verwarnungen und Sperre die Du (nicht nur von mir) auf dem Kerbholz hast, weit mehr Zeitverschwendung und Kopfschütteln als ein sich noch entwickelndes Projekt der Normdaten. --Carl von Canstein (Diskussion) 07:40, 5. Jun. 2012 (CEST)Beantworten
+1 und bitte Rainald, unterlass es, mich absichtlich falsch zu zitieren. Für solche Verdrehungen und Unterstellungen sollte man dich sperren. --Kolja21 (Diskussion) 16:03, 5. Jun. 2012 (CEST)Beantworten
Außerhalb der WP sind Normdaten längst zum Standard geworden, sind neben den bibliografischen Datenbanken unverzichtbare Bestandteile der bibliothekarischen Erschließung. Es ist nicht immer der Weg von der Wikipedia über die Normdaten zu anderen Druckerzeugnissen, es sollte hier auch umgekehrt der Weg von den Druckerzeugnissen dann hin zur Wikipedia betrachtet werden.
Der derzeitige Kampf der Physikredaktion gegen die Normdaten erinnert mich etwas an den früheren Kampf der IEEE gegen die unpraktischen und völlig unverständlichen metrischen SI-Einheiten: man gibt schließlich den Durchmesser eines zölligen Rohres besser in Zoll an. Irgendwann einmal wird jedoch auch das sich erübrigt haben. :-) --≡c.w. 16:51, 5. Jun. 2012 (CEST)Beantworten

Was wird denn nun mit dem Ausblenden der GNDs in Sachartikeln? (entweder pauschal den Typ SWD ausblenden oder Einzelfallentscheidung per Schalter in der Vorlage) – Rainald62 (Diskussion) 14:54, 5. Jul. 2012 (CEST)Beantworten

Das Ausblenden der Normdaten ist nicht erwünscht. Gruß --Kolja21 (Diskussion) 21:49, 5. Jul. 2012 (CEST)Beantworten
Entschuldige bitte, Kolja, aber das ist nicht der Stand der Diskussion. Ich hätte Rainalds Nachfrage gerne anders formuliert gesehen, sehe deine Antwort aber auch nicht als hilfreich an. Kein Einstein (Diskussion) 22:13, 5. Jul. 2012 (CEST)Beantworten
Ich habe mir die Diskussion nochmal in Gänze zu Gemüte geführt und verstehe die aufgeführten Probleme im Bereich Physik. Andererseits sehe ich auch die Vorteile in vielen anderen Bereichen, die durch die Verknüpfung mit Normdaten entstehen. Ich gehe davon aus, dass mit einer zukünftigen Weiterentwicklung der Bibliothekssysteme die GND viel stärker als bisher als Zugriffsmöglichkeit angeboten wird, sodass nicht nur auf die DNB, sondern auch auf die Bestände naturwissenschaftlicher Bibliotheken zugegriffen werden kann. Kurzum: Ich plädiere dafür, dass die GND-Daten auch im Bereich Physik eingepflegt und angezeigt werden. --Monsieur Becker (Diskussion) 22:40, 5. Jul. 2012 (CEST)Beantworten
Danke für deinen Kommentar als Dritter. Einpflegen ist ja nicht das Problem. Warum die Anzeige?? Gruß Kein Einstein (Diskussion) 22:48, 5. Jul. 2012 (CEST)Beantworten
Ich persönlich bin ein großer Befürworter der GND, da sie meines Erachtens bei breiter und konsequenter Nutzung den Zugang zu Wissen verbessert. »Wir« als Wikipedia sind ein Schwergewicht und können der GND zu mehr Bedeutung verhelfen. Das klappt nur, wenn sie auch möglichst vollständig und sichtbar eingebunden wird. So wird es später zum Beispiel attraktiver, eine Physik-Bibliographie zu erarbeiten, die mithilfe der GND inhaltlich gut erschlossen wird. Rückkopplung mit Bibliothekskatalogen nicht ausgeschlossen. Ich weiß, klingt utopisch. Noch. --Monsieur Becker (Diskussion) 23:06, 5. Jul. 2012 (CEST)Beantworten
Ich kann deinen Gedankengang gut nachvollziehen und hege durchaus Sympathie für ihn. Aber in der Abwägung "Möglicher Gewinn für die (ggf. fernere) Zukunft durch Nutzung des WP-Impacts" vs. "Derzeitiger Nutzen oder eher Schaden für den WP-Leser" komme ich zu einem drastisch anderen Ergebnis: Wir wollen unseren Lesern eine möglichst gute Enzyklopädie bieten, den Einfluss der WP als Mittel zu einem noch so guten Zweck zu nutzen kollidiert imho mit einer unserer Grundsätze: Wie wir keine Theorieetablierung betreiben dürfen, wie wir nicht entscheiden dürfen, was richtiger oder falsch ist, so müssen wir uns auch hier sehr zurückhaltend sein. So "benutzen" wir eher unsere Leser, weil wir es ja besser für sie wissen (klingt recht moralisierend, ist auch so). Kein Einstein (Diskussion) 11:41, 6. Jul. 2012 (CEST)Beantworten
Ich glaube, ich habe mich ungünstig ausgedrückt: Mein Ansinnen ist es nicht, den »WP-Impact« für die GND auszunutzen, weil sie sonst nur vor sich hindümpelte und ein Schattendasein fristete. Im Gegenteil. Die GND wird heute schon vielfach verwendet, insbesondere jene Datensätze, die aus der PND stammen. Für mich ist es aufgrund der Zusammenführung zu einer gemeinsamen Normdatei nur folgerichtig, dass wir auch die anderen Teile (ehemals SWD und GKD) in die Wikipedia integrieren. Das machen abgesehen von Bibliotheksverbünden vermutlich noch nicht viele, sodass uns zwar eine Vorreiterrolle zukommt, aber nicht in dem Sinne, dass wir den Lesern etwas aufdrücken, um sie zu bevormunden oder zu bemuttern. Bedauerlicherweise hat die GND in einigen Bereichen offenbar (noch) nicht die gewünschte Qualität erreicht. Du leitest daraus einen möglichen Schaden für die Nutzer ab, ich würde in den konkreten Fällen eher von Nichtnutzen sprechen, denn jeder Leser sollte in der Lage sein, die Literaturangaben zu bewerten. Klar, im Normalfall sollte ein Verweis auf die DNB (ähnlich wie bei den Weblinks) einen Mehrwert darstellen, ich halte es in den konkreten Fällen aber für verkraftbar, dass noch kein übermäßiger Nutzen entsteht. --Monsieur Becker (Diskussion) 21:47, 6. Jul. 2012 (CEST)Beantworten

Hallo Kein Einstein, ich sehe in Rainalds steter Wiederholung der gleichen Forderung kein neues Argument und insofern - wie bei einem LA - auch keinen Grund, die Diskussion wieder von vorne aufzurollen. Gruß --Kolja21 (Diskussion) 22:28, 5. Jul. 2012 (CEST)Beantworten

Hallo Kolja21. Es ist nicht nur Rainalds Forderung, hier ist sich ein Fachbereich ziemlich einig. Und die alte Diskussion ist leider nicht zu einem Abschluss gebracht worden. Ich sehe Thomas Bergers Vorschlag hier als Brücke, auf die leider nicht reagiert wurde. Daher sehe ich das eben nicht als erledigten Fall. Gruß Kein Einstein (Diskussion) 22:44, 5. Jul. 2012 (CEST)Beantworten

Hallo Kein Einstein, selbst wenn sich alle Mitarbeiter des Portals Physik einig sind oder wären, liegen seit der letzten Diskussion vor einem Monat mittlerweile konkrete Zahlen vor. Aus der Vorlage:NORMDATENCOUNT geht hervor, dass die GND (einschl. PND) in fast 200.000 Artikeln eingebunden ist. Vom "Typ s" (Sachbegriffe) sind nur 2.312 Artikel betroffen. Selbst wenn jeder zehnte davon zu einem physikalischen Thema wäre, betrifft die Diskussion nur 0,01 Prozent der Artikel. Ausnahmeregelungen zu treffen, ist immer unangenehm, aber in diesem Fall angesichts der Größenordnung imho völlig überflüssig. Gruß --Kolja21 (Diskussion) 01:19, 7. Jul. 2012 (CEST)Beantworten

Hallo Kolja21. Deine Zahlen kann man selbstverständlich genausogut umdrehen: Wenn es nur um 0,01% aller Artikel geht, dann ist doch eine Ausnahme kein Problem... Dieses Argument ist in meinen Augen sehr schwach. Und ob die anderen Typ s - Einträge sinnvoll sind, wäre zu belegen. Dazu kommt das grundsätzliche Problem, dass dein Argument der „Ausnahmeregelung“ impliziert, dass es eine „Regelung“ gibt - eben wird aber angezweifelt.
Hier kollidieren, wie mir scheint, zwei Prinzipien: Das (sinnvolle) Prinzip, dass die Normdaten-Leute die Normdaten nach ihrem Sachverstand projektweit umsetzen dürfen. Und das (sinnvolle) Prinzip, dass die Fachleute in ihrem Bereich (hier: Die Redaktion Physik) entscheiden können, welche Einträge (Kategorien, Normdaten, whatever) innerhalb ihres Fachbereichs sinnvoll sind und welche nicht. Aus Sicht der RP ist es schon ein gewisses Zugeständnis, die Normdaten-Einträge überhaupt zuzulassen. Ich sehe bei dir bisher nur das Festhalten an der Maximalforderung. Ist kein Kompromiss möglich? Das wäre schade. Gruß Kein Einstein (Diskussion) 22:35, 8. Jul. 2012 (CEST)Beantworten

Hallo Kein Einstein, es wird niemand gezwungen, die Normdaten für einen Sachartikel einzutragen. Die Ausgangslage war ja folgende: Einige Autoren haben die Normdaten für Physikartikel eingetragen, Rainald hat sie wieder gelöscht, mit dem Argument, es wäre keine brauchbaren Weblinks. Die Normdaten sind ein Angebot. Ob ihr sie nutzt, bleibt euch überlassen. Anders gesagt: Entweder, die Normdaten sind sinnvoll, dann sollte man sie auch anzeigen oder sie sind es nicht, dann braucht man sie nicht unsichtbar zu machen, sondern kann sie einfach weglassen. Für das Portal:Hörfunk, das ich betreue, kann ich nur sagen, dass sie eine große Hilfe sind, da sie bei mehrdeutigen Begriffen eine eindeutige Zuordnung ermöglichen. --Kolja21 (Diskussion) 02:36, 9. Jul. 2012 (CEST)Beantworten

Meilenstein < 174.000

In der Kategorie »Veraltete Normdaten« gibt es jetzt weniger als 174.000 umstellungsbedürftige Einträge. Einen herzlichen Dank an alle, die fleißig mitmachen. --Monsieur Becker (Diskussion) 07:47, 8. Jun. 2012 (CEST)Beantworten

Das ist schön, aber diese Kategorie halte ich für keine gute Idee. Eine Wartungskategorie in 170.000 Artikeln, die ja an sich völlig ok sind und nur bei Vorliegen anderer Korrekturen "verbessert" werden sollten, ist kontraproduktiv für das Image der Normdaten insgesamt. Wenn in einem alten Artikel von mir ohne Not plötzlich eine Wartungskategorie für ein kosmetisches Problem erscheint, wäre ich jedenfalls nicht begeistert. Und für die Statistik ist die Kategorie auch unwichtig, denn Vorlage:NORMDATENCOUNT ergibt ja täglich die aktuelle Zahl. --AndreasPraefcke (Diskussion) 09:31, 8. Jun. 2012 (CEST)Beantworten
Nunja, die Kategorie erscheint ja auch nicht im Artikel, jedenfalls nicht bei Standardeinstellungen. --Mai-Sachme (Diskussion) 11:49, 8. Jun. 2012 (CEST)Beantworten
Ich halte die Umstellung auf die GND für mehr als eine reine kosmetische Angelegenheit. Auch der Begriff »veraltet« ist meines Erachtens nicht kontraproduktiv, da die PND de facto veraltet ist. Davon abgesehen konnten im Rahmen der Abarbeitung bei vielen Einträgen auch schon VIAF- und LCNN-IDs hinzugefügt werden, sodass die Kategorie aus meiner Sicht ihren Nutzen hat. --Monsieur Becker (Diskussion) 18:34, 8. Jun. 2012 (CEST)Beantworten
Die Kat schärft das Bewusstsein ... oder sagen wir einfach, ist gute PR für die Umstellungsarbeit. Fröhliches Schaffen! --Kolja21 (Diskussion) 00:38, 9. Jun. 2012 (CEST)Beantworten

Die Normdaten im Artikel sind nicht veraltet, sowohl das "Datum" selbst als auch die Beschriftung fuer den Leser sind voellig in Ordnung. Das einzige, was veraltet ist, ist der Quelltext der Vorlage. Ich halte es fuer voellig sinnlos, wenn dafuer User auch nur eine Sekunde Lebenszeit aufwenden. Die automatische Ersetzung im Rahmen von anderen Projekten habe ich auch bereits angestossen (zB machta aka das jetzt bei der Rechtschreibverbesserung mit, und ein Skript fuer automatische Quelltextverbesserung macht die Aenderung jetzt auch mit). Die diversen Bots muessen noch dazukommen. Wichtig ist tatsaechlich das Anreichern auch aelterer Artikel mit VIAF und LCCN, wenn die Kategorie also dabei irgendwie hilft: meinetwegen. ----AndreasPraefcke (Diskussion) 07:35, 9. Jun. 2012 (CEST)Beantworten

Hallo Andreas, wo du von anstoßen sprichst, hast du bei den Botanfragen die Vorlage:PNDfehlt (16.239 Einbindungen) miteinbezogen? Im Grunde könnten wir alle Einträge löschen, bei denen nur ein Parameter (die Datumsangabe) vorliegt, oder? Gruß --Kolja21 (Diskussion) 15:20, 9. Jun. 2012 (CEST)Beantworten
Wäre es nicht sinnvoller, derartige Verwendungen der Vorlage:PNDfehlt, statt sie ersatzlos zu löschen, auf {{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=|GNDName=|GNDfehlt=|GNDCheck=Datumsangabe im Format JJJJ-MM-TT|REMARK=}} umzuschreiben (vorausgesetzt, dass die Vorlage:Normdaten im Artikel noch nicht eingebunden ist)? Dadurch bleibt die Information erhalten, dass es sich um einen Personenartikel handelt (selbst wenn andere Merkmale eines Personenartikels fehlen sollten, wie etwa die Vorlage:Personendaten oder Personenkategorien) und dass die Eintragung einer GND vom Typ Person erwünscht wäre. --UV (Diskussion) 17:49, 9. Jun. 2012 (CEST)Beantworten
Davor müsste geprüft werden, ob nicht mittlerweile eine GND vorhanden ist. Durch die Einspielung der regionalen Datensätze Ende 2011 / Anfang 2012 sind die alten Datumsangaben obsolet. Ob es sich um eine Person handelt, die noch keine Normdateneintrag hat, kann man leicht über die Kats Mann/Frau feststellen. Der Auftrag an den Bot eilt aber nicht. Wir können auch erstmal abwarten, wieviele Leute sich an der Abarbeitung der veralteten Vorlage:PNDfehlt beteiligen. --Kolja21 (Diskussion) 18:57, 9. Jun. 2012 (CEST)Beantworten
Ich könnte mir vorstellen, dass es auch (vereinzelt) Personenartikel gibt, die irgendwie durch die Eingangskontrolle o. ä. durchgerutscht sind, wo sowohl die Vorlage:Personendaten als auch die Kats Mann/Frau und andere Personenkats fehlen und nur z. B. Kategorien wie „Sport (in LAND)“ oder „Wissenschaft (in LAND)“ oder „Politik (in LAND)“ o. ä. gesetzt sind. Zugegebenermaßen wird die Anzahl dieser Fälle nicht allzu hoch sein, aber bei diesen Artikeln könnte dann die Vorlage PNDfehlt das einzige (automatisch auswertbare) Kennzeichen sein, dass es sich bei diesem Artikel um einen Personenartikel handelt. --UV (Diskussion) 19:17, 9. Jun. 2012 (CEST)Beantworten

Ich habe einmal den Dump 2012-06-03 durchgezählt und es sieht so aus:

  • 10733 Vorlageneinbindungen mit einem Parameter (nur Datum also), davon tragen 1189 eine Vorlage:Normdaten (drei davon mit PND korrigiere ich gleich)
  • 5532 Einbindungen mit zwei Parametern (also mit PND-Nummer eines zu dem gegebenen Datum nichtindividualisierten Satzes), davon 4198 mit Vorlage:Normdaten, davon wiederum 83 mit PND (Spekulation: das sind Fälle Tp existiert, Tn trägt Literatur)
  • 50 Einbindungen mit drei Parametern (Angabe eines abweichenden Namens): (inzwischen umgestellt dank Mai-Sachme und Kolja21)

Ich denke, jede Einbindung von PNDfehlt sollte zumindest in eine Vorlageneinbindung Normdaten|TYP=p umgewandelt werden (sofern noch nicht vorhanden), jeder Parameter #2 in den Parameter GNDname. Das Datum sollte m.E. nach GNDcheck überführt werden (die entsprechenden Monatswartungskategorien wären noch anzulegen), dann sind die 17.000 Pflegefälle etwas auseinandersortiert und es wird weniger frustrierend sie abzuarbeiten. Das Argument von Kolja verstehe ich nicht: Die Datumsangaben dienen doch gerade dazu, Fälle von nachträglichen Verbesserungen in der Normdatei in den Griff zu bekommen: Wenn ich sehe, dass zum Stand 2010-01 kein Tp-Satz existierte, lohnt es sich nachzusehen. Wenn hingegen jetzt durch einen Automatismus 2012-06 eingetragen würde, müsste ich davon ausgehen, dass auch aktuell kein Tp-Satz existiert, weil das diesen Monat jemand überprüft hat... -- Thomas Berger (Diskussion) 22:21, 9. Jun. 2012 (CEST)Beantworten

Natürlich ist die Datumsangabe hilfreich - bei der neuen Vorlage:Normdaten. Bei dem PNDfehlt-Hinweis ist es dagegen schnuppe, ob die letzte Überprüfung 2008 oder 2010 stattgefunden hat, da 2011/2012 die regionalen Bibliotheksverbünde mit aufgenommen wurden und damit eine Flut neuer GND-Datensätze angelegt wurde. --Kolja21 (Diskussion) 20:08, 10. Jun. 2012 (CEST)Beantworten
Der GNDCheck-Parameter in der Normdaten-Vorlage ist doch genau aus dem Grund eingeführt worden, die Funktion des Datumsparameters aus PNDfehlt zu übernehmen! Also können auch die Daten existierender PNDfehlt-Einbindungen in die Normdaten-Vorlage überführt werden. Aus Sicht eines Einzeldatensatzes ist es auch egal, ob seit der letzten Kontrolle 300 oder 3.000.000 Sätze neu in die Normdatei aufgenommen wurden, was zählt ist, ob zu dieser Person oder nicht... Andersherum gedacht: Welches Datum würdest Du denn als GNDCheck eintragen, wenn per Bot die PNDfehlt's aufgelöst werden? -- Thomas Berger (Diskussion) 22:51, 10. Jun. 2012 (CEST)Beantworten
Das ist eine Fangfrage ;) Ich halte die alte PNDfehlt-Vorlage (mit nur einem Parameter) ja eher für überflüssig, aber wenn sich genug Leute finden, die sich der Arbeit annehmen wollen, bin ich der letzte, der sie boykottieren würde. --Kolja21 (Diskussion) 00:49, 11. Jun. 2012 (CEST)Beantworten
Lass' uns das mal differenzieren: Zu 10.000 PNFfehlt "nur mit Datum" sind zwischenzeitlich knapp 3.000.000 Tn-Sätze in der PND hinzugekommen. Die Chance ist tatsächlich gross, dass der Name inzwischen in der GND vorkommt, aber kaum verändert im Hinblick auf "meldbare" Tn's, also solchen mit Literatur in der DNB. Allerdings sind - und das betrifft auch die 5.000 PNDfehlt mit Tn-Angabe - aus den Masseneinspielungen ein paar Zigtausend Tp hinzugekommen, das tritt m.E. aber nicht sonderlich hervor, denn von 2007 (so alt sind die Daten in PNDfehlt manchmal) bis 2012 ist auch "regulär" eine enorme Zahl von Tp-Sätzen angelegt worden. Ich denke jedoch, dass Neuprüfung eines vor fünf Jahren mit PNDfehlt versehenen Artikel in sehr vielen Fällen immer noch dasselbe Ergebnis bringt, wohingegen ein noch nie geprüfter Artikel deutlich häufiger einen Treffer haben wird. Die Crux ist natürlich, dass wir nie wissen, wie alt der Datumsstempel sein muss, damit sich eine - evtl. sogar systematische - erneute Prüfung lohnt (nur dass ein fünf Jahre nicht geprüfter Satz evtl. lohnender ist als ein zwei Jahre nicht geprüfter, vorausgesetzt die Personen sind aufgrund nicht scharf formulierbarer Kriterien genügend vergleichbar). Die Alternative zur 1:1-Überführung der Daten aus PNDfehlt in die Normdaten-Vorlage ist eigentlich nur das komplette Verwerfen von PNDfehlt, wie Du es ja auch vorzuschlagen scheinst, das würde aber bedeuten, die Artikel auf "noch nie geprüft" heraufzustufen: Bevorzugte, angebliche Erst-Prüfung wäre dann angebracht, was für die 17.000 fraglichen Artikel locker 2.000h Arbeit sind, die wir bei Erhaltung der Zeitstempel leichter in die Zukunft schieben könnten. -- Thomas Berger (Diskussion) 01:54, 11. Jun. 2012 (CEST)Beantworten

Überprüfung der VIAF-Einträge auf Zusammenführung

Beim it. Schauspieler Stefano Accorsi war ursprünglich die VIAF-ID 103292496 eingetragen. Diese wird nun automatisch auf 19917790 weitergeleitet. Ich gehe stark davon aus, dass hier mehrere Datensätze zusammengeführt wurden. Da eine regelmäßige manuelle Überprüfung kaum durchführbar ist, wollte ich fragen, ob es Möglichkeiten gibt, die VIAF-IDs monatlich oder vierteljährlich auf solche Zusammenführungen hin zu überprüfen. -- Monsieur Becker (Diskussion) 19:19, 14. Jun. 2012 (CEST)Beantworten

Bei PNDs habe ich das mal gemacht, bei den VIAF-Nummern hatte ich das auch angedacht. Wie so oft ist das aber eine Frage der Zeit. Mit allem, was ich so geplant habe im Bereich Personendaten/Normdaten könnte ich vermutlich vollzeit den Rest meines Lebens dran arbeiten ;) --APPER\☺☹ 20:40, 14. Jun. 2012 (CEST)Beantworten

Eine monatliche Überprüfung wäre übertrieben, da die VIAF-Datenbank selbst nur alle ein, zwei Monate aktualisiert wird. Am wichtigsten sind die "Ur-"Normdatensätze GND, LCCN und NDL. Darauf sollten wir uns konzentrieren. Die Sammelnormdaten VIAF sind nur ein Zusatzangebot. Gruß --Kolja21 (Diskussion) 23:39, 14. Jun. 2012 (CEST)Beantworten

Dubletten: SWD und GKD

Durch Zusammenfallen von SWD und GKD (das schien für geografische Objekte bis dato funktional unterschieden worden zu sein in "Thema in Literatu" und "beteiligt an/Urheber von Literatur") scheint es jetzt mehrfache GNDs für geografische Körperschaften zu geben, so zum Beispiel http://d-nb.info/gnd/2015398-3 und http://d-nb.info/gnd/4030481-4 für Kiel. Was tun? --Widerborst 11:22, 17. Jun. 2012 (CEST)Beantworten

Abwarten und Tee trinken ;) Nach der Umstellung auf die GND (incl. Schulung etc.) nehmen die Bibliotheken jetzt erst langsam wieder die Arbeit auf, und dann sind auch schon Sommerferien. Bis die Dubletten zusammengeführt sind, werden also noch ein paar Monate vergehen. Zzt. gibt es für uns zwei Möglichkeiten: Fall 1: Einer der beiden Normeinträge enthält deutlich weniger Informationen und keine Verknüpfungen auf Werke, dann kann er wegfallen. Fall 2: Beide Normeinträge sind wichtig, dann sollte man SWD und GKD stehen lassen bzw. eine GND eintragen und die zweite GND im Feld "REMARK" vermerken. --Kolja21 (Diskussion) 15:16, 17. Jun. 2012 (CEST)Beantworten

Das sieht bei Kiel dann z.B. so aus:

{{Normdaten|TYP=g|GND=2015398-3|GNDCheck={{subst:NormdatenDatum}}
 |REMARK=Dublette GND 4030481-4 vorhanden.}}

Dadurch landet der Artikel in der Wartungskat Kategorie:Wikipedia:GND fehlt 2012-06, obwohl die GND natürlich in diesem Fall nicht fehlt, sondern nur in ein paar Monaten überprüft werden soll. --Kolja21 (Diskussion) 15:28, 17. Jun. 2012 (CEST)Beantworten

Zu nach GND-Start redundanten Datensätzen ist eine Ankündigung aus dem Newsletter "Standardisierung" Nr. 19 interessant (PDF-Ausgaben hier): »Ebenso wurde ein weiterer Termin für das sog. Match-und Merge-Verfahren abgestimmt, das erst zehn Wochen nach dem Umstiegstermin am 19. April 2012 starten kann, um den Verbünden genügend Zeit zum Überspielen der GND-Daten in die Lokalsysteme zu lassen. In diesem Verfahren sollen bereits als dublett erkannte Sätze aus der GKD und SWD, die dieselben Entitäten beschreiben, maschinell zusammengeführt werden.« – 19. April + 10 Wochen = 28. Juni als frühester Starttermin. Keine Ahnung, wann erste Ergebnisse dieser Zusammenführung sichtbar werden könnten. -- Make (Diskussion) 15:54, 17. Jun. 2012 (CEST)Beantworten

Danke für die kompetenten Antworten. Dann harrenwermal. --Widerborst 18:13, 17. Jun. 2012 (CEST)Beantworten

Ich hatte mich bezüglich zweier Datensätze für den Eurovision Song Contest 2004 (4792884-0 und 10335908-4) an die DNB gewandt und bekam folgende Antwort: »der ehemalige GKD-Satz wird bei Körperschaften und Kongressen gewinnen. Im vorliegenden Fall erkennt man es daran, dass keine Systematiknummer vorhanden sein darf (bei 4792884-0 Systematik 14.1 Musik (Allgemeines), Musikgeschichte - also Looser). Bei Geografica gewinnt der SWD-Satz (üblicherweise mit DDC-Notation versehen).« Bezogen auf Kiel müsste also 4030481-4 das Rennen machen. --Monsieur Becker (Diskussion) 07:28, 18. Jun. 2012 (CEST)Beantworten

Sehr interessant, danke. Aber vielleicht warten wir wirklich am besten noch die paar Wochen, bevor wir uns unnötig Arbeit machen. --AndreasPraefcke (Diskussion) 09:41, 18. Jun. 2012 (CEST)Beantworten

Vorschlag zur Masseneinspielung von VIAF-Nummern in en:WP

von den "Wikipedians in Residence" bei OCLC und der British Library: en:User:Maximiliankleinoclc/Authority_control_integration. Interessant finde ich die Andeutungen (oder habe ich da etwas falsch verstanden), dass die (en)-Wikipedia-Links, die mir auch bereits in VIAF aufgefallen waren, wegen der strukturierten Persondata-Inhalte anscheinend recht stabilisierend auf die Clusterung wirken, insofern also für VIAF echten Nutzen haben und nicht nur populistisches Beiwerk sind. -- Thomas Berger (Diskussion) 21:23, 18. Jun. 2012 (CEST)Beantworten

Klasse. Hatte schon lange gehofft, dass die engl. WP die Normdaten englich in größerem Maßstab nutzt. Bisher war die Nutzung dort ja kaum vom Fleck gekommen. Ich hatte drüben zwar auch mal ein bißchen in dem Bereich gemacht, hatte aber einfach nicht die nötige Zeit, Energie und Connections, um das dort auf breitere Beine stellen zu können. Vor allem bin ich gespannt, was die breite Nutzung der Normdaten in der engl. WP an Auswirkungen außerhalb der Wikipedia haben könnte. --Kam Solusar (Diskussion) 11:59, 19. Jun. 2012 (CEST)Beantworten
Schließe mich Kam Solusar an - es wäre ja auch für mich technisch ein leichtes gewesen, deutsche Normdaten + VIAF/LCCN per Bot in die en.wp einzuspielen, aber ich habe hier in de.wp genug zu tun und keine "Zeit, Energie und Connections", mich um die en.wp zu kümmern. Gut kanns nur sein! --APPER\☺☹ 15:02, 19. Jun. 2012 (CEST)Beantworten
Danke für den Hinweis. Ich hab mal etwas in dem Skript wikipedia2auth3.py von en:User:Maximiliankleinoclc/Authority_control_integration gestöbert. Kurze Skizze, was es wie macht folgt in eigenem Unterabschnitt (soweit ich durchblicke, direkte Korrekturen, Ergänzungen erwünscht). – Vielleicht hat jemand Lust anzufragen, ob VIAF nicht weiteren Code "rausrückt". Die Versuchung bei mir ist groß, da selber nachzuhaken. Die Erfahrung, dass das zu faszinierenden aber zeitgefräßigen Aktivitäten führt, hält mich (vernünftigerweise ;-) auf Distanz. -- Make (Diskussion) 15:22, 20. Jun. 2012 (CEST)Beantworten

A propos VIAF: die sind dabei, die japanische NDL einzubauen: http://outgoing.typepad.com/outgoing/2012/05/just-links.html (comments) --AndreasPraefcke (Diskussion) 22:24, 20. Jun. 2012 (CEST)Beantworten

Jau, und ich hatte deswegen sogar schon einmal angenommen, die NDL sei schon längst drin in VIAF: Wikipedia_Diskussion:Normdaten/Archiv#Weitere_Punkte. Aufruf der genannten Beispiele gibt die identischen Ergebnisse wie im Blog-Post, nur eben ohne NDL. -- Thomas Berger (Diskussion) 22:35, 20. Jun. 2012 (CEST)Beantworten
Ah, das hatte ich irgendwie damals nicht mitbekommen. Immerhin haben wir jetzt auch die Bestätigung. --AndreasPraefcke (Diskussion) 12:22, 21. Jun. 2012 (CEST)Beantworten

wikipedia2auth3.py

  • Funktionalität: Python-Skript, das aus einem en:Wikipedia-XML-Dump eine Datei mit MARC-konformen Authority-Datensätzen erstellt.
  • Funktionsweise:
    • Jeder Wikipedia-Artikel wird zunächst darauf geprüft, ob er eine Person beschreibt. Dazu werden (u.a.) die Unterkats von en:Category:Births by year / en:Category:Deaths by year und en:Template:Infobox person ausgewertet.
    • Nicht berücksichtigt werden en:Template:Persondata und en:Template:Authority control
    • Kandidaten für Werke von und über die Person werden ermittelt durch Parsen von en:Template:Citation (= en:Template:cite) und Sammeln aller im Artikel auftretenden ISBN, ISSN sowie buchstabenfreier LCCN.
    • Kandidaten für den zur Person gehörigen LoC-Authority-Datensatz werden ermittelt durch Sammeln von LCCN aus Weblinks auf Worldcat inkl. en:Template:Worldcat, die mindestens einen Buchstaben enthalten – Regular-Expression-Patterns (Zeilen 156,157, siehe python-re-documentation) dafür
      • \{\{worldcat.*?lccn-([\d\- a-z]+)
      • identities/lccn-([\d\-a-z]+)
    • diverse Plausibilitätsprüfungen und konsequente Bereinigung eliminieren und verhindern Datenmüll (zB werden 1. Literaturverweise, die den Personennamen nicht grob enthalten, verworfen 2. (? sachlich richtig ?) Literaturverweise mit einer "Blacklist" NoiseTitles abgeglichen, die irreführende/zu allgemeine Titel enthält)
  • kleine Spekulation, wie die en:Wikipedia-Pseudo-Authority-Datensätze stabilisierend bei der Clusterung von VIAF eingesetzt werden: Man wirft die ganz naiv in den Pool der regulären Datensätze und läßt die Clusteralgorithmen arbeiten. Dann können die Wikipedia Datensätze als Attraktoren wirken und schwach matchende Datensätze aus anderen Clustern abziehen oder wie unsichtbarer Kitt die Datensätze eines Clusters enger zusammenhalten.

Jetzt als RFC in neuer Version

en:Wikipedia:Authority control integration proposal/RFC --AndreasPraefcke (Diskussion) 17:06, 29. Jun. 2012 (CEST)Beantworten

Update: Diskussion ist inzwischen abgeschlossen mit breitem Konsens pro Bot-Einspielung der VIAF-IDs in {{:en:Template:Authority control}}. Der Bot wird unter https://github.com/notconfusing/VIAFbot entwickelt. Bin echt gespannt, wie die allgemeine Reaktion in en aussehen wird, wenn der Bot losläuft. (Von wütendem Protest bis gelangweiltem Desinteresse scheint mir alles möglich.) Die Diskussion verlief eher entspannt, wobei ich persönlichen Erkenntnisgewinn in Sachen British Library Authority ControlNACOLoC-Authorities verbuchen konnte. -- Make (Diskussion) 15:49, 16. Aug. 2012 (CEST)Beantworten

Noch eine Arbeitsliste

Wer einfache Erfolgserlebnisse sucht, findet unter Benutzer:Gymel/VIAF-Zuordnungen eine Liste von Artikeln, die zum Stichtag 3. Juni 2012 gar keine Normdaten (oder PNDfehlt-Einträge) hatten, denen jedoch aus VIAF (über Umweg en:WP und Interwiki-Links) eine GND-Nummer zugeordnet werden kann (oder dennoch nicht: Die Qualität hängt von der Güte der VIAF-Automatismen ab). Diese Liste dürfte komplementär zu APPERs Liste im vorigen Abschnitt sein (denn wenn ein Artikel keine Normdaten-Vorlage trägt, kann er auch keine VIAF-Nummer direkt ausspucken). -- Thomas Berger (Diskussion) 02:23, 25. Jun. 2012 (CEST)Beantworten

Danke, schau gleich mal rein. Durchnummerierte Liste abzuarbeiten, ist motivierender als Kats mit über 10.000 Einträgen, obwohl die neue mit 6.924 Artikel auch nicht gerade kurz ist. BTW: Ich hatte dich, glaube ich, schon mal gefragt. Ist es aufwändig, eine aktualisierte Liste Parameterhäufigkeit in de:WP zu erstellen? Ich bin neugierig, was sich im Hinblick auf Parameter wie "SELIBR", "WP" etc. seit Anfang Mai getan hat. Aus dem Dump, den ich mir gezogen habe, werde ich nicht schlau. Gruß --Kolja21 (Diskussion) 02:34, 25. Jun. 2012 (CEST)Beantworten
Der Dump ist schon drei Wochen alt, bereinigt um zwischenzeitlich schon bereinigtes (Benutzer:APPER war gestern wohl fleißig) sieht es wie folgt aus (Stand 3. Juni 2012):
 BNE       :      1
 BNF       :     43
 EST       :     58
 GKD       :   6015
 GKD-V1    :    486
 GKD-V2    :     60
 GND       :   6790
 GNDCheck  :   2500
 GNDName   :   1659
 GNDfehlt  :   1478
 IPI       :      1
 LCCN      : 114531
 NDL       :   1776
 PND       : 174658
 REMARK    :    480
 SELIBR    :   2478
 SWD       :   7197
 TYP       :   9964
 VIAF      : 139809
 WORLDCATID:     16
 WP        :    311
 typ       :     48
Für den Juli-Dump gibt es dann wieder eine Auswertung unter eigener Überchrift, hoffentlich ist das mit "typ" nicht eingerissen, da es aber überwiegend Personenartikel mit altem "PND"-Parameter sind, ist es derzeit harmloser Schmutz, aber dennoch unschön...
Artikel mit "Typ" oder "typ" sind jetzt auch unter Kategorie:Wikipedia:Normdaten-Typ falsch eingetragen eingetragen. Hab gerade schon zwei gefixt. --AndreasPraefcke (Diskussion) 19:41, 25. Jun. 2012 (CEST)Beantworten

Hast du eine Präferenz, wie wir die abgearbeiteten Artikel markieren/löschen sollen? Nach meiner Löschung stimmt die Kapitelzählung nicht mehr. --Mai-Sachme (Diskussion) 21:35, 25. Jun. 2012 (CEST)Beantworten

Die Überschriften sollten nicht geändert werden, höchstens gelöscht, wenn ein Abschnitt ganz leer geworden ist. Die Binnennummerierung in den einzelnen Abschnitten hilft vielleicht beim Abzählen, wenn man sich mehrere Artikel gleichzeitig in Browser-Tabs lädt (ich selber arbeite eher in 10er- oder 20er-Portionen, 50er wären mir viel zu umfangreich). Die Hoffnung ist, dass sich die Bearbeitermassen schön gleichmässig auf die verschiedenen Abschnitte verteilen, so dass es keine BK's gibt. Es ist genug für alle da, derzeit sehe ich kein Problem darin, großzügig auch das zu löschen, was zu knifflig zu lösen oder zu mühsam zu melden ist oder einen ganzen Abschnitt zu löschen, wenn man bei seinen Bearbeitungen den Überblick verloren haben sollte: Spätestens wenn der nächste VIAF-Komplettabzug aufliegt werde ich die Liste mit aktuellen Daten komplett neu generieren und danach werden alle Nummern geändert sein, alle anderweitig erledigten verschwunden und alle unbearbeitet gestrichenen wieder da. Bitte "Bescheid", wenn die Liste dann besser mit fixen Eintragsnummern generiert werden sollte. -- Thomas Berger (Diskussion) 22:26, 25. Jun. 2012 (CEST)Beantworten

Wow, tolle Liste! Man man... also dass wir irgendwann die Artikel voller Normdaten haben ist wohl unwahrscheinlich ;). Zur Parameterliste: ich habe ja jetzt den MMP-Account "authoritycontrol" auf dem Toolserver und eines der ersten Projekte dort ist ein Neuschreiben der Auswertung der Normdaten. In diesem Zusammenhang wird es demnächst möglich sein, Listen aller Parameter der Normdatenvorlage (wie hier grade geschehen) halbwegs aktuell auszugeben. Das ganze ist noch nicht fertig, aber ich habe schonmal ein paar Fälle gefunden und korrigiert, deshalb war ich fleißig ;). --APPER\☺☹ 00:50, 26. Jun. 2012 (CEST)Beantworten

+1. Klingt alles sehr motivierend. Danke Andreas für den Update! @APPER: Wird die Liste dann auch die Anzahl der GNDs nach TYP getrennt ausgeben? --Kolja21 (Diskussion) 03:46, 26. Jun. 2012 (CEST)Beantworten
Ja. Der TYP wird sogar in der alten Version jetzt schon miterfasst - dann werde ich aber Vorlage:NORMDATENCOUNT entsprechend anpassen, dass auch diese Daten immer aktuell zur Verfügung stehen. --APPER\☺☹ 11:42, 26. Jun. 2012 (CEST)Beantworten

Parameterhäufigkeit in de:WP (2012-06-30)

Der dewiki-Dump 20120630 enthält 225.467 Verwendungen der Vorlage:Normdaten, dabei sind die einzelnen Parameter wie folgt verteilt: -- Thomas Berger (Diskussion) 20:44, 1. Jul. 2012 (CEST)Beantworten

BNF       :     42
EST       :      1
GKD       :   3488
GKD-V1    :    384
GKD-V2    :     29
GND       :  25849
GNDCheck  :   7017
GNDName   :   4164
GNDfehlt  :   5130
IPI       :      1
LCCN      : 118467
NDL       :   2585
PND       : 166779
PNDCheck  :      1
PNDfehlt  :      1
REMARK    :    603
SELIBR    :   2357
SWD       :   3671
TSURL     :      1
TYP       :  34910
VIAF      : 146831
WP        :    233

Super, danke! Zwei Artikel mit Tippfehlern (PNDCheck und PNDfehlt) habe ich schon korrigiert. --Kolja21 (Diskussion) 21:34, 1. Jul. 2012 (CEST)Beantworten

Hallo Freunde der Normdaten-Vorlage. Ab sofort wird automatisiert täglich eine Liste der fehlerhaften Normdaten-Vorlagen-Parameter angelegt. Ihr findet diese unter http://toolserver.org/~authoritycontrol/service/dewiki_normdatenparameter.txt - diese Liste wird um 8 Uhr UTC (also im Sommer 10 Uhr unserer Zeit) aktualisiert. Die aktuelle Ausschlussliste enthält alle Parameter die in der Liste hier mehr als 10 Mal vorkommen. Wenn von "Parameter 1" die Rede ist, dann sind unbenannte Parameter gemeint, also beispielsweise {{Normdaten|PND...}} oder {{Normdaten|...|1234}}. Damit sollte die "Normdatenhygiene" jetzt wohl zunehmen *g*. --APPER\☺☹ 02:27, 7. Jul. 2012 (CEST)Beantworten

Gute Tippfehlersammlung! Die 9 Einträge von heute habe ich abgearbeitet. --Kolja21 (Diskussion) 02:55, 7. Jul. 2012 (CEST)Beantworten

PS: Wenn ich dich richtig verstehe, erfasst die Liste allerdings nicht veraltete oder ungültige Parameter wie "EST", "IPI", "PNDCheck", "WP" etc.? --Kolja21 (Diskussion) 03:05, 7. Jul. 2012 (CEST)Beantworten
Genau. Die Ausnahmeliste sieht wie folgt aus: 'PND', 'GND', 'BNF', 'GKD', 'GKD-V1', 'GKD-V2', 'GNDCheck', 'GNDName', 'GNDfehlt', 'LCCN', 'NDL', 'REMARK', 'SELIBR', 'SWD', 'TYP', 'VIAF', 'WP'. Ich kann gerne auch Listen für andere Parameter liefern, wenn ihr die abarbeiten wollt, beispielsweise BNF oder GKD-V1/V2. Bei dieser konkreten Liste ging es jetzt aber erstmal darum, dass nicht noch weitere Typen dazukommen ;) --APPER\☺☹ 14:19, 7. Jul. 2012 (CEST)Beantworten
Danke, jetzt habe ich es verstanden. "EST", "IPI", "PNDCheck" würde also automatisch als Fehler gemeldet. Mit der Abarbeitung von GKD-V1/V2 hat es noch Zeit; erst mal soll die DNB in Ruhe ihre halbautomatische Dublettenbereinigung durchziehen. Bei dem Parameter "WP" würde ich mich allerdings gerne an der Abarbeitung beteiligen, sprich eine Liste wäre hilfreich. Wer über diese Abk. stolpert, wird unnötig irritiert, denn in der Dokumentation zur Normdatenvorlage, Abschnitt "Veraltete Parameter" kommt sie nicht vor. Gruß --Kolja21 (Diskussion) 19:09, 7. Jul. 2012 (CEST)Beantworten

Nicht individualisierte GNDs

Zur Zeit klagen wir ja nicht über mangelnde Arbeit, trotzdem wollte ich mich hier erkundsigen, ob und wie eine Initiative gegen einen meiner Meinung nach unschönen Zustand möglich und erwünscht ist. Mit erstaunlicher Häufigkeit stoße ich auf nicht individualisierte Einträge, die in Personenartikel als reguläre PNDs/GNDs vermerkt sind (im Normalfall nicht von den regulars hier eingetragen, aber man freut sich ja, dass auch andere ein bisschen was in die Richtung machen). Offenbar war eine automatisierte Erkennung derselben bisher nicht ganz trivial, aber eventuell hat sich das ja geändert, seit auf viaf.org nicht individualisierte Einträge als (undifferentiated) markiert werden. Deshalb meine Frage: Ist es mit vertretbarem Aufwand möglich, die nicht individualisierten Einträge in der Normdaten-Vorlage aufzuspüren? Und lohnt sich eurer Meinung nach der Aufwand? --Mai-Sachme (Diskussion) 14:30, 6. Jul. 2012 (CEST)Beantworten

Ich habe mich noch nicht darum gekümmert das nachzuprüfen, aber angekündigt war, dass die GND seit 1. Juli unter einer neuen Lizenz (CC0) steht. Damit ist uns auch ohne individuelle Vereinbarung erlaubt, Daten direkt zu uebernehmen (z.B. den Typ automatisiert eintragen zu lassen) oder den Gesamtdatenbestand auszuwerten, beispielsweise einen WP-Monatsdump gegen einen GND-Komplettabzug auszuwerten und Abweichungen des Typs als Wartungsliste festzuhalten. Oder etwas komplizierteres irgendwie in der Mitte ablaufen zu lassen, etwa einen Wartungsbot, der in geänderten Artikeln die Konsistenz der eingetragenen Normdaten überprüft (Typ, Tn/Tp, ob die Nummer noch gültig ist etc.). Mit der neuen Lizenz können wir uns solche Werkzeuge nicht nur ausdenken, sondern sie auch tatsächlich implementieren. -- Thomas Berger (Diskussion) 15:23, 6. Jul. 2012 (CEST)Beantworten

Hallo Mai-Sachme, das Problem ist bekannt. Eine Zählung im Februar 2010 ergab, dass damals 5.000 Tn-Datensätze (fälschlicher Weise) per PND-Vorlage eingebunden waren. Mittlerweile kennzeichnet VIAF nicht-individualisierte Datensätze und Neueinträge kommen zum Glück seltener vor. Gruß --Kolja21 (Diskussion) 01:37, 7. Jul. 2012 (CEST)Beantworten

Zitat von http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html Für die Gemeinsame Normdatei (GND) und die Titeldaten des Linked-Data-Services gilt ab sofort die Nutzungslizenz Creative Commons Zero. --AndreasPraefcke (Diskussion) 18:54, 7. Jul. 2012 (CEST)Beantworten

Bestimmte Tests konnten wir auch ohne CC0 machen - vor allem wenn es darum ging, schon in der WP vorhandene PNDs zu checken, dazu hatte ich zumindest das informelle okay der DNB. Also dass bestimmte Tests (z.B. auf Tn) nicht gelaufen sind, liegt meinerseits eher an fehlender Zeit als an fehlenden Lizenzen. Was bringt es uns auch, eine Liste der genutzten Tns zu haben? Ja, dann können wir die 5000 Artikel bearbeiten und aus GND= GNDName= machen, aber die eigentliche Arbeit wäre, diese GNDs alle anzugucken, zu prüfen, welche Literatur zur korrekten Person gehört und die zu melden: aber beim aktuellen Rückstand von WP:PND/F würde eine Meldung von 5000 Nummern wohl eher nicht viel bringen. Solange wir soviel Arbeit haben (z.B. die GND-VIAF-Liste) stören mich die Tns nicht sonderlich. Also früher oder später werde ich wieder entsprechende Tests laufen lassen (hatte ich vor einigen Jahren schonmal), aber in den nächsten Wochen werd ich sicher nicht dazu kommen: Also wenn jemand anders will, gerne ;) --APPER\☺☹ 19:10, 7. Jul. 2012 (CEST)Beantworten

So: entgegen meiner obigen Aussage, dass ich in den nächsten Wochen nicht dazu komme, habe ich jetzt mal einen Testlauf angeworfen, wird sicher ein bissl brauchen (betrifft nur Personenartikel). Dafür checke ich auch ein paar andere Sachen. Rauskommen werden wohl fünf Wartungslisten. Je nach Länge werde ich die selbst bearbeiten oder hier irgendwo posten werde:

  1. völlig falsche GND
  2. fehlerhaftes Geschlecht (anscheinend zu 99% Fehler bei der DNB)
  3. kein Tp-Datensatz (das ist die geforderte Tn-Liste)
  4. geringe Ähnlichkeit WP-Datensatz <-> GND-Datensatz
  5. Weiterleitung: bei uns ist eine GND angegeben, die inzwischen auf eine andere weiterleitet

Die Listen 1 und 2 werden nur wenige Einträge haben, Liste 3 wird die längste, gefolgt von 4 und 5. Zur Liste 4: Hier berechne ich einen Ähnlichkeits-Score, in den Name, Geschlecht und Lebensdaten einfließen - und unterhalb einer gewissen Ähnlichkeit landet ein Eintrag auf der Liste. Bei zwei zufällig angeschauten Datensätzen waren auch das Schreibfehler bei der DNB (bei den Lebensdaten), aber auf dieser Liste werden natürlich auch viele Fehleinträge sein. Noch dauerts, die erste Liste (Liste 3) werde ich dann demnächst mal bereitstellen.

Wie soll denn das Vorgehen sein? Also was machen wir mir Artikeln, in die eine Tn-GND eingebunden ist? Wenn wir plötzlich tausende Einträge der DNB melden, dann kommt doch nie eine Rückmeldung... irgendwie macht mich die Meldesituation derzeit unzufrieden :/ --APPER\☺☹ 13:49, 9. Jul. 2012 (CEST)Beantworten

Die Tn-Liste komplett an die DNB schicken und sie um ein passables Meldeverfahren bitten. Irgendwie müssen sie sich was einfallen lassen: Entweder sie stellen jemand zur Bearbeitung unserer Rückmeldungen ab oder wir bekommen ein eingeschränktes Zugriffsrecht. Es gibt ja bereits im Normdatensatz die Position 4, die die Erfassungsqualität kennzeichnet. (1 = Verbundredaktion; 2 = lokalte Red.; 3 = geschultes Personal ...) Insofern sollte es technisch kein Problem sein, Wikipediaautoren stärker einzubinden. --Kolja21 (Diskussion) 16:03, 9. Jul. 2012 (CEST)Beantworten
Hilft beides (hier) nicht: M.E. ist da eine Person mit festem Stundenkontingent (5 oder 10h wöchentlich?) für die Bearbeitung "unserer" Meldungen abgestellt. Wir sollten davon ausgehen, dass die Bearbeitung unserer Meldungen normalerweise länger dauert als unser Melden, obwohl das bereits ziemlich zeitverschlingend sein kann, wenn es sorgfältig gemacht wird. Und das Level "6", das uns als unqualifiziertem, bibliotheksfremdem Personal zugeteilt werden würde (so wie auch Museen und Archiven: Selbst Besitz von Originaldokumenten oder anderen Formen "besseren" Wissens gibt keine Pluspunkte in der Redaktionshierarchie), würde uns die Anlage von Neusätzen und evtl. das Ergänzen von Todesdaten erlauben, aber beim Aufräumen des Vorhandenen Sumpfs keine Vorteile bringen. Da hilft eigentlich nur "delegieren": Statt dass ein Einzelkämpfer einige Meldungen pro Stunde komplett bearbeitet, könnte er auch einige Dutzend pro Stunde auf die "zuständigen" Sub-Redaktionen verteilen ... -- Thomas Berger (Diskussion) 18:45, 9. Jul. 2012 (CEST)Beantworten
@APPER ("Was machen wir"): Zunächst gefragt: "Was bedeutet das eigentlich?". Mein Eindruck nach der Begegnung mit allerhand Pseudoindividualisierten Tp's und wunderbar eindeutigen Tn's ist folgender: Die Deklaration als Tn oder Tp ist auch nur ein Anhaltspunkt unter mehreren, wenn es um "Personalisierung" geht. Mindestens genauso stark ins Gewicht fällt die tatsächliche Nutzung in Bibliotheksverbünden und anderswo: Wenn ein Tp im Feld für alles Mögliche benutzt wird, taugt er wenig und alle müssen aufräumen, evtl. gibt der Original-GND-Datensatz schwache Hinweise auf "das was gemeint ist" und damit Anhaltspunkte dafür, was in welche Richtung zu schaufeln ist. Wird umgekehrt ein Tn in diversen Anwendungen nur für eine einzige Person genutzt, dann ist das nur insofern defizitär, dass man vielleicht Lebensdaten ergänzen kann. Das VIAF-Matching z.B. ist ja auch ganz stark "evidenzbasiert" und versucht sich nicht primär an Linguistik bezüglich Ansetzungen oder Arithmetik der Lebensdaten. Problematisch wird die Situation "guter" Tn eigentlich erst im Zusammenhang mit Dubletten innerhalb der GND.
Wir könnten nach einem Abgleich erkannte Tn's zwanglos von GND nach GNDName bringen mit aktuellem Datumsstempel GNDCheck. In einigen Jahren, wenn wir mit den Altlasten durch sind, kommen die auf "Wiedervorlage" und jemand schaut intellektuell nach, ob es nicht einen Tp dazu gibt. Zwischenzeitlich können ja immer wieder Umlenkungen (der GND-Term für die "Weiterleitungen" in Liste 5) verarbeitet werden, die das Problem manchmal von alleine lösen (GNDName wird zu GND). Für Exporte und Verarbeitungen (Personensuche, DNB-Export) sollte - je nach Nutzungszweck - GNDName für fehlende GND-Parameter einspringen bzw. sogar beides exportiert werden. Voraussetzung ist allerdings etwas Disziplin hier: GNDName sollte dann wirklich nicht belegt werden, wenn in der GND nur ein Namenssatz ohne irgendwo nachweisbare Literatur oder mit ausschliesslich andere Personen betreffende Literatur gelistet ist. D.h. auch Tn's können glattweg unzutreffend sein, selbst wenn es keinen Tp gibt und die Person so und so heißt. -- Thomas Berger (Diskussion) 18:45, 9. Jul. 2012 (CEST)Beantworten
Verknüpfte Tns ohne Literatur halte ich tatsächlich für extremst überflüssig. Gibt es Gründe dagegen, diese zu entfernen? Dann würde ich die Liste 3 nochmal nachsortieren (insgesamt übrigens 4127 Einträge derzeit). Aber wie siehts mit solchen Fällen aus: Tn 101670826. Erstmal nur Name, wenn man aber den genauen Datensatz anschaut, gibt es einen Hinweis auf Mirambel, André: Etude descriptive du parler maniote méridional. - 1929. Was macht sowas überhaupt in einem Tn-Satz... das ist wohl die Art Quasi-Tp-Sätze von denen du gesprochen hast... Schwierig. --APPER\☺☹ 00:33, 10. Jul. 2012 (CEST)Beantworten
Ich habe auch schon Tn mit Verweis vom Geburtsnamen gesehen... Und bei Personen ohne Literatur in der DNB findet man oft über die WP-Personensuche heraus, dass alle Bibliotheksverbünde damit dieselben, für die Person einschlägigen Titel verknüpfen, in solchen Fällen trage ich das auch als GNDName ein und mache sogar eine Meldung auf WP:PND/F (mit Hinweis auf die Verbünde). Ich meinte eher Fälle wie Hans Schwenke, wo ich mir heute abend einen Wolf gesucht habe: Anscheinend wurde der Tn-Treffer in der DNB nicht nur im Artikel (als Vorlage:DNB-Portal, ein anderer Bearbeiter war bei den Vorlage:Normdaten vorsichtiger...) eingetragen sondern sogar zum Anlass genommen, den Artikel zu einem Bürgerrechtler mit numismatischen Publikationen anzureichern. Daher wäre ich auch extrem vorsichtig beim automatischen Melden von Tn's, denn auch das Helferlein normdaten.js verleitet für meinen Geschmack etwas zu leichtfertig zum Eintrag unzutreffender Tn's. -- Thomas Berger (Diskussion) 00:46, 10. Jul. 2012 (CEST)Beantworten
Das Problem stellt sich bei Amazon viel eher. Es gibt leider immer wieder Autoren, die wahllos einen Namen ergooglen und die Treffer dann als Werke des Gesuchten eintragen. Hans Schwenke war übrigens nicht nur Bürgerrechtler - davon kann man ja nicht leben ;) -, sondern auch Fotograf. Der Tn kann ihm zugeordnet werden, da er zwar kein Numismatiker ist, aber die Münzen abgelichtet hat. (Ich korrektiere den Artikel gleich mal.) --Kolja21 (Diskussion) 05:10, 10. Jul. 2012 (CEST)Beantworten

Ich verknüpfe Tn ohne Literatur wenn

  1. die AKS-Auswertung im B3Kat (oft) oder in anderen Verbünden (selten) ein eindeutiges Ergebnis mit passender Literatur zu der Person bietet
  2. selten auch wenn, der Name sehr, sehr eindeutig ist (gerade bei sehr ungewöhnlichen Namen oder den beliebten Doppelnamen a la Sabine Leutheusser-Schnarrenberger)

--AndreasPraefcke (Diskussion) 11:31, 10. Jul. 2012 (CEST)Beantworten

Also: wie ist der Konsens? Die DNB kann mit sovielen Einträgen nichts anfangen, zumal die Qualität bei uns unterschiedlich ist. Soll ich die Liste (oder einen Auszug daraus?) hier trotzdem irgendwo online stellen oder gibt es da nichts abzuarbeiten? --APPER\☺☹ 14:49, 10. Jul. 2012 (CEST)Beantworten

Also da ich ja hier die Anfrage gestellt habe, würde ich so eine Liste tatsächlich für wünschenswert halten. Die Einzelfälle sind ja sehr unterschiedlich geartet, teilweise sind das Fälle für eine Sofort-Meldung, teilweise leere Namenseinträge, teilweise einfach irgendwas Falsches, wo man sich fragt, wie genau das passiert ist. Ich habe erst kürzlich einen Fall entdeckt, wo statt einer bestehenden Tp mit x Literatureinträgen ein leerer Tn-Namenseintrag verzeichnet war. --Mai-Sachme (Diskussion) 16:32, 10. Jul. 2012 (CEST)Beantworten
Keine Entschuldigung, aber ein Erklärungsversuch: Das kommt evtl. daher, dass das Schnark-Skript den korrekten VIAF-Eintrag auswertet, dieser VIAF-Eintrag aber aus diversen Gründen einen in der DNB "leeren" (aber in Verbünden sehr vollen) Namenseintrag ausgibt, weil die Titel sehr gut mit z. B. der LOC übereinstimmen; während ein gefüllter individualisierter Satz aufgrund einer anderen Namensansetzung, anderen Lebensdatenansetzungen o. ä. dann unberücksichtigt blieb. Wenn man dann dem Skript vertraut und _nicht_ nachschaut, ob das Skript auch einen anderen Satz anbietet (oder nicht selbst einfach nochmal eine Suche bei der DNB startet), dann kommt so etwas zustande. --AndreasPraefcke (Diskussion) 21:40, 17. Jul. 2012 (CEST)Beantworten
Unter Benutzer:APPER/Tn findest du jetzt knapp über 1000 der 4127 Einträge. --APPER\☺☹ 20:23, 17. Jul. 2012 (CEST)Beantworten
Super! Da ich in meiner Anfangszeit aus Unwissenheit auch nicht-individualisierte Einträge in die Normdaten übernommen habe, werde ich bei der Abarbeitung dieser Liste helfen :-) Besten Dank APPER. Silke (Diskussion) 20:59, 17. Jul. 2012 (CEST)Beantworten
Danke, ich werde mir das mal nach und nach anschaun. --Mai-Sachme (Diskussion) 21:36, 17. Jul. 2012 (CEST)Beantworten
Sehr gut, danke APPER. --AndreasPraefcke (Diskussion) 21:40, 17. Jul. 2012 (CEST)Beantworten

Gegen eine automatisierte Löschung der bei der DNB "leeren" Tn unter GNDName bin ich strikt. Ich habe hunderte eingefügt, alle nach Prüfung im B3Kat. Wenn diese Arbeit jetzt zunichte gemacht wird, würde mich das ärgern. Die GND ist NICHT eine Angelegenheit nur der DNB. Diese schlechteste aller deutschen Bibliotheken (von der Stabi Berlin vielleicht abgesehen) ist eher zufällig für uns mit der GND verknüpft, weil sie nunmal die Redaktion bereitstellt und daher die GND-Website mit den DNB-Sätzen verknüpft ist. Wenn sie das nicht wäre, wäre die GND für uns genauso wertvoll. Die DNB-Treffer sind oft naturgemäß wenige (das ist ja keine Nationalbibliothek, die heißt nur so, wenn schon per Definition alles vor 1913 fehlt...). --AndreasPraefcke (Diskussion) 21:14, 17. Jul. 2012 (CEST)Beantworten

Parameter: GNDCheck

Warum verwenden wir eigentlich den Parameter "GNDCheck" nur in Zusammenhang mit fehlenden Normdaten und nicht generell? Sollte es die GND in zehn Jahren noch geben, wäre es für die Wartung hilfreich zu wissen, wann die Normdaten das letzte Mal überprüft wurden. --Kolja21 (Diskussion) 00:52, 8. Jul. 2012 (CEST)Beantworten

Versuch einer Antwort: GNDCheck dokumentiert den auf unserer Seite und für unsere Seite erkannten Wartungbedarf. -- Thomas Berger (Diskussion) 07:40, 8. Jul. 2012 (CEST)Beantworten

Zzt. ist das so, aber nötig ist es nicht, oder sehe ich das falsch? (Um den Wartungsbedarf anzuzeigen, gibt es die Parameter "GNDName" und "GNDfehlt".) Natürlich sollte das Datum nicht im Artikel angezeigt werden, aber im Quelltext stört es nicht und könnte langfristig hilfreich sein. Spätestens nach fünf Jahren will man eigentlich immer wissen, von wann eine Information stammt. Ich kann mir gut vorstellen, dass die Entwicklung der GND noch nicht abgeschlossen ist. Es gibt zahlreiche europäische Nationalbibliotheken und Bibliotheksverbünde, die keine eigenen Normdateien betreiben; die könnten beispielsweise als Partner ins Boot geholt werden. Ganz zu schweigen von der Einführung neuer Entitäten oder was sich sonst noch alles ändern mag. --Kolja21 (Diskussion) 02:55, 9. Jul. 2012 (CEST)Beantworten

Es gibt da einen Nexus durch die aktuelle Programmierung der Normdaten-Vorlage: Ist der Parameter GNDfehlt eingetragen, wird die Kategorie Wikipedia:GND_fehlt_... belegt, notfalls auch "ohne Datum", was dann wiederum sofortigen Wartungsbedarf anzeigt so dass ein Bearbeiter dann den Parameter GNDCheck nachträgt. Ebenso führt jegliches Vorhandensein des Parameters GNDName zum Eintrag in einer der GND_fehlt-Wartungskategorien.
Beides ist nicht zwingend, sondern reflektiert unsere derzeitige Ansicht über die Entwicklungsrichtung der GND und unsere Einflussmöglichkeiten: Nämlich dass Tn-Sätze in de:WP unerwünscht sind, dass Tn-Sätze stets zugunsten Tp-Sätzen abgebaut werden, dass Meldungen auf WP:PND/F irgendwann zu Reaktionen führen, die Nacharbeit in der Wikipedia erfordern, und dass wir evtl. irgendwann anhand von WP-Artikeln einfache Neusätze anlegen dürfen. D.h. gewisse Defizite und Inkonsistenzen in der GND werden von uns wahrgenommen, wir übernehmen durch Meldungen an die DNB eine Teilverantwortung für deren Bereinigung, und daher antizipieren wir für einen unbestimmten Zeitpunkt in der Zukunft Wartungsbedarf in der Wikipedia: Der wird durch GNDCheck dokumentiert, wobei wir nicht den geschätzten Zeitpunkt des Wartungsbedarfs eintragen ("Wiedervorlage Januar 2016") sondern den der letzten Auseinandersetzung mit der GND in Bezug auf diesen Artikel: Wenn GNDCheck nur ein paar Monate in der Vergangenheit liegt wissen Bearbeiter, dass es lohnendere Beschäftigungen gibt als auf reinen Verdacht hin ausgerechnet diesen Artikel erneut zu überprüfen.
Außerdem dienen die Wartungskategorien der Wikipedia-internen Qualitätssicherung: Jeder Personenartikel sollte auch die Vorlage:Normdaten enthalten und darin stets den GND-Parameter, außer natürlich in Fällen wo die GND nichts hergibt. Um die Fälle "noch nie geprüft" und "geprüft aber ohne Ergebnis" zu unterscheiden, wird mit GNDfehlt eine spezielle Nicht-Information positiv markiert. Hier kann man sich (siehe erster Absatz meiner Antwort) fragen, ob die Vergabe eines Datums nicht overkill ist: Theoretisch ist bei jeglicher im Artikel enthaltenen Einzelinformation die Datierung interessant (daher die Versionsgeschichte bzw. die Werkzeuge, die daraus die Änderungen an einem bestimmten Artikelabschnitt extrahieren können), Datierung von nicht enthaltener Information (etwa kein Hochschulabschluss oder keine zweite Ehefrau angegeben: Gab es keine oder war das Faktum dem Artikelautor nicht bekannt, weil die Quelle xy erst nach dem Zeitpunkt erschienen ist, an dem der Autor die Information eingetragen hätte?) ist eigentlich noch viel interessanter, aber in dieser Allgemeinheit vermutlich völlig jenseits der menschlichen Möglichkeiten zur Wissensorganisation. Mit GNDfehlt + GNDCheck tun wir das für ein winziges Bröckchen innerhalb der Normdatenvorlage, aber bereits für LCCN oder VIAF-Parameter tun wir es nicht: Motivation ist halt, dass wir einen Vollständigkeitsanspruch bezüglich "GND" haben, den es in der Wikipedia ansonsten nur bei wesentlich kleineren Personengruppen (etwa Nobelpreisträgern) gibt: Dort wird die Kontrolle allerdings durch Überwachung von Redlinks in Listenartikeln ausgeübt. -- Thomas Berger (Diskussion) 10:53, 9. Jul. 2012 (CEST)Beantworten

Hallo Thomas, danke für dein Gutachten! Wenn ich deine Ausführungen richtig verstanden habe, hältst du die allgemeine Angabe des Datums für einen "overkill" an Informationen. Überzeugt bin ich nicht, aber erschlagen :D --Kolja21 (Diskussion) 16:15, 9. Jul. 2012 (CEST)Beantworten

Hallo Kolja, danke, so kann man es kürzer sagen. Oder mittellang: Wir müssen im Blick behalten, für welches Datenelement oder welchen Umstand das Datum GNDCheck bei der Wartung helfen soll, wenn wir da zu viele Dinge draufladen, fliegt uns alles um die Ohren. -- Thomas Berger (Diskussion)

Statistik: Layout (erl.)

Auf die Frage: "Schöner so?", lautet meine Antwort: "nö". Die Anführungszeichen irritieren und die Schattierung verläuft im Zickzack über zwei Spalten. Da es die Tabelle auch unter Vorlage:NORMDATENCOUNT/Doku gibt, und dort entsprechend angepasst werden müsste, schlage ich einen Revert vor. --Kolja21 (Diskussion) 15:19, 12. Jul. 2012 (CEST)Beantworten

PS: Wäre es nicht sinnvoll, die Statistik als Vorlage auszulagern? --Kolja21 (Diskussion) 15:21, 12. Jul. 2012 (CEST)Beantworten

Das ging ja schnell. Das Layout wurde schon wieder (diesmal einheitlich) überarbeitet. Damit erledigt. --Kolja21 (Diskussion) 15:25, 12. Jul. 2012 (CEST)Beantworten

Kleiner Meilenstein

In der Kategorie:Wikipedia:Normdaten-TYP fehlt sind jetzt nur noch Personenartikel (folglich könnte man diese auch per Bot auf TYP=p umstellen, wenn man will, aber sinnvoller ist es sicher, immer mal wieder ein paar mit dem Normdaten-js anzuschauen und dabei zu sehen, ob für die GND Vorschläge erscheinen). --AndreasPraefcke (Diskussion) 22:51, 15. Jul. 2012 (CEST)Beantworten

Perfekt! Auch ohne Bothilfe geht die Arbeit gut voran. (Allerdings ohne mich, bin auf dem Sprung in den Urlaub ;) Danke auch für die Listen, wie Benutzer:Gymel/NDmiss. Die sind ein wahre Fundgrube und motivierender als die Abarbeitung nach Alphabet. --Kolja21 (Diskussion) 23:04, 15. Jul. 2012 (CEST)Beantworten
Man entdeckt ja immer wieder neue Arbeitslisten und Wartungskategorien zum Thema Normdaten. Sind die irgendwo gelistet? --Mai-Sachme (Diskussion) 13:20, 16. Jul. 2012 (CEST)Beantworten
Ja, mittlerweile gibt es dafür die Kategorie:Wikipedia:Normdaten-Wartung. Dort sind alle Listen eingetragen. --Kolja21 (Diskussion) 17:38, 16. Jul. 2012 (CEST)Beantworten

Formatierung LCCN angeblich falsch

Bitte seht euch mal kurz Ophelia Lovibond an und klickt auf die LCCN. --Mai-Sachme (Diskussion) 11:35, 28. Jul. 2012 (CEST)Beantworten

Die Tatsache, dass mein Skript der Ansicht ist, dass man die LCCN entfernen sollte, spricht sehr dafür, dass da irgendwas komisch ist. Die eingetragene LCCN, die auch so auf der VIAF-Seite steht, ist jedenfalls nicht in den maschinenlesbaren Daten vorhanden, die mein Skript von viaf.org abruft. Eventuell in den Parameter REMARK verschieben, und irgendwann später noch mal nachsehen, ob sich das Problem von selbst gelöst hat. --Schnark 11:44, 28. Jul. 2012 (CEST)Beantworten
Andererseits stellen [10] und [11] den Datensatz korrekt dar. Vielleicht ist der Index für [12] einfach nur noch nicht aktualisiert, der Datensatz ist ja offenbar ziemlich neu (in VIAF eingetragen 2012-07-25)? Vielleicht einfach noch mal ein paar Tage abwarten. --FordPrefect42 (Diskussion) 11:49, 28. Jul. 2012 (CEST)Beantworten
Querverweis auf Hilfe_Diskussion:Normdaten#Problem_mit_LCCN-Link. Gleiche Symptomatik. Und auch für Ophelia Lovibond führt die Suche unter authorities.loc.gov auf den "offiziellen" aber derzeit nicht-funktionierenden Permalink http://lccn.loc.gov/no2012076362 – Screenshot unter http://imgur.com/f3TdYMake (Diskussion) 19:48, 28. Jul. 2012 (CEST)Beantworten

Früher, in der guten alten Zeit, gab es vom Datensatz der DNB einen Link zum entsprechenden WP-Artikel (soweit wir die Normdaten entsprechend eingetragen hatten). Dies scheint nicht mehr der Fall zu sein. Weiß jemand wieso?Olaf2 (Diskussion) 14:52, 30. Jul. 2012 (CEST)Beantworten

Mal funktioniert's, mal wieder nicht... Ende Juli sollte es jetzt bald wieder funktioneren, siehe Benutzer_Diskussion:APPER#links_in_der_DNB_auf_die_WP --FA2010 (Diskussion) 14:56, 30. Jul. 2012 (CEST)Beantworten
Danke.Olaf2 (Diskussion) 15:51, 30. Jul. 2012 (CEST)Beantworten

Scheint mittlerweile wieder zuverlässig zu funktionieren. Sehr schön. Ich geh mal davon aus, dass ich nicht einfach nur Glück hatte, wenn ich in den letzten 14 Tagen geschaut hab und erle. -- Make (Diskussion) 15:10, 16. Aug. 2012 (CEST)Beantworten

Dieser Abschnitt kann archiviert werden. Make (Diskussion) 15:12, 16. Aug. 2012 (CEST)

Ganz allgemein: Gibt es keine Möglichkeit, von der DNB wegzukommen?

Die GND wird immer schlechter (ständige Dubletten, schrottige Pseudodatensätze, Fehler werden monatelang nicht bearbeitet). Die Bibliothek praktiziert das Gegenteil von Öffentlichkeit, selbst ihre Lesesäle kosten Eintritt. Und jetzt schließt die DNB auch noch ihre wenigen Digitalisate (die der jüdischen Exilpresse) ohne jede Not aus angeblichen "Rechtsgründen" weg, wohl nur, um freie Inhalte zu behindern. Wieso unterstützen wir eigentlich diese schlechteste aller Nationalbibliotheken, die keinem Deutschen bei allen Kosten auch nur den geringsten Wert einbringt, auch noch mit unserer Arbeit? Die GND ist frei, wir sollten sie nehmen und das ganze selbst in die Hand nehmen, dann kann die DNB bleiben wo der Pfeffer wächst. --FA2010 (Diskussion) 16:07, 30. Jul. 2012 (CEST)Beantworten

Hallo Krawallsocke, die Analyse stimmt (teilweise. Mein Eindruck ist, im Vergleich zu anderen Nationalbibliotheken steht die DNB recht gut da, wenn man mal von den eigentlichen Beständen absieht), aber vermutlich prügelst Du den falschen Esel: Die DNB ist halt darauf angewiesen, ihre genuine Klientel, nämlich die Regionalen Bibliotheksverbünde, bei Laune zu halten und die sind durch ihr Bestreben, Innovationsdruck abzubiegen, so arg strapaziert, dass ihnen wenig echte Arbeit zumutbar scheint. D.h. die DNB hält des öfteren den Kopf hin, weil ihre "Partner" ihre Hausaufgaben nicht machen. Vermutlich könnten DNB und Wikipedia zusammen, ohne die anderen, eine bessere GND betreiben, weil sich das Normdatenverständnis dann besser deckt. "Wikipedia" alleine ist witzlos, weil das ein einfacher Dump der Personendaten-Templates ist: Da fällt dann gerade die Verzahnung mit anderen Communities weg. Alternativ könnten wir uns natürlich an eine andere Normdatei klammern, die müsste aber konzeptionell vergleichbar modern sein (also etwa exakte Lebensdaten und Geburtsorte erlauben), da fällt mir aber keine ein, ausser vielleicht XA (v.a. weil ich da das Datenformat nicht kenne) und nichtbibliothekarische Sachen wie MusicBrainz oder IMDb, die aber thematisch recht eng sind. In der Normdatenredaktion fällt in jedem Fall viel Arbeit an, denn was wir derzeit produzieren sind ja nur "Meldungen", die dann von "Redakteuren" eingearbeitet werden müssen. Bei unserem derzeitigen Verfahren werden ausserdem noch massiv Titelzuordnungen in der DNB korrigiert, das bremst (wenn jemand drittes hier redaktionell eingreifen würde, wären sie theoretisch im Zugzwang und hätten nur wenig Zeit, ihre Zuordnungen zu reparieren. Oder aber es würde niemals wieder ein Tn-Satz aufgelöst).
Ich bin leider nicht über die Gesamtstrategie orientiert, wie DNB plus "Partner" (hier: GND-"Teilnehmer", also die mit Schreibzugriff auf das ILTIS-System) mittelfristig einige Millionen unbrauchbarer Datensätze aufräumen wollen (und Tn-Sätze sind unbrauchbar, die Arbeitsvermeidungsstrategie, aufgrund der sie seinerzeit eingeführt wurden, ist im Nachhinein nur eine Aufschiebestrategie gewesen, finde ich), aber vielleicht sollten wir (Raymond?) doch einmal ein Gespräch anregen, in dem die DNB klar äußern kann, wieviel Arbeit die redaktionelle Bearbeitung unserer Meldungen wirklich ist und ob bzw. in welchem Masse sie das überhaupt leisten kann. Dann könnte man auch ernsthaft über Auswege reden, vorzugsweise organsiatorische (die Verursacher der schlechten Sätze stärker in die Pflicht nehmen), technische (sowieso, vermutlich fällt aber niemandem etwas ein, die Bearbeitungseit pro Meldung vom Minuten- in den Sekundenbereich zu drücken, ich glaube aber, dass alle GND-Redakteure mit BEACON-Mitteln deutlich effizienter arbeiten könnten als mit den momentan verpflichtenden KVK-Recherchen), und möglicherweise auch mit den vor Jahren in die Diskussion gebrachten "Redaktionsbefugnissen" für "Wikipedia" (was aber realistischerweise bedeutet, dass der Wikimedia-Verein einen Arbeitnehmer spendiert, der dann in einer Bibliothek mit vielen Nachschlagewerken installiert wird und hauptamtlich Normdatenarbeit macht). -- Thomas Berger (Diskussion) 17:44, 30. Jul. 2012 (CEST)Beantworten
Zum letzten Satz: Nunja, WMDE hat ja Gerüchten zufolge sowieso tendenziell Probleme, ihre Spendeneinnahmen auszugeben und gerade erst zur Verwirklichung von Wikidata 12 (!) Mitarbeiter eingestellt. Vielleicht ist die Einstellung/Beauftragung/Finanzierung eines hauptberuflichen Normdatlers gar nicht mal so unrealistisch, da ja auch die erhofften Ergebnisse dabei sich recht gut mit den Kriterien decken, die etwa beim CPB eingefordert wurden (freies Wissen, Bezug zu Wikimedia-Projekt, Nachhaltigkeit), und die Thematik sowieso hervorragend zu den bevorzugt geförderten GLAM-Bereichen einschließlich Wikipedian-in-Residence-Strategie passt. --Mai-Sachme (Diskussion) 18:00, 30. Jul. 2012 (CEST)Beantworten

In diesem Zusammenhang eine allgemeine Frage: Hat die für Juli angekündigte maschinelle Zusammenführung der Dubletten schon begonnen? Es wäre schön, wenn sich die DNB hier gesprächiger (ergo: transparenter) zeigte. --Monsieur Becker (Diskussion) 20:29, 30. Jul. 2012 (CEST)Beantworten

Exakt hier ist die DNB traditionell nicht besonders gesprächig. Auf ihren Webseiten auch nicht unbedingt. Auf der ZDB-Info-Liste (Archiv leider nur für Subskribenten geöffnet) gab es allerdings am 3.7. die Ankündigung, dass am 9. oder 11.7. mit der Zusammenführung begonnen würde, und zwar zunächst für Kongresse, dann für Körperschaften und zum Schluss für Geographika. Man geht davon aus, dass die automatischen Verfahren im Oktober beendet sein werden (und dass allerhand für intellektuelle Abgleiche übrig bleiben wird: Sobald Vorgänger oder Nachfolger vermerkt sind muss beispielsweise berücksichtigt werden, dass GKD und SWD unterschiedliche Regeln für solche sogenannten "Splits" hatten). -- Thomas Berger (Diskussion) 23:07, 30. Jul. 2012 (CEST)Beantworten
Personen werden aber auch automatisch zusammengeführt, oder? -- Monsieur Becker (Diskussion) 13:02, 9. Aug. 2012 (CEST)Beantworten
In der ZDB-Info-Mail ist nur von der „maschinelle[n] Zusammenführung der doppelten Datensätze aus der ehemaligen GKD und SWD“ die Rede. -- Rosenzweig δ 18:08, 11. Aug. 2012 (CEST)Beantworten
Hi. Ich war letzte Woche zu Besuch in der DNB und habe die Gelegenheit genutzt, mich mit meinen ehemaligen Kolleginnen/Kollegen zu treffen. Seit ich das letzte Mal dort war, hat sich eines getan, angefangen von der Zusammenlegung von PND, SWD, GKD zur GND. Der zweite große Hammer war die Entscheidung der DNB, die Normdaten unter Creative Commons Zero herauszugeben und als Datenpaket zum Herunterladen anzubieten. Gleiches geschieht mit den Titeldaten. Was die Zusammenlegung angeht, ist das ein (ihr höre jetzt von euch ein "ach") noch nicht abgeschlossener Prozess und wenn ich das mit meinen eigenen Worten richtig beschreibe, ist der Lag noch recht groß, weil ein Teil der Verbünde beim Mergen noch gewisse Rückstände hat und aus anderen Gründen. Gibt es denn jemanden, der beispielsweise das Projekt PeEnDe ausbauen würde, damit die dort erzeugten Datensätze den aktuellen GND-Richtlinien entsprechen würden? -- Mathias Schindler (WMDE) (Diskussion) 09:00, 13. Aug. 2012 (CEST)Beantworten
Die Abschlussfrage kommt meines Erachtens etwas überraschend. Mich würde interessieren, mit welcher Intention sie gestellt wurde. --Monsieur Becker (Diskussion) 09:24, 16. Aug. 2012 (CEST)Beantworten

Wurzbach

Von Diskussion:Gemeinsame_Normdatei hierhin verlagert

Wurzbach hat oft mehr als 1 Artikel zu einer Person in seinem Lexikon. Offenbar kann man in 2 Artikel die GND eintragen, es wird aber nur 1 Wurzbachartikel angezeigt. Beispiel: Karl Ambrosius von Österreich-Este, siehe Literatur. Bei „Seealso“ (von Wikisource aus) wird nur der Habsburg-Artikel angezeigt, nicht aber der Este-Artikel. Wünschenswert wäre es, wenn alle Wurzbach-Artikel im „See-also-Fenster“ angezeigt würden. Also auch Nachträge, Edrgänzungen, Namensvarianten, (die meistens auch Ergänzungen bringen). Zabia (Diskussion) 19:48, 30. Jul. 2012 (CEST)Beantworten

Technisch sieht das so aus, daß Benutzer:APPER einen Resolver aufgesetzt hat (http://toolserver.org/~apper/pd/person/gnd-redirect/ws-blkoe/) und die automatisiert die Liste aller GND-Nummern zu BLKÖ-Einträgen veröffentlicht. Da ist dann die Nummer 130252972 in der Tat doppelt drin, aber was nutzt das, weil es ja beide Male auf dieselbe URL http://toolserver.org/~apper/pd/person/gnd-redirect/ws-blkoe/130252972 geht? Eine Lösung wäre, dass der Resolver ausgebaut wird, und in solchen Fällen zunächst eine Auswahl ("Liste der Fundstellen zur Person") präsentiert, die andere bestünde darin, den Resolver zu umgehen und den Toolserver eine "allgemeine" BEACON-Datei produzieren zu lassen, die explizit die konkreten Lemmata und WS-Links enthält.
Ich weiss nicht, ob sich der Aufwand lohnt: Es sind 37 Personen betroffen (darunter auch noch Zuordnungsfehler wie den derzeit angeblich vierfachen Jakob Amigoni und beim Este-Beispiel verweist der eine Artikel bereits im Text auf den anderen und die Rückrichtung wird durch eine WS-Fussnote abgedeckt. -- Thomas Berger (Diskussion) 22:38, 30. Jul. 2012 (CEST)Beantworten
Ich denke auch, dass da innerhalb Wikisource ohnehin gegenseitige Links vonnöten sind (schon aus Benutzerfreundlichkeit für alle anderen, die die Artikel nicht über BEACON finden, also wohl 99,99% der Leser), da ist der Aufwand für eine Umprogrammierung dann momentan schlicht zu hoch für die paar Fälle. --FA2010 (Diskussion) 12:07, 31. Jul. 2012 (CEST)Beantworten
Ich danke für Eure Antworten. Versteh ich das richtig: Ich darf, wenn angezeigt, im Wurzbach GND-Nummern auch mehrfach zuordnen? Oder ist genau das total falsch?
Wieviele Personen da betroffen sind, weiß nicht mal ich, und ich kenn inzwischen einige tausend Wurzbachlemmta.
Sicher bemüh ich mich, interne Anmerkungen (so wenig wie möglich, so viel wie nötig) zu geben, allerdings paßt das nicht immer. Wenn zu so einer Person ein WP-Artikel vorhanden ist, dann vergeb ich WP-links in der Wikisource mehrfach, nur gibt es relativ wenig WP-Artikel, auch wenn die Personen relevant wären. Ich arbeite den Wurzbach bändeweise ab, da kann es sein, dass Falsches noch einige Zeit nicht korrigiert wird. Die erwähnten Artikel werd ich mir jedenfalls vornehmen. Mal sehen. Mir gehts jedenfalls sicher nicht um unzumutbaren Mehraufwand für irgendwen, ich frage bloß, weil ich Antworten brauch. Zabia (Diskussion) 13:39, 31. Jul. 2012 (CEST)Beantworten
Meintest Du "WS-Links in der Wikipiedia"? -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)Beantworten
Auch. Eigentlich hab ich gemeint, dass es zutreffendenfalls mehrere Wurzbach-Lemmata in Wikisource gibt, die denselben Wikipedia-Link aufweisen. Die verlink ich aber nur in Ausnahmefällen mehrfach in die WP, z.B. bei durch mich geteilten Adels-Artikeln (Wappen), bzw. beim Schreibers, aber nur, wegen der angenommenen Relevanz der französischen Quellen. Zabia (Diskussion) 14:38, 31. Jul. 2012 (CEST)Beantworten
Die falschen Amigoni-GNDs dürften Copy&Paste-Fehler gewesen sein. Blöderweise waren das 2. korrigierte Artikel, die da verschlimmbessert wurden. Inzwischen hab ich das korrigiert. Herzlichen Dank für den Hinbweis! Zabia (Diskussion) 13:51, 31. Jul. 2012 (CEST)Beantworten
Eine tagesaktuelle Auswertung der BEACON-Datei bezüglich Dubletten bei den GND-Nummern findest Du hier. -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)Beantworten
Oft stellt sich ja der Erkenntnisgewinn gerade erst dann ein, wenn doppelt zugeordnete GND-Nummern auffallen. Sei es, dass der Normdatensatz fälschlich mehrere Personen identifiziert oder sonstwie mehrdeutig ist, oder dass die Quelle unbemerkt zwei im Alphabet auseinander liegende Lemmata zur gleichen Person hat. D.h. in WS sollte natürlich jeder Artikel eine GND-Nummer bekommen, sofern sie zutrifft (sofern mehrere zutreffen, also GND-Dubletten vorliegen, muss das anders geregelt werden: Die Bereitwilligkeit, mit der entsprechendes zur ADB auf WP:PND/F durch die DNB akzeptiert wurde, schien von Monat zu Monat zu variieren, direkte Meldungen an die DNB dürften erfolgversprechender und befriedigender sein). Wir sollten aber davon ausgehen, dass i.A. Zugriffe über die Person nicht zu simultaner Anzeige oder Auswahlmöglichkeit mehrerer Artikel führen, sondern bei einem willkürlichen der mehrfachen Artikel zur Person landen. D.h. jeder muss aus sich heraus, also Text oder WS-Anmerkung auf seine Gegenstücke hinweisen. Nur so kann man auch Suchmaschinenbenutzer optimal bedienen. -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)Beantworten
Danke für die hilfreichen Antworten. Ich hab jedenfalls festgestellt, dass die DNB, was Nummernsuche betrifft extrem benutzerfreundlich, extrem schnell auch, wurde, im Gegensatz zu den Zeiten der ADB. Den Link mit den Dubletten, den seh ich mir auch noch an. Danke! Zabia (Diskussion) 14:38, 31. Jul. 2012 (CEST)Beantworten
Ich geh jetzt so vor, dass ich GND nur 1x vergebe, schon um zu vermeiden, dass ich immer die gleichen Dubletten abarbeiten müsste. An sich hatte ich gestern alle BLKÖ-GND-Dubletten entfernt, das sieht man aber noch nicht in der Liste. Zabia (Diskussion) 14:12, 1. Aug. 2012 (CEST)Beantworten
Risiko ist höchstens, dass jemand anderes die entfernten wieder einträgt, weil er ja nur die Leerstelle sieht. Die Aussagen zur Auswertungsliste muss ich korrigieren, sie wird leider doch nicht automatisch generiert, sondern nur recht häufig (außer in den nächsten Wochen). Derzeit ist sie gelöscht, da im heutigen Toolserver-Abzug tatsächlich keine Dubletten vorlagen. -- Thomas Berger (Diskussion) 10:56, 2. Aug. 2012 (CEST)Beantworten
Danke jedenfalls, für die hilfreichen Hinweise. Ich hab auf der Diskussionsseite zum BLKÖ einen Hinweis (GND und Dubletten) gesetzt, mit Glück wird er gelesen. Die Abfrage-Liste hab ich in meinen Favoriten, ich seh halt ab und an nach. Lieben Gruß, aus Linz, Österreich. Zabia (Diskussion) 13:26, 2. Aug. 2012 (CEST)Beantworten

Botflag

Ich gehe jetzt den Rest der Kategorie:Wikipedia:Normdaten-TYP fehlt an (Buchstabe A schon erledigt). Das sind die Artikel, die LCCN und/oder VIAF enthalten, aber keine PND hatten. Alle Nichtpersonen habe ich ja schon vor kurzem herausgefiltert und allesamt mit Typen versehen (das war etwas komplizierter). Die jetzige Vorgehensweise: vielversprechende (deutschsprachige Personen, andere Autoren, Musiker, Komponisten, Personen ohne VIAF, Personen mit nur VIAF) mit Hand per Normdatenskript mit bislang ganz guter Trefferquote bei VIAF und auch in der GND, den Rest (da bleiben hauptsächlich US-amerikanische Kongressabgeordnete) automatisch: da muss eigentlich überall nur "TYP=p" rein. Solche Restaufgaben würde ich wieder mit dem AutoWikiBrowser erledigen, würde dafür aber gerne ein BotFlag erhalten, da das die Beobachtungslisten der anderen User doch eher über Gebühr strapaziert. Daher habe ich bei Wikipedia:Bots/Anträge auf Botflag dieses Flag für einen Nutzer Benutzer:FA2010Bot beantragt. Wenn Einwände bestehen, bitte dort äußern. --FA2010 (Diskussion) 09:37, 1. Aug. 2012 (CEST)Beantworten

Die vielen US-amerikanischen Politiker (die erfahrungsgemäß nur ganz, ganz, ganz selten GND-Einträge haben), habe ich jetzt per AWB (mit Botflag) mit TYP=p versehen; daher ist jetzt die Arbeit mit der Kategorie sicherlich weniger ermüdend. --FA2010 (Diskussion) 13:06, 9. Aug. 2012 (CEST)Beantworten

Mehrere Datensätze

Hallo, wie verfährt man, wenn man wie hier mehrere Datensätze zur Auswahl hat? --91.39.168.53 21:58, 6. Aug. 2012 (CEST)Beantworten

Kurz: Nach Belieben. Die Dubletten werden hoffentlich in der GND bald deutlich weniger werden. Ich hab das in diesem Fall mal durchgeführt. --FA2010 (Diskussion) 14:28, 7. Aug. 2012 (CEST)Beantworten

DNB kann jetzt auch das Alphabet!

Die Suchergebnisse nach Personennormdatensätzen sind nun endlich alphabetisch nach Nachname, Vorname sortiert, und danach nach Geburtsjahr. Das ist zwar immer noch scheiße (weil man nur 10 Ergebnisse auf einmal anzeigen kann, und weil "Otto Mueller" erstmal seitenweise "Carl Otto Muellers" etc. anzeigt), aber nicht mehr ganz so scheiße wie bisher. --FA2010 (Diskussion) 20:11, 10. Aug. 2012 (CEST)Beantworten

Ein Tipp, falls du ihn noch nicht kennst: Benutze die Druckansicht, da bekommst du 500 Datensätze mit einmal sehen. Leider aber auch nicht mehr. --Das Robert .... gibs mir! 15:07, 16. Aug. 2012 (CEST)Beantworten

Extended VIAF

Was um Himmels willen ist denn das? http://viaf.org/viaf/183447636 --FA2010 (Diskussion) 20:56, 13. Aug. 2012 (CEST)Beantworten

Hier scheint es ein paar Infos dazu zu geben. --Kam Solusar (Diskussion) 00:54, 14. Aug. 2012 (CEST)Beantworten
Sonderlich von Erfolg gekrönt scheint das Konzept aber nicht zu sein. Infolge meiner E-Mail hat man einen xA-Eintrag für die Katalanistin Jenny Brumme (http://viaf.org/hosted/xa/1285/) angelegt. Er ist zwar in VIAF integriert (http://viaf.org/viaf/46848960), aber die im xA-Datensatz ebenfalls genannten Datensätze der deutschen, dänischen und polnischen Nationalbibliothek (http://viaf.org/viaf/232807344) bilden noch immer ein eigenes Cluster. --Monsieur Becker (Diskussion) 07:58, 14. Aug. 2012 (CEST)Beantworten
Das könnte sich noch ändern in der nächsten Matching-Runde (die Ende dieses Monats stattfinden dürfte). Ist jetzt spekulativ, aber die VIAF-Algorithmen brauchen eine gewisse Trägheit, um sicherzustellen, dass Cluster-IDs einigermaßen permanent bleiben. Da könnte es genau im Plan liegen, dass der neue xA-Datensatz zunächst dem größeren der beiden Jenny-Brumme-Cluster zugeordnet wurde. Entsprechend verstärkt könnte dieser nun noch "anziehendere" (frei assoziiert "attraktivere") Cluster im nächsten Schritt die restlichen Datensätze (DNB, Dänemark, Polen) aufnehmen. – Ohne diese Trägheit wäre um den xA-Datensatz vielleicht ein komplett neuer Cluster entstanden, der die zwei bisherigen Jenny-Brumme-Cluster ersetzt hätte.
Mal schauen, ob sich tatsächlich noch etwas bewegt ... -- Make (Diskussion) 11:35, 14. Aug. 2012 (CEST)Beantworten

"No longer part of VIAF"

Immer mal wieder kommen mir Sätze wie http://viaf.org/viaf/112009186/ unter die Finger. So etwas ist natürlich höchst unbefriedigend. Neben der allgemeinen Wechselhaftigkeit der Cluster ist das ein weiteres Argument dafür, VIAF nicht als Allheilmittel zu sehen, sondern die nationalen Normdaten redundant vorzuhalten. --AndreasPraefcke (Diskussion) 14:56, 15. Aug. 2012 (CEST)Beantworten

Ich habe diese Datensätze bisher nur gesehen, wenn der nationale Eintrag (in meinen Fällen GND) nicht mehr vorhanden ist (oder nur noch als Weiterleitung) und es sich eben nicht um ein Cluster handelte (sondern ausschließlich der GND-Eintrag dazugehörte). Solche gelöschten Einträge gibt es wie gesagt auch in der DNB und daher ist das meiner Meinung nach nichts neues oder schlechteres als bei nationalen Normdateien. --APPER\☺☹ 02:00, 16. Aug. 2012 (CEST)Beantworten
Wenn ich es recht sehe, wurde NII generell aus der VIAF entfernt. Im Cluster http://viaf.org/viaf/49224511/ beispielsweise gibt es in Entwicklungshistorie die Anmerkung, dass der Datensatz im April 2010 aufgenommen und im Oktober des gleichen Jahres wieder entfernt wurde. Eine gezielte Suche nach der NII-ID liefert zumindest bei mir kein Ergebnis. Insofern deute ich diese Entwicklung nicht als Zeichen von Inkonsistenz. Ich nehme an, vom o. g. jetzt ungültigen NII-VIAF-Eintrag zu Eugene Kennedy wäre eine automatische Weiterleitung zum Cluster http://viaf.org/viaf/39897207 vorhanden, wenn der NII-Datensatz nach Einspielung dem Cluster zugeordnet worden wäre. --Monsieur Becker (Diskussion) 09:01, 16. Aug. 2012 (CEST)Beantworten
Ja, auf der VIAF-Startseite ist NII nicht mehr aufgeführt und ich bin ziemlich sicher, dass es dort mal gelistet war. Woran ich mich nicht erinnere ist, ob NII damals als "experimentell" klassifiziert war (wie derzeit zB BIBSYS Norwegen). Wenn der Status von NII entsprechend gekennzeichnet war, dann ist es doch OK, wenn ein zugehöriger Datensatz verschwindet, zumal ja unter http://viaf.org/viaf/112009186/ immer noch eine mehr oder weniger aussagekräftige Statusinfo zu finden ist. (Wobei ich in der History konsequenterweise noch einen "delete"-Eintrag erwarten würde.) Ich gehe auch davon aus, dass die Cluster-Nummer 112009186 nicht irgendwann neu vergeben wird.
Vielleicht zum Vergleich und generell ganz interessant die History von http://viaf.org/viaf/39897207/ (Eugene C. Kennedy): Ein zugeordneter NII-Datensatz wird ebenfalls im OktoberNovember 2010 entfernt (Monsieurbecker verwechselt dies oben auch :). Weiter zu beobachten: Munteres Cluster-Hopping von zwei DNB-Datensätzen in 2011-04 und 2012-02. Wobei ich es auch grundsätzlich für einen Fehler halte, dass VIAF die als "undifferentiated" erkannten DNB-Datensätze überhaupt zur Clusterung verwendet. – Dass die derzeitige Praxis – VIAF und nationale Normdaten werden parallel erfasst – höchst vernünftig ist, scheint mir hier "bei uns" breiter Konsens zu sein. Grüße Make (Diskussion) 14:51, 16. Aug. 2012 (CEST)Beantworten