Wikipedia Diskussion:Normdaten
Archiv |
Wie wird ein Archiv angelegt? |
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. |
Erweiterungsvorschlag: Library of Congress Subject Headings
Wir könnten analog zur deutschen Schlagwortnormdatei (SWD) auch die Schlagwortsammlung der Library of Congress als Parameter ergänzen. Damit würden Interessierte nicht nur Literatur in dt. Sprache zu den Themen finden, sondern auch in engl. Sprache.
Die Schlagworte lassen sich entweder über http://id.loc.gov/authorities/subjects.html finden oder über http://authorities.loc.gov/ . Erstere Seite führt zu Einträgen wie etwa [1] für Nordpol, bei zweiterer muss man sich erst durchklicken, bis man zu einer Seite wie [2] gelangt. Diese nutzen wir derzeit auch schon als Linkziel für LCCN-Einträge und hat den Vorteil, dass hier auch ein Link zu einer Suche nach entsprechenden Werken vorhanden ist. Bei ersterer Seite ist interessant, dass dort auch teilweise Links zu Einträgen in anderen Datenbanken vorhanden sind, siehe etwa bei [3]. --Kam Solusar 18:12, 4. Feb. 2012 (CET)
- Nun, wenn niemand etwas dagegen einzuwenden hat, werd ich den Parameter LCSH mal in den nächsten Tagen ergänzen. --Kam Solusar 19:07, 22. Feb. 2012 (CET)
- OK, eigentlich wollte ich heute nacht endlich den Parameter für LCSH ergänzen. Bin mir aber jetzt doch nicht ganz sicher. Die Library of Congress Subject Headings nutzen ja auch LCCNs als ID. Hier gibt es also dieselbe Situation wie etwa demnächst bei PND, GKD und SWD bei der Deutschen Nationalbibliothek. Die Frage ist, ob ein eigenständiger LCSH-Parameter noch Sinn macht, oder ob man besser die Änderungen an der Vorlage infolge der Zusammenlegung der DNB-Normdatenbanken (siehe unten) abwartet und dann einfach den LCCN-Parameter + Angabe des Normdatentyps dafür nutzt. --Kam Solusar (Diskussion) 03:04, 9. Mär. 2012 (CET)
Google, Freebase, Entities
Bin grad gestolpert über Direkte Antworten statt Linklisten (heise.de) Hab mir Freebase schon seit Ewigkeiten nicht mehr angeschaut, wusste auch nicht, dass die inzwischen bei Google sind. Könnte interessant sein: Blick über den Tellerrand, Inspiration für Verknüpfungsmöglichkeiten. – Falls am Wochenende schlechtes Wetter oder sonstwie Langeweile aufkommt, kann man dort zB ausgehend von http://www.freebase.com/view/en/albert_einstein
mal herumschnuppern ;-) -- Make (Diskussion) 14:39, 15. Mär. 2012 (CET)
Programmierer gesucht
Hallo. Wie schon öfter erwähnt, wird die GND ab Juli wohl unter freier Lizenz verfügbar sein. Dass es sich lohnt, diese in irgendeiner Form auf dem Toolserver zur Verfügung zu haben, liegt auf der Hand. Mein Account hat inzwischen soviele Datenbanken, dass ich öfter an die 15-Verbindungen-Grenze komme... da ich auch nicht dauerhaft alles alleine machen will, stelle ich mal die Frage in den Raum, ob es hier jemanden gibt, der Programmiererfahrung hat und mit mir gemeinsam eine so genanntes Multi-Maintainer-Project (MMP) auf dem Toolserver erstellen will. Innerhalb dieses Toolserver-Accounts kann dann alles ablaufen, was Normdaten betrifft. Neue Sachen wie die GND-Datenbank aber über kurz oder lang auch das Normdaten-Bezogene, was bisher auf meinem Account läuft (also z.B. die Extraktion der Normdaten aus der Wikipedia und Redirects etc.). Also: gibt es interessierte Programmierer (idealerweise schon mit Toolserver-Erfahrung/-Account)? Grüße --APPER\☺☹ 19:19, 10. Mai 2012 (CEST)
Wichtigste Arbeiten nach der Ersetzung der Vorlage
Hier kann ich nichts helfen, daher von mir erst mal nur einige Punkte (mit herzlichem Dank, wie lange es auch dauern mag): --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
- normdaten.js von Schnark müsste GND mit Typ p erfassen und die PNDfehlt-Funktionalität umstellen, sowie SELIBR durch NDL erstzen (das kann mit VIAF allerdings noch nicht befüllt werden, ein leeres Feld reicht) --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST) Ok
- Apper-Tool (Wikipedia-Personensuche) müsste auch die GND (mit Typ p) erfassen. Am besten alle, auch Mickey Maus und Adelsfamilien, standardmäßig suchen und finden könnte das Tool ja vielleicht weiterhin nur Männer und Frauen, aber über die GND angesprochen eben auch diese anderen.--AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST) Ok
- Das hab ich grad implementiert, läuft grad ein erstes Mal, aber bei der aktuellen SQL-Performance auf dem Toolserver macht Entwicklung grad keinen Spaß. Hoffe einfach, dass es funktioniert. Alle Artikel, die jetzt schon eine GND hatten, sind leider erstmal nicht erfasst - wenn das ganze funktioniert werde ich mal einen Gesamtlauf machen, um auch die zu erfassen. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)
- Apper-Tool (Wikipedia-Personensuche) müsste auch die GNDName (mit Typ p) erfassen und mit den BEACON-Dateien vergleichen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST) Ok
- Personeninfo-Tool sollte jetzt vollständig auf GND umgestellt sein. --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)
- Resolver für GND -> Wikipedia müssten erstellt werden. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST) Ok
- Auch das ist erledigt: siehe http://toolserver.org/~apper/pd/person/gnd-redirect/de/1021397091 . Und auch wenn da "person" in der URL ist, funktioniert das mit allen GNDs: http://toolserver.org/~apper/pd/person/gnd-redirect/de/1006609-3 --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)
- Die Wikipedia-BEACON-Datei müsste auch die Artikel mit GND und Typ p enthalten, und natürlich weiterhin auch die vielen mit PND.
- Eine weitere komplettere BEACON-Datei müsste außerdem die Artikel mit TYP=p, leerem Feld GND, aber vorhandenem GNDName erfassen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
- Die "Mutter aller Botläufe" müsste alle PND= in TYP=p und GND= ersetzen. Vielleicht am besten erst im Juli, damit nicht-individualisierte und Weiterleitungen vorher ausschließen können und dann extra behandeln. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
- Ich weiß immer noch nicht, ob das sinnvoll ist. Was spricht denn im Fall "PND" dagegen, dass "PND=123" ein Kürzel ist für "TYP=p|GND=123"? Über 180.000 Artikel mit einem Bot... uiuiui. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)
- Wir könnten z. B. erst mal nur bei Bedarf ändern (also z. B. den Interwiki-Bots und Rechtschreibhelferlein sagen, dass sie bei Personen mit PND das grundsätzlich mit ändern sollen, wenn sie die Artikel ohnehin anfassen). Und wenn dann nächstes Jahr noch ein paar tausend übrig sind, kann man die immer noch irgendwie machen (das sind dann wohl eh so Artikelleichen, die anzusehen sich irgendwie lohnen wird). Sobald die Tools GND auslesen können und die dann auch sicher in den BEACON-Dateien landen und es einen Resolver gibt, könnten wir die Botbetreiber damit beauftragen. Wir würden uns zurücklehnen und könnten uns weiterhin auf Vorlage:PND, GKD, SWD usw. konzentrieren. Klingt eigentlich gut, ja. --AndreasPraefcke (Diskussion) 19:28, 11. Mai 2012 (CEST) PS: WP:Bots/Anfragen gestellt. --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)
- Wartungsliste: Artikel mit Normdaten, bei denen Felder GND _und_ PND befüllt sind. Geforderte Aktion dann: Prüfen und PND dann löschen. Alternativ könnte auch die Vorlage eine solche Wartungskategorie einfügen (soll ich das machen?) Theoretisch wäre das irgendwann mal auch für SWD, GKD etc. sinnvoll, aber durch die vielen Dubletten und die insgesamt viel geringere Verbreitung in der Wikipedia ist das sehr nachrangig. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
Alle können helfen dabei, die
- Vorlagen DM, SWD, GKD, PND und auch PNDfehlt nach und nach umzustellen und überflüssig zu machen. Meist ergeben sich ja doch neue Möglichkeiten mit VIAF und der GND, so dass eine rein automatische Abarbeitung vielleicht gar nicht so sinnvoll ist. Wer Automatisierungsmöglichkeiten sieht, möge dennoch seine Bots anwerfen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
- Wartungskategorien Kategorie:Wikipedia:Normdaten-Typ falsch eingetragen und Kategorie:Wikipedia:Normdaten-Typ fehlt schlank zu halten. Die etwa 20 Eintragungen, die die Kategorie gerade hatte, habe ich schon gefixt. --AndreasPraefcke (Diskussion) 18:30, 11. Mai 2012 (CEST)
Klärungsbedarf mit der DNB?
Ich habe jetzt nicht jeden Diskussionsbeitrag durchgelesen, irgendwo tauchte aber mal mein Name auf mit der Bitte um Rückfrage bei der DNB auf. Könntet ihr hier bitte mal kurz notieren, was zu klären ist?
Konkret ist mir gerade eben ein GND/kiz-Duplikat aufgefallen: 4707542-9 und 2101563-6 zum NS-Dokumentationszentrum der Stadt Köln. — Raymond Disk. 12:03, 12. Mai 2012 (CEST)
- Hi Raymond, die Frage ist, ob wir die Liste Wikipedia:PND/Fehlermeldung zu "WP:GND/Fehlermeldung" erweitern können. Gibt es innerhalb der GND-Redaktion noch eine Trennung, wer Personen bzw. Geografika etc. bearbeitet? Außerdem könnte man die Umstellung auf die GND dazu nutzen, freundlich anzufragen, ob die Abarbeitung der gemeldeten Fehler nicht schneller möglich ist. Per E-Mail dauert das in der Regel nur einen Tag; unsere Liste dagegen hat mittlerweile eine Wartezeit von einem halben Jahr, was für beide Seiten auf die Dauer frustrierend ist. --Kolja21 (Diskussion) 16:04, 12. Mai 2012 (CEST)
- Bei mir ist immer noch die Frage offen, was mit Einträgen wie dem GND 174188625 passieren soll. So ein Eintrag ist zu dünn: Name und Geburtsjahr reicht einfach nicht, um davon ausgehen zu können, dass es die gleiche Person ist. So würde ich den Beitrag niemals Lothar Brandes zuordnen, obwohl es natürlich sein kann. Ich glaube, du hattest da schonmal angefragt... --APPER\☺☹ 23:48, 12. Mai 2012 (CEST)
@APPER: Da legst du die Latte aber sehr hoch ;) Traditionell reicht für Bibliotheken das Geburtsjahr als Indikator aus. In den seltenen Fällen, dass zwei Autoren den gleichen Namen und das gleiche Geburtsjahr haben, ergänzt die LoC noch Tag und Monat der Geburt. Mehr war ursprünglich, in Zeiten des Zettelkatalogs, nicht vorgesehen. (Nicht mal das Todesjahr wurde nachträglich ergänzt, weil sich damit die Ansetzung geändert hätte.) Konkret heißt das: Der von dir erwähnte Fall sollte natürlich auf der PND/F-Seite eingetragen werden, nur wie prüft die GND-Redaktion die Zugehörigkeit? D.h. ich wüsste gerne von der DNB, welches Wissen sie nutzt, das der DNB-OPAC nicht anzeigt. Z.B.: Wer hat den Datensatz geliefert (PICA3-Feld 012 Nutzungskennzeichen) und vor allem, mit welchen Büchern, Schriftstücken etc. ist er verlinkt? Können wir mit dem nötigen Know-how selbst überprüfen, ob die Person unser "Lothar Brandes" ist oder müssen wir die Fehlermeldung blind abgegeben, in dem Sinne: Überprüft mal, ob das die gleiche Person ist, auf die sich euer Tp bezieht. --Kolja21 (Diskussion) 23:22, 13. Mai 2012 (CEST)
- Ein tagesgenaues Geburtsdatum reicht mir ja schon - oder halt Geburts- und Sterbejahr. Oder eine Jobbezeichnung... Bei den 17***er PND-Nummern sind leider Dutzende solche Einträge dabei (also auf die ich schon gestoßen bin - also mit Wikipedia-Eintrag). Bisher habe ich die nicht gemeldet - weil ich halt nicht weiß, ob die DNB da überhaupt was machen kann. --APPER\☺☹ 00:00, 14. Mai 2012 (CEST)
- VIAF nimmt deutlich die Literatur, die mit so einem Normsatz geliefert wird, als Informationsquelle für seine Bedeutung. In der PND scheint es ähnlich zu sein, der "Verursacher" eines Normsatzes (von ihm wird angenommen, dass er ihn mindestens einmal nutzt oder zumindest genutzt hat) wird in Prozesse zur Identitätsklärung oder Dublettenbereinigung eingebunden und muss sich äußern, welche Person bei der Anlage des Normsatzes wirklich gemeint gewesen ist. Speziell bei den 17er und 18er-Nummern, insgesamt bei den etwa 3.000.000 offline eingespielten Sätzen vom letzten Jahr (nur ein kleiner Teil davon Tp) ist bekannt, dass die DNB überhaupt nichts anderes darüber weiss als im Normsatz steht, also immer eine Fremdredaktion befragt werden muss. Um die nicht übermässig zu belasten wurde in PND-Redaktionskreisen die Devise ausgegeben, von Meldungen bezüglich Dubletten möglichst Abstand zu nehmen. An der Stelle ist die Wikipedia aber deutlich Nutzer der Normdaten, und ich z.B. finde nicht, dass wir von solchen Meldungen Abstand nehmen sollten: Bei den SWD- und GKD-Körperschaften z.B. ist angekündigt, dass maschinelle Abgleichsläufe sehr bald stattfinden sollen, für die Personen hingegen ist m.W. konkret nichts geplant, d.h. es kann nur über hartnäckiges Melden eine Verbesserung geben. -- Thomas Berger (Diskussion) 00:14, 14. Mai 2012 (CEST)
- Bislang hat die DNB solche Anfragen abgelehnt, da, wie Thomas eben schon geschrieben hat, die Masse von Neueinspielungen erst halbautomatisch nach Dubletten durchsucht werden soll. (Tagesgenaue Geburtsdaten gibt es übrigens aus Datenschutzgründen eher selten; in der Regel wird der Beruf als zweiter Indikator hinzugefügt.) Drei, vier Monate würde ich der DNB mindestens Zeit lassen, bevor wir alle 17er- und 18er-Nummern melden. Drängen würde ich dagegen auf den Abbau der alten Listen. (Es muss doch möglich sein, mal ein, zwei studentische Hilfskräfte zu finanzieren. Warum z.B. nicht aus dem Kreis der Wikipedianer?) --Kolja21 (Diskussion) 00:21, 14. Mai 2012 (CEST)
- Die Einspielungen erfolgten im April und Oktober 2011 (letztere wurden allerdings erst Anfang Dezember 2011 in der PND sichtbar). Dabei wurden Tn-Sätze stark maschinell abgeglichen, Tp-Sätze vorsichtshalber überhaupt nicht. Ich kenne keine Quelle dafür, dass ein maschineller Abgleich der Tp-Sätze geplant sein könnte und unterstelle, dass die Zurückhaltung beim gegenseitigen Melden nur aus Rücksichtnahme auf die Bearbeitungskapazitäten bei den Nicht-DNB-Redaktionen motiviert ist. -- Thomas Berger (Diskussion) 01:06, 14. Mai 2012 (CEST)
Bitte um Hilfe
Die neue Vorlage hat noch das Problem, dass sie auch eingeblendet wird, wenn sie ganz leer ist {{Normdaten}} oder wenn nur {{Normdaten|TYP=g}} oder so etwas drin steht (bei TYP=p soll sie ja eingeblendet werden, immerhin gibt's dann den Personensuche-Link). Für die Leute mit Metadaten-Anzeige soll sie immer angezeigt werden, wenn sie da ist, denn man kann sie dann ja löschen oder was eintragen, und es ist gut, wenn das die erfahrenen Wikipedianer schon in der Artikelansicht sehen.
Ich habe das in der Testvorlage Vorlage:NormdatenTemp zu verbessern versucht, und an sich passiert genau das, was ich will, und es kommt beim Parsen {{Normdaten|TYP=g}} das raus:
<span class="metadata"><div id="normdaten" class="catlinks normdaten-typ-g">'''Normdaten (Geografikum):''' <span class="metadata"></span></div></span>
Sieht dann so aus (bitte auch mal ausgeloggt anschauen, sofern das Helferlein "Metadaten anzeigen" aktiviert ist):
Ich dachte, das zeigt dann einfach gar nichts an für Benutzer ohne angeschaltete Metadaten, aber es kommt so ein breiter, dünner, leerer Streifen mit dem Kasten raus. Was ist falsch daran? Es hat wohl mit dem "div" zu tun. Ich kenne mich damit leider nicht aus. --AndreasPraefcke (Diskussion) 13:23, 12. Mai 2012 (CEST)
- <span><div></div></span> wird von Browsern andersrum geparst, also als ob das span im div ist. Hängt damit zusammen, dass ein span "inline" ist und keinen Block (div) enthalten kann. Einfachste Lösung ist, statt eines span ein div außenrum zu nehmen. Keine Ahnung, ob das irgendwelche Seiteneffekte hat, aber hier funktionierts erstmal:
Super, danke, das scheint zu funktionieren. --AndreasPraefcke (Diskussion) 14:05, 12. Mai 2012 (CEST)
Ist es denn notwendig, ein eigenes Element extra für die Klasse "Metadata" drumherum zu setzen? Oder könnte man einfach den Normdaten-DIV noch um die Metadata-Klasse ergänzen und sich den zweiten DIV/SPAN sparen:
--Kam Solusar (Diskussion) 18:33, 12. Mai 2012 (CEST)
Wer das einfacher machen kann, möge es bitte tun (gerne in der Testvorlage Vorlage:NormdatenTemp). Ich bin auch nicht sehr zufrieden mit dem Spaghetti-Code, der das gerade erledigt. Mir fehlen leider tiefere Kenntnisse zu div IDs und classes. --AndreasPraefcke (Diskussion) 18:42, 12. Mai 2012 (CEST)
Hilftexte erwünscht / Wartungskategorien
Wann soll überhaupt die Normdatenvorlage als Wartungskategorie eingebaut werden, wenn keine Normdaten vorhanden sind? Bei jedem, zu dem ein Werk in einem Namensdatensatz steht, auf jeden Fall. Bei jedem, der so heißt wie ein Namensdatensatz? Bei jedem färoischen Politiker und indonesischen Badmintonsportler, egal wie er heißt? Vielleicht "bei Autoren, Komponisten, Musikern, Wissenschaftlern und Herrschern"? Oder nur bei deutschsprachigen? Oder doch überall, wobei dann vielleicht GNDfehlt nicht bejaht werden sollte, sondern nur das Datum der letzten Suche? Schon bei Vorlage:PNDfehlt war die Verwendung sehr disparat, es gibt doch so einige Eintragungen mit wenig Aussicht darauf, dass da jemals ein bibliothekarischer oder Normdateneintrag irgendwo entstehen sollte, und schon gar nicht in der GND. --AndreasPraefcke (Diskussion) 20:07, 12. Mai 2012 (CEST)
Weitere Frage: Was ist mit den Normdaten, wo z. B. VIAF und LCCN vorhanden sind, nicht aber GND (und auch kein Namenseintrag). Brauchen die eine Wartungskategorie? --AndreasPraefcke (Diskussion) 20:11, 12. Mai 2012 (CEST)
- Ganz ehrlich: so 100%ig habe ich den Sinn der Vorlage "PNDfehlt" nie verstanden. Ich habe sie nur dann gesetzt, wenn ein zum verwechseln ähnlicher PND-Eintrag existierte (also z.B. "Meier, Hans *1952"), der aber eine andere Person betraf - sozusagen als Hinweis, dass da genauer geguckt werden muss. Wieso sonst alle Artikel damit ausgestattet sein müssen - keine Ahnung. --APPER\☺☹ 20:25, 12. Mai 2012 (CEST)
Das Problem, dass wir nicht in die Zukunft sehen können, werden wir nicht lösen können. Wie wollen wir festlegen, welche Person oder Personenkreis in Zukunft nicht relevant für die GND sein soll? Ich bin mit der Vorlage:PNDfehlt bislang auch sparsam umgegangen, aber jetzt, wo sie so galant in die Vorlage:Normdaten eingebaut ist, werde ich den Hinweis auf die fehlende GND häufiger verwenden. Langfristig könnte ich mir sogar vorstellen, dass die GND-Redaktion auch einen Wikipediaartikel als Grundlage für eine GND akzeptiert, schließlich verlinken die Bibliothekskataloge bereits hierher und auch in der Quellenangabe der Normdaten findet sich häufiger ein Verweis auf das Onlinelexikon. --Kolja21 (Diskussion) 20:47, 12. Mai 2012 (CEST)
- Ich habe PNDfehlt bisher nur benutzt, wenn schon ein Name-Eintrag zu der Person in der DNB war, nur eben nicht personalisiert. Also letztlich, wenn deutschsprachige Veröffentlichungen von der Person existieren. Mir stellt sich in dem Zusammenhang die Frage, was "die Leute von der GND" wollen, was ist deren Ziel? Sind sie überhaupt daran interessiert, für Personen Datensätze einzufügen, von/zu denen es keine deutschsprachige Literatur gibt? An anderer Stelle wurde von einem halbjährlichen Rückstand in Bezug auf die Abarbeitung der Fehlerkategorie geschrieben, da sollte man auch abwägen, ob man diese Zusammenarbeit nicht irgendwann überstrapaziert.--Berita (Diskussion) 21:00, 12. Mai 2012 (CEST)
Die GND kennt keine Relevanzkriterien. Alles und jedes was von einer der beteiligten Institutionen erfasst wird (und das ist nicht nur die DNB), bekommt einen Normdatensatz. Wenn sich eine Bibliothek also entschließt, Zeitschriften oder langfristig vielleicht sogar Zeitungen auszuwerten, bekommen, wie schon jetzt üblich, Personen und Sachbegriffe eine GND, die nicht in Wikipedia aufgenommen werden. Theoretisch sind unsere Lemmata daher nur eine Teilmenge der GND. --Kolja21 (Diskussion) 21:12, 12. Mai 2012 (CEST)
- Hier ein konkretes Beispiel: Ein Brief an Soma Morgenstern, geschrieben am 26. Juni 1973 und heute Teil seines Nachlasses (Deutsches Exilarchiv, Sign. EB 96/242-B.04.0004), reichte aus, dass die Verfasserin des Briefes einen Normdateneintrag erhielt. --Kolja21 (Diskussion) 21:38, 12. Mai 2012 (CEST)
- Schon klar, dass irgendein deutschsprachiges Schriftstück ausreicht. Aber was ist mit Personen, die nur fremdsprachig publizieren oder gar dem von Andreas erwähnten Badmintonspieler?--Berita (Diskussion) 22:00, 12. Mai 2012 (CEST)
- Gerade im Sportbereich gibt es wirklich viele nach unseren RK derzeit relevante Sportler, die nur in kaum beachteten Nischensportarten antreten. Dort gibt es vielfach außer Namen in Ergebnislisten und entsprechenden Daten in Online-Datenbanken so gut wie überhaupt keine schriftlichen Infos - also auch für die DNB auch so gut wie nichts, was man diesen Datensätzen zuordnen könnte. Hat es da viel Sinn, die DNB mit Anfragen zur Anlage von Normdatensätzen zu solchen Sportlern zu überhäufen, wenn es derzeit schon bei den bekannten Autoren, Filmschaffenden und Musikern noch immer Lücken gibt, denen man IMO Vorrang geben sollte? --Kam Solusar (Diskussion) 22:25, 12. Mai 2012 (CEST)
- Schon klar, dass irgendein deutschsprachiges Schriftstück ausreicht. Aber was ist mit Personen, die nur fremdsprachig publizieren oder gar dem von Andreas erwähnten Badmintonspieler?--Berita (Diskussion) 22:00, 12. Mai 2012 (CEST)
- @Berita: Wieso Schriftstück oder wieso deutschsprachig? Schon ein Foto in einem Nachlass kann ausreichen, um, aus welchen Gründen auch immer, den Archivar zu bewegen, den Namen der betreffenden Person zu notieren und ihn in die GND einzutragen. Da sich die GND, wie gesagt, nicht auf Bücher aus der DNB beschränkt, sondern auch Tondokumente und den Bestand anderen Bibliotheken und Institutionen umfasst, nimmt sie alles auf, was gesammelt werden kann oder Menschen interessiert. Auch für die Anzahl der beteiligten Institutionen gibt es keine festgelegte Obergrenze. Die DNB ist schon jetzt international stark vernetzt, und es ist durchaus möglich, dass sich in Zukunft auch Institutionen aus dem nicht-deutschsprachigen Ausland an der Normdatei beteiligen. --Kolja21 (Diskussion) 22:40, 12. Mai 2012 (CEST)
- @Kam: Solche Anfragen (Eintragung von Sportlern) gibt es nicht und hätten auch keinen Erfolg. Bislang ist nicht vorgesehen, Personen aus Wikipedia in die GND aufzunehmen, sondern der Weg läuft in der entgegengesetzen Richtung. Wir melden über WP:PND/F Fehler, wie falsche Zuordnungen, nicht individualisierte Datensätze oder Dubletten, die in der GND vorhanden sind. Wenn bislang kein Archivmaterial über Person x erschlossen ist, bekommt diese keine GND, egal wie relevant oder berühmt sie ist. --Kolja21 (Diskussion) 22:51, 12. Mai 2012 (CEST)
- Schon klar. Ich wollte damit ausdrücken, dass es bei solchen Personen IMO wenig Sinn hat, die Artikel noch explizit mit Wartungskategorien und Normdatenvorlagen-Parametern zu versehen, die auf eine nicht vorhandene GND-Nummer hinweisen. Ich finde solche Hinweise implizieren irgendwie, dass die fehlenden GND-Datensätze in diesen Fällen Mängel in der GND darstellen und dass wir danach auf die DNB warten müssen, bis die sich endlich darum kümmern. Solche GND-fehlt-Hinweise sollten also nur dann genutzt werden, wenn man realistisch davon ausgehen kann, dass in solche Datensätze in absehbarer Zukunft angelegt werden könnten. --Kam Solusar (Diskussion) 00:22, 14. Mai 2012 (CEST)
- @Kam: Solche Anfragen (Eintragung von Sportlern) gibt es nicht und hätten auch keinen Erfolg. Bislang ist nicht vorgesehen, Personen aus Wikipedia in die GND aufzunehmen, sondern der Weg läuft in der entgegengesetzen Richtung. Wir melden über WP:PND/F Fehler, wie falsche Zuordnungen, nicht individualisierte Datensätze oder Dubletten, die in der GND vorhanden sind. Wenn bislang kein Archivmaterial über Person x erschlossen ist, bekommt diese keine GND, egal wie relevant oder berühmt sie ist. --Kolja21 (Diskussion) 22:51, 12. Mai 2012 (CEST)
- Aber was ist realistisch? Dass sich der färoische Politiker sein Leben lang auf Lokalpolitik beschränken und nie ein Buch schreiben wird, und auch sonst nie auffallen? (Eine Festschrift zum 60. Geburtstag reicht schon aus.) Wir können nur schätzen und vermuten, aber Gewissheit haben wir erst, wenn wir in der GND nachgeschlagen haben. --Kolja21 (Diskussion) 00:37, 14. Mai 2012 (CEST)
- Bei Politikern würde ich dir da ja auch noch zustimmen. Die LoC hat z. B. schon viele Normdatensätze für Politiker kleiner afrikanischer Länder. Aber ich denke halt, dass wir bei Personenkreisen, die zu 99,x Prozent keine Normdatensätze haben, nicht überall schon auf Vorrat eine Wartungskategorie reinsetzen müssen. Das verstopft nur die Kategorie und führt zu einem gewissen Frust bei den Leuten, die die Artikel in dieser Kategorie durchgehen um neue Normdatensätze einzutragen. Wenn wir dann mitbekommen, dass man inzwischen angefangen hat, GND-Datensätze für z. B. taiwanesische Badmintonspieler anzulegen, kann man ja immer noch z. B. per Bot überall in diese Artikel die entsprechenden Parameter setzen. --Kam Solusar (Diskussion) 15:43, 15. Mai 2012 (CEST)
Und konkret zur Ausgangsfrage von Andreas: Die Wartungslisten können sich danach richten, welche Vorlagen a) den Parameter "GNDName" enthalten (= potentieller Kandidat für Eintrag in die Fehlerliste: WP:PND/F) oder b) bereits in einer anderen Normdatei erfasst sind (= gute Chancen auf Übernahme in die GND). Langfristig könnte ich mir auch eine Wartungsliste "Wikipedia:Noch nicht auf GND geprüft"e Artikel vorstellen. (Da es nur einen Erfahrungswert, aber keine Ausschlusskriterien gibt, welche Personen einen Eintrag in der GND haben, muss man theoretisch alle abfragen. Was zeigt, dass der GNDfehlt-Hinweis auch in den Fällen hilfreich ist, in denen man nicht erwartet, dass die betreffende Person eine GND hat, denn dass ist ja nur eine Vermutung, die bestenfalls in 98% der Fälle zutrifft.) --Kolja21 (Diskussion) 00:00, 14. Mai 2012 (CEST)
Irgendwie gehen hier zwei Fälle heftigst durcheinander:
- Neuanlage von Normsätzen durch unsere Meldungen ist ein sehr seltener Fall und passiert derzeit nur indirekt, nämlich
- wenn dadurch ein von uns nachgewiesener Fehler in der Normdatei korrigiert werden kann
- oder wenn in der DNB vorhandene Literatur dadurch von einem Tn auf einen bislang noch nicht vorhandenen Tp umverknüpft werden kann (und da sitzt das wirkliche Problem mit den Millionen aus DNB-Sicht "leerer" Tn-Sätze mit 15er, 16er, 17er und 19er-Nummern: Dazu werden keine Meldungen akzeptiert).
- Allerdings gibt es durchaus nichtbibliothekarische Organisationen und Projekte, die Daten in die Normdateien einbringen, z.B. die erwähnten Literaturarchive, oder Projekte zu Professorenkatalogen und Digitalisierung von Nachschlagewerken. Es wurde bereits angedeutet, dass es durchaus denkbar wäre, "die Wikipedia" als Normdaten-Teilnehmer zuzulassen, das beträfe dann in der Masse die eher simpel gestrickten Fälle "Person nachweislich gar nicht in der GND und kann autonom eingetragen werden, sofern genügend bequellbare Daten zur Person vorliegen" -- Thomas Berger (Diskussion) 01:21, 14. Mai 2012 (CEST)
@Andreas: Ich finde deine Liste Parameterhäufigkeit in de:WP sehr nützlich, da man mit ihr Tippfehler wie "IVAF" (statt VIAF) und "PDF" (statt PND) finden kann. Was hält du daher von einer Wartungskategorie Kategorie:Wikipedia:Normdaten-Parameter falsch eingetragen? Und damit man auf einen Blick sieht, auf welcher Baustelle etwas zu tun ist, würde ich, falls keine Einwände kommen, die Oberkategorie Kategorie:Wikipedia:Normdaten anlegen. --Kolja21 (Diskussion) 05:24, 14. Mai 2012 (CEST)
- Vorab: Das war nicht meine Liste, ich selbst kann so etwas auch nicht anlegen (und die Vorlage selber kann so etwas m. W. auch nicht erkennen). Ich wäre sehr für so eine Kategorie oder ein ähnliches Mittel. Praktikabler als eine Kategorie ist wohl eine immer mal wieder aktualisierte Liste solcher Artikel. Denn für so eine Kategorie müsste ja ein Bot die Kategorie einfügen, und dann ein Mensch die Fehler beseitigen. Das heißt: zwei Edits im Artikel. Eine Liste abarbeiten kann ein Mensch mit jeweils nur einem Edit im Artikel selbst. --AndreasPraefcke (Diskussion) 08:50, 14. Mai 2012 (CEST)
Die Liste "Normdaten-Parameter falsch eingetragen" müsste dann allerdings, wie die PND-Wartungslisten von APPER, die Artikel einzeln aufführen. Wer hat das technische Know-how? --Kolja21 (Diskussion) 14:59, 14. Mai 2012 (CEST)
- Ich werte sowieso in unregelmässigen Abständen die
PND-BEACON-Datei auf Dubletten und illegale Nummern aus und korrigiere dann die Artikel und ich kann auch in den etwa monatlichen Dumps "merkwürdige" Parameter ermitteln. Ich glaube nicht, dass da genug zusammenkommt, um das als "Wartungsliste" irgendwo hinzustellen (es schienen ein paar Dutzend Verschreiber in drei Jahren zustandegekommen zu sein?). Ich werde allerdings eine "Wartungsliste" zu den Artikeln erstellen, in denen GKD-V1 und GKD-V2 eingetragen ist, weil die ja als eigene Normdaten-Vorlage in vermutlich oft erst noch anzulegende Weiterleitungssätze aufgenommen werden sollen. Ich würde damit allerdings warten wollen, bis die Körperschaften-Zusammenführung in der GND abgeschlossen ist und dann kann auch evtl. der Bot, der die GKD- und SWD-Parameter in "GND" umwandelt, die Liste ausspucken. -- Thomas Berger (Diskussion) 15:23, 14. Mai 2012 (CEST)
Kurier
Ich habe jetzt einen Artikel im Wikipedia:Kurier zu den Neuerungen "publiziert". --AndreasPraefcke (Diskussion) 11:32, 16. Mai 2012 (CEST)
- Ein gelungener Abschluss für die Arbeit (Phase 1: Einführung der GND). Wenn die Ausgabe des Kuriers nicht mehr aktuell ist, können wir die Grafik für den Artikel Gemeinsame Normdatei gut gebrauchen. Ich lade demnächst noch die Screenshots von Web NDL Authorities und VIAF hoch. --Kolja21 (Diskussion) 15:03, 16. Mai 2012 (CEST)
PICA-Link
Momentan ist der beim Parameter PND vorhanden, aber beim Parameter GND nicht. Als Begründung, den wegzulassen, konnte ich hier nur finden, dass bei http://dispatch.opac.d-nb.de oben drüber „Dieser Katalog wird nicht mehr weiterentwickelt.“ steht, aber das ist ja offenbar ein rein ästhetisches Problem; die Datensätze dort sind aktuell wie eh und je. Könnte man also den Link (oder einen äquivalenten, der direkt zu den Rohdaten führt) bitte auch bei GND wieder einbauen? — PDD — 16:49, 16. Mai 2012 (CEST)
- War m.E. eigentlich auch so beabsichtigt, zumindest aber auch von APPER so gewünscht worden. Könnte bei der Gelegenheit das kryptische "PICA" auf "Rohdaten" abgeändert werden, oder ist das zu raumgreifend breit? -- Thomas Berger (Diskussion) 18:30, 16. Mai 2012 (CEST)
- Es wird ohnehin nur für die angezeigt, die Metadaten angeschaltet haben. Da ist das raumgreifende eigentlich egal. --AndreasPraefcke (Diskussion) 21:19, 16. Mai 2012 (CEST)
- Hallo PDD, wenn ich die von dir verlinkte Seite anklicke, erhalte ich die fett und in rot gedruckte Meldung: "Diese Variante des DMA-Kataloges steht nicht mehr zur Verfügung. Für die Recherche in den Beständen und Normdaten des Deutschen Musikarchivs nutzen Sie bitte das Web-Portal der Deutschen Nationalbibliothek". Dieses "rein ästhetische" ;) Problem führte unter anderem dazu, dass die mittlerweile gelöschte "Vorlage:DM" nicht mehr funktioniert hat, da der alte OPAC Probleme mit den Redirects hat. Auch bei Datensätzen, mit denen keine Literatur verknüpft ist, erhalte ich öfters Fehlermeldungen. Ich finde, man sollte weder zu dem veralteten OPAC, den die DNB ja "vom Netz" nehmen will, verlinken, noch einen Sammelbegriff wie "Rohdaten" zu verwenden, da es die unterschiedlichsten Formate wie PICA+, PICA3 und MARC gibt. Wer entsprechende Daten sucht, wird auf die bekannte Weise (Klick unter das Personenicon) im OGND fündig. Gruß --Kolja21 (Diskussion) 22:56, 16. Mai 2012 (CEST)
- Aha, dann suche ich also die Person einfach nochmal im OGND (weil, der ist ja in den Normdaten nicht verlinkt) und wähle die richtige Person aus und klicke dann nochmal aufs unsichtbare Icon und schon kriege ich genau das, was ich vorher mit einem Klick in der Normdatenvorlage bekommen habe? Das ist tatsächlich ungeheuer praktisch :-) — PDD — 23:13, 16. Mai 2012 (CEST)
- Für Personen funktioniert der PICA-Link weiterhin (die rote Meldung kommt nur beim Aufruf der Basis-URL, nicht bei konkreten Aufrufen wie [4]). Allerdings beruht dieser Aufruf auf der internen Identnummer im ILTIS-System der DNB, die ist nur bei Personen und bei seit der GND-Einführung neu erezeugten Datensätzen identisch mit dem Normdaten-Identifier. Die Regensburger Verbundklassifikation muss man z.B. mit der Nummer 950181226 zur Anzeige bringen, wir kennen aber nur die offizielle Nummer 4449787-8. Da der fragliche PICA-Katalog der alte Katalog des DMA zu sein behauptet, sind Schlagworte dort konsequenterweise noch nicht einmal recherchierbar, der einzige mir bekannte Weg zum Feststellen der internen Nummer erfordert Registrierung und besteht darin, den Datensatz in MARC-Format über den Datenshop herunterzuladen (oder die SRU-Schnittstelle zu benutzen, die erfordert allerdings ebenfalls Registrierung).
- Das soeben gesagte gilt in abgewandelter Form für den OGND-Katalog, da dort zwar eine Recherche nach echten Normdaten-Nummern prinzipiell möglich ist (die internen Nummern des "Zitierlinks" sind die des SWB und daher nirgendwo identisch mit den offiziellen Normdatennummern) und wir auch direkt eine Rohdaten-Anzeige zu 11875856X erzwingen können. Allerdings müssen wir der GND-Nummer vorher ansehen, ob sie Ex-PND, Ex-GKD, Ex-SWD ist, denn 4449787-8 benötigt derzeit Recherche über einen anderen Index! -- Thomas Berger (Diskussion) 00:20, 17. Mai 2012 (CEST)
- Ich würde daraus das Fazit ziehen, dass (da, um die gewohnte Funktionalität zu erzeugen, der PICA-Link sowieso nur bei TYP=p angezeigt werden soll und es dabei völlig gehupft wie gesprungen ist, ob das dann auf das alte oder das neue verlinkt) der PICA-bzw.-Rohdaten-Link jetzt also wieder eingefügt werden kann? — PDD — 00:40, 17. Mai 2012 (CEST)
Sollte man die PICA/OGND etc.-Anzeigemöglichkeiten vielleicht lieber in die Wikipedia-Personensuche aufnehmen als in die Normdatenleiste? Oder nochmal anders gedacht: wieso zeigt die DNB eigentlich keine Rohdaten mehr an, oder wenigstens einen Link darauf? Einer dieser hirnrissigen "unsichtbaren" Links wie im alten OPAC würde es für unsere Zwecke ja auch schon tun. Das DNB-Portal ist in dieser Hinsicht einfach nicht vollständig. --AndreasPraefcke (Diskussion) 08:51, 17. Mai 2012 (CEST)
- Ich würde das so sehen: Sobald entweder DNB-Portal oder Toolserver-Personensuche aus der normalen Anzeige heraus mit einem Extra-Klick vollständige Rohdaten (möglichst sogar in einem vernünftigerem Format als das derzeitige PICA+-Internformat) zeigen, können wir auf den PICA-Link in der Normdatenleiste verzichten. -- Thomas Berger (Diskussion) 11:44, 17. Mai 2012 (CEST)
"Universelle" OGND-Suchanfrage für die direkte Rohdatenanzeige "PICA" aller Normdatentypen: http://swb2.bsz-bw.de/DB=2.104/CMD?ACT=SRCHM&ACT0=SRCH&IKT0=2011&TRM0={ID}&ACT1=%2B&IKT1=2012&TRM1={ID}&ACT2=%2B&IKT2=2013&TRM2={ID}&PRS=PP
- Frage zum OGND-Katalog: Sind das immer aktuelle Daten oder entsprechen die den GND-Lieferungen alle paar Monate? Beim DNB-Katalog (PICA) sind die Daten ja praktisch tagesaktuell... --APPER\☺☹ 13:35, 17. Mai 2012 (CEST)
- Der Katalog scheint eine "Auskopplung" aus der SWB-Verbunddatenbank, die wiederum per OAI-Schnittstelle die Änderungen in der GND eigentlich ~zeitnah~ nachverfolgen sollte. Konkret ist allerdings der heute gegen 10:00 angelegte 2118855-5 noch nicht sichtbar, die Vorgängerkörperschaft 2008801-2 in der OGND hat einen Link auf ihren Nachfolger, der führt aber ins Leere... -- Thomas Berger (Diskussion) 13:58, 17. Mai 2012 (CEST)
- Finde gerade den Link nicht, hatte aber gelesen, dass der OGND im 5-Minuten-Takt aktualisiert wird. Tagesaktuell sollte er auf jeden Fall sein (und kein Vergleich mit VIAF, wo bestenfalls 1x pro Monat neue Daten eingespielt werden). --Kolja21 (Diskussion) 15:21, 17. Mai 2012 (CEST)
- Vermutlich wird die SWB-Verbunddatenbank so häufig aktualisiert. VIAF bezieht GND-Daten auch recht aktuell (täglich, m.W. per OAI), nur die völlige Neuberechnung aller Cluster ist ca. einmal im Monat. -- Thomas Berger (Diskussion) 15:59, 17. Mai 2012 (CEST)
- VIAF: Es werden ein paar Buchtitel drangehängt, aber auf Neueinträge muss man mehrere Wochen warten. So die offizielle Auskunft eines VIAF-Mitarbeiters. (Aktuell habe ich zwei, drei Änderungen in der GND von Anfang April notiert, die bislang immer noch nicht in VIAF angezeigt werden.) Gruß --Kolja21 (Diskussion) 21:15, 17. Mai 2012 (CEST)
NDL-Api (2)
Ich brauche da nochmal Hilfe. SPARQL habe ich jetzt soweit verstanden, dass ich Abfragen konstruieren kann, die den Namen sowohl im eigentlichen Namensfeld, als auch in der Umschrift suchen (d. h. sowohl für Albert Einstein als auch für Yoshihiko Noda funktioniert). Inzwischen bin ich bei folgender Abfrage:
PREFIX rda: <http://RDVocab.info/ElementsGr2/> PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX xl: <http://www.w3.org/2008/05/skos-xl#> PREFIX ndl: <http://ndl.go.jp/dcndl/terms/> SELECT ?uri1 ?name ?birth ?death WHERE { ?uri1 foaf:primaryTopic ?uri2 . {?uri2 foaf:name ?name} UNION {?uri1 xl:prefLabel [ndl:transcription ?name;] . FILTER langMatches( lang(?name), "ja-Latn")} . FILTER regex(?name, "Albert") #oder Yoshihiko FILTER regex(?name, "Einstein") #oder Noda OPTIONAL { ?uri2 rda:dateOfBirth ?birth. } OPTIONAL { ?uri2 rda:dateOfDeath ?death. } }
Das Problem ist, dass die elend langsam ist. Hat jemand eine Idee, wie das effizienter geht? --Schnark 10:28, 19. Mai 2012 (CEST)
- Da du die Infos aus den Personendaten nimmst, wäre es da nicht performanter und vor allem treffsicherer die dort im Feld Alternativnamen hinterlegte japanische Schreibung zu verwenden? Die Transkription von uns und bei denen ist nicht immer identisch, z.B. bzgl. der Verwendung des Makrons als auch von der Person verwendete Spezialtranskriptionen, die so nicht in der NDL geführt werden. Unter Verwendung der japanischen Originalschreibung habe ich bisher aber stets Treffer bekommen. Das Format im Feld Alternativnamen ist auch immer dasselbe: eine beliebige Anzahl von Zeichen aus dem Unicodebereich [U+0020, U+3000 bis U+9FFF] und die zum Lemma passende Originalschreibung steht üblicherweise zuerst. Von daher sollte sich das leicht über ein Regex erfassen lassen, Whitespace (üblicherweise U+0020 und U+3000) entfernen und so der Abfrage übergeben lassen können. Dann braucht der NDL-Server auch nicht das kostenintensive UNION durchführen und evtl. könnten dann auch die SPARQL-Regexe entfallen. --Mps (Diskussion) 12:32, 19. Mai 2012 (CEST)
- Kann bitte jemand, der sich mit der NDL auskennt, Alfons Mumm von Schwarzenstein seine NDL verlinken? Ein Werk ist als Digitalisat der Tōyō Bunko in seinem Artikel verlinkt, er müsste also eine eigene Nummer haben.--Kresspahl (Diskussion) 10:22, 18. Jun. 2012 (CEST)
- Der scheint keine eigene Nummer zu haben. Das digitalisierte Werk ist zudem auch auf Deutsch und bis jetzt sind mir bei den NDL Authorities nur Autoren untergekommen die in Japan veröffentlicht wurden. --Mps、かみまみたDisk. 13:24, 18. Jun. 2012 (CEST)
- Kann bitte jemand, der sich mit der NDL auskennt, Alfons Mumm von Schwarzenstein seine NDL verlinken? Ein Werk ist als Digitalisat der Tōyō Bunko in seinem Artikel verlinkt, er müsste also eine eigene Nummer haben.--Kresspahl (Diskussion) 10:22, 18. Jun. 2012 (CEST)
Dublettenbereinigung
Die Technische Universität Berlin kommt in der GND zweimal vor: 2114678-0 und 4005079-8. Ich bin etwas ratlos, was in solchen Fällen passieren soll.
- Beide Nummern aufnehmen? Allerdings wird dann nur die zuletzt aufgeführte ausgegeben.
- Bei Wikipedia:PND/Fehlermeldung hinzufügen? Gilt dort die Beschränkung auf Personendaten eigentlich noch? Andererseits sind schon jetzt so viele Fehlermeldung aufgelaufen, die auf Bearbeitung warten ...
- Abwarten, Tee trinken und hoffen, dass irgendwann (gibt es hierfür eigentlich einen konkreten Termin) im großen Stil Dubletten bereinigt werden?
--Monsieur Becker (Diskussion) 23:27, 19. Mai 2012 (CEST)
Abwarten, Tee trinken und auf die angekündigte baldige große Dublettenbereinigung warten. Momentan ist die GND leider unbrauchbar für Nichtpersonen. Wie immer bei der DNB wird erstmal großflächig Müll auf die Benutzer geschüttet und dann irgendwann mal mit dem Putzen angefangen. --AndreasPraefcke (Diskussion) 00:02, 20. Mai 2012 (CEST)
- Holla Monsieur, sehe ich ähnlich, auch wenn nicht so drastisch. Die Chancen stehen gut, dass die SWD- / GKD-Dubletten noch in diesem Jahr zusammengeführt werden. In den betreffenden Fällen lasse ich die veralteten Vorlagen SWD und GKD stehen oder wähle eine der beiden Nrn. aus und vermerke die Dublette in den Anmerkungen (Parameter "REMARK"). Gruß --Kolja21 (Diskussion) 00:07, 20. Mai 2012 (CEST)
- Ja, war schon drastisch ausgedrückt. Aber wenn man eine "Normdatei" auf die Menschheit loslässt, sollte die halt auch etwas normieren, und nicht für jeden Pups fünf verschiedene Nummern anbieten. Wenigstens die 16 Bundesländer und die 100 größten deutsche Städte hätte man ja z. B. mal in ein, zwei Stunden mit Hand zusammenfassen können, bevor man großartig die GND mit "Geografika" einführt. --AndreasPraefcke (Diskussion) 00:24, 20. Mai 2012 (CEST)
- Was mich mehr stört ist, dass aus den Daten nicht mal hervorgeht, welche regionale GND-Redaktion die entsprechende Dublette angelegt hat. Habe aus Neugierde vor ein paar Tagen dem hbz-Verbundkatalog eine doppelten Eintrag gemeldet und erhielt am nächsten Morgen die positive Rückmeldung: "Der dublette Personennamensatz ist zur Bereinigung vorgemerkt, die Bearbeitung kann jedoch erst im Juni erfolgen." Wenn ich an die "Vielfalt" (um es freundlich auszudrücken) denke, die sich bei uns in Sachen GND-/PND-/DMA-/SWD-/GKD-Vorlagen im Laufe der Jahre entwickelt hat, sind vermutlich auch nicht alle Wiki-Autoren auf Anhieb von unserer Arbeit angetan ;) Fröhliches Schaffen --Kolja21 (Diskussion) 00:44, 20. Mai 2012 (CEST)
Wozu die Aufregung? Das Schlagwort ist seit mindestens Juli 1988 in der SWD, der Körperschaftssatz seit Dezember 1990 in der GKD (viel früher wäre das auch kaum möglich gewesen, denn da war es die "Technische Universität <Berlin, West>"). [Man sieht sehr schön, dass hier die GKD zwei Entitäten kannte, und die SWD nur eine: Da muss dann nachträglich dort differenziert oder hier zusammengefasst werden, so genau kenne ich die Regeln nicht, so richtig automatisch wird es in diesem Fall jedenfalls nicht gehen können]. Bibliothekare haben jedenfalls lange geglaubt, dass sie mit der strikten Trennung der beiden Sphären der Formal- und Sacherschliessung mehr Probleme lösen können als sie sich durch die Dopplung von Datensätzen zur (tendenziell) gleichen "Entität" einfangen. Jetzt sind endlich die diversen Normdateien vereinigt und man hatte bei der Vorbereitung beschlossen, den komplexen Umstellungsprozess (da hingen ja auch noch die "Spiegel" der Normdateien in den bibliothekarischen Regionalverbünden und wiederum deren Sattelliten-Datenbanken in den teilnehmenden Bibliotheken dran) nicht auch noch mit einer gleichzeitigen Zusammenfassung zigtausender Datensätze zu überfrachten, sondern dies "live" ab etwa Juni zu tun, wenn die Regionalverbünde die Umstellung vom April fertig verdaut haben werden und wieder zu einem annähernden Normalbetrieb zurückgekehrt sind. -- Thomas Berger (Diskussion) 02:16, 20. Mai 2012 (CEST)
Vielen Dank für die Rückmeldungen, ich werde dann erstmal vom weiteren (sporadischen) Einpflegen von GND-Daten absehen, um doppelte Arbeit zu vermeiden. Grüße --Monsieur Becker (Diskussion) 08:34, 20. Mai 2012 (CEST)
- Hallo. Ich sehe das anders: Wenn du Lust drauf hast, GNDs einzupflegen oder sowieso darüber stolperst: pack sie ruhig in die Artikel (also eine der GNDs). Werden später zwei GNDs zusammengelegt, gibt es immer eine Weiterleitung - und das lässt sich automatisiert prüfen. Aus GND 1 GND 2 zu machen, nachdem sie auf einer Wartungsliste aufgetaucht ist, macht ja weit weniger Arbeit als überhaupt erstmal eine GND zu recherchieren - im Zweifelsfall kann das (wenn es zuviel wird) sogar automatisiert gemacht werden (wobei ein kurzes Raufschauen natürlich nie schadet). Also: füge ruhig GNDs ein. --APPER\☺☹ 14:54, 20. Mai 2012 (CEST)
Unpassende / kollidierende Typen
Ich wollte gerade mal schauen, zu welchen Nicht-Personen-Artikeln man denn direkt noch passende LCCN- und VIAF-Datensätze finden könnte. Bin dabei über die Georg-von-Neumayer-Station (eine Forschungsstation in der Antarktis) gestolpert. Passende VIAF-ID und LCCN existieren und weisen es als geographisches Objekt aus. In der DNB dagegen existieren zwei Datensätze ([5], [6]), aber beide (IMO nicht ganz korrekt) als Organisation. Was macht man am Besten in solchen Fällen? --Kam Solusar (Diskussion) 21:36, 20. Mai 2012 (CEST)
- Bei der Typ-Angabe orientieren wir uns an den DNB. Was die Dubletten betrifft, so stammt der eine Datensatz aus der SWD-, der andere aus der alten GKD-Normdatei. Wähle eine Nr. aus, ab Juni werden die Dubletten sukzessive von der DNB zusammengeführt. Gruß --Kolja21 (Diskussion) 21:55, 20. Mai 2012 (CEST)
- Mit den Dubletten hab ich kein Problem, halte mich mit der Eintragung derzeit aber ein bißchen zurück bis dann mal die Dubletten-Bereinigung erfolgt ist. Die unterschiedlichen Typen finde ich aber schon etwas problematisch. Sollten wir z. B. mal dazu kommen, auch zu anderen Typen als nur Personen eigene Tools und Link-Sammlungen wie die Personensuche anbieten zu können, sollten wir sehr bemüht sein, eine möglichst konsistente und fehlerfreie Datengrundlage zu haben. In diesem Fall frage ich mich schon, warum hier ein großer Container am Ende der Welt in der GND als Organisation klassifiziert ist und nicht eher als geografisches Objekt. Auch Expeditionen finden sich z. B. derzeit in der GND bunt verteilt auf Organisationen, Sachbegriffe (Historisches Einzelereignis) und Veranstaltungen. Nach den Renovierungsarbeiten infolge der Zusammenlegung mag das vielleicht dann anders aussehen, es wäre aber nicht schlecht, wenn es in solchen Fällen die Möglichkeit gäbe, direkt eine Korrekturanfrage zu stellen wie es etwa bei Personendatensätzen möglich ist. --Kam Solusar (Diskussion) 06:10, 22. Mai 2012 (CEST)
- Hi Kam, das Problem sehe ich eher auf unserer Seite. Ich wollte z.B. vorhin dem Euratom-Vertrag eine Werk-GND spendieren, landete dann aber per Weiterleitung auf der Organisation Europäische Atomgemeinschaft. Mal sehen, wie sich das weiter entwickelt. Bislang haben wir uns ja fast ausschließlich auf Personen beschränkt, und das wird vorerst auch der Schwerpunkt für die Normdaten bleiben. Gruß --Kolja21 (Diskussion) 07:35, 22. Mai 2012 (CEST)
- Ja mal schauen. Es scheint ja beispielsweise bei vielen geografischen Dingen die Möglichkeit zu geben, sie sowohl als Geografikum als auch als Körperschaft zu sehen (Städte, Kreise, Länder, etc..). Oder bei Flughafen vs Flughafenbetreibergesellschaft, Nationalpark vs Nationalparkbetreiber, etc. Da müssen wir mal schauen, wie wir so etwas am besten handhaben. Wahrscheinlich wirds nicht in allen Fällen einfach per Weiterleitung klappen. --Kam Solusar (Diskussion) 06:13, 25. Mai 2012 (CEST)
Motivation erläutern
Bei Wikipedia Diskussion:Kurier gibt es wie schon manchmal zuvor die Frage, warum die Normdaten für alle angezeigt werden und was das überhaupt ist. Ich würde ja gerne auf Normdatei verweisen, aber der Artikel ist einigermaßen unverständlich und zeigt m. E. nicht, wozu Normdaten außerhalb eines einzelnen Bibliothekskatalogs überhaupt gut sein sollen. Auch WP:Normdaten zeigt die Ziele der Normdatenverknüpfung nicht recht auf. Da wäre einiges zu ergänzen. --AndreasPraefcke (Diskussion) 09:10, 21. Mai 2012 (CEST)
Hinweis zu Wikisource
Ich habe bei Wikisource die Anzeige der PND in den Personen- und ADB-Artikeln durch GND ersetzt (nicht jedoch den Parameternamen, das wäre dann doch ein bisschen zuviel des Guten, kann m. E. so bleiben). Und auch s:Vorlage:Ortsdaten sowie s:Vorlage:Textdaten, s:Vorlage:Themendaten und s:Vorlage:Verlag kennen jetzt Normdaten (Parameter GND). Die Ortsdaten werde ich großflächig eintragen, sobald die DNB sich der Dubletten in diesem Bereich entledigt hat. Wer sonst noch in anderen Schwesterprojekten unterwegs ist, kann sich ja vielleicht auch einmal Gedanken machen, was da geändert werden muss und das in die Wege leiten. --AndreasPraefcke (Diskussion) 09:14, 21. Mai 2012 (CEST)
- Gute Idee. An Wikisource hatte ich noch gar nicht gedacht. Du kennst die Übersicht schon, aber für andere, die hier vielleicht mitlesen, eine Übersicht über die von der GND betroffenen Vorlagen findet sich unter Hilfe:GND#Vorlagen. (Ich habe versucht, alle Interwikilinks zu erfassen; häufig wurden die Vorlagen ohne Dokumentation und ohne Link auf die Ursprungsfassung in andere Sprachversionen reinkopiert.) Da gibt es noch Einiges abzuarbeiten. --Kolja21 (Diskussion) 01:42, 22. Mai 2012 (CEST)
- Jetzt übrigens auch s:BLKÖ, und Apper hat dankenswerterweise auch schon eine automatische BEACON-Datei dazu eingerichtet. --AndreasPraefcke (Diskussion) 00:09, 27. Mai 2012 (CEST)
Stand Auflösung der Vorlage:PND
Derzeit ist die Vorlage:PND noch in 1272 Artikel eingebunden (CatScan V2.0β: [7]), dabei sind alle in der Kategorie:Mann und es gibt weder die Normdaten- noch die PND-Vorlage und alle Vorlagennutzungen sind in der Form mit nur einem Parameter, also {{PND|123456789}}, allerdings gibt es ein paar Artikel mit mehreren PND-Einbindungen oder mit zusätzlichen HTML-Kommentaren.
Bei manueller Abarbeitung (der mehrparametrigen Einbindungen) gestern hat es sich für mich am günstigsten herausgestellt, die Normdaten-Vorlage "frisch" auszufüllen, dabei die PND-Vorlage heranzuziehen, wenn ich nichts fand, und anschließend die PND-Vorlage in DNB-Portal umzuwandeln oder zu löschen (allerdings steht bei diesen älteren Sätzen die Vorlageneinbindung nicht immer bei == Weblinks ==). Das ist aber ein recht zeitaufwendiges Verfahren, weil dabei auch einige Meldungen unter WP:PND/F anfallen. Eine Umwandlung ausgehend von der derzeitgen Nutzung müsste aber wenigstens ermitteln, ob es auch wirklich ein individualisierter Satz ist, der da eingetragen ist und ob es unter der Nummer auch wirklich (noch) Treffer im DNB-Portal gibt.
Es gibt allerdings eine ähnlich große Anzahl (723) von Personenartikeln mit Vorlage:DNB-Portal ohne Vorlage:Normdaten, die eigentlich denselben Wartungsbedarf wie die verbliebenen Vorlage:PND-Fälle haben (zumindest wenn nicht auch noch die Vorlage:PNDfehlt belegt ist und darauf hindeutet, dass es sich um einen Tn-Satz handelt). Ein Bot könnte daher auch jetzt die triviale Umsetzung Vorlage:PND -> Vorlage:DNB-Portal veranstalten und die Normdaten werden irgendwann ergänzt. -- Thomas Berger (Diskussion) 09:16, 22. Mai 2012 (CEST)
- Hallo Thomas, wieso nennt "Jarry1250's Toolserver Tools" 400 Treffer mehr? ("1657 Vorlageneinbindungen wurden ermittelt".) Jede gut geplante Bot-Unterstützung ist mir recht. Wir haben ja auch noch die 16.500 Mal eingebundene Vorlage:PNDfehlt. Genug Arbeit für mehr als ein Jahr. Gruß --Kolja21 (Diskussion) 19:03, 22. Mai 2012 (CEST)
- Die 400 zusätzlichen Treffer sind in Diskussionen und im Benutzernamensraum. --AndreasPraefcke (Diskussion) 08:18, 23. Mai 2012 (CEST)
- Ja, ein Bot könnte jetzt (nach der umfangreichen Abarbeitung aller komplizierteren Fälle) die triviale Umsetzung -> DNB-Portal (im Artikelnamensraum) jetzt machen, dann könnten wir die Vorlage endlich löschen. Die dann ca. 2000 Artikel mit DNB-Portal ohne Normdaten-Vorlage müssten wir allerdings so oder so verstärkt in Angriff nehmen, da ist der Bot-Edit jetzt nicht so die große Hilfe "zur Verbesserung unserer Enzyklopädie". Über CatScan komme ich übrigens nicht an "alle mit DNB-Portal und ohne Normdaten" heran, scheint ihn zu überfordern (hängt sich auf), da wäre eine numerierte Liste eine willkommene Arbeitshilfe (am besten mit 50er-Abschnitten, die sich Mitarbeiter reservieren können und dann abhaken). --AndreasPraefcke (Diskussion) 10:01, 23. Mai 2012 (CEST)
- Klarer Fall für Benutzer:APPER/Wartungslisten ;) --Kolja21 (Diskussion) 13:07, 23. Mai 2012 (CEST)
Ich habe den Toolserver überlistet oder die Tageszeit war günstig, jedenfalls sind die Seiten (zu DNB-Portal und PND) nun einmal zusammengefasst als portionierte Liste Benutzer:Gymel/NDmiss abgespeichert. Da das Abarbeiten gewiss länger dauert, darf der Botlauf durchaus stattfinden, sofern er stur PND in DNB-Portal abändert, bleibt diese Liste gleich gültig. -- Thomas Berger (Diskussion) 15:53, 23. Mai 2012 (CEST)
- Danke für die Liste. Kann der Bot eventuell auch fremdsprachliche Versionen der Wikipedia mit einbeziehen? Dort ist die Arbeit sogar noch wichtiger, da die Vorlagen oft nicht dokumentiert sind. Wenn demnächst der Link zu der deutschsprachigen Vorlage gelöscht wird, weiß man also nicht mehr, wozu sie überhaupt angelegt wurden. --Kolja21 (Diskussion) 13:52, 24. Mai 2012 (CEST)
Ich habe die verbliebenen PND-Einbindungen im Artikelnamensraum jetzt alle durch DNB-Portal ersetzt. Meinetwegen kann man Vorlage:PND löschen, oder noch eine Weile stehen lassen. --AndreasPraefcke (Diskussion) 20:44, 25. Mai 2012 (CEST)
- Wow, das ging schnell. Danke! Deinen Hinweistext finde ich hilfreich. Da die Vorlage über 500 Mal auf Benutzer- und Diskussionsseiten verlinkt ist und auch noch zahlreiche Interwikilinks abgearbeitet werden müssen, finde ich es gut, wenn sie vorerst in der vorliegenden Fassung erhalten bleibt. Gruß --Kolja21 (Diskussion) 22:48, 25. Mai 2012 (CEST)
Einbinden "roter" Kategorien
Bin mir grad unsicher, auf welcher Diskussionsseite ich das posten soll, aber ich nehme an, hier ist's passend und das hat sowieso jeder auf dem Schirm. Ich habe in Christoph Hartung von Hartungen (1849–1917) mit Schnarks Skript die "neue" Vorlage gesetzt und seither wird die noch rote Kategorie:Wikipedia:GND fehlt 2011-12 eingebunden. Soll das wirklich so? Und ist der Zeitraum "2011-12" sinnvoll gewählt? --Mai-Sachme (Diskussion) 20:35, 23. Mai 2012 (CEST)
- Das "12" meint Dezember: Das Skript hat das Prüfdatum "22. Dezember 2011" aus der PNDfehlt-Vorlage genommen und in den Parameter GNDCheck=2011-12-22 der Normdaten-Vorlage umgewandelt, da es nicht entscheiden mag, ob Du bei Deinem Edit die Situation in der GND erneut übeprüft hast. Das vom Skript eingeblendete Menue hat unten einen Link "Datum aktualisieren", der müsste angeklickt werden, um eine erneute Prüfung zu dokumentieren. Ich vergesse das auch immer, evtl. wäre ein aktiv zu setzendes Häkchen in räumlicher Nähe zum Eingabefeld für GNDName eine bessere Variante? -- Thomas Berger (Diskussion) 21:32, 23. Mai 2012 (CEST)
- Ah danke, das hatte ich übersehen. Primär hatte ich mich allerdings für die eingeblendete Wartungskategorie interessiert, die nun nach der Aktualisierung verschwunden ist. --Mai-Sachme (Diskussion) 21:54, 23. Mai 2012 (CEST)
- Wg. GNDCheck=2012-05-23 ist er per Vorlagen-Funktionalität jetzt bei GND fehlt 2012-05 gelistet (ich weiss gar nicht, ob man die Vorlage so programmieren könnte, dass nur bereits angelegte Wartungskategorien beschickt werden, ich hielte das aber auch gar nicht für sinnvoll). Dass da nach etwas über einer Woche schon 2.000 Artikel auf Wartung warten, ist hoffentlich nur ein Ausreisser für diesen speziellen Umstellungsmonat: GNDCheck entspricht ja in etwa der alten Vorlage:PNDfehlt, und die hatte es in etwa auf 2.000 Belegungen pro Jahr gebracht... -- Thomas Berger (Diskussion) 22:10, 23. Mai 2012 (CEST)
- Das ist kein Ausreißer. Unter "GND fehlt" werden zzt. sogar Artikel mit individualisierter GND erfasst, wenn eine Dublette vermerkt ist. Ich denke, man sollte eine Kat "GND Wartung" schaffen und diese dann entsprechend untergliedern. Vorschläge dazu unter Kategorie Diskussion:Wikipedia:GND fehlt. Gruß --Kolja21 (Diskussion) 01:55, 24. Mai 2012 (CEST)
- Inzwischen kann mein Skript das Datum auf Wunsch aktualisieren, dazu befindet sich ein Link in der Fußzeile.
- Es ist auch möglich, die Vorlage so zu programmieren, dass sie auf das Vorhandensein der Kategorie achtet, ich habe das mal in Vorlage:NormdatenTemp eingebaut, bei Bedarf kann das in die richtige Vorlage übernommen, ansonsten revertiert werden. Falls die Kategorie fehlt, wird stattdessen eine Ersatzkategorie (die man noch anlegen müsste) befüllt. --Schnark 09:31, 24. Mai 2012 (CEST)
- Kl. Anm.: Warum benutzt du nicht den Link "Test-/Beispielseite erstellen"? Dann erreicht man mehr Leser/Tester. Gruß --Kolja21 (Diskussion) 13:48, 24. Mai 2012 (CEST)
- Ah danke, das hatte ich übersehen. Primär hatte ich mich allerdings für die eingeblendete Wartungskategorie interessiert, die nun nach der Aktualisierung verschwunden ist. --Mai-Sachme (Diskussion) 21:54, 23. Mai 2012 (CEST)
PPNs einbinden?
Hallo, mit {{LBMV PPN}} und {{HessBib PPN}} gibt es noch zwei Vorlagen zu Landes-bibliographischen Normdateien. Können/sollen die irgendwie in die Normdaten integriert werden? --emha d|b 13:50, 29. Mai 2012 (CEST)
- Danke für den Hinweis. Ich habe die Kategorie:Vorlage:Datenbanklink Normdaten erstellt, damit diese selten genutzten Vorlagen nicht übersehen und demnächst aktualisiert (PND durch GND ersetzen) werden. --Kolja21 (Diskussion) 14:33, 29. Mai 2012 (CEST)
In beiden Fällen handelt es sich um lokale PPNs (Pica Production Numbers) des jeweiligen Katalogisierungssystems, nicht um PND- oder GND-Nummern. -- Thomas Berger (Diskussion) 17:18, 29. Mai 2012 (CEST)
- Stimmt, aber auf den Dokumentationsseiten zu den lokalen Normdaten wird Bezug auf die PND genommen, daher müssten sie überarbeitet werden. Es gibt übrigens auch noch eine {{LBMV SWW}}, die sogar auf Englisch und Arabisch vorliegt. --Kolja21 (Diskussion) 17:50, 29. Mai 2012 (CEST)
Als Nichtbibliothekar muss ich mal doof fragen, ob die Landesbibliotheken für Personen und Schlagwörter nicht auch die GND verwenden? --Monsieur Becker (Diskussion) 19:42, 29. Mai 2012 (CEST)
- Das sind Landesbibliographien: Da geht es dann zum Teil auch um Bücher und v.a. Aufsätze, die nicht "im Besitz" einer konkreten Bibliothek sind. Traditionell sind das eigene Abteilungen mit eigenen Mitarbeitern und präsentiert wird das in einem eigenen Katalog. Technisch ist das allerdings überall seit vielen Jahren in die allgemeinen Verbunddatenbanken integriert und daher stelle auch ich mir als bibliothekarisch eher vorbelasteter Mensch seit langem dieselbe Frage ... -- Thomas Berger (Diskussion) 21:17, 29. Mai 2012 (CEST)
Die (regionale) PPN ist die interne Nummer, die es bereits vor der Einführung der GND gab. Sie wird weiterhin verwendet, ist jetzt aber mit der (überregionalen) GND verknüpft. Beispiel: Stephen King im Landesarchiv BW. Die PPNs der Bibliotheksverbünde sind es, die uns die Vielzahl an Dubletten beschert haben. --Kolja21 (Diskussion) 01:23, 30. Mai 2012 (CEST)
Die Landesbibliographie BW ist da vorbildlich in der Hinsicht und verwendet GND und stellt auch eine BEACON-Datei bereit. Ich hoffe, dass die anderen da bald nachziehen, dann sollten wir die Vorlagen natürlich umstellen. --AndreasPraefcke (Diskussion) 08:55, 30. Mai 2012 (CEST)
Aus dem Gesagten schließe ich, dass keine Notwendigkeit besteht, die PNNs einzubinden. Oder? Wie steht es eigentlich mit einer Seite analog zu GeoHack oder der ISBN-Suche, bloß für GND? --Monsieur Becker (Diskussion) 19:50, 30. Mai 2012 (CEST)
- Diese PPNs sind offensichtlich Nummern von Normdatensätzen ihrer jeweiligen Anwendungen, für die Normdaten-Vorlage hängen wir hier die Latte aber einige Löcher höher. Ich hatte vor einiger Zeit bei Vorlage_Diskussion:Normdaten/Archiv/2012#NEBIS_aufnehmen ein paar Kriterien zu formulieren versucht, eigentlich läuft aber alles darauf hinaus, ob solche Nummern den Anspruch erheben und das Potential haben, über die eigene Anwendung hinaus wahrgenommen zu werden.
- Zur zweiten Frage: Mal abgesehen davon, wie sich Dbpedia und Wikidata entwickeln werden, ist die "Personensuche" auf dem Toolserver [8] eigentlich auf dem Weg, diese Funktion wahrzunehmen. Lt. Statistikseite werden da derzeit etwa 100 Quellen eingebunden, anders als bei der ISBN-Suche ist allerdings schon vorher bekannt, ob die Quelle eine konkrete Person nachweist, insofern gibt es da nie 100 Links. Die Sache ist noch ausbaufähig [9], denn http://beacon.findbuch.de/seealso/pnd-aks weist über 170 Quellen zu GND-Personen nach, die Liste [10] kennt noch mehr Datenbanken, bei denen immerhin eine Recherche nach Normdatennummern möglich ist (ohne dass durch eine BEACON-Datei vorab bekannt ist, ob sie sich lohnt) und auf dem Toolserver wären durch Auswertungen von Interwiki-Links und Live-Abfragen etwa an VIAF auch Ergebnisanzeigen möglich, bei denen im Hintergrund durch simultane Berücksichtigung weiterer Identifier-Systeme für dieselbe Person oder Ressource noch mehr herangeschafft werden kann. -- Thomas Berger (Diskussion) 23:07, 30. Mai 2012 (CEST)
Vorlagen SWD und GKD ohne Vorlage Normdaten
Analog #Stand Auflösung der Vorlage:PND dasselbe für Vorlage:SWD und Vorlage:GKD (für Gebietskörperschaften etwa kamen tendenziell beide infrage): Die Liste Schlagworte, Geographika, Körperschaften mit Vorlage:SWD und/oder Vorlage:GKD ohne Vorlage:Normdaten führt alle Verwendungen dieser beiden Vorlagen auf.
Mir scheint da einiges an Quatsch drin zu stehen (etwa bei Geographie von Istanbul oder Geschichte der Sklaverei halte ich es ohne nachzusehen bereits für ausgeschlossen, dass es dazu Normsätze gibt), und im Fall von Verwaltungseinheiten wurde schon des öfteren diskutiert, ob die Normdaten-Nummer nicht eher in die Vorlage:Infobox Verwaltungseinheit in Deutschland bzw. ihre Derivate gehört und da auch einmal automatisiert eingetragen werden kann: Oft gibt es in der DNB keine Literatur über die Verwaltungseinheit und der Nachweis der von ihr herausgegebenen Literatur ist in der DNB uneinheitlich und fast nicht existent (vermutlich hebeln da die Archivgesetzte das Dépot legal aus, genaues weiss ich aber nicht).
Die Liste ist also eher zum anschauen gedacht, nicht zum abarbeiten! -- Thomas Berger (Diskussion) 12:59, 31. Mai 2012 (CEST)
- Hab gleich mal in die Liste reingeschaut. Die Normdaten (bzw. Literaturhinweise) für Geschichte der Sklaverei müssen nach Sklaverei verschoben werden.[11], [12] Bei den regulären Fällen können, falls nur {{GKD}} oder {{SWD}} vorliegen, selbige durch {{DNB-Portal}} ersetzt und {{Normdaten}} ergänzt werden.[13] Unkorrigiert würde ich vorerst nur jene Fälle lassen, wo GKD und SWD gemeinsam eingetragen sind (und warten, bis die DNB die Dubletten bereinigt hat). --Kolja21 (Diskussion) 13:21, 31. Mai 2012 (CEST)
Umgang mit GND auf viaf.org
Wahrscheinlich ist es den meisten schon aufgefallen, die übrigen wollte ich nur kurz darauf hinweisen, dass auf viaf.org jetzt (seit der Umstellung?) erfreulicherweise Tn als undifferentiated markiert werden. --Mai-Sachme (Diskussion) 21:27, 1. Jun. 2012 (CEST)
- Super, das ist ein riesen Fortschritt. Mir war nur aufgefallen, dass beim letzten Update etliche Personen/Namen, die bereits zusammengeführt waren, getrennt wurden. Offenbar sind die Regeln, wann Personen gemergt werden, strenger geworden. --Kolja21 (Diskussion) 00:10, 2. Jun. 2012 (CEST)
Frage nach einem "Normdatenkonsens"
Aufgrund einer Massenlöschung der GND-Daten zu Sachartikeln von Benutzer:Rainald62 hatte ich auf seiner Diskussionsseite nach den Grund gefragt. Meine Anfrage wurde gelöscht und in der Zusammenfassungszeile auf folgende Diskussionen Benutzer_Diskussion:Rainald62#Normdaten und Wikipedia_Diskussion:Richtlinien_Physik#Verlinkung_von_Normdaten_.28SWD.29 verwiesen. Rainald62 versteht den Sinn der Normdaten nicht und fragt nach einem Konsens bezüglich dieser Vorlage. Im Artikel Corioliskraft ist nun diesbezüglich ein Editwar entstanden. Konkret wird dabei Benutzer:Kam Solusar und seine fehlende Diskussionsbereitschaft angegriffen. (Aus meiner Sicht völlig aus der Luft gegriffen, da keiner die Diskussion im Portal Physik verfolgt und Kam Solusar auf seiner Benutzerseite nie angesprochen wurde.) Hinweise auf diese Diskussionsseite hat er auch bisher ignoriert. Ich bin nun ziemlich ratlos. Gibt es hier in der Wikipedia so eine Art Konsens oder was auch immer bezüglich der Normdaten, damit auch Rainald62 von der Sinnhaftigkeit der Normdaten überzeugt werden kann? Ziemlich ratlose Grüße --Silke (Diskussion) 23:40, 1. Jun. 2012 (CEST)
- Hallo Silewe, danke für den Hinweis. Ich habe mich auf "Richtlinien Physik" dazu geäußert. Gruß --Kolja21 (Diskussion) 00:24, 2. Jun. 2012 (CEST)
- Ich denke, Benutzer:Rainald62 ist ein Fall für die Vandalismusmeldung. Er interessiert sich weder dafür, was Normdaten sind, noch hat er Interesse an einer Diskussion. --Kolja21 (Diskussion) 00:56, 2. Jun. 2012 (CEST)
- Silke, ich verstehe deine Ratlosigkeit - allerdings gibt es da wohl ein Problem dergestalt, dass eine universelle Verlinkung wohl nirgends breit diskutiert wurde und nun genervte Reaktionen hervorrief. Es hat sich auf der dafür natürlich nicht eben optimal geeigneten Seite der Physiker eine einigermaßen konstruktive Diskusion entwickelt. (Woanders blieb das zwei Monate ohne Resonanz.) Thomas Berger hat imho eine praktikable Lösung vorgeschlagen. Ich möchte diese auch hier zur Diskussion stellen: Gibt es Einwände gegen „Normdaten vom Typ s (Sachbegriffe) sollen keine Anzeigebox erzeugen“? Damit wäre doch das Ärgernis (der einen) beseitigt, während die Vorteile noch vorhanden sind. Gruß Kein Einstein (Diskussion) 22:18, 3. Jun. 2012 (CEST)
- Ich selber hatte nicht bemerkt, dass diese Diskussion bereits im Februar zum Einsatz der Vorlage:SWD gestartet war und jetzt anlässlich intensiver Umstellung auf die Vorlage:Normdaten wieder aufgeflackert ist. Bezüglicher ersterer waren Beurteilungen nach WP:WEB legitim (ob für in Kategorie:Datenbanklinks eingestufte Vorlagenverwendungen ein anderes Mass angelegt werden sollte, wäre allerdings auch einmal eine Diskussion irgenwo wert), bezüglich letzterer laufen sie ins Leere ("Normdaten" ist so etwas ähnliches wie Kategorien). Das ist aber ein ziemlich formalistisches Argument und dürfte unserem Hauptanliegen, dass möglichst niemand sich durch die Vorlagenverwendung provoziert fühlen sollte diese aus Artikeln zu löschen, nicht hilfreich sein. Auch in den Bibliotheken gibt es unterschiedliche Communities, Mathematikern z.B. sind die Schlagworte herzlich egal, weil sie seit jeher eine international akzeptierte Fachklassifikation haben. Dementsprechend sind Vollständigkeit und Pflege der SWD-Begriffe gerade im Bereich der Sachschlagworte von Fach zu Fach durchaus unterschiedlich und wir hier können das weder leugnen oder kurz- oder mittelfristig "reparieren" noch ist es unsere Aufgabe, Stellvertreterdiskussionen zu führen: Ob die SWD Bibliotheken glücklich macht, interessiert uns nur insofern, als wir Wert auf Verlinkungen zu einem System legen, das von einer möglichst breiten Community aktiv gepflegt wird. Und ob die SWD der Wikipedia nutzt, ist eine sehr unscharf gestellte Frage, mögliche Antworten sind "Nein, niemand hat vor die Wikipedia zu verschlagworten" oder "Ja, denn die SWD ist partiell crosskonkordanziert".
- Bezüglich Personen hat es sich im Laufe der Zeit so entwickelt, dass wir die ursprügnliche Vorlage:PND einerseits in ihre "zeige-den-Benutzern-Literatur"-Funktionalität als Vorlage:DNB-Portal und andererseits in eher abstrakte Verlinkungen mittels Vorlage:Normdaten aufgespalten haben. Die Links in letzterer dienen primär zur Überprüfung der Zuordnung, wobei (etwa im Fall von VIAF oder NDL) ein Zusatznutzen auch für Normalbenutzer nicht auszuschliessen ist. Wartungsvorlagen wie Vorlage:PNDfehlt sind in einen <div class="catlinks metadata"> gesetzt und werden für Benutzer ausgeblendet, die nicht MediaWiki:Gadget-Personendaten.css (Achtung: historischer Name, gemeint sind Metadaten) aktiviert haben. Für Normdaten (<div class="catlinks normdaten-typ-X">) fehlt eine solche differenzierte Oberflächenbehandlung, allerdings werden einige Parameter der Vorlage in ein <span class="metadata"> gesetzt und sind damit auch nur den Benutzern mit aktiviertem Gadget sichtbar. Denkbar wären nun:
- ein eigenes Gadget für Normdaten (Standard wäre dann allerdings "on"?)
- Für gewisse Normdatentypen X ein Ausblenden von div.normdaten-typ-X in der allgemeinen load.php plus Reaktivieren im Rahmen des vorhandenen Helferleins Gadget-Personendaten.css (scheint mir logisch am saubersten)
- Anpassung der Vorlage:Normdaten, so dass bei gewissen Normdatentypen das Normdaten-div komplett zusätzlich die CSS-Klasse metadata spendiert bekommt (lässt sich in rein lokaler Regie durchführen)
- -- Thomas Berger (Diskussion) 23:57, 3. Jun. 2012 (CEST)
- Warum sollen wir die eigene Arbeit sabotieren: Normdaten eintragen, aber für den Typ s (Sachbegriff) nicht anzeigen? Ich wäre wohl nicht der Einzige, der in diesem Fall ganz auf den Eintrag verzichten würde. Dass sich bei einem Projekt dieses Umfangs sich ein, zwei Gegenstimmen finden, ist völlig normal. Niemand wird gezwungen, Normdaten einzutragen, aber wer sich die Arbeit macht, hat ein Recht darauf, dass sie nicht mit Kommentaren wie "Unsinn" oder "Wir wollen doch den Exzellenz-Status nicht gefährden" per Revert-Taste zerstört wird. --Kolja21 (Diskussion) 04:17, 4. Jun. 2012 (CEST)
- Ad hominem-Beitrag entfernt. Darf man KeinEinstein fragen, was ihn dazu berechtigt, meinen Diskussionsbeitrag durch eine themenfremde Überschrift als Verlinkung zu ersetzen?
- Einen persönlichen Angriff nach Ad hominem kann ich in meinem Text nicht ausmachen, auch keinen persönlichen Angriff nach WP-Regeln.
- Von mir wurden dort Verhältnisse beschrieben, die das befremdende Wirken einiger anonymer Mitautoren, Physik-Redakteure und Admins konkret im Zusammenhang mit realen Konflikten innerhalb der WP betrifft, insbesondere zu Rainald62 dessen Verhalten hier von Kolja angesprochen wurde.
- Wenn zu Rainald62 der Hintergrund aufgezeigt werden kann, können die hier an der Diskussion beteiligten Mitautoren sich orientieren. Das KeinEinstein hierzu sofort verschleiernd aktiv wird, passt haarscharf in das Profil von ihm, welches bereits in meinem von ihm gelöschten Beitrag steht. --Carl von Canstein (Diskussion) 08:10, 4. Jun. 2012 (CEST)
@Kolja21: Die Frage ist doch, wozu die Normdaten im Artikel nützlich sind. Das "taggen" der Artikel, beispielsweise zum automatisierbaren Verlinken ist wohl unbestritten sinnvoll. Wenn aber die für den Leser durch Anklicken sichtbaren Links von den Fachleuten als untauglich betrachtet werden, dann ist Bedarf für Verbesserung da. Kai-Martin hat ja Beispiele verlinkt, solche Angaben würden bei den Weblinks i.d.R. hochkant rausfliegen - und das zeigt das Problem für die Physiker auf, sichtbar stellen viele der Links eine Verschlechterung für den Leser dar. @Thomas Berger: So weit ich das verstehe, scheint deine Variante 2 gut. @Carl: Dein (übrigens wieder von sachlichen Fehlern garnierter) Beitrag geht am Thema vorbei. Es geht hier um eine inhaltliche Frage, die Normdaten. Kein Einstein (Diskussion) 14:02, 4. Jun. 2012 (CEST)
- Hallo Kein Einstein, natürlich können auch die Links wertvoll sein, müssen aber nicht. Der Punkt ist doch, dass sich Autor A Arbeit macht, die Autor B per Revers-Button löscht und ihm Kommentarfeld dazu noch vorhält, dass er nicht lesen könne, Unsinn mache und natürlich nur er, Autor B, ein Fachmann sei. Der Sinn von Normdaten liegt nicht darin, dass man leichter 20 Bücher bei der DNB findet, dafür gibt es die Vorlage {{DNB-Portal}}. Während offenbar die meisten Autoren das auf Anhieb verstehen, treten jetzt ein, zwei Autoren aus dem Portal:Physik mit dem Schlachtruf "Wir sind die Fachleute!" auf, die im Grunde behaupten, die Leser seinen zu dumm, um Normdaten zu verstehn und müssten daher vor diesem Wissen und "irreführenden Weblinks" geschützt werden. Mit Physik haben Normdaten aber herzlich wenig zu tun. Das zuständige Fachgebiet fällt in den Bereich der Bibliothekswissenschaft. Fazit: Egal, welche Beispiele man aus den Millionen von Datensätzen raussucht: Dass ein schlecht angelegter oder verlinkter Normdatensatz plötzlich dadurch besser wird, dass man ihn versteckt, wirst du mit keinem von ihnen beweisen können. Nicht umsonst teilen wir seit Jahren (erfolgreich) der DNB Verbesserungsvorschläge über die Liste WP:PND/F mit. Gruß --Kolja21 (Diskussion) 15:52, 4. Jun. 2012 (CEST)
- Ich stimme dir nur teilweise zu. Wenn ein Bibliothekswissenschaftler Einwände gegen die Normdaten eines Artikels oder eines Bereichs hat, dann ist das imho ebenso ein KO-Argument wie der Einwand eines Fachwissenschaftlers. Andersherum gesagt: Wenn nur einer von beiden zufrieden ist, dann liegt ein Problem vor.
- Und ganz ernsthaft: Wenn der Sinn von (angezeigten) Normdaten nicht darin besteht, dass der Leser dieser anklickt und etwas davon hat - welchen Sinn hat die Anzeige denn dann? Da kann ich derzeit keinen Vorteil erkennen.
- Die Seite WP:PND/F kannte ich noch nicht. Sie bezieht sich jedoch nur auf die (in diesem Zusammenhang viel leichter zu wartenden) Personen und hat einen Rückstand von einem dreiviertel Jahr. Ich sehe nicht, wie das im Bereich der Naturwissenschaften (für beide Seiten) machbar wäre, da kann ich mich aber auch irren. Kein Einstein (Diskussion) 17:52, 4. Jun. 2012 (CEST)
- Hallo Kein Einstein, wie schon gesagt, sind Normdaten keine Weblinks, auch wenn sie zur Verlinkung genutzt werden können. Wenn jetzt also ein Literaturwissenschaftler kommt und die Normdaten zu Thomas Mann löscht, weil da ein Buch verlinkt ist, dass den von ihm geschätzten Nobelpreisträger völlig missverstanden hat oder, schlimmer noch, ein Buch, dass gar nicht zu dem Thema gehört, geht das an der Sache vorbei. Die Normdaten verknüpfen Namen und Begriffe mit Identifikatoren, damit klar ist, ob sich das Wort "New York" auf das Geografikum New York (Bundesstaat), das Werk New York (Zeitschrift) oder die Person Tiffany Pollard bezieht. Ähnlich wie bei den Interwikilinks lautet die Frage also nicht: Ist der fremdsprachige Artikel fachlich fundiert geschrieben? Sondern: Beziehen sich die Lemmata auf das gleiche Thema, die gleiche Person, den gleichen Ort? Wenn du nur an den auf die {{Normdaten}} klickenden Leser vom 4. Juni 2012 denkst, hast du 95 Prozent des Potentials, das in den Normdaten steckt, ausgeblendet. Gruß --Kolja21 (Diskussion) 18:57, 4. Jun. 2012 (CEST)
- Aber das ist genau das Argument, warum es im Bereich der Sachbegriffe, wo derzeit wahrscheinlich ohnehin nur ein paar hundert Artikel mit der Normdaten-Vorlage versehen sind, nicht besonders weh tut, die nicht jedem zu zeigen. Wenn es irgendwann Abertausende sind und entsprechend weiterführende Anwendungen entstanden sein werden, wird der Nutzen einer Anzeige viel deutlicher aufscheinen. Es ist ja auch wirklich so, dass sich Erfahrungen mit der PND nicht zwangsläufig auf die SWD übertragen: Im Vergleich zur "Marke" PND führt die deutlich ältere SWD ein Nischendasein, wurde von nicht so vielen außerbibliothekarischen Projekten aufgegriffen (einzig mir bekannt: Museen überlegten, ob die SWD für ihre Dokumentationszwecke einsetzbar ist) und auch die internationale Vernetzung mit LCSH und Rameau steckt noch in den Anfängen. Wir wissen ohnehin, dass Akzeptanz und Erfolg von der Menge der Verlinkungen beeinflusst sind und hoffen zudem, dass in der Welt von Linked Open Data die Investition in die Erzeugung von Normdaten-Vorlagen in Sachartikeln sich irgendwann genau so auszahlen wird wie die in Personenartikel. In dieser Phase des Versprechens sind wir auf den Goodwill aller Bearbeiter angewiesen. Auf dieser Seite ist also die Frage, ob uns für jedermann sichtbare Normdaten-Boxen in Sachartikeln so viel mehr nutzen als unsichtbare (etwa weil das Interessenten anzieht oder dokumentiert, dass "die Wikipedia" da was tut), so daß wir das zwangsläufige Mehr an Konflikten inkauf nehmen wollen. -- Thomas Berger (Diskussion) 19:47, 4. Jun. 2012 (CEST)
- (Nach BK, war an Kolja21 gerichtet:) Du musst mir schon glauben, dass ich dich gerne verstehen will. Aber was ich noch nicht verstanden habe ist: Warum müssen die Normdaten sichtbar sein? Ich habe das Argument der Bevormundung verstanden - das man aber auch verwenden könnte, um WP:WEB auszuhebeln. Und ich sehe natürlich den Vorteil, wenn die angegebene Literatur weiterführend ist. Derzeit ist die Lage im Bereich der Naturwissenschaften aber eher so, dass - um bei deinem Beispiel zu bleiben - die zu Thomas Mann verlinkten Bücher nur manchmal etwas mit ihm zu tun haben, meist aber irgendwelche Zauberberge, Krankheitsepidemien in Venedig, Männer im Allgemeinen und so fort als Thema haben. Und da schaudert es den Thomas-Mann-Fachmann und er fragt, ob solche Verlinkungen sein müssen. Vermutlich aber sollten das Dritte entscheiden, wir kommen einander ja nicht wirklich näher. Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)
- Thomas Berger: Ja, so kann man es ausdrücken. Danke für deine vermittelnden Worte (Hier und bei WD:RLP). Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)
- "die Leser seinen zu dumm, um Normdaten zu verstehn" (Kolja21) – die meisten werden schlau genug sein, nach dem ersten Ausprobieren diese Links zu meiden, aber selbst das bedeutet immense Zeitverschwendung und millionenfaches Kopfschütteln. – Rainald62 (Diskussion) 00:33, 5. Jun. 2012 (CEST)
- Entschuldige Dich lieber dafür, dass Du als Auslöser dieser Diskussion ohne Rücksicht auf Vorautoren revertiert hast. Du kennst die Regeln genau, hältst Dich aber nur dann daran, wenn das allgemeine Augenmerk gerade auf Dich und Deine Beitragsliste gerichtet ist. Dein Verhalten bedeutet angesichts der langen Liste von VM´s, Verwarnungen und Sperre die Du (nicht nur von mir) auf dem Kerbholz hast, weit mehr Zeitverschwendung und Kopfschütteln als ein sich noch entwickelndes Projekt der Normdaten. --Carl von Canstein (Diskussion) 07:40, 5. Jun. 2012 (CEST)
- "die Leser seinen zu dumm, um Normdaten zu verstehn" (Kolja21) – die meisten werden schlau genug sein, nach dem ersten Ausprobieren diese Links zu meiden, aber selbst das bedeutet immense Zeitverschwendung und millionenfaches Kopfschütteln. – Rainald62 (Diskussion) 00:33, 5. Jun. 2012 (CEST)
- +1 und bitte Rainald, unterlass es, mich absichtlich falsch zu zitieren. Für solche Verdrehungen und Unterstellungen sollte man dich sperren. --Kolja21 (Diskussion) 16:03, 5. Jun. 2012 (CEST)
- Außerhalb der WP sind Normdaten längst zum Standard geworden, sind neben den bibliografischen Datenbanken unverzichtbare Bestandteile der bibliothekarischen Erschließung. Es ist nicht immer der Weg von der Wikipedia über die Normdaten zu anderen Druckerzeugnissen, es sollte hier auch umgekehrt der Weg von den Druckerzeugnissen dann hin zur Wikipedia betrachtet werden.
- Der derzeitige Kampf der Physikredaktion gegen die Normdaten erinnert mich etwas an den früheren Kampf der IEEE gegen die unpraktischen und völlig unverständlichen metrischen SI-Einheiten: man gibt schließlich den Durchmesser eines zölligen Rohres besser in Zoll an. Irgendwann einmal wird jedoch auch das sich erübrigt haben. :-) --≡c.w. 16:51, 5. Jun. 2012 (CEST)
GND zu einer Körperschaft
Hola, 2 Fragen:
- Gibt es bei Körperschafts-GNDs auch die Unterscheidung individualisiert vs. nicht individualisiert?
- Lohnt sich eine Bitte um Ausbau auf WP:PND/F?
Anlass ist die GND zum Slowenischen Alpenverein. --Mai-Sachme (Diskussion) 22:40, 4. Jun. 2012 (CEST)
- Da gibt es auf VIAF leider kein undifferentiated, wie das bei nicht individualisierten Personen der Fall ist.--84.161.210.139 22:46, 4. Jun. 2012 (CEST)
- "Slowenischer Alpenverein" etwa ist nicht als Generikum gemeint, Körperschaften sind immer sie selbst und keine andere. 1995 gab es eine deutschsprachige Publikation "Berghütten des slowenischen Alpenvereins" [14], dadurch ist "Slowenischer Alpenverein" als eine quasi offizielle Eigenbezeichung der Körperschaft belegt und normsatzfähig. Falls (sobald?) wir einmal erlaubt bekommen, auf WP:PND/F auch Meldungen zu Körperschaften zu machen, wird es analog den Personen klare Hinweise dazu geben, welche Informationen passen werden. Ich könnte mir vorstellen, dass Hinweise auf Sitz, Gründungsjahr und Namen von Vorgängerkörperschaften erwünscht sein könnten. Im konkreten Fall gibt der Wikipedia-Artikel aber gerade dazu nichts her... -- Thomas Berger (Diskussion) 23:09, 4. Jun. 2012 (CEST)
- Naja es gibt durchaus auch unterschiedliche Körperschaften mit demselben Namen (mal als Beispiel Andreas-Hofer-Bund), insofern ist die Situation analog zu Personennamen, daher hatte ich gedacht, dass die DNB da auch unterscheidet, aber wenn nicht, dann stört's mich auch nicht :-) --Mai-Sachme (Diskussion) 23:21, 4. Jun. 2012 (CEST)
- Doch, sie unterscheidet da (theoretisch) immer. Zu den drei Andreas-Hofer-Bünden gibt es allerdings nur zwei Normsätze, obwohl die DNB immerhin drei Publikationen des (einen Normsatz vermissenden) Andreas-Hofer-Bund Tirol aus den 1930er Jahren nachweist: Aus unserer Sicht wäre das meldewürdig, dürfte aber mit den bekannten Hinweisen "keine nachträgliche Verschlagwortung" und "keine nachträgliche Verknüpfung" (es gibt jeweils persönliche Verfasser, also nach den bibliothekarischen Regeln keinen Grund, die komplizierte Ansetzung der Körperschaft vorzunehmen) abgeschmettert werden. -- Thomas Berger (Diskussion) 23:47, 4. Jun. 2012 (CEST)
- Naja es gibt durchaus auch unterschiedliche Körperschaften mit demselben Namen (mal als Beispiel Andreas-Hofer-Bund), insofern ist die Situation analog zu Personennamen, daher hatte ich gedacht, dass die DNB da auch unterscheidet, aber wenn nicht, dann stört's mich auch nicht :-) --Mai-Sachme (Diskussion) 23:21, 4. Jun. 2012 (CEST)
- Zusammengefasst zwei Antworten: Nein, es gibt keine nicht individualisierten Körperschafts-GNDs, und ja, auf jeden Fall wollen wir in Zukunft alle Fehler und Verbesserungsvorschläge (nicht nur bei Personen) an die GND-Redaktion melden. Gruß --Kolja21 (Diskussion) 00:36, 5. Jun. 2012 (CEST)
- Danke für eure Hinweise! --Mai-Sachme (Diskussion) 13:41, 5. Jun. 2012 (CEST)
- "Slowenischer Alpenverein" etwa ist nicht als Generikum gemeint, Körperschaften sind immer sie selbst und keine andere. 1995 gab es eine deutschsprachige Publikation "Berghütten des slowenischen Alpenvereins" [14], dadurch ist "Slowenischer Alpenverein" als eine quasi offizielle Eigenbezeichung der Körperschaft belegt und normsatzfähig. Falls (sobald?) wir einmal erlaubt bekommen, auf WP:PND/F auch Meldungen zu Körperschaften zu machen, wird es analog den Personen klare Hinweise dazu geben, welche Informationen passen werden. Ich könnte mir vorstellen, dass Hinweise auf Sitz, Gründungsjahr und Namen von Vorgängerkörperschaften erwünscht sein könnten. Im konkreten Fall gibt der Wikipedia-Artikel aber gerade dazu nichts her... -- Thomas Berger (Diskussion) 23:09, 4. Jun. 2012 (CEST)
Meilenstein < 174.000
In der Kategorie »Veraltete Normdaten« gibt es jetzt weniger als 174.000 umstellungsbedürftige Einträge. Einen herzlichen Dank an alle, die fleißig mitmachen. --Monsieur Becker (Diskussion) 07:47, 8. Jun. 2012 (CEST)
- Das ist schön, aber diese Kategorie halte ich für keine gute Idee. Eine Wartungskategorie in 170.000 Artikeln, die ja an sich völlig ok sind und nur bei Vorliegen anderer Korrekturen "verbessert" werden sollten, ist kontraproduktiv für das Image der Normdaten insgesamt. Wenn in einem alten Artikel von mir ohne Not plötzlich eine Wartungskategorie für ein kosmetisches Problem erscheint, wäre ich jedenfalls nicht begeistert. Und für die Statistik ist die Kategorie auch unwichtig, denn Vorlage:NORMDATENCOUNT ergibt ja täglich die aktuelle Zahl. --AndreasPraefcke (Diskussion) 09:31, 8. Jun. 2012 (CEST)
- Nunja, die Kategorie erscheint ja auch nicht im Artikel, jedenfalls nicht bei Standardeinstellungen. --Mai-Sachme (Diskussion) 11:49, 8. Jun. 2012 (CEST)
- Ich halte die Umstellung auf die GND für mehr als eine reine kosmetische Angelegenheit. Auch der Begriff »veraltet« ist meines Erachtens nicht kontraproduktiv, da die PND de facto veraltet ist. Davon abgesehen konnten im Rahmen der Abarbeitung bei vielen Einträgen auch schon VIAF- und LCNN-IDs hinzugefügt werden, sodass die Kategorie aus meiner Sicht ihren Nutzen hat. --Monsieur Becker (Diskussion) 18:34, 8. Jun. 2012 (CEST)
- Die Kat schärft das Bewusstsein ... oder sagen wir einfach, ist gute PR für die Umstellungsarbeit. Fröhliches Schaffen! --Kolja21 (Diskussion) 00:38, 9. Jun. 2012 (CEST)
Die Normdaten im Artikel sind nicht veraltet, sowohl das "Datum" selbst als auch die Beschriftung fuer den Leser sind voellig in Ordnung. Das einzige, was veraltet ist, ist der Quelltext der Vorlage. Ich halte es fuer voellig sinnlos, wenn dafuer User auch nur eine Sekunde Lebenszeit aufwenden. Die automatische Ersetzung im Rahmen von anderen Projekten habe ich auch bereits angestossen (zB machta aka das jetzt bei der Rechtschreibverbesserung mit, und ein Skript fuer automatische Quelltextverbesserung macht die Aenderung jetzt auch mit). Die diversen Bots muessen noch dazukommen. Wichtig ist tatsaechlich das Anreichern auch aelterer Artikel mit VIAF und LCCN, wenn die Kategorie also dabei irgendwie hilft: meinetwegen. ----AndreasPraefcke (Diskussion) 07:35, 9. Jun. 2012 (CEST)
- Hallo Andreas, wo du von anstoßen sprichst, hast du bei den Botanfragen die Vorlage:PNDfehlt (16.239 Einbindungen) miteinbezogen? Im Grunde könnten wir alle Einträge löschen, bei denen nur ein Parameter (die Datumsangabe) vorliegt, oder? Gruß --Kolja21 (Diskussion) 15:20, 9. Jun. 2012 (CEST)
- Wäre es nicht sinnvoller, derartige Verwendungen der Vorlage:PNDfehlt, statt sie ersatzlos zu löschen, auf
{{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=|GNDName=|GNDfehlt=|GNDCheck=Datumsangabe im Format JJJJ-MM-TT|REMARK=}}
umzuschreiben (vorausgesetzt, dass die Vorlage:Normdaten im Artikel noch nicht eingebunden ist)? Dadurch bleibt die Information erhalten, dass es sich um einen Personenartikel handelt (selbst wenn andere Merkmale eines Personenartikels fehlen sollten, wie etwa die Vorlage:Personendaten oder Personenkategorien) und dass die Eintragung einer GND vom Typ Person erwünscht wäre. --UV (Diskussion) 17:49, 9. Jun. 2012 (CEST)
- Wäre es nicht sinnvoller, derartige Verwendungen der Vorlage:PNDfehlt, statt sie ersatzlos zu löschen, auf
- Davor müsste geprüft werden, ob nicht mittlerweile eine GND vorhanden ist. Durch die Einspielung der regionalen Datensätze Ende 2011 / Anfang 2012 sind die alten Datumsangaben obsolet. Ob es sich um eine Person handelt, die noch keine Normdateneintrag hat, kann man leicht über die Kats Mann/Frau feststellen. Der Auftrag an den Bot eilt aber nicht. Wir können auch erstmal abwarten, wieviele Leute sich an der Abarbeitung der veralteten Vorlage:PNDfehlt beteiligen. --Kolja21 (Diskussion) 18:57, 9. Jun. 2012 (CEST)
- Ich könnte mir vorstellen, dass es auch (vereinzelt) Personenartikel gibt, die irgendwie durch die Eingangskontrolle o. ä. durchgerutscht sind, wo sowohl die Vorlage:Personendaten als auch die Kats Mann/Frau und andere Personenkats fehlen und nur z. B. Kategorien wie „Sport (in LAND)“ oder „Wissenschaft (in LAND)“ oder „Politik (in LAND)“ o. ä. gesetzt sind. Zugegebenermaßen wird die Anzahl dieser Fälle nicht allzu hoch sein, aber bei diesen Artikeln könnte dann die Vorlage PNDfehlt das einzige (automatisch auswertbare) Kennzeichen sein, dass es sich bei diesem Artikel um einen Personenartikel handelt. --UV (Diskussion) 19:17, 9. Jun. 2012 (CEST)
Ich habe einmal den Dump 2012-06-03 durchgezählt und es sieht so aus:
- 10733 Vorlageneinbindungen mit einem Parameter (nur Datum also), davon tragen 1189 eine Vorlage:Normdaten (drei davon mit PND korrigiere ich gleich)
- 5532 Einbindungen mit zwei Parametern (also mit PND-Nummer eines zu dem gegebenen Datum nichtindividualisierten Satzes), davon 4198 mit Vorlage:Normdaten, davon wiederum 83 mit PND (Spekulation: das sind Fälle Tp existiert, Tn trägt Literatur)
50 Einbindungen mit drei Parametern (Angabe eines abweichenden Namens): (inzwischen umgestellt dank Mai-Sachme und Kolja21)
Ich denke, jede Einbindung von PNDfehlt sollte zumindest in eine Vorlageneinbindung Normdaten|TYP=p umgewandelt werden (sofern noch nicht vorhanden), jeder Parameter #2 in den Parameter GNDname. Das Datum sollte m.E. nach GNDcheck überführt werden (die entsprechenden Monatswartungskategorien wären noch anzulegen), dann sind die 17.000 Pflegefälle etwas auseinandersortiert und es wird weniger frustrierend sie abzuarbeiten. Das Argument von Kolja verstehe ich nicht: Die Datumsangaben dienen doch gerade dazu, Fälle von nachträglichen Verbesserungen in der Normdatei in den Griff zu bekommen: Wenn ich sehe, dass zum Stand 2010-01 kein Tp-Satz existierte, lohnt es sich nachzusehen. Wenn hingegen jetzt durch einen Automatismus 2012-06 eingetragen würde, müsste ich davon ausgehen, dass auch aktuell kein Tp-Satz existiert, weil das diesen Monat jemand überprüft hat... -- Thomas Berger (Diskussion) 22:21, 9. Jun. 2012 (CEST)
- Natürlich ist die Datumsangabe hilfreich - bei der neuen Vorlage:Normdaten. Bei dem PNDfehlt-Hinweis ist es dagegen schnuppe, ob die letzte Überprüfung 2008 oder 2010 stattgefunden hat, da 2011/2012 die regionalen Bibliotheksverbünde mit aufgenommen wurden und damit eine Flut neuer GND-Datensätze angelegt wurde. --Kolja21 (Diskussion) 20:08, 10. Jun. 2012 (CEST)
- Der GNDCheck-Parameter in der Normdaten-Vorlage ist doch genau aus dem Grund eingeführt worden, die Funktion des Datumsparameters aus PNDfehlt zu übernehmen! Also können auch die Daten existierender PNDfehlt-Einbindungen in die Normdaten-Vorlage überführt werden. Aus Sicht eines Einzeldatensatzes ist es auch egal, ob seit der letzten Kontrolle 300 oder 3.000.000 Sätze neu in die Normdatei aufgenommen wurden, was zählt ist, ob zu dieser Person oder nicht... Andersherum gedacht: Welches Datum würdest Du denn als GNDCheck eintragen, wenn per Bot die PNDfehlt's aufgelöst werden? -- Thomas Berger (Diskussion) 22:51, 10. Jun. 2012 (CEST)
- Das ist eine Fangfrage ;) Ich halte die alte PNDfehlt-Vorlage (mit nur einem Parameter) ja eher für überflüssig, aber wenn sich genug Leute finden, die sich der Arbeit annehmen wollen, bin ich der letzte, der sie boykottieren würde. --Kolja21 (Diskussion) 00:49, 11. Jun. 2012 (CEST)
- Lass' uns das mal differenzieren: Zu 10.000 PNFfehlt "nur mit Datum" sind zwischenzeitlich knapp 3.000.000 Tn-Sätze in der PND hinzugekommen. Die Chance ist tatsächlich gross, dass der Name inzwischen in der GND vorkommt, aber kaum verändert im Hinblick auf "meldbare" Tn's, also solchen mit Literatur in der DNB. Allerdings sind - und das betrifft auch die 5.000 PNDfehlt mit Tn-Angabe - aus den Masseneinspielungen ein paar Zigtausend Tp hinzugekommen, das tritt m.E. aber nicht sonderlich hervor, denn von 2007 (so alt sind die Daten in PNDfehlt manchmal) bis 2012 ist auch "regulär" eine enorme Zahl von Tp-Sätzen angelegt worden. Ich denke jedoch, dass Neuprüfung eines vor fünf Jahren mit PNDfehlt versehenen Artikel in sehr vielen Fällen immer noch dasselbe Ergebnis bringt, wohingegen ein noch nie geprüfter Artikel deutlich häufiger einen Treffer haben wird. Die Crux ist natürlich, dass wir nie wissen, wie alt der Datumsstempel sein muss, damit sich eine - evtl. sogar systematische - erneute Prüfung lohnt (nur dass ein fünf Jahre nicht geprüfter Satz evtl. lohnender ist als ein zwei Jahre nicht geprüfter, vorausgesetzt die Personen sind aufgrund nicht scharf formulierbarer Kriterien genügend vergleichbar). Die Alternative zur 1:1-Überführung der Daten aus PNDfehlt in die Normdaten-Vorlage ist eigentlich nur das komplette Verwerfen von PNDfehlt, wie Du es ja auch vorzuschlagen scheinst, das würde aber bedeuten, die Artikel auf "noch nie geprüft" heraufzustufen: Bevorzugte, angebliche Erst-Prüfung wäre dann angebracht, was für die 17.000 fraglichen Artikel locker 2.000h Arbeit sind, die wir bei Erhaltung der Zeitstempel leichter in die Zukunft schieben könnten. -- Thomas Berger (Diskussion) 01:54, 11. Jun. 2012 (CEST)
Format des LCCN-Parameters
Ein kurzer Hinweise auf Vorlage_Diskussion:LCCN, wo ich eine meines Erachtens notwendige Diskussion über das Format des LCCN-Parameters anstoßen möchte. --Monsieur Becker (Diskussion) 07:50, 8. Jun. 2012 (CEST)
Computerspiele
sind in der GND unter "Softwareprodukt (siw)", also unter "Sachbegriff" einsortiert. Gehörte das nicht vielmehr zu den "Werken"? (ich wüsste nicht, was einem Computerspiel weniger Werk sein sollte als an einem Roman oder einem Kinofilm). Beispiel: http://d-nb.info/gnd/4311276-6 Bei uns also "TYP=s" oder "TYP=w"? --AndreasPraefcke (Diskussion) 14:25, 14. Jun. 2012 (CEST)
- Ich kann der Auffassung, dass Softwareprodukte vielmehr Werke als Sachbegriffe sind, an sich nur zustimmen. Andererseits fühle ich mich aber dem Prinzip der Normdatei verpflichtet und fände es uneinheitlich, wenn wir in der Entitätencodierung abwichen. Somit bin ich für "TYP=s". --Monsieur Becker (Diskussion) 18:46, 14. Jun. 2012 (CEST)
- Ist mir auch schon mehrfach aufgefallen und ich hab mich über diese Kategorisierung gewundert. Aber Computerspiele scheinen eh bislang eher stiefkindlich behandelt zu werden. Über portal.dnb.de finden sich zwar Lösungsbücher, Romane oder Soundtracks zu Spielen, aber die Spiele selbst scheinen nicht aufgenommen zu werden. --Kam Solusar (Diskussion) 23:24, 14. Jun. 2012 (CEST)
Typ "siw" gehört zu TYP s. Für was "s" genau steht, kann man immer noch präzisieren, z.B. "Sachbegriffe, einschl. Computerspiele". --Kolja21 (Diskussion) 23:35, 14. Jun. 2012 (CEST)
- Nur wäre eine Einordnung als Werk ("w") IMO irgendwie logischer und konsequenter. --Kam Solusar (Diskussion) 11:47, 16. Jun. 2012 (CEST)
- Auch nicht elektronisches wie "Monopoly" ist in der GND vom Typ "Marke, Produkt". Bei einem elektronischen Spiel gibt es auch noch die Software, die klar unter das Urheberrecht fällt. Aber es geht natürlich eher um das Spiel an sich, die Spielidee, die Optik etc. und da tut sich auch das Urheberrecht schwer, selbst bei "Autorenspielen". Der Werkbegriff der Bibliotheken ist m.E. nah an dem des Urheberrechts, während wir hier einen deutlich weiteren Werkbegriff haben, der auch (zuschreibbare) Ideen oder Ingenieurleistungen umfasst. -- Thomas Berger (Diskussion) 13:22, 16. Jun. 2012 (CEST)
- Ein Computerspiel von heute hat von Aufwand und Machart mehr mit einem Hollywoodfilm zu tun als mit irgendetwas anderem. Wir reden hier ja nicht von Pong. Daher finde ich das "s" ziemlich falsch und auf dem Stand der 70er Jahre (wie so vieles im Bibliothekswesen...). --AndreasPraefcke (Diskussion) 19:07, 16. Jun. 2012 (CEST)
Auch lustig: http://d-nb.info/gnd/4040037-2 Typ zwar "gik" (also g wie Geografikum), aber Extraterrestrika als "Geo"grafikum zu bezeichnen, ging irgendjemand gegen den Strich, also steht statt "Geografikum" doch wieder "Sachbegriff" in der Tabelle... Bei "Sonne" dito. Die Planeten wiederum sind "Geografika"... --AndreasPraefcke (Diskussion) 20:38, 16. Jun. 2012 (CEST)
Mit den "Typen" werden wir noch viel Freude haben... http://d-nb.info/gnd/4003385-5 --AndreasPraefcke (Diskussion) 21:19, 16. Jun. 2012 (CEST)
- Die Ansetzung steht im MARC-authority-Feld 150 für Sachbegriffe, daher das Label "Sachbegriff" und der Satz ist (079$b) vom Typ Ts. Gezeigt wird aber der Entitätencode (079$v) und der beginnt halt mit "g". Keine Ahnung, ob eine solche Schere im Plan ist oder ob da einfach zwei separate Umsetzungsalgorithmen versehentlich zu verschiedenen Schlüssen gekommen sind. "Lustig" ist eher, dass für diese Sätze im GND-Portal kein Kontaktformular angeboten wird... -- Thomas Berger (Diskussion) 21:21, 16. Jun. 2012 (CEST)
Überprüfung der VIAF-Einträge auf Zusammenführung
Beim it. Schauspieler Stefano Accorsi war ursprünglich die VIAF-ID 103292496 eingetragen. Diese wird nun automatisch auf 19917790 weitergeleitet. Ich gehe stark davon aus, dass hier mehrere Datensätze zusammengeführt wurden. Da eine regelmäßige manuelle Überprüfung kaum durchführbar ist, wollte ich fragen, ob es Möglichkeiten gibt, die VIAF-IDs monatlich oder vierteljährlich auf solche Zusammenführungen hin zu überprüfen. -- Monsieur Becker (Diskussion) 19:19, 14. Jun. 2012 (CEST)
- Bei PNDs habe ich das mal gemacht, bei den VIAF-Nummern hatte ich das auch angedacht. Wie so oft ist das aber eine Frage der Zeit. Mit allem, was ich so geplant habe im Bereich Personendaten/Normdaten könnte ich vermutlich vollzeit den Rest meines Lebens dran arbeiten ;) --APPER\☺☹ 20:40, 14. Jun. 2012 (CEST)
Eine monatliche Überprüfung wäre übertrieben, da die VIAF-Datenbank selbst nur alle ein, zwei Monate aktualisiert wird. Am wichtigsten sind die "Ur-"Normdatensätze GND, LCCN und NDL. Darauf sollten wir uns konzentrieren. Die Sammelnormdaten VIAF sind nur ein Zusatzangebot. Gruß --Kolja21 (Diskussion) 23:39, 14. Jun. 2012 (CEST)
Botanfrage zur Auflösung der Vorlage:PNDfehlt
habe ich soeben hier gestellt. -- Thomas Berger (Diskussion) 09:56, 15. Jun. 2012 (CEST)
- *Räusper*, dann werden in ein paar 1000 Artikel rote Kategorien eingebunden. --Mai-Sachme (Diskussion) 10:17, 15. Jun. 2012 (CEST)
- Das ist sozusagen der Hauptgrund für die Eile: Beim Umarbeiten entstehen derzeit einzelne, die zugehörige Kategorie lässt sich schnell einrichten (enthält nur einen stereotypen Baustein {{GND fehlt}}), während der paar Stunden, wo der Artikel in Spezial:Gewünschte_Kategorien gelistet ist, wird er noch einmal entdeckt und das Datum angepasst, so dass die Kategorie dann leer ist: Mindestens eine ist bereits wieder als "Kategorie ohne Inhalt" gelöscht worden... Wenn die PNDfehlt-Daten aber überführt sind, wird nichts mehr an historischen Zeitstempeln hinzukommen, wenn dann eine der Wartungskategorien leer wird, bleibt sie es auch. -- Thomas Berger (Diskussion) 11:00, 15. Jun. 2012 (CEST)
- ... und kann dann, wenn alle Artikel abgearbeitet sind, wieder gelöscht werden, oder? Ein Liste der verschiedenen (Ab-)Arbeitsfelder bietet jetzt die (von Andreas angelegte) Kategorie:Wikipedia:Normdaten-Wartung. Danke für die akribisch formulierte Bot-Anfrage! Nur einen Verbesserungsvorschlag: Ich ziehe es vor, die vollständige Vorlage
- {{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=}} bzw.
- {{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=|GNDName=|GNDfehlt=ja|GNDCheck={{subst:NormdatenDatum}}|REMARK=}}
- in die Artikel einzubauen. Wenn die leeren Parameter mit angegeben sind, muss niemand umständlich lernen bzw. nachschlagen, welche Parameter für die Vorlage infrage kommen. Diese Vorgehensweise hat sich bei den Infoboxen bewährt. Gruß --Kolja21 (Diskussion) 15:17, 15. Jun. 2012 (CEST)
- Naja, aber "GNDName" wird typischerweise irgendwann durch Wegnehmen von vier Zeichen in "GND" umgewandelt, das wäre dann doof, wenn da bereits ein leeres "GND=" herumgammelt. Und bis jemand LCCN, NDL oder VIAF ausfüllen will, ist evtl. noch ein Parameter theoretisch erlaubt worden und der hat dann Schwierigkeiten wahrgenommen zu werden, weil er nicht "vorbereitet" ist. Es sind zugegebenermaßen nur stilistische Unterschiede zwischen Infoboxen und allgemeinen Vorlagen, aber irgendwie reflektieren die doch die jeweilige Dynamik. -- Thomas Berger (Diskussion) 16:40, 15. Jun. 2012 (CEST)
- :-) und noch ein Hinweis zu den leeren Datenfeldern. Ich nutze die von Benutzer:PerfektesChaos zur Verfügung gestellte Benutzer:PerfektesChaos/js/WikisyntaxTextMod. Dabei ist mir aufgefallen, dass genau diese leeren Datenfelder "weggeputzt" werden. Wenn diese Datenfelder also erwünscht sind, dann sollte PerfektesChaos davon in Kenntniss gesetzt werden? Liebe Grüße und Dank an alle, die sich sooooo sehr für die Normdaten einsetzen. Silke (Diskussion) 16:50, 15. Jun. 2012 (CEST)
- Entschuldige Kolja21, da hatte ich das falsche Skript in Verdacht. WikisyntaxTextMod ist für das "Putzen" nicht verantwortlich. "Geputzt" wird aber bei mir, da bin ich ganz sicher. Nachdem ich nun ein paar Dinge ausprobiert habe, weiß ich, dass das Normdatenskript von Benutzer:Schnark dafür verantwortlich ist. Da Schnark hier mitliest, wird er sich sicher (hoffentlich) dazu melden. Einen schönen Abend noch und Grüße --Silke (Diskussion) 20:23, 15. Jun. 2012 (CEST)
- :-) und noch ein Hinweis zu den leeren Datenfeldern. Ich nutze die von Benutzer:PerfektesChaos zur Verfügung gestellte Benutzer:PerfektesChaos/js/WikisyntaxTextMod. Dabei ist mir aufgefallen, dass genau diese leeren Datenfelder "weggeputzt" werden. Wenn diese Datenfelder also erwünscht sind, dann sollte PerfektesChaos davon in Kenntniss gesetzt werden? Liebe Grüße und Dank an alle, die sich sooooo sehr für die Normdaten einsetzen. Silke (Diskussion) 16:50, 15. Jun. 2012 (CEST)
- Danke für den Hinweis, das Skript kannte ich noch nicht. Ich halte die standardisierte Reihenfolge gerade auch im Hinblick auf eine Umwandlung von "GNDName" in "GND" für wichtig, denn die Reihenfolge der Parameter entscheidet mit darüber, ob ich den Sinn einer Vorlage auf Anhieb verstehe. Für den Techniker mag es schnuppe sein, ob da "GND, LCCN und NDL" oder "LCCN, NDL und GND" steht, aber nicht wenige Autoren kommen aus anderen Gebieten und "denken" nicht wie ein Computer. Im Grunde ist es wie bei der Sprache, der Sinn von Wörtern erschließt sich (für den menschlichen Leser) durch die Reihenfolge. --Kolja21 (Diskussion) 19:50, 15. Jun. 2012 (CEST)
- Als kleiner Hinweis: Mein Skript besitzt eine (undokumentierte) Konfigurationsvariable, um das Entfernen leerer Felder zu unterlassen, allerdings sehe ich das so wie Gymel und halte diese ganzen leeren Parameter für nicht wirklich hilfreich/nötig. Ein Benutzer, der nichts von einem Parameter LCCN weiß, der weiß auch nicht, wie er die LCCN herausfindet, geschweige denn, wie er sie formatieren muss. --Schnark 09:27, 16. Jun. 2012 (CEST)
Die vollständige Vorlage auch bei leeren Werten finde ich gar nicht so doll. Die automatische Syntaxkosmetik löscht sie z. B. gleich wieder... (hab mich getäuscht, es ist das Normdatenscript) Und überhaupt: wer Normdaten in größerem Ausmaß einbauen will, sollte unbedingt das Schnark-Script verwenden, alles andere ist doch nur völlig unnötige Arbeitsbelastung. Und das Eintragen von Normdaten durch "Laien" (also die, die das nur zwei, drei mal im Monat machen werden) ist ohnehin fehlerbehaftet. Es "fehlt" ja nicht unbedingt etwas, wenn nioht alle Felder ausgefüllt sind. --AndreasPraefcke (Diskussion) 19:05, 16. Jun. 2012 (CEST)
Dubletten: SWD und GKD
Durch Zusammenfallen von SWD und GKD (das schien für geografische Objekte bis dato funktional unterschieden worden zu sein in "Thema in Literatu" und "beteiligt an/Urheber von Literatur") scheint es jetzt mehrfache GNDs für geografische Körperschaften zu geben, so zum Beispiel http://d-nb.info/gnd/2015398-3 und http://d-nb.info/gnd/4030481-4 für Kiel. Was tun? --Widerborst 11:22, 17. Jun. 2012 (CEST)
- Abwarten und Tee trinken ;) Nach der Umstellung auf die GND (incl. Schulung etc.) nehmen die Bibliotheken jetzt erst langsam wieder die Arbeit auf, und dann sind auch schon Sommerferien. Bis die Dubletten zusammengeführt sind, werden also noch ein paar Monate vergehen. Zzt. gibt es für uns zwei Möglichkeiten: Fall 1: Einer der beiden Normeinträge enthält deutlich weniger Informationen und keine Verknüpfungen auf Werke, dann kann er wegfallen. Fall 2: Beide Normeinträge sind wichtig, dann sollte man SWD und GKD stehen lassen bzw. eine GND eintragen und die zweite GND im Feld "REMARK" vermerken. --Kolja21 (Diskussion) 15:16, 17. Jun. 2012 (CEST)
Das sieht bei Kiel dann z.B. so aus:
{{Normdaten|TYP=g|GND=2015398-3|GNDCheck={{subst:NormdatenDatum}} |REMARK=Dublette GND 4030481-4 vorhanden.}}
Dadurch landet der Artikel in der Wartungskat Kategorie:Wikipedia:GND fehlt 2012-06, obwohl die GND natürlich in diesem Fall nicht fehlt, sondern nur in ein paar Monaten überprüft werden soll. --Kolja21 (Diskussion) 15:28, 17. Jun. 2012 (CEST)
Zu nach GND-Start redundanten Datensätzen ist eine Ankündigung aus dem Newsletter "Standardisierung" Nr. 19 interessant (PDF-Ausgaben hier): »Ebenso wurde ein weiterer Termin für das sog. Match-und Merge-Verfahren abgestimmt, das erst zehn Wochen nach dem Umstiegstermin am 19. April 2012 starten kann, um den Verbünden genügend Zeit zum Überspielen der GND-Daten in die Lokalsysteme zu lassen. In diesem Verfahren sollen bereits als dublett erkannte Sätze aus der GKD und SWD, die dieselben Entitäten beschreiben, maschinell zusammengeführt werden.« – 19. April + 10 Wochen = 28. Juni als frühester Starttermin. Keine Ahnung, wann erste Ergebnisse dieser Zusammenführung sichtbar werden könnten. -- Make (Diskussion) 15:54, 17. Jun. 2012 (CEST)
Danke für die kompetenten Antworten. Dann harrenwermal. --Widerborst 18:13, 17. Jun. 2012 (CEST)
Ich hatte mich bezüglich zweier Datensätze für den Eurovision Song Contest 2004 (4792884-0 und 10335908-4) an die DNB gewandt und bekam folgende Antwort: »der ehemalige GKD-Satz wird bei Körperschaften und Kongressen gewinnen. Im vorliegenden Fall erkennt man es daran, dass keine Systematiknummer vorhanden sein darf (bei 4792884-0 Systematik 14.1 Musik (Allgemeines), Musikgeschichte - also Looser). Bei Geografica gewinnt der SWD-Satz (üblicherweise mit DDC-Notation versehen).« Bezogen auf Kiel müsste also 4030481-4 das Rennen machen. --Monsieur Becker (Diskussion) 07:28, 18. Jun. 2012 (CEST)
- Sehr interessant, danke. Aber vielleicht warten wir wirklich am besten noch die paar Wochen, bevor wir uns unnötig Arbeit machen. --AndreasPraefcke (Diskussion) 09:41, 18. Jun. 2012 (CEST)
Vorschlag zur Masseneinspielung von VIAF-Nummern in en:WP
von den "Wikipedians in Residence" bei OCLC und der British Library: en:User:Maximiliankleinoclc/Authority_control_integration. Interessant finde ich die Andeutungen (oder habe ich da etwas falsch verstanden), dass die (en)-Wikipedia-Links, die mir auch bereits in VIAF aufgefallen waren, wegen der strukturierten Persondata-Inhalte anscheinend recht stabilisierend auf die Clusterung wirken, insofern also für VIAF echten Nutzen haben und nicht nur populistisches Beiwerk sind. -- Thomas Berger (Diskussion) 21:23, 18. Jun. 2012 (CEST)
- Klasse. Hatte schon lange gehofft, dass die engl. WP die Normdaten englich in größerem Maßstab nutzt. Bisher war die Nutzung dort ja kaum vom Fleck gekommen. Ich hatte drüben zwar auch mal ein bißchen in dem Bereich gemacht, hatte aber einfach nicht die nötige Zeit, Energie und Connections, um das dort auf breitere Beine stellen zu können. Vor allem bin ich gespannt, was die breite Nutzung der Normdaten in der engl. WP an Auswirkungen außerhalb der Wikipedia haben könnte. --Kam Solusar (Diskussion) 11:59, 19. Jun. 2012 (CEST)
- Schließe mich Kam Solusar an - es wäre ja auch für mich technisch ein leichtes gewesen, deutsche Normdaten + VIAF/LCCN per Bot in die en.wp einzuspielen, aber ich habe hier in de.wp genug zu tun und keine "Zeit, Energie und Connections", mich um die en.wp zu kümmern. Gut kanns nur sein! --APPER\☺☹ 15:02, 19. Jun. 2012 (CEST)
- Danke für den Hinweis. Ich hab mal etwas in dem Skript wikipedia2auth3.py von en:User:Maximiliankleinoclc/Authority_control_integration gestöbert. Kurze Skizze, was es wie macht folgt in eigenem Unterabschnitt (soweit ich durchblicke, direkte Korrekturen, Ergänzungen erwünscht). – Vielleicht hat jemand Lust anzufragen, ob VIAF nicht weiteren Code "rausrückt". Die Versuchung bei mir ist groß, da selber nachzuhaken. Die Erfahrung, dass das zu faszinierenden aber zeitgefräßigen Aktivitäten führt, hält mich (vernünftigerweise ;-) auf Distanz. -- Make (Diskussion) 15:22, 20. Jun. 2012 (CEST)
A propos VIAF: die sind dabei, die japanische NDL einzubauen: http://outgoing.typepad.com/outgoing/2012/05/just-links.html (comments) --AndreasPraefcke (Diskussion) 22:24, 20. Jun. 2012 (CEST)
- Jau, und ich hatte deswegen sogar schon einmal angenommen, die NDL sei schon längst drin in VIAF: Wikipedia_Diskussion:Normdaten/Archiv#Weitere_Punkte. Aufruf der genannten Beispiele gibt die identischen Ergebnisse wie im Blog-Post, nur eben ohne NDL. -- Thomas Berger (Diskussion) 22:35, 20. Jun. 2012 (CEST)
- Ah, das hatte ich irgendwie damals nicht mitbekommen. Immerhin haben wir jetzt auch die Bestätigung. --AndreasPraefcke (Diskussion) 12:22, 21. Jun. 2012 (CEST)
wikipedia2auth3.py
- Funktionalität: Python-Skript, das aus einem en:Wikipedia-XML-Dump eine Datei mit MARC-konformen Authority-Datensätzen erstellt.
- Funktionsweise:
- Jeder Wikipedia-Artikel wird zunächst darauf geprüft, ob er eine Person beschreibt. Dazu werden (u.a.) die Unterkats von en:Category:Births by year / en:Category:Deaths by year und en:Template:Infobox person ausgewertet.
- Nicht berücksichtigt werden en:Template:Persondata und en:Template:Authority control
- Kandidaten für Werke von und über die Person werden ermittelt durch Parsen von en:Template:Citation (= en:Template:cite) und Sammeln aller im Artikel auftretenden ISBN, ISSN sowie buchstabenfreier LCCN.
- Kandidaten für den zur Person gehörigen LoC-Authority-Datensatz werden ermittelt durch Sammeln von LCCN aus Weblinks auf Worldcat inkl. en:Template:Worldcat, die mindestens einen Buchstaben enthalten – Regular-Expression-Patterns (Zeilen 156,157, siehe python-re-documentation) dafür
\{\{worldcat.*?lccn-([\d\- a-z]+)
identities/lccn-([\d\-a-z]+)
- diverse Plausibilitätsprüfungen und konsequente Bereinigung eliminieren und verhindern Datenmüll (zB werden 1. Literaturverweise, die den Personennamen nicht grob enthalten, verworfen 2. (? sachlich richtig ?) Literaturverweise mit einer "Blacklist"
NoiseTitles
abgeglichen, die irreführende/zu allgemeine Titel enthält)
- kleine Spekulation, wie die en:Wikipedia-Pseudo-Authority-Datensätze stabilisierend bei der Clusterung von VIAF eingesetzt werden: Man wirft die ganz naiv in den Pool der regulären Datensätze und läßt die Clusteralgorithmen arbeiten. Dann können die Wikipedia Datensätze als Attraktoren wirken und schwach matchende Datensätze aus anderen Clustern abziehen oder wie unsichtbarer Kitt die Datensätze eines Clusters enger zusammenhalten.
Arbeitsliste
Hallo Normdaten-Freunde. Heute habe ich für euch mal wieder eine schöne Wartungsliste ;). Zu finden unter Benutzer:APPER/GND. Wurde jetzt einmalig gefüllt, wird wohl eher nicht regelmäßig aufgefüllt. In der Liste sind Artikel mit VIAF-Nummer, der eine GND zugeordnet ist - im Artikel findet sich aber keine GND. Diese sollte natürlich ergänzt werden - außerdem sind das entsprechend alles Artikel, die durch das Fehlen der "PND" keinen "TYP"-Parameter haben - man schlägt also gleich zwei Fliegen mit einer Klappe ;) --APPER\☺☹ 19:46, 21. Jun. 2012 (CEST)
- Achso: Es tauchen natürlich nicht nur Personen auf sondern auch Körperschaften etc. Die sind derzeit wohl erstmal einfach aus der Liste zu löschen bis die GKD/SWD zusammengeführt wurden. --APPER\☺☹ 19:48, 21. Jun. 2012 (CEST)
- Zwei Beispiele probiert, eineinhalb Nieten gezogen: Bei Patrick Cassidy irrt VIAF (WP hat die Nummer bereits dem richtigen zugeordnet) und bei Bernard B. Brodie war GNDName vermerkt (war aber individualisiert). Beim "Nachtragen" anhand dieser Wartungsliste muss man also ziemlich auf der Hut sein, insbesondere normaten.js ist ja recht leichtgläubig, was VIAF-Angaben angeht... -- Thomas Berger (Diskussion) 22:33, 21. Jun. 2012 (CEST)
- Ja, das ist auch der Grund, wieso ich da keinen Bot rangesetzt habe - man muss da schon alles von Hand anschauen --APPER\☺☹ 22:42, 21. Jun. 2012 (CEST)
- zB Thomas Gesterkamp hat via WP:PND/F (Anfrage im September 2011) einen individualisierten Datensatz bekommen. Per "Links auf diese Seite" kann man das ja fix prüfen, und dann ggf. auch bei den PND-Anfragen abhaken. -- Make (Diskussion) 23:55, 21. Jun. 2012 (CEST)
- Zwei Beispiele probiert, eineinhalb Nieten gezogen: Bei Patrick Cassidy irrt VIAF (WP hat die Nummer bereits dem richtigen zugeordnet) und bei Bernard B. Brodie war GNDName vermerkt (war aber individualisiert). Beim "Nachtragen" anhand dieser Wartungsliste muss man also ziemlich auf der Hut sein, insbesondere normaten.js ist ja recht leichtgläubig, was VIAF-Angaben angeht... -- Thomas Berger (Diskussion) 22:33, 21. Jun. 2012 (CEST)
Noch eine Arbeitsliste
Wer einfache Erfolgserlebnisse sucht, findet unter Benutzer:Gymel/VIAF-Zuordnungen eine Liste von Artikeln, die zum Stichtag 3. Juni 2012 gar keine Normdaten (oder PNDfehlt-Einträge) hatten, denen jedoch aus VIAF (über Umweg en:WP und Interwiki-Links) eine GND-Nummer zugeordnet werden kann (oder dennoch nicht: Die Qualität hängt von der Güte der VIAF-Automatismen ab). Diese Liste dürfte komplementär zu APPERs Liste im vorigen Abschnitt sein (denn wenn ein Artikel keine Normdaten-Vorlage trägt, kann er auch keine VIAF-Nummer direkt ausspucken). -- Thomas Berger (Diskussion) 02:23, 25. Jun. 2012 (CEST)
- Danke, schau gleich mal rein. Durchnummerierte Liste abzuarbeiten, ist motivierender als Kats mit über 10.000 Einträgen, obwohl die neue mit 6.924 Artikel auch nicht gerade kurz ist. BTW: Ich hatte dich, glaube ich, schon mal gefragt. Ist es aufwändig, eine aktualisierte Liste Parameterhäufigkeit in de:WP zu erstellen? Ich bin neugierig, was sich im Hinblick auf Parameter wie "SELIBR", "WP" etc. seit Anfang Mai getan hat. Aus dem Dump, den ich mir gezogen habe, werde ich nicht schlau. Gruß --Kolja21 (Diskussion) 02:34, 25. Jun. 2012 (CEST)
- Der Dump ist schon drei Wochen alt, bereinigt um zwischenzeitlich schon bereinigtes (Benutzer:APPER war gestern wohl fleißig) sieht es wie folgt aus (Stand 3. Juni 2012):
BNE : 1 BNF : 43 EST : 58 GKD : 6015 GKD-V1 : 486 GKD-V2 : 60 GND : 6790 GNDCheck : 2500 GNDName : 1659 GNDfehlt : 1478 IPI : 1 LCCN : 114531 NDL : 1776 PND : 174658 REMARK : 480 SELIBR : 2478 SWD : 7197 TYP : 9964 VIAF : 139809 WORLDCATID: 16 WP : 311 typ : 48
- Für den Juli-Dump gibt es dann wieder eine Auswertung unter eigener Überchrift, hoffentlich ist das mit "typ" nicht eingerissen, da es aber überwiegend Personenartikel mit altem "PND"-Parameter sind, ist es derzeit harmloser Schmutz, aber dennoch unschön...
- Artikel mit "Typ" oder "typ" sind jetzt auch unter Kategorie:Wikipedia:Normdaten-Typ falsch eingetragen eingetragen. Hab gerade schon zwei gefixt. --AndreasPraefcke (Diskussion) 19:41, 25. Jun. 2012 (CEST)
Hast du eine Präferenz, wie wir die abgearbeiteten Artikel markieren/löschen sollen? Nach meiner Löschung stimmt die Kapitelzählung nicht mehr. --Mai-Sachme (Diskussion) 21:35, 25. Jun. 2012 (CEST)
- Die Überschriften sollten nicht geändert werden, höchstens gelöscht, wenn ein Abschnitt ganz leer geworden ist. Die Binnennummerierung in den einzelnen Abschnitten hilft vielleicht beim Abzählen, wenn man sich mehrere Artikel gleichzeitig in Browser-Tabs lädt (ich selber arbeite eher in 10er- oder 20er-Portionen, 50er wären mir viel zu umfangreich). Die Hoffnung ist, dass sich die Bearbeitermassen schön gleichmässig auf die verschiedenen Abschnitte verteilen, so dass es keine BK's gibt. Es ist genug für alle da, derzeit sehe ich kein Problem darin, großzügig auch das zu löschen, was zu knifflig zu lösen oder zu mühsam zu melden ist oder einen ganzen Abschnitt zu löschen, wenn man bei seinen Bearbeitungen den Überblick verloren haben sollte: Spätestens wenn der nächste VIAF-Komplettabzug aufliegt werde ich die Liste mit aktuellen Daten komplett neu generieren und danach werden alle Nummern geändert sein, alle anderweitig erledigten verschwunden und alle unbearbeitet gestrichenen wieder da. Bitte "Bescheid", wenn die Liste dann besser mit fixen Eintragsnummern generiert werden sollte. -- Thomas Berger (Diskussion) 22:26, 25. Jun. 2012 (CEST)
Wow, tolle Liste! Man man... also dass wir irgendwann die Artikel voller Normdaten haben ist wohl unwahrscheinlich ;). Zur Parameterliste: ich habe ja jetzt den MMP-Account "authoritycontrol" auf dem Toolserver und eines der ersten Projekte dort ist ein Neuschreiben der Auswertung der Normdaten. In diesem Zusammenhang wird es demnächst möglich sein, Listen aller Parameter der Normdatenvorlage (wie hier grade geschehen) halbwegs aktuell auszugeben. Das ganze ist noch nicht fertig, aber ich habe schonmal ein paar Fälle gefunden und korrigiert, deshalb war ich fleißig ;). --APPER\☺☹ 00:50, 26. Jun. 2012 (CEST)
- +1. Klingt alles sehr motivierend. Danke Andreas für den Update! @APPER: Wird die Liste dann auch die Anzahl der GNDs nach TYP getrennt ausgeben? --Kolja21 (Diskussion) 03:46, 26. Jun. 2012 (CEST)
- Und noch eine Frage: Wieso gibt es noch 58x den Parameter EST? Sind die alle leer und mir daher beim Abarbeiten entgangen? Gibt es einen Trick, wie ich sie über das Feld "Suche" finde? (Die einfache Variante: "Normdaten EST" funktioniert bei Vorlagen leider nicht.) --Kolja21 (Diskussion) 04:05, 26. Jun. 2012 (CEST)
Gewünschte Liste
Wenn mir jemand (sobald ein neuer Dump da ist?) die GND-Werte der Artikel mit Vorlage:Theaterlexikon zusammenstellen könnte (PND sollte eigentlich nicht vorkommen, da ich alle Artikel beim Eintragen angefasst habe), wäre das eine schöne Vorarbeit für eine zu erstellende BEACON-Datei. Danke im voraus. --AndreasPraefcke (Diskussion) 19:39, 25. Jun. 2012 (CEST)
- Hallo Andreas, das wäre [15]? -- Thomas Berger (Diskussion) 21:26, 25. Jun. 2012 (CEST)
- Genau, dankeschön (ganz automatisch geht nicht, weil die Vorlage auch in thematisch nur verwandten Seiten und als Einzelnachweis in ganz anderen Artikeln eingesetzt wird). --AndreasPraefcke (Diskussion) 22:05, 25. Jun. 2012 (CEST) PS: Deine Datei scheint aber tatsächlich fehlerfrei zu sein (da nur Personen vorkommen und Dopplungen (etwa von "Fredy Lienhard") intelligent gestrichen wurden) --AndreasPraefcke (Diskussion) 22:09, 25. Jun. 2012 (CEST)
- Klar, aber ein passenderes Extraktionstool hatte ich nicht, und ich war zu faul die Datei noch einmal zu editieren um ihre Herkunft zu verschleiern... -- Thomas Berger (Diskussion) 22:11, 25. Jun. 2012 (CEST)
- Genau, dankeschön (ganz automatisch geht nicht, weil die Vorlage auch in thematisch nur verwandten Seiten und als Einzelnachweis in ganz anderen Artikeln eingesetzt wird). --AndreasPraefcke (Diskussion) 22:05, 25. Jun. 2012 (CEST) PS: Deine Datei scheint aber tatsächlich fehlerfrei zu sein (da nur Personen vorkommen und Dopplungen (etwa von "Fredy Lienhard") intelligent gestrichen wurden) --AndreasPraefcke (Diskussion) 22:09, 25. Jun. 2012 (CEST)