Wikipedia:Bots/Anfragen
Hier ist Platz, Bearbeitungs- und Änderungswünsche an die Botbetreiber zu notieren, die in „Handarbeit“ ausgeführt eher als Zumutung gelten können, zum Beispiel das Korrigieren von mehr als 50 Einbindungen einer verschobenen Vorlage (gilt nur für zu löschende Falschschreibungsweiterleitungen auf Vorlagen!). Wenn du Fragen hast, kannst du Botbetreiber auch im IRC-Channel [#wikipedia-de-bots
] Webchat erreichen. Für Besprechungen unter den Botbetreibern oder zur Koordination von wichtigen Änderungen (z. B. an der API) gibt es die Bot/Notizen.
- Für Rundschreiben (Einladungen zu Stammtischen usw.) gibt es auch die Funktion Hilfe:Massennachricht.
- Anfragen bitte begründen, gegebenenfalls mit Links auf relevante Diskussionen, und unterschreiben.
- Es gibt keine Verpflichtung der Botbetreiber, diesen Anfragen nachzukommen, und insofern auch keinen Anspruch auf Umsetzung eines Änderungswunsches.
- Größere Änderungen an Artikeln eines Themengebietes, z. B. an Einbindungen viel genutzter Vorlagen, bitte mit den jeweiligen Fachportalen oder -redaktionen abstimmen. Die Verantwortung für die Aktion liegt beim Anfragesteller.
- Vor dem Stellen einer Anfrage, die einen regelmäßigen Boteinsatz und keine einmalige (Massen-)Änderung betrifft, bitte ebenfalls das betroffene Portal bzw. Projekt informieren und den geplanten Boteinsatz dort diskutieren.
- Bei einem Boteinsatz ist oft noch Vor- und Nacharbeit durch den Anfragesteller notwendig, zum Beispiel nach Auflösung von Weiterleitungen die Kontrolle und das Stellen eines Schnelllöschantrages. Auch kann es immer Fälle geben, in denen der Bot nicht richtig arbeitet und die dann manuell nachgearbeitet werden müssen.
- Ent- oder Umkategorisierungen von Artikeln in die Kategoriendiskussion eintragen, dort diskutieren und dann in die Warteschlange des WikiProjekts Kategorien stellen.
- Ein einfaches Umbiegen von Links nach einer Verschiebung auf das neue Ziel wird grundsätzlich nicht vorgenommen. Umgebogen werden können Verweise auf zwingend zu löschende Weiterleitungen – wie z. B. bei Falschschreibungs-Weiterleitungen oder nach Verschiebungen falsch geschriebener Vorlagen.
- Änderungen der Signatur können in Fällen durchgeführt werden, in denen zahlreiche Links auf eine falsche Benutzerseite zeigen. Dies jedoch nur, falls die Korrektur nicht mittels Weiterleitungen möglich ist (beispielsweise bei im Rahmen der SUL-Finalisierung umbenannten Benutzern).
- Es werden keine Änderungen der Rechtschreibung zwischen zulässigen Versionen bzw. Variationen durchgeführt.
- Jeder Botbetreiber ist verpflichtet, die Sinnhaftigkeit vor Ausführung eines Änderungswunsches zu prüfen und bei Einsprüchen gegebenenfalls von der Änderung abzusehen (kein blindes Vertrauen in die Angemessenheit/Richtigkeit hier gestellter Anfragen).
- Für jede hier gelistete Anfrage gelten die auf Wikipedia:Bots genannten grundsätzlichen Regeln (zum Beispiel keine Änderungen im Benutzer- oder Wikipedia-Namensraum ohne Absprache).
- Bot-Anfragen (insbesondere nach Löschdiskussionen) sollten mindestens 3 Tage ruhen, um eine gegebenenfalls initiierte Löschprüfung nicht durch vollendete Tatsachen unmöglich zu machen. Bei offensichtlichen Botaufträgen (z. B. aus einer Portal-Diskussion für das Portal beschlossene Änderungen und dergleichen) ist diese Wartezeit nicht zwingend notwendig, desgleichen nicht für „Anfrage-Aufträge“, die keine Seiten in der Wikipedia ändern.
- Durchführung
- Die Botbetreiber sollen bitte vor Umsetzung den jeweiligen Punkt entsprechend kommentieren, um Überschneidungen zu vermeiden.
- Dazu sollte vor dem Botstart hier im entsprechenden Abschnitt die Vorlage InuseBot platziert werden:
- {{InuseBot|Botname|Betreiber}}
- Den Bot bitte sorgfältig beobachten!
- Bitte nach Erledigung den Punkt in der Liste als erledigt kennzeichnen.
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 2 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. Die Archivübersicht befindet sich unter Wikipedia:Bots/Anfragen/Archiv. |
Uploader von Logos ≠ Urheber
Bei Dateien mit dem Lizenzbaustein {{Bild-LogoSH}}
sollte beim Parameter Urheber
nie der Uploader stehen. Ich habe in den letzten Tagen mehrere solcher Fälle entdeckt und korrigiert. Mag jemand mit seinem Bot die Dateien in Kategorie:LogoSH-Bild durchgehen und allenfalls [[Benutzer:XXX|XXX]]
durch unbekannt
ersetzen? --Leyo 01:12, 4. Jun. 2010 (CEST)
- Verstehe ich nicht. Was ist wenn der Urheber wirklich das Logo hochgeladen hat? Oder wenn der Uploader eben den Urheber kennt?! Das erschließt sich mir nicht, wieso da zwangsweise unbekannt stehen muss. --Saibo (Δ) 01:23, 4. Jun. 2010 (CEST)
- Der erste Fall ist wohl sehr selten, der zweite Fall würde ja nicht tangiert. In den allermeisten Fällen steht dort der Benutzername fälschlicherweise, denn durch den Upload oder auch durch das Konvertieren in SVG wird dieser nicht zum Urheber. Oft wird auch beim Datum das Upload-Datum eingesetzt (Beispiel). --Leyo 01:32, 4. Jun. 2010 (CEST)
- In der Tat, das macht beides keinen Sinn und ist eigentlich falsch. Beim Feld Urheber sollte der "Urheber" stehen oder eben "unbekannt". -- Chaddy · D·B - DÜP 01:58, 4. Jun. 2010 (CEST)
- Nunja, einige Ausnahmen gibt es aber doch (z.B. den seltenen ersten Fall) - wie willst du die erkennen? Oder willst du die einfach auch "plattmachen"?
- Das mit dem Datum ist übrigens bei vielen Bearbeitungen ein Problem (wohl auch, weil es nirgends und schon gar nicht beim Ausfüllen der Vorlage richtig steht (ich kenne zumindest keine Stelle)). Der derivativeFX setzt auch das aktuelle Datum ein. Ich werde den Betreiber (Luxo) demnächst darauf ansprechen - stört mich schon länger. --Saibo (Δ) 02:41, 4. Jun. 2010 (CEST)
- Bspw. in Datei:10vorWien_Logo.jpg bezieht sich der Urh-Vermerk explizit auf denjenigen, der das Bild erstellt bzw. fotografiert hat. Zählt das im Ggs zu anderen Fotografien hier nicht? - @xqt 06:26, 4. Jun. 2010 (CEST)
- Ich habe die Angaben mal nach meinem Gutdünken korrigiert. --Leyo 09:46, 4. Jun. 2010 (CEST)
- Bspw. in Datei:10vorWien_Logo.jpg bezieht sich der Urh-Vermerk explizit auf denjenigen, der das Bild erstellt bzw. fotografiert hat. Zählt das im Ggs zu anderen Fotografien hier nicht? - @xqt 06:26, 4. Jun. 2010 (CEST)
Vielleicht hilft es zu wissen, wie viele Dateien es überhaupt betrifft. Wenn es nicht allzu viele sind, wäre eine Liste, die händisch abgearbeitet werden kann, besser. --Leyo 23:30, 7. Jun. 2010 (CEST)
- In 5. Hochrechnung sinds vielleicht 544 - @xqt 18:07, 11. Jun. 2010 (CEST)
- Doch etwas viel für händisch… Vielleicht erstmal so ca. 20 per Bot machen, die dann kontrolliert werden können? --Leyo 18:14, 11. Jun. 2010 (CEST)
- Erst mal haben hätten sollen. Muß mal gucken, was in der Spielebox alles drin ist. - @xqt 18:32, 11. Jun. 2010 (CEST)
- Wenn's per Bot zu kompliziert oder zu mühsam ist, kannst du mir auch einfach eine Liste machen. --Leyo 16:18, 21. Jul. 2010 (CEST)
- Erst mal haben hätten sollen. Muß mal gucken, was in der Spielebox alles drin ist. - @xqt 18:32, 11. Jun. 2010 (CEST)
- Doch etwas viel für händisch… Vielleicht erstmal so ca. 20 per Bot machen, die dann kontrolliert werden können? --Leyo 18:14, 11. Jun. 2010 (CEST)
Wie sieht es nun aus mit dem Botauftrag (automatisch korrigieren oder manuell abzuarbeitende Liste erstellen)? Wenn niemand kann und mag, dann kann die Anfrage auch archiviert werden. Aber ich hoffe jetzt mal noch… :-) --Leyo 15:23, 2. Dez. 2010 (CET)
- 942/34088 Dateien gefunden: Benutzer:GiftBot/LogoSH-Bild-Liste. Einen Teil der Angaben kann man automatisch entfernen: Ich habe z.B. viele Urheberangaben von Marsupilami gesehen, die kann man, glaube ich, alle entfernen, da keine weiteren Angaben enthalten (aber soll die Information eventuell woanders hin?). Für den Rest muss ich mir was einfallen lassen, oder wir machen das per Hand. – Giftpflanze 06:38, 5. Dez. 2010 (CET)
- Vielen Dank! Ich habe mal mit dem Abarbeiten angefangen, kann es aber derzeit nicht im grossen Stil machen. Botunterstützung wäre natürlich sowieso praktisch. Beispielsweise könnte
PDF konvertiert von XXX
,Quelle konvertiert von XXX
,Vektorisiert von XXX
undSVG erzeugt von XXX
nach „Anmerkungen“ verschoben werden (ev. mit zusätzlchem<br />
). Unter „Urheber“ käme dann einfachunbekannt
hin. Damit würde die Liste schon um ein gutes Stück kürzer. --Leyo 09:10, 7. Dez. 2010 (CET)- Was ist mit Urheber=[[Benutzer:…[|…]]], also wo nur der Benutzername steht, ohne ein Bearbeitungshinweis, soll das, wie im Testlauf gemacht, als „hochgeladen von …“ in die Anmerkungen, oder soll das ersatzlos gestrichen werden? Was ist mit Datei:Bahlsen TET Warenzeichen.jpg, wer ist da der Urheber? – Giftpflanze 01:51, 9. Dez. 2010 (CET)
- Die bisherigen Bot-Edits, die ich mir angeschaut habe, sehen gut aus.
- Chaddy hat sich dieses Bilds angenommen. Meines Erachtens ist die Variante mit „hochgeladen von …“ besser. Das ist auch für die Fälle, wo eigentlich {{Logo}} statt {{Bild-LogoSH}} drinstehen sollte, besser. Vielleicht könntest du beim Bearbeitungskommentar deines Bots noch einen Link auf diesen Abschnitt hier hinzufügen. --Leyo 23:18, 9. Dez. 2010 (CET)
- Vorlage:Logo und Vorlage:Bild-LogoSH klingen für mich als Laien ziemlich gleich. Muss ich für den Botauftrag da irgendetwas beachten/ersetzen? Fotos lasse ich jetzt erstmal außen vor. Beabeitungskommentar wird ergänzt. Und danke für die Auskunft :) – Giftpflanze 07:26, 10. Dez. 2010 (CET)
- Vorlage:Logo ist vor allem für Bilder gedacht, wo das Logo nur ein Bestandteil ist.
- Wäre es ein erheblicher Aufwand, die Liste in eine sortierbare Tabelle (Spalten: Dateiname, Text bei Urheber, Uploader) umzuformatieren? Das würde es IMHO erleichtern zu sehen, wo der Bot hilfreich wäre und was besser von Hand korrigiert wird. --Leyo 14:00, 12. Dez. 2010 (CET)
- Noch was: Verwaiste Dateien könnten durch eine bessere Version ersetzt oder in nun gelöschten Artikeln eingebunden gewesen sein. Diese können ggf. gelöscht werden. Eine Kennzeichnung wäre daher praktisch. --Leyo 14:13, 13. Dez. 2010 (CET)
- Verwaiste Dateien sind Dateien, die nicht eingebunden werden? – Giftpflanze 14:17, 13. Dez. 2010 (CET)
- Ja, aber nur in Bezug auf den ANR. --Leyo 14:26, 13. Dez. 2010 (CET)
- Verwaiste Dateien sind Dateien, die nicht eingebunden werden? – Giftpflanze 14:17, 13. Dez. 2010 (CET)
- Vorlage:Logo und Vorlage:Bild-LogoSH klingen für mich als Laien ziemlich gleich. Muss ich für den Botauftrag da irgendetwas beachten/ersetzen? Fotos lasse ich jetzt erstmal außen vor. Beabeitungskommentar wird ergänzt. Und danke für die Auskunft :) – Giftpflanze 07:26, 10. Dez. 2010 (CET)
- Was ist mit Urheber=[[Benutzer:…[|…]]], also wo nur der Benutzername steht, ohne ein Bearbeitungshinweis, soll das, wie im Testlauf gemacht, als „hochgeladen von …“ in die Anmerkungen, oder soll das ersatzlos gestrichen werden? Was ist mit Datei:Bahlsen TET Warenzeichen.jpg, wer ist da der Urheber? – Giftpflanze 01:51, 9. Dez. 2010 (CET)
- Vielen Dank! Ich habe mal mit dem Abarbeiten angefangen, kann es aber derzeit nicht im grossen Stil machen. Botunterstützung wäre natürlich sowieso praktisch. Beispielsweise könnte
Abgeordnetenbiografien bei bundestag.de
Wie siehts jetzt aus? Kann das ein Bot erledigen? --Nuuk 13:06, 14. Jun. 2010 (CEST)
- Klingt nach MerlBot... --Guandalug 13:19, 14. Jun. 2010 (CEST)
- Wenn mir jemand sagen könnte wie man vom alten Namen zum Neuen kommt. Merlissimo 11:52, 15. Jun. 2010 (CEST)
- Soweit ich das sehe stellt der Bundestag nur noch die aktuellen Abgeordneten auf der Seite dar. Alle anderen finden sich nur noch übers Archiv. Bspw. Ulrich Adam hat jetzt http://webarchiv.bundestag.de/archive/2007/0206/mdb/bio/A/adam_ul0.html --Wikijunkie Disk. (+/-) 03:23, 17. Jun. 2010 (CEST)
- Das ist klar, aber wir wollen ja nicht in Archiv, sondern z.b. von http://www.bundestag.de/bundestag/abgeordnete/bio/B/baumagu0.html nach http://www.bundestag.de/bundestag/abgeordnete17/biografien/B/baumann_guenter.html Merlissimo 03:55, 17. Jun. 2010 (CEST)
- Und was machst du mit den Links bei den ehemaligen Abgeordneten? Da funktioniert das ja so wie du willst nicht. Da wirst du notgedrungen übers Archiv gehen. --Wikijunkie Disk. (+/-) 08:56, 17. Jun. 2010 (CEST)
- Das ist klar, aber wir wollen ja nicht in Archiv, sondern z.b. von http://www.bundestag.de/bundestag/abgeordnete/bio/B/baumagu0.html nach http://www.bundestag.de/bundestag/abgeordnete17/biografien/B/baumann_guenter.html Merlissimo 03:55, 17. Jun. 2010 (CEST)
- Soweit ich das sehe stellt der Bundestag nur noch die aktuellen Abgeordneten auf der Seite dar. Alle anderen finden sich nur noch übers Archiv. Bspw. Ulrich Adam hat jetzt http://webarchiv.bundestag.de/archive/2007/0206/mdb/bio/A/adam_ul0.html --Wikijunkie Disk. (+/-) 03:23, 17. Jun. 2010 (CEST)
- Wenn mir jemand sagen könnte wie man vom alten Namen zum Neuen kommt. Merlissimo 11:52, 15. Jun. 2010 (CEST)
Das ist eigentlich ein klarer Fall für eine Linkvorlage. Wenn jetzt geändert werden muss, dann sollten gleich Nägel mit Köpfen gemacht und eine Vorlage eingebunden werden. Der variable Teil kommt in Parameter. So vermeiden wir ggf. zukünftige Massenedits. Darüber hinaus bedarf es einer Änderungsliste alte URL -> neue URL, denn die Änderungen sind ja nicht ganz systematisch. ÅñŧóñŜûŝî (Ð) 09:47, 17. Jun. 2010 (CEST)
Häufigkeitsanalysen von Beklammerung
Werte Kollegen,
Ich möchte ein paar Auswertungen mit Bezug auf den Gebrauch von Klammerlemmata machen und benötige dafür zunächst ein Tool, mit dem ich Häufigkeiten von bestimmten Beklammerungen ermitteln kann.
Der Kontext der Anfrage ergibt sich hieraus.
Ich möchte so nach und nach verschiedene Kategorien abklappern und die "Popularität" bestimmter Klammerzusätze ermitteln. Daraus ergeben sich dann Aussagen wie
- Wenn ein Namenskonflikt auftritt, wird bei Büchern häufig (Buch), seltener (Roman) angefügt
- Im Bereich Xyz wird neben der geschriebenen Konvention (abcd) auch häufig (efgh) verwendet.
Ich kann zwar SQL, habe aber keine Ahnung, wie man konkret die Datenbank abfragt. Die Query müsste ungefähr so aussehen
(Nur zur Verdeutlichung des Prinzips, Datenbankstruktur und Feldnamen frei erfunden) SELECT SUBSTRING(a.name, CHARINDEX(a.name, '(') +1, LEN(a.name)-CHARINDEX(a.name, '(')-1) AS kz, COUNT(*) AS cnt FROM categories AS c INNER JOIN catart AS ca ON c.id=ca.catid INNER JOIN articles AS a ON ca.artid-a.id WHERE CHARINDEX(a.name, '(')>0 AND c.name=???????????????' GROUP BY SUBSTRING(a.name, CHARINDEX(a.name, '(') +1, LEN(a.name)-CHARINDEX(a.name, '(')-1)
Im Grunde stell' ich mir etwas in der Art vom Contributors-Tool (oder eins von den anderen) vor, weiss aber nicht, wer, wie, was usw. ...
Danke für's Interesse, Hilfe und/oder Hinweise. --Normalo 17:13, 17. Jul. 2010 (CEST)
- Wenn du SQL kannst, wäre es nicht sinnvoll die Abfragen selbst durchzuführen? Unter http://download.wikimedia.org/dewiki/latest/ kannst du dir die Datenbanktebellen page und categorylinks herunterladen. Das sind die beiden, die du brauchst.
- Ansonsten muss man nach '_(' suchen. Wenn man nur Klammer-Auf ohne Unterstrich sucht bekommt du die ganzen Chemikalien in der Ergebnisliste.
- Für ein Live-Tool brauchen die Queries zu lange. Queries per Shell laufen lassen und das Ergebnis auf eine Seite ausgeben ist zwar kein Problem, aber für solch ein Projekt und für dich zu unflexibel, wenn du jedes mal neu hier anfragst und 'nen halben Tag warten musst.
- Beim "bauen" der SQL-Queries kann ich dir helfen. Du müsstest dir nur mysql lokal installieren. Merlissimo 19:08, 20. Jul. 2010 (CEST)
- Lokaler Download und/oder Installation sind leider keine Option. Ich weiss zwar, dass es die Anfrageseite für Queries gibt, aber es wäre äusserst umständlich, für jede Kategorie immer wieder neue Anfragen zu stellen.
- Alternativ fällt mir nur noch Datenbankabfrage per Javascript und Ajax ein. Gibt es irgendwo-wie-wer ein (leidlich verständliches) Muster, das man sich eventuell anpassen kann? Unendlich viel Zeit und Energie kann ich da nicht reinstecken. --Normalo 18:55, 23. Jul. 2010 (CEST)
- Was meinst du mit "Datenbankabfrage per Javascript und Ajax"? (ich hoffe, das war in Ordnung, dass ich die Unterschrift da weggemacht habe?) --TheJH disk 19:15, 23. Jul. 2010 (CEST)
- Alternativ fällt mir nur noch Datenbankabfrage per Javascript und Ajax ein. Gibt es irgendwo-wie-wer ein (leidlich verständliches) Muster, das man sich eventuell anpassen kann? Unendlich viel Zeit und Energie kann ich da nicht reinstecken. --Normalo 18:55, 23. Jul. 2010 (CEST)
- Vermutlich die mw:API. Du kannst dir mit der API die categorymembers geben lassen und dann auf Klammern prüfen. Unterkategorien lassen sich damit natürlich betrachten. Dann eher per WP:CatScan eine Liste aller Seitennamen der Kategorie geben lassen und diese auf Klammern prüfen. Da ich deine Möglichkeiten nicht kenne, letztes geht auch mit Excel (TEIL, SUCHEN, LÄNGE etc. gibt es dort) Der Umherirrende 19:31, 23. Jul. 2010 (CEST)
- Ich habe mal ein bischen rumgebaut. Vielleicht ist das doch als Tool machbar. Meine erste Version und gleichzeitig hoher DB-Auslastung brauche 6 min (daher meine Aussagte oben). Gerade ist die DB-Auslastung deutlich geringer und brauchte nur noch 10 Sekunden. (Getestet mit Kategorie Buch). Jetzt muss ich das nur von Shell-Skript auf eine Scriptsprache umbauen, aber jetzt keine Zeit mehr für. Kann jemand anderes versuchen oder ich in den nächsten Tagen. Hier mein derzeitiges SGE-Skript (genannt Klammer.qsub):
- Vermutlich die mw:API. Du kannst dir mit der API die categorymembers geben lassen und dann auf Klammern prüfen. Unterkategorien lassen sich damit natürlich betrachten. Dann eher per WP:CatScan eine Liste aller Seitennamen der Kategorie geben lassen und diese auf Klammern prüfen. Da ich deine Möglichkeiten nicht kenne, letztes geht auch mit Excel (TEIL, SUCHEN, LÄNGE etc. gibt es dort) Der Umherirrende 19:31, 23. Jul. 2010 (CEST)
#! /bin/sh #$ -N Klammerhaeufigkeit #$ -hard #$ -l sqlprocs-s5=1 SQL="USE u_%USER%;" SQL="$SQL CREATE TEMPORARY TABLE catids (cid int PRIMARY KEY);" SQL="$SQL INSERT INTO catids SELECT page_id FROM dewiki_p.page WHERE page_title in ('%KAT%') AND page_namespace=14;" SQL="$SQL CREATE TEMPORARY TABLE cats (pid INT PRIMARY KEY, pt VARCHAR(255), done INT);" SQL="$SQL DROP PROCEDURE IF EXISTS mycreatecattree;" SQL="$SQL delimiter //;" SQL="$SQL CREATE PROCEDURE mycreatecattree()" SQL="$SQL BEGIN" SQL="$SQL SET @x = 0;" SQL="$SQL REPEAT" SQL="$SQL SET @x = @x + 1;" SQL="$SQL INSERT IGNORE INTO cats SELECT p.page_id, p.page_title, 0 FROM catids ci INNER JOIN dewiki_p.page p on cid=p.page_id where p.page_namespace=14;" SQL="$SQL INSERT IGNORE INTO catids SELECT cl_from FROM cats INNER JOIN dewiki_p.categorylinks ON pt = cl_to WHERE done=0;" SQL="$SQL UPDATE cats SET done=1 WHERE done=0;" SQL="$SQL UNTIL ROW_COUNT() = 0 OR @x > 20 END REPEAT;" SQL="$SQL END" SQL="$SQL //" SQL="$SQL delimiter ;//" SQL="$SQL CALL mycreatecattree();" SQL="$SQL CREATE TEMPORARY TABLE titles (title VARCHAR(255) PRIMARY KEY, bracket VARCHAR(255), INDEX(bracket));" SQL="$SQL INSERT INTO titles SELECT DISTINCT page_title, TRIM(TRAILING ')' FROM SUBSTRING_INDEX(page_title, '_(', -1)) FROM cats INNER JOIN dewiki_p.categorylinks ON pt = cl_to INNER JOIN dewiki_p.page ON cl_from = page_id WHERE page_namespace=0 AND page_title LIKE '%_(%)';" SQL="$SQL SELECT bracket, count(*) FROM titles GROUP BY bracket ORDER BY COUNT(*) DESC LIMIT 500;" SQL=`echo "$SQL" | sed "s/%USER%/${USER}/g"` SQL=`echo "$SQL" | sed "s/%KAT%/${KAT:-Buch}/g"` mysql -vvv -hdewiki-p.db -wBN dewiki_p -e "$SQL" > Klammerhaeufigkeit.txt
Aufruf mit qsub -v KAT="Buch" Klammer.qsub oder direkt in der Shell. Merlissimo 20:58, 23. Jul. 2010 (CEST)
tagesschau.de et al - Inhalte "verschwinden" --> Webcite?
Haie ihrs,
demnächst werden ja die Inhalte von tagesschau.de nach ein paar tagen verschwinden. Ziemlich blöd wenn sie in Fußnoten verwendet wurden. Kann "man" hierfür einen bot basteln der die fußnoten mit "tagesschau.de" erfasst und auf WebCite archiviert? - Sonst haben wir bald wohl eine ganze reihe toter links :o( ...Sicherlich Post / FB 09:51, 21. Jul. 2010 (CEST)
- Der Artikel sagt, dass das illegal ist, oder? Also, es anderen zu zeigen, meine ich. Vielleicht sollten wir stattdessen selbst ein Backup anlegen (nichtöffentlich) und für Zitatzwecke Ausschnitte in eine Metavorlage tun oder so? Erfordert dann allerdings Handarbeit für das Heraussuchen dieser Zitate. --TheJH disk 12:34, 21. Jul. 2010 (CEST)
- Achja: Ist es dafür nicht schon zu spät? Ein rekursiver wget-crawl sagt mir, dass auf www.tagesschau.de nur noch 173 Dateien sind, davon 113 mit "html" im Namen. --TheJH disk 12:39, 21. Jul. 2010 (CEST)
- Alle Links auf Unterseiten sind tot. --TheJH disk 12:53, 21. Jul. 2010 (CEST)
- @TheJH; hätte ja ein botbetreiber tun können der in einem land lebt wo das erlaubt ist :D .... hmm, ich dachte es geht noch. aber wenns schon zu spät ist; blöd :( ...Sicherlich Post / FB 14:00, 21. Jul. 2010 (CEST)
- Alle Links auf Unterseiten sind tot. --TheJH disk 12:53, 21. Jul. 2010 (CEST)
- die hier gehen aber noch (mit www davor) ...Sicherlich Post / FB 14:05, 21. Jul. 2010 (CEST)
- Hmm, scheint so zu sein, dass da ein paar störende "nofollow" u.ä. in den Headern stehen, wenn ich die ignoriere, bekomme ich deutlich mehr. Ich versuche mal, so viel wie möglich runterzuladen. --TheJH disk 14:38, 21. Jul. 2010 (CEST)
- 2,6GB und wachsend, schon über 24h lang heruntergeladen... tut mir Leid, aber meine Festplatte ist zu klein. :( Ich breche das jetzt ab, könnte das jemand anders mit einer großen Festplatte machen? --TheJH disk 22:57, 22. Jul. 2010 (CEST)
- Wenigstens die verlinkten 3392 Seiten (doppelte herausgefiltert) habe ich jetzt. --TheJH disk 18:00, 23. Jul. 2010 (CEST)
- 2,6GB und wachsend, schon über 24h lang heruntergeladen... tut mir Leid, aber meine Festplatte ist zu klein. :( Ich breche das jetzt ab, könnte das jemand anders mit einer großen Festplatte machen? --TheJH disk 22:57, 22. Jul. 2010 (CEST)
- Ich versuche mal mit dem Betreiber von en:User:WebCiteBOT Kontakt aufzunehmen. Vielleicht kann der aushelfen, vorausgesetzt, man gäbe im rechtzeitig ein Botflag, vorausgesetzt, es wäre ihm zeitlich möglich. --Matthiasb
(CallMeCenter) 07:47, 22. Jul. 2010 (CEST)
- Der Benutzer war am 23. Mai das letzte mal aktiv, nach ziemlich viel Attacken auf ihn in einem, was wir Adminproblem nennen. So glaube ich, daß wir von da keine Hilfe bekommen. :( --Matthiasb
(CallMeCenter) 08:07, 22. Jul. 2010 (CEST)
- Der Benutzer war am 23. Mai das letzte mal aktiv, nach ziemlich viel Attacken auf ihn in einem, was wir Adminproblem nennen. So glaube ich, daß wir von da keine Hilfe bekommen. :( --Matthiasb
- Hmm, scheint so zu sein, dass da ein paar störende "nofollow" u.ä. in den Headern stehen, wenn ich die ignoriere, bekomme ich deutlich mehr. Ich versuche mal, so viel wie möglich runterzuladen. --TheJH disk 14:38, 21. Jul. 2010 (CEST)
- hmm - niemand der so einen bot hat oder basteln könnte? Ich kenne auch jmd. der das unter seinem account laufen lassen würde. allerdings hat er keine Ahnung von Bots o.ä. es müsste also ziemlich idiotensicher zu bedienen sein ...Sicherlich Post / FB 16:04, 28. Jul. 2010 (CEST)
- Einen wikipedia-Account braucht man eigentlich nicht, sondern einen Webcite-Account. Dieser Webcite-Accountinhaber ist rechtlich Auftraggeber der Archivierung mit allen Konsequenzen.
- Man kann auf jeden Fall Wayback eine Mail schreiben, damit nochmal alles sicher crawlen und archivieren. Aufgrund der Zeitdifferenz von mind. sechs Monaten ist das kein Problem. OB das WebciteBot-Skript irgendwo verfügbar ist weiß ich nicht. Merlissimo 16:22, 28. Jul. 2010 (CEST)
- ein account bei Webcite? bisher ging das meines wissens ohne account?! ... und wer ist Wayback? Internet Archive? - ob die wohl gerade zuhören wenn ein zufälliger dahergelaufener Wikipedianer seinen archivierungswunsch äußert? :D ...Sicherlich Post / FB 16:25, 28. Jul. 2010 (CEST)
- Ja, bei Geocities haben sie sogar eine extra Projektseite eingerichtet gehabt um alle URLs zu bekommen. Eine Liste aller URLs von dewiki habe ich unter tools:~merl/sql/dewiki_tagesschau_de.txt hinterlegt - falls das wem weiterhilft. Merlissimo 16:35, 28. Jul. 2010 (CEST)
- Das Problem ist, daß jemand hergehen muß und den Kram auf Webcite zur Archivierung melden und den Archivlink auf irgendeine Weise dann in die entsprechenden Artikel reinmuß. Das zeitkritische ist dabei, daß die Seiten in den nächsten drei Tagen bei Webcite archiviert werden. Wer das tut, muß fast viertausend Links zu Webcite dokumentieren. Wann und wie man das ganze dann einpflegt (Wegwerfaccount?), das ist dann ein nachrangiges Problem, daß man auch noch im August oder September lösen kann.
- ein account bei Webcite? bisher ging das meines wissens ohne account?! ... und wer ist Wayback? Internet Archive? - ob die wohl gerade zuhören wenn ein zufälliger dahergelaufener Wikipedianer seinen archivierungswunsch äußert? :D ...Sicherlich Post / FB 16:25, 28. Jul. 2010 (CEST)
- @Merlissimo: Mit Webarchive ist das Problem, daß Tagesschau.de wohl seit 2007 nicht mehr gecrowlt wird (norobots?) – aber bis 2006 sind die Seiten wohl archiviert. Noarchive ist wohl nicht gesetzt, denn das Archivieren mit Webcite geht.
- Rein praktisch brauchen wir also einen Botbetreiber, der ein Skript schreibt, das die entsprechenden Seiten bei Webcite anmeldet, die von Webcite ausgegebene URL dokumentiert und später ausgibt. Idealerweise sitzt dieser Botbetreiber in den Staaten, weil da Fairuse gilt.
- Zu technischen Details: Hilft dir dieses PDF? --Matthiasb
(CallMeCenter) 17:07, 28. Jul. 2010 (CEST)
- In der robots.txt steht nichts gegen Wayback (User-Agent wäre ia_archiver). Das Problem ist wohl eher das nofollow, weshalb den Links nicht gefolgt wird, obwohl die Seiten selber kein noindex haben. Merlissimo 17:20, 28. Jul. 2010 (CEST)
- das Internetarchiv sagt frag alexa oder dmoz, alexa sagt frag dmoz. und dort konnte ich tagesschau.de nicht finden (unterseiten ja, aber nicht die seite an sich). deshalb auch mein Aufruf/Anfrage bei WP:FZW#dmoz-account-besitzer? ...Sicherlich Post / FB 17:25, 28. Jul. 2010 (CEST)
- Erschwerend kommt bei der Tagesschau hinzu, daß die älteren Tageeschaulinks alle per Redirect auf neuere URL-Muster umgestellt sind, d.h. der Link an sich existiert nicht mehr, es wird aber (noch) auf die aktuelle Seite weitergeleitet. --Matthiasb
(CallMeCenter) 17:52, 28. Jul. 2010 (CEST)
- In der robots.txt steht nichts gegen Wayback (User-Agent wäre ia_archiver). Das Problem ist wohl eher das nofollow, weshalb den Links nicht gefolgt wird, obwohl die Seiten selber kein noindex haben. Merlissimo 17:20, 28. Jul. 2010 (CEST)
mir scheint es ist schon zu spät :( dieses Schlusslicht lässt sich mit webcite schon nicht mehr archivieren; Fehlermeldung: "When WebCite tried to archive the page, it received a Page Not Found error from the website concerned." - obwohl ich die seite noch abrufen kann :( ...Sicherlich Post / FB 13:56, 29. Jul. 2010 (CEST)
- Muß irgendein anderer Fehler gewesen sein: http://www.webcitation.org/5raSNETMz
--Matthiasb (CallMeCenter) 17:23, 29. Jul. 2010 (CEST)
- oh gut! danke - aber ist halt auch nur so eine einzelaktion ... mail ans internetarchiv ist übrigens raus. aber wie gesagt ob die sich wirklich darum kümmern .oO - die haben Sicherlich vieles zu tun ...Sicherlich Post / FB 18:00, 29. Jul. 2010 (CEST)
- Die Inhalte sind
nun nicht mehr verfügbar, Fehler 404. --Matthiasbtw. bereits nicht mehr verfügbar -- Links vom Muster http://www.tagesschau.de/<ressort>/meldung<Nummer>.html gehen nicht mehr. --Matthiasb(CallMeCenter) 22:45, 31. Jul. 2010 (CEST)
(CallMeCenter) 11:59, 1. Aug. 2010 (CEST)
Dank eines Hinweises von Benutzer:Cirdan: das tagesschau-archiv findet sich unter http://depub.org/ damit ist die Botanfrag wohl nicht mehr so dringend auch wenn auf grund der unklaren dauerhaftigkeit ein "doppelt hält besser" sicher toll wäre ...Sicherlich Post / FB 23:05, 14. Sep. 2010 (CEST)
- Kann man einen Bot basteln, der die nicht mehr vorhanden Tagesschaulinks durch die depub-Links ergänzt? Z.B. Bot steuert den Einzelnachweislink http://www.tagesschau.de/aktuell/meldungen/0,1185,OID7217122,00.html an um den vom Tagesschau-Server nach http://www.tagesschau.de/inland/meldung6506.html auflösen zu lassen. Bot schaut ob http://depub.org/tagesschau/artikel/meldung6506/ existiert und ergänzt diesen Link im Artikel. --Mps 14:43, 15. Sep. 2010 (CEST)
- Hallo, es gibt einen Torrent von dem Zeug, von daher wird das nicht so schnell verschwinden: http://thepiratebay.org/torrent/5707087/tagesschau-de_Meldungen_1999-08_bis_2010-07.tar.bz2 --TheJH disk 23:37, 17. Sep. 2010 (CEST)
Hallo zusammen, ich habe mir gerade mal angesehen, ob und wie das ganze mit meinem Bot realisierbar wäre. Ich kam bis zu der Adresserzeugung des depub-Servers. "Bot schaut ob ... existiert und ergänzt diesen Link im Artikel.", so trivial hört sich das an aber ich weiß im Moment nicht, wie ich das testen könnte. Hat sich dazu jemand schonmal Gedanken gemacht? meldung111164 existiert, meldung11164 nicht. Die Antwort des Servers -> 200 (ok). Lediglich wenn ich die Verzeichnisstruktur wechsle, bekomm ich 404.
Optisch sieht man, dass der Artikel nicht da ist, weil kein Inhalt da ist. Aber ich kann ja schlecht gegen "Das angeforderte Dokument ist nicht vorhanden." testen, oder? Würde mich freuen, wenn sich das schonmal jemand näher betrachtet hatte und vielleicht schon einen Gedanken dazu hat. --Croesch 03:15, 24. Okt. 2010 (CEST)
- Ich habe jetzt mal mein Skript soweit fertig, dass ich zum Testen bereit bin. Mir ist noch keine bessere Möglichkeit eingefallen zu prüfen, ob die Seite auf depub existiert als einfach nach Das angeforderte Dokument ist nicht vorhanden zu suchen und zusätzlich auf den Antwortcode 404 zu testen.
- Mir stellen sich allerdings noch einige Fragen:
- Geht es nur um den Artikelnamensraum oder sollen die Links in allen Namensräumen geändert werden.
- Die Linkbeschriftung bleibt die vorherige? Also bei [Adresse Beschreibung] wird Adresse geändert, Beschreibung aber nicht!?
- Links die nicht aufgelöst werden können, bleiben bestehen oder werden entfernt?
- Muss geprüft werden, ob die Seite noch auf tagesschau.de verfügbar ist? MMn nicht, denn früher oder später verschwindet sie ja dort, also kann der Link doch gleich geändert werden, sollte der Artikel schon im Archiv vorhanden sein?
- Wie kann man einsehen, wie viele Artikel ungefähr betroffen sind
- Ist die Aufgabe erledigt, sobald die Änderungsaktion vorbei ist, oder soll später weiter regelmäßig geprüft werden, ob Tagesschaulinks vorhanden sind?
- Dazu würde mich mal eure Meinung interessieren, danke --Croesch 15:57, 24. Okt. 2010 (CEST)
- Habe mal zwei Edits durchgeführt: hier und hier <- to be commented.
- Ist das so gewollt? --Croesch 18:36, 24. Okt. 2010 (CEST)
- Es wäre in meinen Augen transparenter, wenn der urpsprüngliche Tagesschau-Link drinbliebe und dahinter etwa folgendes eingefügt würde: (depubliziert, Kopie auf Depub). Dann hätte man auch in dem Fall, dass depub vom Netz geht, auch wieder die ursprünglichen Links, die man in einem Offline-Dump finden oder auf ein neues Online-Archiv umbiegen könnte.--Cirdan ± 18:56, 24. Okt. 2010 (CEST)
- Ich finde das ist etwas zu viel des Guten. Behalten gut und schön, aber die Altlasten weiter mitschleppen? Und wieso soll der depub wieder vom Netz gehen? Reicht es nicht, dass man die alte Version des Links in der Historie hat? Man könnte den alten Link auch als Kommentar im Code lassen, aber ich würde ihn aus der Ansicht für den Benutzer entfernen. Es ist immerhin ein toter Link.
- Also ich finde, entweder komplett überschreiben, oder wenn behalten, dann so, dass der Betrachter es nicht sieht. Er hat ja kein Mehrnutzen daraus, im Gegenteil: Es stiftet für den Benutzer wohl Verwirrung. --Croesch 19:10, 24. Okt. 2010 (CEST)
- ob der alte link drinbleibt oder nicht; gibts Sicherlich pros und contras. aber auf keinen fall darf der tote link anklickbar sein - das wäre schlecht für leser. - das ausblenden wäre eine option ohne das die Fußnote "unendlich" lang wird...Sicherlich Post / FB 19:35, 24. Okt. 2010 (CEST)
- Also ich bin immer noch für nicht behalten, aber wenn behalten, dann ausgeblendet: <!-- depubliziert: alterLink-->[neuerLink Beschreibung]. Wäre das eine Lösung oder kann der alte Link doch rausgenommen werden? --Croesch 19:59, 24. Okt. 2010 (CEST)
- Dass es depubliziert wurde geht ja ziemlich klar aus dem Mirror hervor. Den Alten Link bräuchten wir also nur noch für den Fall, dass depub aus irgend einem Grund verschwindet. Ich finde ganz ausschließen können wir das nicht und sollten den entsprechend mitführen. Reicht dann aber IMO im Quelltextkommentar.--goiken 20:05, 24. Okt. 2010 (CEST)
- Naja, ganz unrecht habt ihr ja nicht. Aus einem Kommentar kann man den Link später auch leichter wieder finden als aus der Historie. Dann nehme ich das mal so in mein Skript auf. --Croesch 20:08, 24. Okt. 2010 (CEST)
- Dass es depubliziert wurde geht ja ziemlich klar aus dem Mirror hervor. Den Alten Link bräuchten wir also nur noch für den Fall, dass depub aus irgend einem Grund verschwindet. Ich finde ganz ausschließen können wir das nicht und sollten den entsprechend mitführen. Reicht dann aber IMO im Quelltextkommentar.--goiken 20:05, 24. Okt. 2010 (CEST)
- Also ich bin immer noch für nicht behalten, aber wenn behalten, dann ausgeblendet: <!-- depubliziert: alterLink-->[neuerLink Beschreibung]. Wäre das eine Lösung oder kann der alte Link doch rausgenommen werden? --Croesch 19:59, 24. Okt. 2010 (CEST)
- ob der alte link drinbleibt oder nicht; gibts Sicherlich pros und contras. aber auf keinen fall darf der tote link anklickbar sein - das wäre schlecht für leser. - das ausblenden wäre eine option ohne das die Fußnote "unendlich" lang wird...Sicherlich Post / FB 19:35, 24. Okt. 2010 (CEST)
- Es wäre in meinen Augen transparenter, wenn der urpsprüngliche Tagesschau-Link drinbliebe und dahinter etwa folgendes eingefügt würde: (depubliziert, Kopie auf Depub). Dann hätte man auch in dem Fall, dass depub vom Netz geht, auch wieder die ursprünglichen Links, die man in einem Offline-Dump finden oder auf ein neues Online-Archiv umbiegen könnte.--Cirdan ± 18:56, 24. Okt. 2010 (CEST)
Falls keiner Einwände hat, lasse ich den Bot ab morgen peu à peu mit der Arbeit beginnen. --Croesch 21:02, 24. Okt. 2010 (CEST)
- Der Punkt warum sich lange niemand an den Job hier gemacht hatte, ist dass da noch vieles in Bewegung ist. depub.org war Anfang Oktober komplett durch PIR gesperrt worden. Seitdem war das Ganze unter depub.info erreichbar. Erst seit kurzen auch wieder unter debug.org. Ich denke die Domain wird in Zukunft noch öfters wechseln. Insofern sollte man die URL durch eine Vorlage generieren lassen. Merlissimo 21:20, 24. Okt. 2010 (CEST)
- Hm, ok.
Kann man die Vorlage gleich so einrichten, dass man ihr den Suffix der Tagesschau-Adresse mitgibt und sie die depub-Adresse daraus baut? Dann könnte man auch die alte Adresse behalten und hätte nicht zwei im Code stehen. Zur Not kann man ja eine Key/Value-Tabelle aufstellen, in der die alten Suffixe mit den neuen in Verbindung gebracht werden. Ist das machbar? Oder wie wäre es besser?--Croesch 21:33, 24. Okt. 2010 (CEST)- Ich kenne mich in der Vorlagenprogrammierung nicht aus, aber würde Folgender Vorschlag ausreichen:
- <includeonly>[http://depub.org/tagesschau/artikel/{{{1}}}/ {{{2}}}]<!-- {{{3}}} ---></includeonly>
- Vielleicht ist das zu kurz gedacht, aber wenn man alle drei Sachen (Ordner bei depub, Beschreibung und alte Adresse) mitgibt, kann man die Vorlage bei Änderungen der Server der Tagesschau beliebig anpassen. --Croesch 23:24, 24. Okt. 2010 (CEST)
- Habe mal ein wenig getestet und Folgendes funktioniert wie ich mir das vorstellen würde. Man übergibt url, descr, oldUrl. Ist url nicht vorhanden, wird oldUrl gesetzt, ist descr vorhanden wird sie als Linkbeschreibung, gesetzt, ansonsten wird Linktext gesetzt. Fraglich ist, ob url optional sein soll:
- Hm, ok.
- <includeonly>{{#if: {{{url|}}} |[http://depub.org/tagesschau/artikel/{{{url}}}/ {{#if: {{{descr|}}} |{{{descr}}}|http://depub.org/tagesschau/artikel/{{{url}}}/}}]<!-- {{{oldUrl}}} -->|[{{{oldUrl}}} {{#if: {{{descr|}}} |{{{descr}}}|{{{oldUrl}}}}}]}}</includeonly>
- Wenn man es so einsetzt können auch Links, die zur Zeit nicht aufgelöst werden können mit der Vorlage dargestellt werden und später kann man anhand der Parameter dann auf eventuelle Serverumzüge reagieren. --Croesch 09:03, 25. Okt. 2010 (CEST)
- Was genau enthält denn url? Die neue Adresse? Oder ist es bloß die genaue Bezeichnung des Artikels, wie sie auch im Tagesschau.de-Link vorkommt?--Cirdan ± 11:20, 25. Okt. 2010 (CEST)
- Im obigen Beispiel wurde der Link http://www.tagesschau.de/aktuell/meldungen/0,1185,OID7217122,00.html nach http://www.tagesschau.de/inland/meldung6506.html aufgelöst. "url" würde dann in diesem Fall "meldung6506" enthalten, und oldURL="http://www.tagesschau.de/aktuell/meldungen/0,1185,OID7217122,00.html" --Croesch 11:26, 25. Okt. 2010 (CEST)
- Achso, ok, alles klar. Die neue URL sollte (so sie abgerufen werden kann) auf jeden Fall mit rein. In diesem Fall lieber zu viele als zu wenig Daten speichern.--Cirdan ± 11:30, 25. Okt. 2010 (CEST)
- Du meinst, dass zusätzlich zu den drei Parametern noch die komplette neue URL übergeben werden soll? (url ist hier irreführend und soll nur den Ordner auf dem depub-Server enthalten). Oder reichen die drei Parameter aus? --Croesch 11:36, 25. Okt. 2010 (CEST)
- Achso, ok, alles klar. Die neue URL sollte (so sie abgerufen werden kann) auf jeden Fall mit rein. In diesem Fall lieber zu viele als zu wenig Daten speichern.--Cirdan ± 11:30, 25. Okt. 2010 (CEST)
- Im obigen Beispiel wurde der Link http://www.tagesschau.de/aktuell/meldungen/0,1185,OID7217122,00.html nach http://www.tagesschau.de/inland/meldung6506.html aufgelöst. "url" würde dann in diesem Fall "meldung6506" enthalten, und oldURL="http://www.tagesschau.de/aktuell/meldungen/0,1185,OID7217122,00.html" --Croesch 11:26, 25. Okt. 2010 (CEST)
- Was genau enthält denn url? Die neue Adresse? Oder ist es bloß die genaue Bezeichnung des Artikels, wie sie auch im Tagesschau.de-Link vorkommt?--Cirdan ± 11:20, 25. Okt. 2010 (CEST)
- Wenn man es so einsetzt können auch Links, die zur Zeit nicht aufgelöst werden können mit der Vorlage dargestellt werden und später kann man anhand der Parameter dann auf eventuelle Serverumzüge reagieren. --Croesch 09:03, 25. Okt. 2010 (CEST)
Ich würde vorschlagen die Vorlage TSLink zu nennen. Dabei drei Parameter ("ordner", "beschr", "alteUrl"). Dabei Ist Ordner der letzte Teil der depub-URL ohne "/". Die komplette neue Adresse benötigt man mMn nicht. Beschr ist die Link-Beschreibung/-iftung, die auch bislang verwendet wurde. alteUrl spricht für sich und enthält die bisher verwendete URL. Die Vorlage bastelt dann den Link zum depub-Server zusammen und bei Server-Änderungen kann darauf reagiert werden. Sollte der Server komplett vom Netz gehen bleibt der Parameter alteUrl, der dann wieder genutzt werden kann .. oder für die Erzeugung einer neuen Url dienen kann. Gibt es etwas, was dagegen spricht, diese Vorlage so zu verwenden und die Links dann in die Vorlage umwandeln? --Croesch 20:07, 25. Okt. 2010 (CEST)
- Ja, die Idee ist gut, aber ich würde die Felder ausschreiben. Das kostet nur ein paar Bytes (was kein Problem ist) und macht es für Benutzer einfacher, die Vorlage zu verstehen, ohne erst die Dokumentation lesen zu müssen. Ich würde die Vorlage Tagesschau nennen und die Felder ID („ordner“ ist ja nicht ganz korrekt, oder? Alternativ auch Artikel), Beschreibung und AlteURL. Aber das ist ja mehr kosmetisch, inhaltlich klingt das sehr vernünftig.--Cirdan ± 22:42, 25. Okt. 2010 (CEST)
Kompliment, finde es toll, dass ihr dies macht. Ich frage mich nur, wie das rechtlich aussieht... -- KurtR 01:47, 26. Okt. 2010 (CEST)
- Gut, dann schreibe ich die Felder aus. Wieso soll das rechtlich ein Problem sein? Wir verlinken doch nur auf eine andere Website. Und der Server depub ist nicht da, dass keiner mehr die Inhalte sehen darf, sondern dass sie nicht auf der eigentlichen Website zu finden sind. Sie sollten "versteckt" werden, aber nicht unzugänglich sein. So habe ich das verstanden und sehe da kein Problem. --Croesch 09:25, 26. Okt. 2010 (CEST)
- kannst du bevor du loslegst ein bsp.-edit mit der vorlage machen? (oder habe ich den gerade nur übersehen?) - denn technisch klingt das gut. aber ich habe die vermutung das wir den Quelltext mit ziemlich viel meta-zeugs zuschütten. das ist sehr unsexy; das macht das bearbeiten an sich schwerer und gerade für neueinsteiger ist das IMO eine ziemlich hürde ...Sicherlich Post / FB 12:36, 26. Okt. 2010 (CEST)
- Ja
mache ich heute Abend und dann können wir nochmal darüber reden. --Croesch 12:45, 26. Okt. 2010 (CEST): Erledigthier. Eventuell kann man sich überlegen das http://www.tagesschau.de/ aus der "AlteURL" zu entfernen und von der Vorlage erzeugen zu lassen. Würden den Code etwas übersichtlicher machen. --Croesch 18:11, 26. Okt. 2010 (CEST)
- Ja
Wie sieht es nun aus? Kann das so gemacht werden oder ist noch was zu Ändern an der Vorlage und Art der Linkeinbindung? --Croesch 21:47, 27. Okt. 2010 (CEST)
- IMO: okay. ... zwar bin cih kein vorlagenfan da dass gerade für einsteiger zusätzlicher unverständlicher meta-kram ist, aber in dem fall fällt mir nix besseres ein. alternativ wäre ein ziemlich langer text im Quelltext. ...Sicherlich Post / FB 22:18, 27. Okt. 2010 (CEST)
- Ok, nur eine Frage noch bevor ich anfange, soll das http://www.tagesschau.de/ aus dem Parameter AlteURL rausgenommen werden, da dies überall gleich ist? Und die Vorlage dies entsprechend anhängen? Oder ist das so ok? --Croesch 10:44, 28. Okt. 2010 (CEST)
- IMO nein. würde es zwar kürzer machen aber für uneingeweihte wäre es unverständlich ...Sicherlich Post / FB 10:48, 28. Okt. 2010 (CEST)
- Gut, dann werde ich es so lassen und
wenn ichheute Abenddazu kommedie ersten Edits tätigen :) --Croesch 11:53, 28. Okt. 2010 (CEST)
- Gut, dann werde ich es so lassen und
- IMO nein. würde es zwar kürzer machen aber für uneingeweihte wäre es unverständlich ...Sicherlich Post / FB 10:48, 28. Okt. 2010 (CEST)
- Ok, nur eine Frage noch bevor ich anfange, soll das http://www.tagesschau.de/ aus dem Parameter AlteURL rausgenommen werden, da dies überall gleich ist? Und die Vorlage dies entsprechend anhängen? Oder ist das so ok? --Croesch 10:44, 28. Okt. 2010 (CEST)
Der Bot ist nun über alle Links, die dieser Query brachte, drübergelaufen. Es sind etwas mehr als 500 Links auf tagesschau.de noch vorhanden. Davon ist ein Großteil Videos, bei denen ich keine Ahnung habe, wo die Archivbeiträge liegen, wenn es sie überhaupt gibt. Auch einige Links sind dabei, die beim Aufruf direkt zur Startseite von tagesschau.de leiten. Und womöglich gibt es einige Links, die nicht im Archiv sind (evtl. noch nicht). Wie soll mit den restlichen Links verblieben werden? Sind noch andere Namespaces dran?
Ich schaue morgen mal durch die Logs, denn es gibt noch eine handvoll Artikel, die der Bot wegen Speicherproblemen nicht aufrufen konnte, die werde ich dann noch bearbeiten. --Croesch 02:30, 30. Okt. 2010 (CEST)
Dazu noch eine Anmerkung: Bisher hat der Bot "lediglich" die normalen Links gefunden: [Adresse Beschr] und [Adresse], auch <ref>Adresse</ref>. Sämtliche "Spielereien" mit Vorlagen sind noch nicht abgedeckt und können auch noch in den 500 Artikeln stecken, beispielsweise eine Verlinkung durch die Vorlage "cite web". Da müsste man sich noch Gedanken machen, wie man solche Dinge behandelt. --Croesch 02:49, 30. Okt. 2010 (CEST)
- Ich habe den Bot nun nochmal mit ein paar erweiterten Suchmustern laufen lassen. Es sind nun noch rund 500 Links auf tagesschau.de im ANR vorhanden. Ich gehe davon aus, dass diese Bearbeitung keinen anderen Namensraum betreffen soll. Die restlichen Artikel lassen sich in meinen Augen in folgende Kategorien unterteilen:
- Links auf tagesschau.de aus einer Vorlage heraus, meist Vorlage:Internetquelle, Vorlage:cite news oder Vorlage:cite web. Dabei sind auch einige bereits mit der Archiv-URL versehen.
- Links auf Multimedia-Beiträge, dort ist die Erzeugung des Archiv-Links entweder anders oder sie werden nicht archiviert.
- Links die selbst manuell nicht auflösbar sind, da beim Aufruf auf tagesschau.de weitergeleitet wird, ohne einen Hinweis auf den Zielartikel zu geben.
- Links auf noch aktuelle Beiträge, die im Archiv noch nicht vorhanden sind.
- Da ist jetzt die Frage, ob und wie weitergemacht werden soll. --Croesch 15:16, 31. Okt. 2010 (CET)
- Hallo! Ich freue mich, dass die Wikipedia sich durch diesen Bot-Auftrag auch systematisch mit dem Thema Depublizieren beschäftigt! Ich finde die Vorlage schon einmal sehr nützlich! Ich glaube aber, dass noch einiges verbessert werden könnte. Kompatibilität mit anderen Vorlagen wie Vorlage:Webarchiv und Vorlage:Internetquelle ist z.B. sehr wünschenswert.
- Bei Artikeln, die noch auf tagesschau.de verfügbar sind, ist es ungünstig, sie auf depub.org umzuleiten. Beispiel hier: tagesschau.de hat einen Beitrag mit Stand vom 20.07.2010, depub.org hat einen Beitrag vom 07.07.2010, also veraltet. Der depub.org-Artikel wird auch nicht im WP-Artikel genannt, da da eindeutig auf die Version vom 20. Juli verwiesen wird. Hinzu kommt, dass auf tagesschau.de noch weitere Inhalte präsentiert werden, nämlich Weblinks im Text und eingefügte Info-Kästen (hier: "Verweildauerkonzept"), die ich persönlich auch unter der tagesschau.de-URL zitieren würde.
- Das sind jetzt keine massiven Probleme, aber welche, die es noch zu lösen gilt. Nochmals aber: Vielen Dank für die Vorlage und ihre Umsetzung! --Emkaer 14:37, 1. Nov. 2010 (CET)
Als totaler "Botsoftwarenoob" habe ich eine Frage: Ist es möglich, die Tätigkeit des / eines Bots insofern zu erweitern, dass er nicht nur Sachen archiviert, die nichts mit der Tagesschau zu tun haben? Oder ganz platt: Ist es möglich, das mir ein Bot solche Edits abnimmt? Wenn ich mir die Diskussion hier ansehe, scheint das nicht gerade einfach zu sein, von daher will ich hier gar keine "großen Töne spucken", geschweige denn etwas fordern, aber da das Problem der "toten Weblinks" recht weit verbreitet (und in Artikeln ohne Literaturangeban sehr schädlich) ist, wäre es sicher hilfreich, für das Archivieren einen Bot zu haben. --Firefly05 14:19, 2. Nov. 2010 (CET)
- technisch geht das Sicherlich; lies mal weiter oben; auf en gabs so einen Bot der gerade nicht aktiv ist :( ... und es gibt irgendwie zumindest in deutschland ein kleines rechtsproblem das zu tun :( - der botbetreiber wäre daher am besten nicht aus deutschland (umgehen von deutschen recht wäre natürlich hier proxys zu verwenden und damit die wahre identität zu verschleiern; auch geben vermutlich weder webcite noch die foundation die IP-Adresse raus - aber das wäre illegal also nicht tun!) ... Der Bot hier tut das aber nicht. der verlinkt auf ein bestehendes archiv und nicht webcite ist. ...Sicherlich Post / FB 14:25, 2. Nov. 2010 (CET)
depub.org zieht gerade um.... Weiss wer mehr? -- KurtR 06:11, 14. Nov. 2010 (CET)
Listen und Kategorien
Hallo, kann diese Aufgabe Benutzer Diskussion:XenonX3/Archiv/2010/Juli#Listen anhand von Tags, z.B. {{SORTIERUNG:Mustermann, Hans}} ein Bot übernehmen? In den Listen fangen die Namen alle mit dem Vornamen an und da braucht man gar nicht erst mit dem Suchen anfangen. --Jörg der Wikinger 15:29, 28. Jul. 2010 (CEST)
Hat keiner einen Vorschlag, wie man dem Herr werden kann? --Jörg der Wikinger 11:12, 7. Aug. 2010 (CEST)
- Gehen würde das schon. Aber ich komm ggw. nicht dazu. Vielleicht einer meiner Kollegen (m/w) @xqt 14:19, 7. Aug. 2010 (CEST)
- Das wäre gut. Hatte ich schon im Netz gesehen. Das erste Messie-Syndrom bei Wikipedia ist der „Index“ (Listen). Es ist alles da, aber wenn man es braucht, kann man es nicht finden. Also für eine Enzyklopädie ist der Index wirklich zum weglaufen. Wollte nur kurz ein Beispiel suchen. Die ist sogar alphabetisch geordnet. Leider nach dem Vornamen. Noch schlimmer geht es nicht. Liste schwedischer Musiker und wir haben hunderte davon!!! --Jörg der Wikinger 23:37, 7. Aug. 2010 (CEST)
- Bei diesem Beispiel sind aber auch rote Links dabei - die wird kein Bot umdrehen können, da muss man vermutlich von Hand ran. --APPER\☺☹ 01:39, 8. Aug. 2010 (CEST)
- Besser als alles mit der Hand umzuschreiben. Einige haben sich die Mühe schon gemacht. Auch ich, aber es ist einfach zu viel: Liste polnischer Komponisten klassischer Musik. Und dann kommen noch die Kategorien dazu. Wäre eine Strafarbeit anstelle einer Sperre ;).--Jörg der Wikinger 10:53, 8. Aug. 2010 (CEST)
- Bei diesem Beispiel sind aber auch rote Links dabei - die wird kein Bot umdrehen können, da muss man vermutlich von Hand ran. --APPER\☺☹ 01:39, 8. Aug. 2010 (CEST)
- Das wäre gut. Hatte ich schon im Netz gesehen. Das erste Messie-Syndrom bei Wikipedia ist der „Index“ (Listen). Es ist alles da, aber wenn man es braucht, kann man es nicht finden. Also für eine Enzyklopädie ist der Index wirklich zum weglaufen. Wollte nur kurz ein Beispiel suchen. Die ist sogar alphabetisch geordnet. Leider nach dem Vornamen. Noch schlimmer geht es nicht. Liste schwedischer Musiker und wir haben hunderte davon!!! --Jörg der Wikinger 23:37, 7. Aug. 2010 (CEST)
Besteht denn noch Bedarf? Eine Liste mit Seiten, die sortiert werden sollen, bzw. generell eine Koordinierung solcher Seiten wäre gut. – Giftpflanze 01:33, 5. Dez. 2010 (CET)
- Sicher hat Wikipedia noch Bedarf. Solange es keiner macht, ist es ja weiterhin nicht wirklich zu gebrauchen. --Jörg der Wikinger 23:56, 6. Dez. 2010 (CET)
- Dann werde doch mal konkret, wo darf denn sortiert werden? Ohne das gibt es keinen Auftrag. – Giftpflanze 23:59, 6. Dez. 2010 (CET)
- Schau dir einfach mal die Listen bei Wikipedia an. Wo willst du Anfangen und wo ist da ein Ende? Gib mal unter Google rusischen Musiker ein. Dann landest du hier. Kategorie:Russischer Musiker oder diese Liste Liste deutscher Komponisten klassischer Musik und wie schon geschrieben, das ist nur Musik. Die anderen Listen und Kategorien sehen ähnlich aus. --Jörg der Wikinger 00:06, 7. Dez. 2010 (CET)
- Sortierung nach Alphabetische Sortierung wäre angebracht, oder war es das mit der Anfrage und das Problem ist doch zu groß? --Jörg der Wikinger 12:35, 7. Dez. 2010 (CET)
- Hmmm, bin jetzt etwas ins Grübeln geraten. Wolltest du nur eine Sortierung nach dem Nachnamen (finde sinnvoll), oder willst du zusätzlich eine Änderung in die Form „Nachname, Vorname(n)“?
- DIN 5007 Variante 1 kann ich dir anbieten, denn so wird das auch durch Defaultsort gehandhabt (bei Rotlinks muss ich halt ersetzen). Und ansonsten ist das eine Aufgabe für eine lange Zeit. – Giftpflanze 13:16, 7. Dez. 2010 (CET)
- Dann werde doch mal konkret, wo darf denn sortiert werden? Ohne das gibt es keinen Auftrag. – Giftpflanze 23:59, 6. Dez. 2010 (CET)
DM → DNB-Portal
Die Vorlage {{DM}} sollte durch {{DNB-Portal}} ersetzt werden. Die DM-Vorlage ergibt z.B. diesen Link und die Vorlage DNB-Portal diesen. Müsste so ähnlich wie die Ersetzung PND → DNB-Portal ablaufen, also APPER, wenn du mitliest ... --Ephraim33 15:19, 14. Aug. 2010 (CEST)
- Zu beachten ist, dass es Artikel gibt, in denen beide Vorlagen vorkommen und dort die DM-Vorlage nur entfernt werden muss. Technisch kein Problem, muss aber mal sehen, wann ich Zeit dafür finde. Ist ja aber nicht sooo dringend ;) --APPER\☺☹ 02:08, 22. Aug. 2010 (CEST)
- Sollte da noch irgendwie eine andere "ART" angegeben werden? Aus "XY im Katalog des Deutschen Musikarchivs" ist schon was anderes als "Literatur von und über XY". Vielleicht "Werke von und über ..."? --APPER\☺☹ 23:12, 26. Aug. 2010 (CEST)
- Ja, "Werke von und über ..." hört sich gut an (besser als "Literatur von und über..."). Oder wenn das möglich ist "Werke von ..." falls es keine Werke über den Musiker gibt. Bei Leonard Bernstein hat die Tabelle bei der DNB eine Zeile "Thema in" - dann sollte es auch "Werke von und über ...". Aber Johann Joseph Vilsmayr hat keine Zeile "Thema in" - dann würde "Werke von ..." reichen. Wenn die Unterscheidung nicht möglich sein sollte, geht auch "Werke von und über ..." für alle. --Ephraim33 18:16, 31. Aug. 2010 (CEST)
- Technisch ist das möglich - ich werde zur Abarbeitung dieses Antrags aber wohl frühestens in den zwei Wochen zwischen 13. und 26. September kommen, ansonsten wohl erst im Oktober... --APPER\☺☹ 19:27, 31. Aug. 2010 (CEST)
- Was machen wir, falls {{DNB-Portal}} und {{DM}} oder {{Normdaten}} und {{DM}} mit unterschiedlichen Parametern benutzt werden? (Beispiel: Carl Kuntze) --Ephraim33 20:39, 31. Aug. 2010 (CEST)
- Da sollte es sich doch um einen Fehler bei der DNB handeln oder? Also manuell bei der DNB als doppelte PND zur Zusammenführung melden, oder? --APPER\☺☹ 23:00, 31. Aug. 2010 (CEST)
- Was machen wir, falls {{DNB-Portal}} und {{DM}} oder {{Normdaten}} und {{DM}} mit unterschiedlichen Parametern benutzt werden? (Beispiel: Carl Kuntze) --Ephraim33 20:39, 31. Aug. 2010 (CEST)
Zu tun ist also folgendes. Der Bot-Auftrag betrifft alle Artikel, die die Vorlage:DM benutzen. Dabei gibt es Kombinationen mit den Vorlagen:DNB-Portal und :Normdaten, die beachtet werden müssen. Bei DM und DNB-Portal ist der erste Parameter die PND, bei der Normdaten-Vorlage findet sich die PND im Parameter PND. Je nach Vorhandensein der Vorlagen gibt es ein unterschiedliches Vorgehen:
- Ist mehr als eine der drei Vorlagen vorhanden und die PNDs unterscheiden sich, muss der Artikel auf eine Wartungsliste gesetzt werden. An dieser Stelle müssen die PNDs manuell geprüft werden. In den nächsten Fällen wird also von identischen PNDs ausgegangen.
- Vorlage:DM und Vorlage:Normdaten vorhanden: In diesem Fall muss die Vorlage:DM durch Vorlage:DNB-Portal ersetzt werden, wobei der Parameter "TYP" auf "Werke von und über" gesetzt werden muss.
- Ist außerdem die Vorlage:DNB-Portal schon vorhanden, wird die DM-Vorlage nur entfernt und in der DNB-Portal-Vorlage nur der Parameter "TYP" angepasst (zu "Werke von und über").
- Ist die Vorlage:DM vorhanden, aber die Vorlage:Normdaten nicht, ist die Behandlung von der PND abhängig. Handelt es sich bei der PND um eine Tp-PND, kann die Normdaten-Vorlage mit dem PND-Parameter ergänzt werden und dabei die DM-Vorlage durch die DNB-Portal-Vorlage ersetzt werden. Bei einer Tn-PND wird nur durch die DNB-Portal-Vorlage ersetzt, aber der Artikel sollte auf eine Wartungsliste, da diese PNDs der DNB gemeldet werden sollten.
--APPER\☺☹ 00:47, 24. Okt. 2010 (CEST)
Das ganze wird auch nötig, da der Katalog seitens der DNB demnächst abgeschaltet wird, siehe Vorlage Diskussion:DM. Es gibt derzeit 4828 Einbindungen. --APPER\☺☹ 19:06, 26. Nov. 2010 (CET)
Amtliches Gemeindeverzeichnis 2006 (Rheinland-Pfalz)
In einer Anzahl von Ortsartikeln ist das Amtliches Gemeindeverzeichnis 2006 in den <ref>s verlinkt. Das Statistische Landesamt hat kürzlich den Link von http://www.statistik.rlp.de/verlag/sonstiges/AmtlichesGemeindeverzeichnis_2006.pdf geändet auf http://www.statistik.rlp.de/fileadmin/dokumente/Verzeichnisse/AmtlichesGemeindeverzeichnis_2006.pdf . Kann die Änderung in den Artikeln bitte ein Bot übernehmen? Gruß --Update 12:43, 3. Sep. 2010 (CEST)
- Ich habe es mir notiert und schaue es mir demnächst genauer an. Ein erster Überblick ergibt 132 Links auf dewiki/140 global. Es scheint aber alle Links Spezial:Weblink-Suche/http://www.statistik.rlp.de/verlag/ zu betreffen. Das sind 2630 Links lokal bzw. 7832 global. Jemand einen guten Tipp, wo ich nun http://www.statistik.rlp.de/verlag/berichte/A1033_200822_hj_G.pdf finden kann? Merlissimo 13:48, 6. Sep. 2010 (CEST)
- die Datei http://www.statistik.rlp.de/verlag/berichte/A1033_200822_hj_G.pdf steht jetzt unter http://www.statistik.rlp.de/fileadmin/dokumente/berichte/A1033_200922_hj_G.pdf (war garnicht so einfach zu finden). Allerdings dürfte sich die hierzu notwendige Änderung einfach bewerkstelligen lassen, weil hier die über 2000 Links irgendwo in der Infobox "versteckt" sind und über einen zentralen Link, der über die Gemeindekennziffer die Einwohnerzahl in die "Infobox Gemeinde in Deutschland" bringt und gleichzeitig auch den Eintrag bei den Einzelnachweisen generiert. Gruß --Update 14:23, 6. Sep. 2010 (CEST)
- Nachtrag: die Steuervorlage ist wohl diese: "Vorlage:Metadaten Einwohnerzahl DE-RP" --Update 14:35, 6. Sep. 2010 (CEST)
- Ich wollte den Job gerade abarbeiten und merke nun, dass die mich beim Statistischen Landamt gar nicht mögen *schnief*. Nicht mein User-Agent, sondern meine IP scheint der Grund für "FW-1 at fw0301: Access denied." zu sein. Das Ganze wird sich deshalb etwas verzögern. Merlissimo 20:50, 6. Sep. 2010 (CEST)
- Fünf Links sind noch auf dewiki übrig: Spezial:Weblink-Suche/http://www.statistik.rlp.de/verlag/
- Auf enwiki habe ich jetzt immer wieder noch eine weitere Vorlage gefunden, wo die Links waren. Jedesmal muss ich aber derzeit 3-4 Tage auf die JobQueue dort warten, ob nun alle weg sind. Derzeit noch über 1100 Links laut DB. Merlissimo 22:53, 14. Sep. 2010 (CEST)
- Ich wollte den Job gerade abarbeiten und merke nun, dass die mich beim Statistischen Landamt gar nicht mögen *schnief*. Nicht mein User-Agent, sondern meine IP scheint der Grund für "FW-1 at fw0301: Access denied." zu sein. Das Ganze wird sich deshalb etwas verzögern. Merlissimo 20:50, 6. Sep. 2010 (CEST)
Bot für die Liste der Namenstage
Gibt es eine Möglichkeit einen dafür zu machen? Ich bearbeite es derzeit (puh - nochn Haufen Arbeit).
- Es gibt 2 Kategorien: Männlicher Vorname und Weiblicher Vorname. Es sollte so aussehen: Liste der Namenstage/B. Ab Buchstabe D sieht es noch so aus: Liste der Namenstage/D. Ist sowas möglich? -- -- VampLanginus 20:48, 8. Sep. 2010 (CEST)
- Schwer. In den einzelnen Namensartikeln ist die Angabe der Namenstage nicht einheitlich - das hieße, eine Menge Optionen für die Textanalyse vorsehen. Ich möcht's nicht programmieren.... --Guandalug 10:46, 16. Sep. 2010 (CEST)
- An das Datum der Namenstage habe ich nicht gedacht. Einfach wenn jemand einen Namenstagsartikel schreibt, sollte dieser mit dem richtigen Format auf der dazugehörigen Liste erscheinen, Datum sollte händisch eingegeben werden, Geschlecht auch mittels Bot. Die beiden Vornamelisten (männliche + weibliche, siehe oberhalb) müssen vorher auf die Liste der Namenstage übertragen werden. -- VampLanginus 11:41, 16. Sep. 2010 (CEST)
Ich halte das ganze generell für eine schlechte Idee aus der Liste der Namenstage eine Liste der Vornamen zu machen. Namenstage sind ja die Festtage katholischer Heiliger im kanonischen Jahr. Selbst bei allen Namensvarianten ist sicher, daß es nicht zu allen Vornamen Namenstage gibt. @xqt 09:37, 2. Okt. 2010 (CEST)
- Das ist ja die 2.Stufe meiner Überarbeitung, indem ich das mit diversen externen Seiten abgleiche. Im übrigen wurde es so gehandhabt seit es diese Liste gibt. -- VampLanginus 09:51, 2. Okt. 2010 (CEST)
- Wenn Du das ohnehin händisch nacharbeiten muß, wo liegt dann der Sinn des Ganzen? Im Übrigen, was schon immer so gemacht wurde muß ja nicht richtig sein - da könnte ja jeder kommen und sagen, das ham wa noch nie so gemacht ;) Im Ernst: Ich sehe keinen Sinn darin, zuerst alle Vornamen zu übertragen und danach diejenigen wieder zu löschen, zu denen es keine Namenstage gibt. @xqt 07:55, 5. Okt. 2010 (CEST)
- Wie würdest du denn das machen? -- VampLanginus 09:10, 5. Okt. 2010 (CEST)
- Die o.g. Kategorien zu Hilfe nehmen und die Namen mit dem zugehörigen Datum dann eintragen. Vermutlich hast Du da irgendwo eine Quelle. Falls eine solche Quelle in einigermaßen strukturiertem Text vorliegt, kann man auch den den anderen Weg gehen, und die Liste automatisch erstellen lassen. Das war wohl auch eine ursprüngliche Intension, nehme ich an. Wie Guandalug aber schon treffend erwähnt, ist die Angabe des Namenstags in den Namensartikeln nur mit unverhältnismäßig hohem Aufwand auswertbar; da wäre dann die händische Vorgehensweise wohl einfacher. @xqt 10:46, 5. Okt. 2010 (CEST)
- Ich will/wollte mir die lange Arbeit ersparen die über 1000 Vornamen händisch einzutragen und immer wieder neu eingetragene nachzutragen. Quellen habe ich ein paar Webseiten, leider nur die christlichen Vornamen. Mir fehlen noch Webseiten in deutsch oder englisch mit Namenstage für nichtchristliche Vornamen. -- VampLanginus 22:48, 5. Okt. 2010 (CEST)
- Das dürfte wohl schwierig werden. So viele Heilige mit "nichtchristlichen" (was auch immer das heißen mag) Vornamen hat die kath. Kirchen nicht. Deshalb ist Dein Unterfangen ja so fragwürdig, da Du einen Großteil der Bot-Einträge wieder löschen müßtest, weil es keinen Heiligen dieses Namens, ergo keinen Namenstag dazu gibt. @xqt 10:49, 6. Okt. 2010 (CEST)
- Vornameliste hat nichts mit Heiligen zu tun. Löschen ist vielfach einfacher und schneller also wenn ich jeden Vornamen händischen eingeben muß. Zuerst werden alle Vornamen eingegeben und dann nach den Namenstagen gesucht/eingetragen. -- VampLanginus 00:15, 1. Nov. 2010 (CET)
- Kann mir das jemand machen? -- VampLanginus 00:15, 1. Nov. 2010 (CET)
Ist es soviel Arbeit dass mir jemand ein Bot macht? Wenn ich es händisch machen muss, brauche ich sicher mehr als 100 Stunden. -- VampLanginus 19:51, 27. Nov. 2010 (CET)
- Ich habe hier ein Tool geschrieben: http://toolserver.org/~gifti/bot/namenstage.fcgi?char=D, den Buchstaben nach Belieben abändern (Žarko (m) und Đorđe (m) habe ich jetzt nicht reingezwängt). Das Tool spuckt eine Kopiervorlage aus, du musst nur noch die Daten eintragen (bereits vorhandene habe ich jetzt nicht übernommen). – Giftpflanze 01:16, 5. Dez. 2010 (CET)
- Danke, werds mir demnächst zu Gemüte führen. Gruß -- VampLanginus 09:54, 5. Dez. 2010 (CET)
- Leider fehlt noch das wichtigste: ein Bot, das mir alle Vornamen der beiden Kategorien: Männlicher Vorname und Weiblicher Vorname in die Namenstagsliste überträgt. -- VampLanginus 10:00, 5. Dez. 2010 (CET)
- Hä? Das wirst du doch noch selber können … – Giftpflanze 18:12, 5. Dez. 2010 (CET)
- Hatte noch nie mit Bots zu tun, aber wenn du mir sagst wie das geht.... Kannst mir auch nee Email schicken. Gruß -- VampLanginus 18:33, 5. Dez. 2010 (CET)
- Ich glaube, es geht darum, dass das Tool, das Giftpflanze gebastelt hat ja für jeden Buchstaben schon den richtigen Text auswirft. Für 26 Seiten dauert es vermutlich länger einen Bot entsprechend einzurichten, als einfach 26 Mal Copy&Paste zu machen. --APPER\☺☹ 20:11, 5. Dez. 2010 (CET)
Sorry, ich halte die Vorgehensweise nach wie vor für unsinnig: Erst alle Vornamen in die Namenstagsliste zu übertragen und dann wieder alle Namen zu löschen, zu denen es keine Namenstage gibt. Wer kann denn garantieren, daß alle Vornamen wieder gelöscht werden. Und wieso soll das löschen einfacher sein, als das einfügen. Die Liste der Namen erhält man über die Kategorie. Damit wären doch diejenigen Namen prüfbar, zu denen es Namenstage gibt. @xqt 20:46, 5. Dez. 2010 (CET)
- Ich kann schon verstehen, dass das Rausklauben und Zusammenstellen mühselig ist. Die weitere Verantwortung liegt jetzt auch nicht mehr bei mir. Und zu Apper: Es ist noch weitere Verarbeitung notwendig um die Seiten in einem sinnvollen Zustand zu erhalten, deswegen ist es auch nicht sinnvoll mit dem Bot drüberzugehen (so schwierig wäre das nicht). – Giftpflanze 23:56, 5. Dez. 2010 (CET)
Befüllung der Kategorien Fußballnationalspieler
Anhand der Interwikilinks in der Kategorie:Fußballnationalspieler könnten die Subkategorien für die einzelnen Verbände recht effektiv und ohne Handarbeit per Bot befüllt werden. Kann ein Bot das übernehmen? -- 188.82.144.214 17:06, 15. Sep. 2010 (CEST)
- Den Botauftrag erkläre bitte mal etwas genauer. --Guandalug 10:16, 16. Sep. 2010 (CEST)
- Unterhalb der Kategorie:Fußballnationalspieler sind inzwischen eine Reihe von Subkategorien für die einzelnen Nationalmannschaften angelegt. Diese Subkategorien können eigentlich anhand der Vorarbeit in anderssprachigen Wikipedias und bestehender Nationalspielerlsiten leicht automatisch befüllt werden.
- In allen Artikeln, die anderswo der Kategorie:Fußballnationalspieler (Land) zugeordnet sind und die ein Pendant in deutscher Sprache haben, wäre die Kategorie:Fußballspieler (Land) durch Kategorie:Fußballnationalspieler (Land) zu ersetzen.
- Ebenso können die Listen in der Kategorie:Liste (Fußballnationalspieler) recht einfach zur Befüllung abgearbeitet werden. Das Muster wäre das gleiche. -- 188.81.83.214 12:45, 16. Sep. 2010 (CEST)
Bei den Einbindungen obiger Vorlage wären zum einen die Zeilen |EINWOHNER = .. und |STAND_EINWOHNER = ... ersatzlos zu löschen (wird über Metadaten eingebunden) und zum anderen {{Infobox Ort in der Slowakei... zu {{Infobox Gemeinde in der Slowakei... umzuschreiben. Könnte das ein Bot erledigen? --AleXXw •שלום!•disk 22:05, 17. Sep. 2010 (CEST)
- Nein, nicht umbenennen. Grundsätzlich sollen einheitliche Infoboxen für unselbständige und selbständige Orte verwendet werden (der Sonderweg für Deutschland ist im WP:WPG unerwünscht. --Matthiasb
(CallMeCenter) 23:04, 17. Sep. 2010 (CEST)
- Sorry auch in Österreich haben wir den Sonderweg, denn Gemeinde ist nicht Ort, wo wurde das besprochen - wir haben etliche Gemeinde(namen) die mit einem Ort nichts zu tun haben. Slowakei weiß ich nicht, aber nach der österr. Gesetzgebung unter k.u. kann ich mir das vorstellen (weil es keine gemeindefreien Flächen im gegensatz zu D gibt. --K@rl (Verbessern ist besser als löschen) 23:08, 17. Sep. 2010 (CEST)
- Zur Slowakei: die Gleichung Gemeinde = Ort ist leider wahr nur im Fall eine Gemeinde ist auch der einzige Gemeindeteil (oder Stadtteil wenn Stadt). Viele Gemeinden haben mehrere Gemeindeteile und diese besitzen keine GKZ oder ähnliches. Ausnahme sind nur Stadtteilen von BA und KE, die auch eigene Selbstverwaltung haben. Andere Gemeindeteile sind nicht so. MarkBA 23:17, 17. Sep. 2010 (CEST)
- Der politische Status einer Ortschaft ist vom geographischen Standpunkt aus vollkommen irrelevant, weswegen wir seit zwei Jahren oder so Ortsinfoboxen so umstellen, daß sie sowohl für selbständige Orte (Gemeinden, Kommunen, whatsoever) als auch für unselbständige Orte (vulgo: Ortsteile) verwendet werden können. Das hängt einerseits damit zusammen, daß im Sinne von Wikipedia:WikiProjekt Vorlagenauswertung es keinen Sinn macht, wenn ein Teil der Orte eine Infobox hat und der Rest eine andere IB. Zum anderen wollen wir auf längere Sicht dahin kommen, daß wir nur noch eine einzige Ortsinfobox für alle Staaten haben, weswegen bereits (derzeit noch) kleinere Schritte unternommen wurden und werden, etwa bei der Parameterbenennung.
- In der Regel macht man das so, wie in Vorlage:Infobox Ort in den Niederlanden, indem man der Vorlage einen Parameter Typ beigibt, der für Gemeinden auf Typ=Gemeinde gesetzt wird und so verschiedene gemeindespezifische Anzeigen steuert.
- Ich schaue mir die IB am Wochenende mal an. --Matthiasb
(CallMeCenter) 23:20, 17. Sep. 2010 (CEST)
- PS:Ich melde mich dann auf der Diskussionsseite zur Infobox, da das hier off-topic ist. --Matthiasb
(CallMeCenter) 23:25, 17. Sep. 2010 (CEST)
- PS:Ich melde mich dann auf der Diskussionsseite zur Infobox, da das hier off-topic ist. --Matthiasb
- Matthiasb, wie lange willst du eigentlich noch mit der Aussage Grundsätzlich sollen einheitliche Infoboxen für unselbständige und selbständige Orte verwendet werden arbeiten? Wer diese Seite beobachtet, merkt doch irgendwann, dass kein einziger Benutzer außer dir diese These vertritt. Die Praxis spricht eine ganz andere Sprache, siehe Kategorie:Vorlage:Infobox Gemeinde. Die ehemalige Vorlage:Infobox Ort in Italien ist übrigens erst vor knapp einem Jahr nach Vorlage:Infobox Gemeinde in Italien umbenannt worden, was auch kräftiges Engagement deinerseits nicht verhindern konnte. Ich finde, es wäre langsam mal an der Zeit, auf den Tisch zu legen, was du (oder meinetwegen auch ein WikiProjekt, dann sollte aber auch allgemein ersichtlich sein, wer sonst noch dahinter steht) langfristig wirklich willst, nämlich eine einheitliche Infobox, die alle Siedlungen welcher Form auch immer und alle „kleinen“ Verwaltungseinheiten der Welt in einen Topf wirft. Diese Diskussion, ob der politische Status einer Ortschaft irrelevant sei (was er selbstverständlich nicht ist – ein Konstrukt wie zum Beispiel Wuppertal ist natürlich nur eine Gemeinde, die zwar aus Ortschaften besteht, aber selbst keine ist) mit den immergleichen Argumenten für jeden Staat neu zu führen, bis die anderen genervt aufgeben, macht keinen Spaß mehr. --Entlinkt 23:39, 17. Sep. 2010 (CEST)
- <SCHNIPP> Ich habe die beiden Infoboxen hier mal entfernt - die Koordinatenvorlagenüberlagerung oben und so ist ja nicht auszuhalten.... --Guandalug 13:01, 25. Sep. 2010 (CEST)
Ich hatte geschrieben Der politische Status einer Ortschaft ist vom geographischen Standpunkt aus vollkommen irrelevant, bitte richtig zitieren. Daß ich Ortschaft verlinkt habe, hatte auch seinen Grund. Ob eine Ortschaft ein Weiler, ein Dorf, eine Stadt, ein Vorwerk, ein Einöde oder sonst etwas ist, ist zur Erfüllung des Zweckes, den Infoboxen haben, irrelevant.
Die Verwendung verschiedener Infoboxen ist innerhalb eines Landes ist aus Gründen von Abfragemöglichkeiten (etwa Templatetiger) hinderlich (über die unterschiedlichen Stadtteilinfoboxen der verschiedenen Stadtportale wird auch noch zu reden sein: wollen wir irgendwann einmal sagen wir zehntausend verschiedene Stadtteilinfoboxen haben? – das derzeitige Vorgehen da erinnert an die Nationalstaatflickenteppiche des 18. Jahrhunderts) und sie behindert die Benutzer, weil sie sich an unterschiedliche Syntax gewöhnen müssen. Wir haben ja auch nicht unterschiedliche Flußinfoboxen, nur deswegen, weil es in DE Fließgewässerkennziffern gibt und in Frankreich Gewässerkennzahlen und in den Vereinigten Staaten eine Flussgebietseinheitennumerierung und wer weiß was wo wie noch heißt.
Wie das in der Praxis aussieht, zeigt das Beispiel Niederlande, das ich hier mal angebildet hab. Links Nimwegen als Gemeinde, rechts Nimwegen als Ortsteil, mit entfernten CBS-Code und ohne Namen des Bürgermeisters. (Die Karte müßte eigentlich wohl auch getauscht werden, dazu hatte ich aber in dem Beispiel keine Lust, auch Fläche, Vorwahlen und Postleitzahlen habe ich nicht modifiziert.) So sollte das üblicherweise laufen.
Übrigens, von den 19 Einträgen in Kategorie:Vorlage:Infobox Gemeinde als ganz andere Sprache auszugehen, ist kein Argument; da hatten wir schon mehr. Sobald die redundante Infobox Gemeinde in England durch Infobox Ort im Vereinigten Königreich ersetzt wurde, ist es dann wieder eine weniger (Wales und Schottland wurden im letzten Monat entsorgt). Vorlage:Infobox Gemeinde in Italien und Vorlage:Infobox Fraktion in Italien könnte man ebenfalls problemlos zusammenführen, die meisten Parameter sind jetzt schon identisch. Daß es da zwei Vorlagen gibt, ist genauso Luxus wie die drei Vorlagen für Inseln, Atolle und Inselgruppen. Interessant in dem Zusammenhang auch, zu welchem Schluß man im Sportbereich gekommen ist, hinsichtlich der Stadien (siehe weiter oben auf dieser Seite). --Matthiasb (CallMeCenter) 10:28, 18. Sep. 2010 (CEST)
(siehe Vorlage Diskussion:Allmusic)
die vorlage verwendet links, die mittlerweile von allmusic.com auf neue umgebogen werden. (man wird automatisch darauf weitergeleitet, wenn man einen link mit dem alten format verwendet). ist es möglich, dass ein bot alle links durchgeht, und diese dann mit den aktuelleren ersetzt? grüße, --inuit - institut 17:48, 14. Okt. 2010 (CEST)
Man kann da schon was machen (um es für andere Mitleser zusammenzufassen: Das bisher als Parameter angebene URL-Fragment wird auf der Zielseite nicht mehr verwendet, bei Eingabe der alten URL wird man aber weitergeleitet). Das neue Linkfragment ist aus dem alten nicht ableitbar.) Man müsste zunächst die Vorlage anpassen, so dass diese parallel alten und neuen Modus unterstützt (am besten über zwei neue Parameter, die die alte id ablösen). Dann könnte ein Bot durch Aufruf der Seiten die alten in die neuen Parameter übersetzten.--Cactus26 18:42, 14. Okt. 2010 (CEST)
- Es existieren ja nur 139639 Links in 117 Projekten mit http://www.allmusic.com/cg/amg.dll . Auf dewiki sind es 5293. Normalerweise editiert mein Bot mit einer Seite pro Minute - das wären dann 96 Tage serielle Laufzeit - wow.
- Ich würde dann erstmal die Wikis ohne Vorlage übernehmen. Die ganze Koordination weltweit wird aber noch viel Platz einnehmen: Wer übernimmt welches Wiki, Überblick über notwendigen Vorlagenänderungen , ... . Dafür würde ich eine extra Seite nehmen (Unterseite der Vorlagendisk?). Merlissimo 02:12, 15. Okt. 2010 (CEST)
- Danke, Merlissimo. Es gibt offensichtlich auch in dewiki eine beträchtliche Anzahl direkter Weblinks ohne Vorlage, die man in diesem Aufwasch gleich auf Vorlage umstellen sollte. Ich könnte mich wie üblich nur um dewiki kümmern. Würde Dir das was helfen? Interessant wäre auch zu wissen, wie lange die Weiterleitungen auf der Allmusic-Seite noch implementiert bleiben.--Cactus26 06:35, 15. Okt. 2010 (CEST)
- Bitte neben http://www.allmusic.com/cg/amg.dll auch http://allmusic.com/cg/amg.dll (ohne „www.“) nicht vergessen ;-( --UV 10:05, 15. Okt. 2010 (CEST)
- Danke für den Hinweis.--Cactus26 17:51, 15. Okt. 2010 (CEST)
- Es sind global noch 175000 Link offen. 69 auf dewiki. Meine Botabarbeitungen haben begonnen (werde ich fortlaufend ergänzen):
- Danke für den Hinweis.--Cactus26 17:51, 15. Okt. 2010 (CEST)
als-0: 5 Pages; an-0: 11 Pages; af-0: 25 Pages; ang-0: 2 Pages; br-0: 47 Pages; ar-0: 72 Pages; arz-0: 1 Page; bs-0: 31 Pages; ast-0: 3 Pages; az-0: 4 Pages; bar-0: 4 Pages; be-0: 3 Pages; bn-0: 105 Pages; be-x-old-0: 14 Pages; bg-0: 192 Pages; ca-0: 483 Pages; cv-0: 1 Page; cy-0: 8 Pages; cs-0: 880 Pages; dv-0: 1 Page; el-0: 51 Pages; commons-6: 2 Pages; incubator-0: 1 Page; en-0: 1 Page; en-0: 1 Page; en-0: 1 Page; en-0: 2 Pages; da-0: 507 Pages; eo-0: 57 Pages; simple-0: 263 Pages; et-0: 30 Pages; eu-0: 23 Pages; fa-0: 429 Pages; fi-0: 3 Pages; fi-0: 1105 Pages; fo-0: 4 Pages; fy-0: 2 Pages; ga-0: 4 Pages; gd-0: 1 Page; gl-0: 32 Pages; gu-0: 10 Pages; he-0: 32 Pages; he-0: 1 Page; hi-0: 54 Pages; hif-0: 1 Page; ht-0: 2 Pages; hu-0: 1 Page; hy-0: 31 Pages; ia-0: 2 Pages; id-0: 439 Pages; io-0: 0 Pages; is-0: 41 Pages; es-0: 6461 Pages; ja-0: 294 Pages; it-0: 287 Pages; ja-0: 0 Pages; it-0: 11 Pages; ja-0: 0 Pages; it-0: 0 Pages; it-0: 0 Pages; it-0: 0 Pages; jv-0: 1 Page; ku-0: 1 Page; kn-0: 44 Pages; la-0: 9 Pages; lmo-0: 3 Pages; ko-0: 256 Pages; lv-0: 96 Pages; mk-0: 23 Pages; ml-0: 1 Page; mn-0: 3 Pages; mr-0: 1 Page; lt-0: 340 Pages; mt-0: 3 Pages; nds-0: 30 Pages; nds-nl-0: 1 Page; new-0: 3 Pages; ms-0: 84 Pages; nn-0: 517 Pages; hu-0: 953 Pages; nl-0: 785 Pages; oc-0: 1 Page; pam-0: 1 Page; ka-0: 214 Pages; no-0: 2029 Pages; ps-0: 1 Page; pt-0: 0 Pages; qu-0: 2 Pages; ro-0: 597 Pages; ru-0: 404 Pages; sah-0: 0 Pages; sc-0: 2 Pages; scn-0: 1 Page; sco-0: 12 Pages; sd-0: 1 Page;
Habe mal die verbliebene nicht mehr per bot korrigierbare liste auf der vorlagendisk. abgelegt. enwiki ist in arbeit.--Cactus26 13:04, 4. Nov. 2010 (CET)
- Hast du eigentlich noch weitere Probleme mit der Webseite gehabt, die ich denen mitteilen sollte? Ich wollte denen wegen dem besch.. Doctype und den Fehler im öffnenden body-Tag eine Mail schreiben. Merlissimo 03:06, 8. Nov. 2010 (CET)
- Entschuldige, sehe Deinen Beitrag erst jetzt. Habe ehrlich gesagt mich für den internen Aufbau gar nicht interessiert. Interessant fände ich auch die Frage, wie lange die Redirects bestehen bleiben und auch, ob es eine Regel gibt, welche alten Links nicht oder nicht korrekt weitergeleitet werden (da scheint es Fälle zu geben, was ich kenne sind die "Essays", die werden alle schlicht nach http://www.allmusic.com/explore/essay/ geleitet (Bsp.: Bot-Edit und anschließende manuelle Vervollst.).--Cactus26 06:58, 15. Nov. 2010 (CET)
Habe festgestellt, dass es auch uralte Links der Form www.allmusicguide.com gibt. Dort ist das "guide" zu entfernen, dann kann man den Link wie gewohnt redirecten lassen und somit übersetzten. Weiterhin sind wir in enwiki darauf gekommen, dass sich Deep Links im Prinzip rekonstruieren lassen. Die gewählten Tabs werden zwar beim redirect bei allmusic nicht abgedeckt, aber aus der Systematik der alten URL (Suffix ~Txx) lässt sich das Tab im Prinzip ableiten, siehe Disk beim en-Template. Bisschen spät für dewiki, schade. Man müsste den Bot-Edit revertieren und den Bot nochmals über die Seite laufen lassen, dann würde er nun auch das gewählte Tab rekonstruieren.--Cactus26 14:38, 10. Dez. 2010 (CET)
- Nachtrag: Es gibt noch eine andere, gelegentlich verwendete alte Variante, nämlich wm05.allmusic.com (siehe [1]).--Cactus26 09:25, 15. Dez. 2010 (CET)
Einwohnerzahlen in Polen
Haie ihrs,
Da die Aktualisierung von Einwohnerzahlen doch recht geistlos ist eine Anfrage ob ein Bot das für Polen übernehmen kann. Zu tun wäre sowas. Das wie ich denke Problem ist, dass es als Quelle nur eine PDF-Datei gibt (Hier; englisch/polnisch) und es nicht selten ist das ein Ortsname in POlen mehrfach vorkommt. Man müsste also prüfen ob der Powiat (Landkreis) übereinstimmt. Der steht jeweils drüber. ... Tja vielleicht gehts ja!? ...Sicherlich Post / FB 09:07, 15. Nov. 2010 (CET)
- Ist das nicht auch ein Kandidat für eine "Metadatenvorlage" und ein Auslagern der Einwohnerdaten? --Guandalug 09:54, 15. Nov. 2010 (CET)
- mir alles recht; hauptsache die einwohnerzahlen sind in der Infobox aktuell ;) ...Sicherlich Post / FB 09:54, 15. Nov. 2010 (CET)
- ahso; es muss aber auch manuell noch möglich sein; das GUS veröffentlicht leider keine Zahlen für Dörfer und diese haben die selbe Infobox! ...Sicherlich Post / FB 09:57, 15. Nov. 2010 (CET)
- Dat geht ja auch. "Wenn nicht explizit gegeben, nutze Metadaten" oder so. Fragt sich bloß, welchen Schlüssel man nutzt.... --Guandalug 10:27, 15. Nov. 2010 (CET)
- Schlüssel? ...Sicherlich Post / FB 10:40, 15. Nov. 2010 (CET)
- Bei der Metadatenvorlage muss man ja irgendwie die Orte mit den Metadaten verknüpfen... ;) In den de-Orten kann man den AGS (Allgemeinen GemeindeSchlüssel) verwenden, der ja (halbwegs) eindeutig ist. --Guandalug 11:13, 15. Nov. 2010 (CET)
- nun es gibt so eine Zahl auch (Teryt), allerdings ist die im PDF nicht drin :( (und deshalb bisher auch in den meisten Boxen nicht eingepflegt; fehlender Nutzen) - man müsste das dann über den Powiat lösen ...Sicherlich Post / FB 11:24, 15. Nov. 2010 (CET)
- Ich schau mal, was ich die nächsten Tage tun kann. Die Metadatenvorlagen gibt's schon: Kategorie:Vorlage:Metadaten Einwohnerzahl PL. --Septembermorgen 22:12, 29. Nov. 2010 (CET)
- nun es gibt so eine Zahl auch (Teryt), allerdings ist die im PDF nicht drin :( (und deshalb bisher auch in den meisten Boxen nicht eingepflegt; fehlender Nutzen) - man müsste das dann über den Powiat lösen ...Sicherlich Post / FB 11:24, 15. Nov. 2010 (CET)
- Bei der Metadatenvorlage muss man ja irgendwie die Orte mit den Metadaten verknüpfen... ;) In den de-Orten kann man den AGS (Allgemeinen GemeindeSchlüssel) verwenden, der ja (halbwegs) eindeutig ist. --Guandalug 11:13, 15. Nov. 2010 (CET)
- Schlüssel? ...Sicherlich Post / FB 10:40, 15. Nov. 2010 (CET)
- Dat geht ja auch. "Wenn nicht explizit gegeben, nutze Metadaten" oder so. Fragt sich bloß, welchen Schlüssel man nutzt.... --Guandalug 10:27, 15. Nov. 2010 (CET)
- ahso; es muss aber auch manuell noch möglich sein; das GUS veröffentlicht leider keine Zahlen für Dörfer und diese haben die selbe Infobox! ...Sicherlich Post / FB 09:57, 15. Nov. 2010 (CET)
- mir alles recht; hauptsache die einwohnerzahlen sind in der Infobox aktuell ;) ...Sicherlich Post / FB 09:54, 15. Nov. 2010 (CET)
- hmm - noch dabei? ...Sicherlich Post / FB 18:38, 27. Dez. 2010 (CET)
Infoboxen aktualisieren (Wuppertal)
Anfrage mit zwei Teilaufgaben:
- 1)
In der Kategorie:Stadtbezirk in Wuppertal die Infoboxen aktualisieren (10 Artikel):
Parameter (Beispielwerte):
|EINWOHNER=64628 |EINWOHNER-STAND=2009-12-31 |AUSLÄNDERANTEIL = 20.8 |AUSLÄNDERANTEIL-STAND=2009-12-31 |QUELLE=[http://www.wuppertal.de/rathaus/onlinedienste/rbs_statistik/statistik_bezirk.phtml?bez=1000&aktion_jahr=2009 Wuppertaler Statistik - Raumbezogene Daten]
Die Felder
- EINWOHNER-STAND und
- AUSLÄNDERANTEIL-STAND auf "2009-12-31" setzen und
- EINWOHNER und AUSLÄNDERANTEIL nach Tabelle aktualisieren (zum Teil wurde das mit Hand gemacht)
Artikel | EINWOHNER | AUSLÄNDERANTEIL | COMMONSCAT ---- Elberfeld (Stadtbezirk) | 64628 | 20.8 | Wuppertal-Elberfeld (district) Elberfeld-West | 27282 | 15.5 | Elberfeld-West Uellendahl-Katernberg | 37727 | 6.4 | Uellendahl-Katernberg Vohwinkel | 31229 | 11.0 | Vohwinkel Cronenberg (Wuppertal) | 21623 | 5.8 | Wuppertal-Cronenberg Barmen (Stadtbezirk) | 57907 | 15.2 | Wuppertal-Barmen (district) Oberbarmen | 42069 | 16.8 | Oberbarmen Heckinghausen (Stadtbezirk) | 20856 | 13.9 | Heckinghausen (district) Langerfeld-Beyenburg | 24844 | 9.5 | Langerfeld-Beyenburg (Wuppertal) Ronsdorf | 21548 | 5.5 | Wuppertal-Ronsdorf
- QUELLE auf "…_jahr=2009" setzen.
- Den Artikel um den Inhalt des Feldes COMMONSCAT erweitern (Weblinks oder Weblinks mit Commonscat könnte zum Teil schon vorhanden sein):
== Weblinks == {{Commonscat|Wuppertal-Elberfeld (district)|{{PAGENAME}}}}
oder NAME aus der Infobox auswerten; entweder NAME (komplett) oder angefügte Klammer abschneiden (Beispiel: Elberfeld (0) -> Elberfeld)
== Weblinks == {{Commonscat|Wuppertal-Elberfeld (district)|NAME}}
- 2)
In der Kategorie:Wohnquartier in Wuppertal die Infoboxen aktualisieren (70 Artikel):
Parameter (Beispielwerte):
|EINWOHNER=5743 |EINWOHNER-STAND=2008-12-31 |AUSLÄNDERANTEIL=24.9 |AUSLÄNDERANTEIL-STAND=2008-12-31 |QUELLE= [http://www.wuppertal.de/rathaus/onlinedienste/rbs_statistik/statistik_quartier.phtml?wahlquar=00&aktion_jahr=2007 Wuppertaler Statistik - Raumbezogene Daten]
Die Felder
- EINWOHNER-STAND und
- AUSLÄNDERANTEIL-STAND auf "2009-12-31" setzen und
- EINWOHNER und AUSLÄNDERANTEIL nach Tabelle aktualisieren (zum Teil wurde das mit Hand gemacht)
Artikel | EINWOHNER | AUSLÄNDERANTEIL | COMMONSCAT ---- Elberfeld-Mitte | 5673 | 24.7 | Wuppertal-Elberfeld-Mitte Nordstadt (Wuppertal) | 16895 | 26.9 | Wuppertal-Nordstadt Ostersbaum | 14597 | 24.3 | Wuppertal-Ostersbaum Südstadt (Wuppertal) | 9554 | 19.1 | Wuppertal-Südstadt Grifflenberg (Quartier) | 11631 | 10.3 | Wuppertal-Grifflenberg Friedrichsberg (Quartier) | 6278 | 14.4 | Wuppertal-Friedrichsberg Sonnborn | 3793 | 11.5 | Wuppertal-Sonnborn Varresbeck (Quartier) | 4348 | 14.2 | Wuppertal-Varresbeck Nützenberg (Quartier) | 5480 | 17.0 | Wuppertal-Nützenberg Brill (Wuppertal) | 4366 | 6.5 | Wuppertal-Brill Arrenberg | 5454 | 31.0 | Wuppertal-Arrenberg Zoo (Wuppertal) | 3781 | 6.7 | Wuppertal-Zoo (quarter) Buchenhofen | 60 | 5.0 | Wuppertal-Buchenhofen Uellendahl-West | 9666 | 8.5 | Wuppertal-Uellendahl-West Uellendahl-Ost | 6479 | 8.6 | Wuppertal-Uellendahl-Ost Dönberg | 4982 | 2.6 | Wuppertal-Dönberg Nevigeser Straße | 6821 | 8.4 | Wuppertal-Nevigeser Straße Beek (Wuppertal) | 2917 | 3.9 | Wuppertal-Beek Eckbusch | 4550 | 3.5 | Wuppertal-Eckbusch Siebeneick | 2312 | 2.1 | Wuppertal-Siebeneick Vohwinkel-Mitte | 9103 | 12.6 | Wuppertal-Vohwinkel-Mitte Osterholz (Wuppertal) | 3982 | 10.3 | Wuppertal-Osterholz Tesche (Wuppertal) | 3914 | 13.3 | Wuppertal-Tesche Schöller-Dornap | 3053 | 3.2 | Wuppertal-Schöller-Dornap Lüntenbeck (Quartier) | 1118 | 5.9 | Wuppertal-Lüntenbeck Industriestraße | 185 | 5.9 | Wuppertal-Industriestraße Westring | 3931 | 6.4 | Wuppertal-Westring Höhe (Wuppertal) | 5366 | 16.6 | Wuppertal-Höhe Schrödersbusch | 577 | 5.9 | Wuppertal-Schrödersbusch Cronenberg-Mitte | 6833 | 6.0 | Wuppertal-Cronenberg-Mitte Küllenhahn | 1845 | 2.8 | Wuppertal-Küllenhahn Hahnerberg (Quartier) | 4064 | 5.6 | Wuppertal-Hahnerberg Cronenfeld | 3991 | 10.1 | Wuppertal-Cronenfeld Berghausen (Wuppertal) | 2135 | 4.8 | Wuppertal-Berghausen Sudberg (Quartier) | 2223 | 2.1 | Wuppertal-Sudberg Kohlfurth | 532 | 3.8 | Wuppertal-Kohlfurth Barmen-Mitte | 4585 | 27.8 | Wuppertal-Barmen-Mitte Friedrich-Engels-Allee (Quartier) | 7521 | 25.4 | Wuppertal-Friedrich-Engels-Allee Loh (Wuppertal) | 4280 | 13.8 | Wuppertal-Loh Clausen (Wuppertal) | 2875 | 9.3 | Wuppertal-Clausen Rott (Wuppertal) | 9529 | 15.5 | Wuppertal-Rott Sedansberg | 10137 | 16.8 | Wuppertal-Sedansberg Hatzfeld (Wuppertal) | 3947 | 4.9 | Wuppertal-Hatzfeld Kothen (Wuppertal) | 8814 | 10.5 | Wuppertal-Kothen Hesselnberg | 2323 | 12.3 | Wuppertal-Hesselnberg Lichtenplatz | 3896 | 3.8 | Wuppertal-Lichtenplatz Oberbarmen-Schwarzbach | 13514 | 25.5 | Wuppertal-Oberbarmen-Schwarzbach Wichlinghausen-Süd | 9434 | 18.9 | Wuppertal-Wichlinghausen-Süd Wichlinghausen-Nord | 6155 | 15.9 | Wuppertal-Wichlinghausen-Nord Nächstebreck-Ost | 4999 | 7.2 | Wuppertal-Nächstebreck-Ost Nächstebreck-West | 7967 | 6.5 | Wuppertal-Nächstebreck-West Heckinghausen | 12380 | 15.5 | Wuppertal-Heckinghausen (quarter) Heidt (Quartier) | 7166 | 12.3 | Wuppertal-Heidt Hammesberg | 1310 | 7.6 | Wuppertal-Hammesberg Langerfeld-Mitte | 4441 | 9.3 | Wuppertal-Langerfeld-Mitte Rauental (Wuppertal) | 3546 | 12.6 | Wuppertal-Rauental Jesinghauser Straße | 1811 | 13.8 | Wuppertal-Jesinghauser Straße Hilgershöhe | 3336 | 14.7 | Wuppertal-Hilgershöhe Löhrerlen | 1779 | 15.1 | Wuppertal-Löhrerlen Fleute (Wuppertal) | 2187 | 13.1 | Wuppertal-Fleute Ehrenberg (Quartier) | 2315 | 3.2 | Wuppertal-Ehrenberg Beyenburg-Mitte | 3173 | 2.6 | Wuppertal-Beyenburg Herbringhausen (Quartier) | 2256 | 1.8 | Wuppertal-Herbringhausen Ronsdorf-Mitte/Nord | 7852 | 5.3 | Wuppertal-Ronsdorf-Mitte/Nord Blombach-Lohsiepen | 2856 | 6.2 | Wuppertal-Blombach-Lohsiepen Rehsiepen (Wuppertal) | 1871 | 13.1 | Wuppertal-Rehsiepen Schenkstraße | 3462 | 4.9 | Wuppertal-Schenkstraße Blutfinke | 4702 | 3.1 | Wuppertal-Blutfinke Erbschlö-Linde | 805 | 4.1 | Wuppertal-Erbschlö-Linde
- QUELLE auf "…_jahr=2009" setzen.
- Den Artikel um den Inhalt des Feldes COMMONSCAT erweitern (Weblinks oder Weblinks mit Commonscat könnte zum Teil schon vorhanden sein):
== Weblinks == {{Commonscat|Wuppertal-Elberfeld-Mitte|{{PAGENAME}}}}
oder NAME aus der Infobox auswerten; entweder NAME (komplett) oder angefügte Klammer abschneiden (Beispiel: Elberfeld-Mitte (00) -> Elberfeld-Mitte)
== Weblinks == {{Commonscat|Wuppertal-Elberfeld-Mitte|NAME}}
Ich hoffe ich habe mein Anliegen deutlich genug erklärt. --Atamari 21:31, 15. Dez. 2010 (CET)
- Hast Du. Die IB-Parameter kann ich machen, für die CommonsCat-Sache müsste ich programmieren und das ist mir ehrlich gesagt für die paar Artikel zu viel Aufwand. Vielleicht finde sich ja noch einer, der beides macht.--Cactus26 18:54, 17. Dez. 2010 (CET)
- In Teilen in dem der Commonscat-Parameter gesetzt wird, hatte oben geschrieben dass man den Parameter NAME der Infobox (reduziert um den Klammerausdruck) als 2. Parameter der Commonscat-Vorlage nehmen kann. Natürlich kann man auch den Artikel-Namen reduziert um den Klammerausdruck nehmen. --Atamari 22:51, 17. Dez. 2010 (CET)
- Schon. Das Problem ist eher, ob ein Weblinks-Header schon vorhanden ist und wenn nicht, wo ihn einfügen. Hier ist ohnehin nur eine recht störungsanfällige Heuristik möglich, die habe ich nicht und eine solche halbwegs wasserdicht zu implementieren dauert länger, als es manuell in die Artikel einzufügen. Für die IB hätte ich einen passenden parametrisierbaren Bot, das, wie gesagt, würde ich machen.--Cactus26 09:12, 18. Dez. 2010 (CET)
- Nach meiner Schäztung glaube ich, dass vielleicht 10% der Artikel ein Weblinks-Abschnitt haben. Einsetzen würde ich ihn generell vor den Kategorien. Da ich bei dieser Zahl alle Änderungen noch kurz kontrollieren kann, sehe ich doppelte Einfügungen des Abschnitts sowie andere Probleme und kann dann nachfeilen. --Atamari 16:14, 26. Dez. 2010 (CET)
- Ich habe 21 von 79 Artikel mit Weblinks gefunden (
==\s*Weblinks\s*==
). Der Abschnitt sollte vor den Navigationsleisten gesetzt werden, falls vorhanden, ansonsten vor den Kategorien. Der Umherirrende 18:29, 27. Dez. 2010 (CET)- Ja, klar - immer vor den Navigationsleisten, die in allen Artikeln vorhanden sind. --Atamari 00:07, 31. Dez. 2010 (CET)
- Klopf-klopf... ;-) --Atamari 13:28, 5. Jan. 2011 (CET)
- Ja, klar - immer vor den Navigationsleisten, die in allen Artikeln vorhanden sind. --Atamari 00:07, 31. Dez. 2010 (CET)
- Ich habe 21 von 79 Artikel mit Weblinks gefunden (
- Nach meiner Schäztung glaube ich, dass vielleicht 10% der Artikel ein Weblinks-Abschnitt haben. Einsetzen würde ich ihn generell vor den Kategorien. Da ich bei dieser Zahl alle Änderungen noch kurz kontrollieren kann, sehe ich doppelte Einfügungen des Abschnitts sowie andere Probleme und kann dann nachfeilen. --Atamari 16:14, 26. Dez. 2010 (CET)
- Schon. Das Problem ist eher, ob ein Weblinks-Header schon vorhanden ist und wenn nicht, wo ihn einfügen. Hier ist ohnehin nur eine recht störungsanfällige Heuristik möglich, die habe ich nicht und eine solche halbwegs wasserdicht zu implementieren dauert länger, als es manuell in die Artikel einzufügen. Für die IB hätte ich einen passenden parametrisierbaren Bot, das, wie gesagt, würde ich machen.--Cactus26 09:12, 18. Dez. 2010 (CET)
- In Teilen in dem der Commonscat-Parameter gesetzt wird, hatte oben geschrieben dass man den Parameter NAME der Infobox (reduziert um den Klammerausdruck) als 2. Parameter der Commonscat-Vorlage nehmen kann. Natürlich kann man auch den Artikel-Namen reduziert um den Klammerausdruck nehmen. --Atamari 22:51, 17. Dez. 2010 (CET)
www.sensesofcinema.com
Sehr geehrte Bot-Besitzer oder auch Hallo,
In der Redaktion Film und Fernsehen wurde diese Anfrage gestellt und es wird gemeint, dass ein Bot die Aufgabe ausführen könnte - Also:
Die Links, die auf Seiten von sensesofcinema.com führen, müssen geändert werden. Der Link auf die Seite zu McCabe & Mrs. Miller beispielsweise hat früher so ausgehen: http://www.sensesofcinema.com/contents/cteq/00/9/mccabe.html und muste jetzt geändert werden in: http://archive.sensesofcinema.com/contents/cteq/00/9/mccabe.html Die anderen Links auf sensesofcinema.com müssen offenbar auch alle geändert werden. Eine Übersicht über die betroffenen Seiten gibt es hier: http://de.wikipedia.org/w/index.php?title=Spezial:Weblink-Suche&target=*.sensesofcinema.com.(Anfrage gestellt von Kerbel). Und könnte dieser Auftrag ausgeführt werden, wenn ich nett bitte? --Roman 14:07, 4. Jan. 2011 (CET)
- MerlLinkBot-Arbeit, oder? ;) --Guandalug 14:14, 4. Jan. 2011 (CET)
- Danke, geau den. --Roman 14:24, 4. Jan. 2011 (CET)
- Das scheint aber nur den content-Pfad zu betreffen. Damit wären dann etwa 1400 Links betroffen. Erledigt mein Bot demnächst. Merlissimo 01:43, 5. Jan. 2011 (CET)
- Komische Serversoftware. Mein Bot hat immer einen 301 auf die Adresse bekommen, im Browser sah ich aber den korrekten 404. Ein Blick in die Log zeigt schnell, dass der Server meinen Header "Accept-Encoding: identity" bemängelt. Einen Server, der keine lesenbare Ausgabe erzeugen will fand ich komisch. Aber was soll's: Also habe ich eben zwei Kompressionfilter ins Framework eingebaut und dem Server ein schönes "Accept-Encoding: gzip, deflate" im Request-Header präsentiert. Aber wieder bekam ich ein "Vary: Accept-Encoding". Ich habe daraufhin noch mal ein paar Varianten meiner anderen drei Accecpt-* und User-Agent Header-Einträgen und zusätzliche Header hinzugefügt. Auch habe ich so ziemlich alles sowohl mit HTTP 1.0 als auch HTTP 1.1 durchgespielt - ebenfalls ohne Erfolg.
- Die Lösung fand sich dann in der letzten Möglichkeit: Deren Serven mag den von benutzen Apache-Framework gesetzen "Host: www.sensesofcinema.com:80" Eintrag nicht, sondern akzeptiert nur die Angabe "Host: www.sensesofcinema.com" ohne Portnummer.
- Dies widerspricht dem RFC und ich bin sicher, dass auch manche Browser deshalb nicht akzeptiert werden. Mich hat es nun eine ganze Stunde Testen gekostet.
- Ich musste es hier gerade mal genervt loswerden. Bot wird in der Nacht laufen. Merlissimo 20:48, 5. Jan. 2011 (CET)
- Danke für deine Hilfe! --Roman 21:03, 5. Jan. 2011 (CET)
- Das scheint aber nur den content-Pfad zu betreffen. Damit wären dann etwa 1400 Links betroffen. Erledigt mein Bot demnächst. Merlissimo 01:43, 5. Jan. 2011 (CET)
- Danke, geau den. --Roman 14:24, 4. Jan. 2011 (CET)
- Es gab 1362 Links. Ich habe zwei wenig eingebundene Vorlagen auf bnwiki und swiki korrigiert. Einige Archive-Links führen per 302 wieder auf de www-Subdomain zurück, was der Bot ebenfalls berücksichtigt hat Bsp.. Der Bot hat dann ein wenig Arbeit geleistet:
de-0: 139 Pages; id-0: 44 Pages; es-0: 44 Pages; ru-0: 40 Pages; fr-0: 27 Pages; tr-0: 29 Pages; en-0: 328 Pages; hr-0: 30 Pages; bn-0: 27 Pages; pt-0: 29 Pages; zh-0: 26 Pages; ja-0: 25 Pages; it-0: 23 Pages; sh-0: 20 Pages; ca-0: 19 Pages; nl-0: 18 Pages; hu-0: 18 Pages; fi-0: 18 Pages; he-0: 14 Pages; vi-0: 12 Pages; sv-0: 13 Pages; el-0: 12 Pages; no-0: 12 Pages; sr-0: 12 Pages; lt-0: 11 Pages; ro-0: 11 Pages; lb-0: 10 Pages; bs-0: 9 Pages; pl-0: 9 Pages; sw-0: 6 Pages; da-0: 8 Pages; la-0: 8 Pages; fa-0: 7 Pages; uk-0: 8 Pages; eo-0: 5 Pages; ar-0: 7 Pages; ml-0: 6 Pages; en-6: 7 Pages; cs-0: 7 Pages; new-0: 4 Pages; hi-0: 5 Pages; th-0: 5 Pages; te-0: 4 Pages; eu-0: 5 Pages; bg-0: 2 Pages; kn-0: 5 Pages; gu-0: 3 Pages; ta-0: 3 Pages; simple-0: 4 Pages; sl-0: 3 Pages; af-0: 3 Pages; mk-0: 3 Pages; ka-0: 3 Pages; ast-0: 2 Pages; sq-0: 2 Pages; ru-6: 2 Pages; ms-0: 2 Pages; cy-0: 2 Pages; hr-6: 2 Pages; mn-0: 2 Pages; br-0: 2 Pages; commons-6: 2 Pages; yo-0: 1 Page; tr-6: 1 Page; sw-10: 0 Pages; is-0: 1 Page; et-0: 1 Page; bn-10: 0 Pages; als-0: 1 Page; fy-0: 1 Page; pcd-0: 1 Page; nds-0: 1 Page; gl-0: 1 Page;
- Übrig blieben dann noch 32 Links. Was ich dann noch entdeckte war, dass es auch 301er-Weiterleitungen gibt und zwei Timeouts standen im Log. Ich habe den Bot nochmal nachlaufen lassen:
en-0: 4 Pages; hr-0: 1 Page; tr-0: 1 Page; es-0: 1 Page; sh-0: 1 Page; ru-0: 1 Page;
- Jetzt bleiben noch 19 Link übrig aus diversen Gründen (Link konnte im Quellcode nicht korrekt extrahiert werden, Serverfehler, ...), die man nun noch manuell nacharbeiten muss [2] (enwikiquote möchte die Ersetzung nicht). Merlissimo 19:21, 6. Jan. 2011 (CET)
- Für einen Nicht-Bot-Programmierer sieht sowas nach einem Wunderwerk aus. Es ist ja nicht einfach nur darum gegangen, sensesofcinema durch archive.sensesofcinema zu ersetzen (wie viele erst geglaubt haben); es haben vielmehr auch Ersetzungen dieser Art ( [3] ) angestanden. Toll, dass das geklapt hat! -- Kerbel 00:46, 7. Jan. 2011 (CET)
Moin, in der Vorlage is nen Tippfehler, es muss korrekterweise Website als letzter Parameter heißen. Wenn man das in der Vorlage ändert, muss man's ja auch in den Artikeln mit der Vorlage machen. Sind 250 Stück und ich hab keine Lust dazu ;) Ist das was für euch? LG, XenonX3 - (☎:±) 18:32, 5. Jan. 2011 (CET)
- Allerdings ist auch der Begriff Webseite durchaus üblich. Ich sehe hier keinen konkreten Handlungsbedarf. -- Schlurcher ??? 19:03, 5. Jan. 2011 (CET)
- Ich denke auch. Die Parameter sind deutsch, da gehört kein "website" rein. --Guandalug 19:09, 5. Jan. 2011 (CET)
- Ich hoffe doch, dass sie mehr als eine Webseite zu bieten haben und die Homepage auch noch auf weitere Webseiten verweist, die auf der gleichen Website liegt. Eine Website ist eine Internetpräsenz und keine einzelne Webseite. Sprachliche verschieben, aber imo doch beides möglich. Ich bevorzuge deswegen übrigens Den Begriff Homepage ;-). Merlissimo 19:15, 5. Jan. 2011 (CET)
- Wirklich sauber sind die Begriffe eh alle nicht. "Internetpräsenz" eventuell? --Guandalug 19:18, 5. Jan. 2011 (CET)
- Ist dann wirklich eine Umstellung notwendig? Ist doch eh alles nur im Quellcode zu sehen. -- Schlurcher ??? 19:56, 5. Jan. 2011 (CET)
- Habt ihr denn Website gelesen? ;) Website ist der gesamte Internetauftritt mit allen seinen Seiten, Webseite ist eine einzelne Seite des Auftritts, also z.B. diese Seite, auf der ich hier gerade schreibe. Von daher ist die Bezeichnung falsch, weil der Link in der Infobox die Website ansteuert und nicht eine einzelne Webseite (eigentlich doch, weil auch die Startseite eine Webseite ist). Iss a bisserl kompliziert. Die Änderung wäre übrigens nicht nur im Quelltext sichtbar, sondern in der Infobox steht explizit das Wort Webseite vor der Adresse. XenonX3 - (☎:±) 20:30, 5. Jan. 2011 (CET)
- Mein Sprachgefühl stört sich auch ein wenig an "Webseite", Website würde mir weit besser gefallen, in der Box könne man es auch "Internetauftritt" oder "Internetpräsens" nennen, wie von Guandalug bereits vorgeschlagen.--Cactus26 08:02, 10. Jan. 2011 (CET)
- Wie es am Ende heißt, ist mir relativ wurscht, nur Webseite ist halt falsch. XenonX3 - (☎:±) 10:30, 10. Jan. 2011 (CET)
- Mein Sprachgefühl stört sich auch ein wenig an "Webseite", Website würde mir weit besser gefallen, in der Box könne man es auch "Internetauftritt" oder "Internetpräsens" nennen, wie von Guandalug bereits vorgeschlagen.--Cactus26 08:02, 10. Jan. 2011 (CET)
- Habt ihr denn Website gelesen? ;) Website ist der gesamte Internetauftritt mit allen seinen Seiten, Webseite ist eine einzelne Seite des Auftritts, also z.B. diese Seite, auf der ich hier gerade schreibe. Von daher ist die Bezeichnung falsch, weil der Link in der Infobox die Website ansteuert und nicht eine einzelne Webseite (eigentlich doch, weil auch die Startseite eine Webseite ist). Iss a bisserl kompliziert. Die Änderung wäre übrigens nicht nur im Quelltext sichtbar, sondern in der Infobox steht explizit das Wort Webseite vor der Adresse. XenonX3 - (☎:±) 20:30, 5. Jan. 2011 (CET)
- Ist dann wirklich eine Umstellung notwendig? Ist doch eh alles nur im Quellcode zu sehen. -- Schlurcher ??? 19:56, 5. Jan. 2011 (CET)
- Wirklich sauber sind die Begriffe eh alle nicht. "Internetpräsenz" eventuell? --Guandalug 19:18, 5. Jan. 2011 (CET)
- Ich hoffe doch, dass sie mehr als eine Webseite zu bieten haben und die Homepage auch noch auf weitere Webseiten verweist, die auf der gleichen Website liegt. Eine Website ist eine Internetpräsenz und keine einzelne Webseite. Sprachliche verschieben, aber imo doch beides möglich. Ich bevorzuge deswegen übrigens Den Begriff Homepage ;-). Merlissimo 19:15, 5. Jan. 2011 (CET)
- Ich denke auch. Die Parameter sind deutsch, da gehört kein "website" rein. --Guandalug 19:09, 5. Jan. 2011 (CET)
- es ist durchaus auch einfach möglich nur den angezeigten text zu ändern und den namen des parameters variabel zu gestalten ({{{website|{{{webseite|}}}}}}). so brauchen die artikel nicht alle einmal angefasst zu werden und der geneigte leser sieht davon nichts. --Akkakk 10:55, 10. Jan. 2011 (CET)
- Ich denke, diese Möglichkeit ist jedem hier bekannt. Ich halte sie für die denkbar schlechteste (dann lieber "Webseite"), wohin das Prinzip "mach es allen Recht" führen kann, sieht man in enwiki, wo es einen ganzen Stall voll Weiterleitungen für die Vorlage Cite Web gibt, was ausgesprochen nett ist, wenn man per Bot untersuchen will, ob ein bestimmter Link innerhalb dieser Vorlage verwendet wird.--Cactus26 12:51, 10. Jan. 2011 (CET)
Neue (villeicht sinnvolle) Botfunktion
Ich habe gesehen, dass es beim Abarbeiten der QS-Seiten angenehm wäre, per Weiterleitung auf die letzte unabgearbeitete QS-Seite zu gelangen. (ungefähr so wie bel Wp:QSH oder WP:Qualitätssicherung/heute) Eine Seite WP:QSL oder Wp:Qualitätssicherung/letzte unabgearbeitete Seite wäre das sinnvoll, die aber (wie auch bei Wp:QSH) immer, wenn eine Seite abgearbeitet wurde, von einem Bot aktualisiert werden müsste.--Fix 1998 Disk. +/- 10:04, 16. Jan. 2011 (CET)
Der Setzer dieses Bausteins ist der Ansicht, diese Bot-Anfrage sei abgeschlossen und könne archiviert werden. probier´ ich mal selbst mit Botix 1998--Fix 1998´s Disk. Sockenpuppe 07:18, 19. Jan. 2011 (CET) | ![]() |
Vorlage:FIFA-Rang aktualisieren
Wäre es prinzipiell möglich, die in dieser Kategorie aufgeführten Vorlagen (zumindest halb-)automatisch immer nach Erscheinen einer neuen FIFA-Weltrangliste zu aktualisieren? Beachte dazu auch die Diskussion im Fußball-Portal. Falls es möglich sein sollte, diese Anfrage aber bitte noch nicht sofort auf die Agenda nehmen, weil noch zwei weitere Vorlagen dazukommen werden ;-) Grüße, -- Memorino Lust, mitzuhelfen? 16:19, 13. Apr. 2010 (CEST)
- Hier wieder das Problem, dass die ToS auch nicht die nicht-kommerzielle Weiternutzung ausschließen. Besonders "keine abgeleiteten Werke auf Grundlage der Website oder Software zu erstellen" ist ein Problem und man die Software nicht ändern oder eingreifen darf. Also brauchen wir wohl eine andere Quelle oder eine Genehmigung, die wir vielleicht sogar bekommen.
- Zur technischen Umsetzung müsste man das Widget installieren und schauen, wo es sich die Daten holt. Merlissimo 16:43, 13. Apr. 2010 (CEST)
- Wer müsste die Genehmigung beantragen? Der Botbetreiber? -- Memorino Lust, mitzuhelfen? 20:07, 18. Apr. 2010 (CEST)
- Um was für eine Lizenz-Geschichte geht es genau? -- Chaddy · D·B - DÜP 19:37, 20. Apr. 2010 (CEST)
- Das ich oder ein anderer Botbetreiber mit meinen Bot die Daten auf der FIFA-Homepage auslesen dürfen um die Daten entsprechend aufzubereiten und so die Vorlage aktualisieren zu können.
- Das Auslesen der Daten ist technisch kein Problem, allerdings gibt es mehrere Klauseln in der TOS, die dies untersagen. Entscheidend ist aber wohl Punkt 8, wo es heißt "Sie vereinbaren, Teile der Website, die Website-Nutzung oder den Zugriff zur Website nicht ohne vorherige schriftliche Genehmigung der FIFA zu reproduzieren, zu duplizieren, zu kopieren, zu verkaufen, weiterzuverkaufen oder zu jeglichen kommerziellen oder nicht-kommerziellen Zwecken zu nutzen. Falls Sie daran interessiert sind, Inhalte der Website zu reproduzieren, ZU duplizieren oder zu kopieren, verwenden Sie bitte das Kontaktformular unter http://de.fifa.com/contact/form.html."
- Falls der Bot das ist die Vorlage schreibt wären die Daten anschließend hier unter der CC-Lizenz verfügbar.
- Alternative wäre eine andere Datenquelle, die nicht so strenge TOS hat. Vielleicht ein Regionalverband. Bei der UEFA konnte ich die Daten aber nicht finden. Merlissimo 20:07, 20. Apr. 2010 (CEST)
- Um was für eine Lizenz-Geschichte geht es genau? -- Chaddy · D·B - DÜP 19:37, 20. Apr. 2010 (CEST)
- Daten sind nicht schützbar, da kann die FIFA schreiben was sie will. Du würdest ja lediglich Platzierung und Punkte übernehmen, wenn ich das richtig sehe. Da gibt es rechtlich keine Probleme. -- Chaddy · D·B - DÜP 20:33, 20. Apr. 2010 (CEST)
- Ich hab mal bei WP:UF nachgefragt. Nicht weil ich dir nicht vertraue, sondern nur um wirklich sicherzugehen ;-) Grüße, -- Memorino Lust, mitzuhelfen? 21:26, 20. Apr. 2010 (CEST)
- Daten sind nicht schützbar, da kann die FIFA schreiben was sie will. Du würdest ja lediglich Platzierung und Punkte übernehmen, wenn ich das richtig sehe. Da gibt es rechtlich keine Probleme. -- Chaddy · D·B - DÜP 20:33, 20. Apr. 2010 (CEST)
- Könnte man die Vorlagen entprechend WP:MD systematisch benennen? --Septembermorgen 22:27, 20. Apr. 2010 (CEST)
- Da die Vorlagen jetzt umbenannt worden sind: Erklärt sich jemand bereit, entweder dem Rat auf UF zu folgen oder auf Nummer sicher zu gehen? Eine Aktualisierung per Hand wäre ziemlich umständlich. -- Memorino Lust mitzuhelfen? 19:09, 12. Mai 2010 (CEST)
- Fände das ehrlich gesagt noch interessant und habe schon für andere Jobs einen Bot(-Teil) in Arbeit der externe Daten (also von Nicht-Wiki) Seiten einbindet und in die Wiki kopiert. Also wenn hier noch niemand daran und etwas Geduld vorhanden ist, würde ich es übernehmen... ;) Aber leider nicht gleich sofort... Würde dann aber auch gleich das mit den Wechselkursen angehen, denn wenn schon sind laut Chaddy alle solchen Daten "frei" zu verwenden...?!? Aber eine juristisch verbindliche Aussage wäre schon schön... ;) Grüsse --DrTrigon 12:32, 2. Aug. 2010 (CEST)
- Sehe gerade Wikipedia:Bots/Anfragen#Botbauer gesucht würde auch dazupassen... --DrTrigon 18:29, 2. Aug. 2010 (CEST)
- Eine juristisch verbindliche Aussage bekommst du nicht mal von einem Rechtsanwalt, da musst du dich erst verurteilen lassen... -- Chaddy · D – DÜP – 18:32, 2. Aug. 2010 (CEST)
- Da die Vorlagen jetzt umbenannt worden sind: Erklärt sich jemand bereit, entweder dem Rat auf UF zu folgen oder auf Nummer sicher zu gehen? Eine Aktualisierung per Hand wäre ziemlich umständlich. -- Memorino Lust mitzuhelfen? 19:09, 12. Mai 2010 (CEST)
- Ich sehe das wie Chaddy: die Daten sind nicht schützbar. Die Berechnung liegt offen (es gibt soweit ich weiß ein PDF, in dem die Punktberechnung ausführlich beschrieben wird). Ich habe das vor einiger Zeit sogar mal selbst für ein Land in einer Excel-Tabelle überprüft. Da man also "nur" alle Länderspielresultate aller Mannschaften braucht (nicht schützbare Daten - und ich glaube auch nur Sieg/Unentschieden/Niederlage, keine genauen Torverhältnisse), kann die Tabelle jeder selbst berechnen. Dass aktualisierte Daten also von der FIFA-Seite kommen ist praktisch nicht nachweisbar. Vielleicht kennt jemand eine Seite, die frei (und gut auslesbar) alle Länderspielergebnisse auflistet (und nach WM/EM etc. unterscheidet). --APPER\☺☹ 00:21, 24. Okt. 2010 (CEST)
Wie ist der Wasserstand in dieser Angelegenheit? Hat jemand bei der FIFA angefragt? Wenn es keine Bot-Lösung für die Aktualisierung gibt, müssen sich die Kollegen vom Portal:Fußball eine andere Lösung ausdenken. Viele Grüße, --Drahreg01 23:35, 24. Dez. 2010 (CET)
Auch von mir nochmal die Bitte, diese Thematik zu einem Abschluss zu bringen. Wenn sich niemand findet, der einen Bot bereitstellt, schickt die Diskussion doch bitte ins Archiv, damit man weiß woran man ist. Gruß --Ureinwohner uff 00:03, 31. Dez. 2010 (CET)
Heute ist wieder ne neue Rangliste erschienen, daher nochmal die Frage, ob sich in diesem Fall noch irgendetwas tut... --Ureinwohner uff 12:18, 12. Jan. 2011 (CET)
- Ich bin mal so frech, diese Anfrage zur allgemeinen Beachtung nach unten zu ziehen. Wenn sich niemand findet oder die rechtlichen Bedenken überwiegen (unterscheidet sich eine Aktualisierung per Bot vom händischen Einpflegen?), seid doch so lieb und setzt einen Archiv-Baustein. Gruß --Ureinwohner uff 00:09, 19. Jan. 2011 (CET)
Dateilinks umbiegen
Wenn jemand einen Bot startbereit hat, könnte er die die Dateilinks auf Datei:180px-Essen Zollverein.jpg umbiegen auf Datei:Essen Zollverein.jpg. Es sind ca. 40 Einbindungen. Geht eine händische Änderung da schneller? Die px-Prefixe machen jedenfalls hin und wieder Ärger und sollten entfernt werden. Die Weiterleitung kann schließlich natürlich auch gelöscht werden. Yellowcard 21:53, 21. Jan. 2011 (CET)
- Eigentlich war's nur ein edit.... nu muss nur noch die Job queue mitkommen ;) --Guandalug 22:09, 21. Jan. 2011 (CET)
- Da war ich auch drauf gekommen, hatte aber wohl die falsche Vorlage im Visier. ;-) Danke! Yellowcard 22:11, 21. Jan. 2011 (CET)
- Ein paar hatten die geSubst... etwas manuelles war's dann doch noch. --Guandalug 22:15, 21. Jan. 2011 (CET)
- Da war ich auch drauf gekommen, hatte aber wohl die falsche Vorlage im Visier. ;-) Danke! Yellowcard 22:11, 21. Jan. 2011 (CET)
Der Setzer dieses Bausteins ist der Ansicht, diese Bot-Anfrage sei abgeschlossen und könne archiviert werden. Guandalug 22:09, 21. Jan. 2011 (CET) | ![]() |