Zum Inhalt springen

user talk:lustiger_seth

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
Abschnitt hinzufügen
aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Benutzer Diskussion:CamelBot)
Letzter Kommentar: vor 7 Tagen von Lustiger seth in Abschnitt Camelbot abbestellen?

im archiv sind aeltere/abgeschlossene beitraege zu finden...

[Quelltext bearbeiten]

url-converter: Probleme

[Quelltext bearbeiten]

Leider hat https://url-converter.toolforge.org/ Probleme bei der Konvertierung von https://archive.vn/Lfihj Vielen Dank im Voraus. --Hamburgum (Diskussion) 17:45, 2. Sep. 2020 (CEST)Beantworten

gudn tach!
oh, vielen dank fuer den hinweis. der archived url scheint zu stimmen. der originalurl ist allerdings verkorkst. schaue ich mir demnaechst an. -- seth 21:13, 2. Sep. 2020 (CEST)Beantworten
gudn tach!
sollte jetzt gefixt sein. -- seth 00:51, 4. Sep. 2020 (CEST)Beantworten
Danke für die Änderung. Aber Einzelnachweis 26 funktionierte immer noch nicht richtig https://de.wikipedia.org/w/index.php?title=Waze&oldid=203407357#cite_ref-26 --Hamburgum (Diskussion) 07:46, 5. Sep. 2020 (CEST)Beantworten
Mögliche Erklärung
falsche Konvertierung im url-converter http:// fehlt
https://archive.today/20130112014448/www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/
richtig
https://archive.vn/20130112014448/http://www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/
(nicht signierter Beitrag von Hamburgum (Diskussion | Beiträge) 08:06, 5. Sep. 2020 (CEST))Beantworten
gudn tach user:Hamburgum!
sorry fuer die nachfrage, aber bei mir funzen alle links. kannst du genauer sagen, was nicht funktioniert (und wie sich das aeussert)?
die angabe des protokolls http:// ist bei archive.today (und archive.vn usw.) nicht noetig. -- seth 10:18, 5. Sep. 2020 (CEST)Beantworten
https://archive.today/20130112014448/www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/ funktioniert nicht vgl. https://ibb.co/LSjkD44
https://archive.vn/20130112014448/http://www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/ funktioniert --Hamburgum (Diskussion) 12:24, 5. Sep. 2020 (CEST)Beantworten
vielen dank fuer die antwort. seltsam, ich haette schwoeren koennen, dass eben bei mir noch beide links funktionierten. jetzt habe ich das gleich problem. vielleicht habe ich mich verklickt?
danke jedenfalls fuer die geduld, ich schaue mir das spaeter noch mal genauer an und melde mich dann noch mal. -- seth 12:28, 5. Sep. 2020 (CEST)Beantworten
sehr seltsam. wenn ich auf den link
https://archive.today/20130112014448/www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/
klicke, werde ich von archive.today auf einen anderen, nicht funzenden url
https://archive.vn/20130112014448/www.tonev.net/2012/06/30/waze-%20%20%20%20-%20%20%20%20-%20%20-%20-%20%20%20-gpl-%20%20%20%20%20%20%20-%20%20-%20%20%20%20-%20%20%20/
weitergeleitet.
wenn ich denselben http-request ohne die referer-angabe sende, dann geht's jedoch.
oder wenn ich den obigen url kopiere und dann in der location bar des browsers einfuege, dann geht's ebenfalls.
oder wenn ich statt ".today" ".vn" nutze, dann geht auch der modifizierte link:
https://archive.vn/20130112014448/www.tonev.net/2012/06/30/waze-%D0%B2%D0%B5%D1%87%D0%B5-%D0%BD%D1%8F%D0%BC%D0%B0-%D0%B4%D0%B0-%D0%B5-%D0%BF%D0%BE%D0%B4-gpl-%D0%B7%D0%B0%D1%82%D0%B2%D0%B0%D1%80%D1%8F-%D1%81%D0%B8-%D1%81%D0%BE%D1%80%D1%81-%D0%BA%D0%BE%D0%B4/
fuer mich sieht das so aus, als waere etwas bei der weiterleitung von archive.today kaputt. die frage ist, wie wir damit umgehen.
ich koennte camelbot beibringen, kuenftig lieber .vn statt .today zu verwenden, aber eigentlich dachte ich, dass .today stabiler sei, und eben immer auf eine gerade funzende domain weiterleiten wuerde.
@user:PerfektesChaos: hast du eine idee? (@user:ⵓ: zur info) -- seth 13:51, 5. Sep. 2020 (CEST)Beantworten

Moin seth, könntest Du bitte mal den COIBot über die im genannten Link aufgeführten Domains laufen lassen? Die wären nach Abarbeitung auch alle was für die Blacklist. Danke und Grüße --Millbart talk 17:34, 8. Sep. 2022 (CEST)Beantworten

gudn tach!
ich hab's jetzt versucht, anzuleiern. mal schauen, ob COIBot sich damit wirklich poken laesst. -- seth 22:01, 8. Sep. 2022 (CEST)Beantworten

DigiZeitschriften, revisited

[Quelltext bearbeiten]

Hallo @Lustiger seth, aus der vor Kurzem abgeschlossenen Bots-Anfragen-Diskussion möchte ich Deine Idee aufgreifen, den DigiZeitschriften-URL durch den ersten unter dem PURL gelisteten URL zu ersetzen, der nicht auf DigiZeitschriften.de führt. Das funktioniert wunderbar im Artikel Helmholtz-Theorem, wo als Quelle das „Journal für die reine und angewandte Mathematik 1858“, Band 55 angegeben wird:

www.digizeitschriften.de/id/243919689_0055|log6
-> resolver.sub.uni-goettingen.de/purl?PPN243919689_0055
-> gdz.sub.uni-goettingen.de/id/PPN243919689_0055

Ein Negativ-Beispiel dagegen ist der Artikel Mausoleum des Theoderich, wo als Quelle die „Zeitschrift für bildende Kunst 1906“, Band 41 [=N.F. 17] angegeben wird:

www.digizeitschriften.de/id/523137710_0041|LOG_0003?...
-> resolver.sub.uni-goettingen.de/purl?PPN523137710_0041
-> gdz.sub.uni-goettingen.de/id/PPN523137710_0041
-> "The title you are looking for is already in the digitisation process, but is not yet available online."

Mein Eindruck ist, dass wir mit Deiner Idee bis Januar warten können, wenn die Gewissheit da ist, dass die Seite wirklich abgeschaltet wurde. Es kann gut sein, dass der Resolver-Mechanismus dann auch nicht mehr funktioniert. Da aber die weitaus meisten Ausweich-URLs nach demselben Muster gdz.sub.uni-goettingen.de/id/PPN(Code) gestrickt sind, kann diese Adressen auch ein Bot auflösen, indem der PPN-Code aus dem Link zu DigiZeitschriften herausgeholt wird. Grüße --T. Wirbitzki (Diskussion) 09:35, 23. Nov. 2025 (CET)Beantworten

Hallo @Lustiger seth, nun ist die Seite abgeschaltet. Hältst Du es für möglich und sinnvoll, dass eine Analyse über die defekten Links erstellt wird, die noch auf digizeitschriften.de zeigen (sofern keine Archivlinks)?
Aus Links der Art
...www.digizeitschriften.de/...PPN243919689_0055...
könnte das Skript folgende vermutete URL bauen
gdz.sub.uni-goettingen.de/id/PPN243919689_0055
Diese URL könnte auf „Lebendigkeit“ geprüft werden: Landet man wirklich auf einer Seite von sub.uni-goettingen.de, die keine Fehlerseite ist und auch nicht den Text „The title you are looking for is already in the digitisation process“ enthält.
Bei 20 Stichproben konnte ich nur einen einzigen Fall finden. --T. Wirbitzki (Diskussion) 23:58, 12. Feb. 2026 (CET)Beantworten
Noch ein Fall, etwas komplizierter:
www.digizeitschriften.de/dms/resolveppn/?PPN=GDZPPN002140241
-> resolver.sub.uni-goettingen.de/purl?GDZPPN002140241
-> gdz.sub.uni-goettingen.de/id/PPN243919689_0013
Man kann also vermutlich die PPN-Angaben oft in den „Resolver“ stecken und erhält eine verwendbare Antwort. Allerdings routet der Resolver manchmal direkt zur gewünschten Seite weiter (wenn vorhanden), manchmal indirekt auf eine Seite, die auch die obsolete Alternative zu digizeitschriften.de anbietet. --T. Wirbitzki (Diskussion) 18:29, 13. Feb. 2026 (CET)Beantworten
Gudn Tach!
Ich denke, mit diesen Informationen sollte sich so eine automatische Analyse erstellen lassen. Ich werde versuchen, mir das heute Nachmittag mal genauer anzuschauen.
-- seth (Diskussion) 10:53, 15. Feb. 2026 (CET)Beantworten
Das wäre fein, wenn wir eine Analyse hätten. Danach erst ergäbe es Sinn, über einen Reparatur-Botlauf statt manueller Bearbeitung nachzudenken. Die Komplexität steckt in den Beschriftungen, wie z.B. "Online", "Digitalisat" oder gerne alle möglichen Schreibweisen von "DigiZeitschriften" vor oder hinter dem Weblink, auch mal als Internetquelle formatiert. Doch erstmal sollten wir verstehen, wieviele Reparaturen überhaupt möglich sind. Wenn es z.B. weniger als 100 sind, sehe ich keinen Zweck in einer automatisierten Reparatur, alleine die Analyseliste würde die manuelle Arbeit ja schon reduzieren. --T. Wirbitzki (Diskussion) 11:11, 15. Feb. 2026 (CET)Beantworten
Gudn Tach!
Von den 2286 Links kann ich aus 502 die PPN auslesen. Davon sind wiederum 205 "Auswahlseiten" (d.h. sie leiten nicht direkt irgendwohin weiter). 274 leiten direkt weiter. Am Ende scheinen nur 47 davon auf existierende Digitalisate zu verweisen. Ich füge die Tabelle hier gleich ein. Ist ja nicht so groß.
-- seth (Diskussion) 00:51, 16. Feb. 2026 (CET)Beantworten
Super, vielen Dank! Die Ausbeute ist erst einmal nicht so groß, aber immerhin. Ich habe gleich mal 3 Stück ausprobiert, funktioniert gut. Wenn Du nichts dagegen hast, kann ich die bearbeiteten gleich hier abtrennen, sonst mache ich eine Arbeitskopie. Vielleicht wäre noch die Liste der Links mit PPN interessant, um sie zu untersuchen, doch das schaue ich mir lieber noch mal an und melde mich noch mal, geht ja evtl. auch mit regulärem Ausdruck. --T. Wirbitzki (Diskussion) 07:28, 16. Feb. 2026 (CET)Beantworten
Gudn Tach!
Ja, du darfst gerne die Tabelle unten nach Belieben modifizieren/kürzen/...
Zum zweiten Anliegen: Du meinst die Liste der 502 o.g. Links (oder die 502-47)? Die kann ich bei Bedarf auf einer Unterseite anlegen.
-- seth (Diskussion) 08:59, 16. Feb. 2026 (CET)Beantworten
Ok, danke für das Angebot. Ich kümmere mich jetzt um die 47 und melde mich dann noch mal, wie gesagt. --T. Wirbitzki (Diskussion) 21:21, 16. Feb. 2026 (CET)Beantworten
Hallo @Lustiger seth, ich habe mir mal eine markante Teilmenge der defekten Links mit PPN angeschaut: insource:digizeitschriften.de insource:/GDZPPN/.
Da lassen sich die meisten in der Tat nicht mehr durch den Resolver auflösen.
Es gibt jedoch einzelne Fälle aus dieser Liste, wo noch was geht, zumeist mathematisches Antiquariat:
Poker: GDZPPN002272717 -> gdz.sub.uni-goettingen.de/id/PPN235181684_0100
Carl Friedrich Gauß: GDZPPN002017954 -> gdz.sub.uni-goettingen.de/id/PPN250442582_0001
Hermann von Helmholtz: GDZPPN002150212 -> gdz.sub.uni-goettingen.de/id/PPN243919689_0055
Walter Felscher: GDZPPN002390116 -> gdz.sub.uni-goettingen.de/id/PPN266833020_0075
Hatte Dein Skript diese Links bei der Analyse besucht? Wenn ja, könnte es sein, dass der Resolver ab und zu in Unpässlichkeiten gerät, vielleicht wegen Überlastung. Dann könnte es noch etwas bringen, die Liste der unaufgelösten noch einmal abzugrasen. --T. Wirbitzki (Diskussion) 00:23, 19. Feb. 2026 (CET)Beantworten
Gudn Tach!
Sorry für die späte Antwort.
Ich denke, mein Script hatte die nicht besucht.
Ich hatte nur URLs betrachtet, die von einem der folgenden RegExps gematcht wurden:
~digizeitschriften\.de/dms/(?:img|toc)/\?(?:PID|PPN)=PPN([0-9_]+)~
~digizeitschriften\.de/id/([0-9]{8,}[0-9_]+)~
Das müsste ich also wohl erweitern.
-- seth (Diskussion) 23:36, 3. Mär. 2026 (CET)Beantworten
Hallo @Lustiger seth
Ich habe die Vermutung, dass Links in Mathematik-Artikeln (insource:digizeitschriften.de Mathematiker insource:/.?.?.?PPN/) auf existierende Digitalisate zurückführbar sind, immerhin über 200 Stück, siehe z. B. de.wikipedia.org/w/index.php?title=Eva_Bayer-Fluckiger&diff=prev&oldid=264887906.
Kann sowas ein Bot bearbeiten, der mit dem Resolver klarkommt und die Beschriftung "Digizeitschriften" ersetzt? Dann würde ich eine Bot-Anfrage stellen. --T. Wirbitzki (Diskussion) 06:03, 3. Mär. 2026 (CET)Beantworten
Wenn es einheitlich ist (was es vermutlich nicht ist), kann es ein Bot vermutlich tun. Je mehr Variation vorhanden ist, desto schwieriger ist es.
-- seth (Diskussion) 23:40, 3. Mär. 2026 (CET)Beantworten
Es gibt 1. die Variation der Link-Behandlung (Resolver) und 2. eine Variation in der Behandlung der Beschriftung ("DigiZeitschriften"). Zu 2. kann man alle Links aus der Maßnahme heraushalten, die das Wort DigiZeitschriften enthalten: insource:digizeitschriften -digizeitschriften. Dann könnte die Botmaßnahme die Beschriftungen so lassen, wie sie sind. --T. Wirbitzki (Diskussion) 10:30, 4. Mär. 2026 (CET)Beantworten
Z. B. werden über 300 defekte Links mit „Digitalisat“ beschriftet, und noch mal ca. 300 Links mit „online“. Natürlich könnte davor oder dahinter wieder irgendwo „DigiZeitschriften“ stehen, das wäre eine Aufgabe für die manuelle Nachbearbeitung. Ich schätze, dass sich davon knapp 10 % zu Links auf digitalisierte Schriften auflösen lassen.
Ich frage mich allerdings, ob noch Umstrukturierungen von Links beim Digitalisierungszentrum während des Abbaus des Portals zu erwarten sind, vielleicht werden auch noch Werke aus dem öffentlichen Zugriff wegen Urheberrechten entfernt. Dann wäre es besser, noch ein paar Monate abzuwarten. --T. Wirbitzki (Diskussion) 18:29, 8. Mär. 2026 (CET)Beantworten
Hallo @Lustiger seth, ich habe eine Bot-Anfrage für vermutet etwa 130 Fälle gestellt, die ich nicht manuell bearbeiten mag. Diese Diskussion hier kann archiviert werden, danke. --T. Wirbitzki (Diskussion) 15:12, 15. Apr. 2026 (CEST)Beantworten
Gudn Tach!
Ok, danke für den Hinweis. Ja, dort ist die Anfrage gut aufgehoben.
Und sorry, dass ich in letzter Zeit so wenig reagierte. Zu viel zu tun.
-- seth (Diskussion) 21:10, 16. Apr. 2026 (CEST)Beantworten

Urlconverter

[Quelltext bearbeiten]

Ich bin etwas aus der Übung, früher antwortet archive.today mit einen aussagenfähigen Response wenn ich mit curl -I https://archive.is/test abfragte. Heute funktoniert das nicht mehr. Der Urlconverter schafft immer noch. Wie machst du das? Kann man den Urlconverter auch direkt per curl abfragen? (nicht signierter Beitrag von (Diskussion | Beiträge) 21:23, 11. Dez. 2025 (CET))Beantworten

Gudn Tach!
Der url-converter (sowie CamelBot) schafft das leider auch nicht immer. Möglicherweise nutzt archive.is Heuristiken oder Whitelists.
Per curl nutzen kann man das Tool:
curl -s 'https://url-converter.toolforge.org/index.pl?url=https://archive.is/test' | grep -A 3 'archived url'
-- seth (Diskussion) 01:34, 12. Dez. 2025 (CET)Beantworten
Danke schön! Es sind über 1300 Kurzurls aufzulösen, da habe ich nach Weihnachten gut zu tun. (vor Weihnachten bin ich andernort sehr eingespannt.)  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 20:34, 12. Dez. 2025 (CET)Beantworten

Ich habe nun das Script beta-externalURLform.js Zeile L-721 und einen Link auf den Urlconverter eingebaut. In der Zeile 721 steht der Filter, der regelt, ob der Link angeboten wird oder nicht. Ich bin mir aber nicht sicher ob das Regex so passt, bzw ob alle Domains abgedeckt sind. Eventuell lässt sich das noch verbessern, wenn man die Muster von schlechten URLs in den Filter einbaut (bei Archive.today ist das schon der Fall) Das Script Benutzer:ⵓ/externalURLform ist ein Fork von User:TMg's User:TMg/weblinkChecker.js, das ich in den letzten Tagen auf ES6 umgestellt habe, um den Scope der Variablen einzuschränken. (Ein ToDo ist noch die Anpassung an die neuen Parameter der Vorlagen {{Webarchiv}}. Das war der Ausgangspunkt für den Umbau, denn Versuche das in der alten Version umzusetzen führten zu fehlerhaft veränderten Variablen) Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 16:15, 30. Dez. 2025 (CET)Beantworten

Gudn Tach!
Zum Regexp: In (ff.) kannst du sehen, welche URLs vom Script aktuell akzeptiert werden.
-- seth (Diskussion) 19:42, 30. Dez. 2025 (CET)Beantworten
Danke. Perl sollte ich mir auch mal näher ansehen. Ist wesentlich viel besser lesbar als ich dachte. for my $ ist übrigen wirklich cool... Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 20:13, 30. Dez. 2025 (CET)Beantworten

Servus! Ein Problembär kommt selten alleine: Ich habe gerade bemerkt, dass https://ghostarchive.org/ bei uns schon verlinkt wird. Ich vermute die ähnliche grundlegenden Probleme wie bei archive.today: Kurzurls, unbekannte Betreiber, ... Zusätzlich kommt hier dazu, dass der Speicher auf google-drives liegt und dort noch zusätzliche Regeln schlagened werden, die zu abrupten Löschungen von Subdomains führen können.

Kannst du dir bitte ansehen, ob es möglich ist aus Kurz-URLs wie https://ghostarchive.org/archive/L69hS Lang-URLs wie https://ghostarchive.org/archive/20211002140545/https://www.newspapers.com/clip/25791146/blue-skies-turn-black-at-scott-adams/ zu erzeugen? Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 15:03, 13. Feb. 2026 (CET)Beantworten

Gudn Tach!
Im konkreten Beispiel würde das wohl gehen:
import requests
from bs4 import BeautifulSoup
from datetime import datetime
def expand_ghostarchive_url(short_url: str) -> str:
	html = requests.get(short_url).text
	soup = BeautifulSoup(html, "html.parser")
	replay = soup.find("replay-web-page")
	if not replay or not replay.get("url"):
		raise ValueError("could not find replay-web-page tag")
	original_url = replay["url"]
	date_text = soup.find(string=lambda t: t and "Archive date:" in t)
	if not date_text:
		raise ValueError("could not find archiving date")
	date_str = date_text.split("Archive date:")[1].strip()
	dt = datetime.strptime(date_str, "%a, %d %b %Y %H:%M:%S %Z")
	timestamp = dt.strftime("%Y%m%d%H%M%S")
	long_url = f"https://ghostarchive.org/archive/{timestamp}/{original_url}"
	return long_url
if __name__ == "__main__":
	short = "https://ghostarchive.org/archive/L69hS"
	print(expand_ghostarchive_url(short))
Kannst du das für andere URLs bestätigen?
-- seth (Diskussion) 00:32, 16. Feb. 2026 (CET)Beantworten
Servus!
ich habe mir das mal auf der enwiki angesehen. Dort gibt es viel mehr davon. Siehe Quarry: https://quarry.wmcloud.org/query/102045
  • demnach sind von den 47000 /archive/ Links 1700 Kurzurls (5 stellig) Hinter der Kurzurl kann in seltenen Fällen ein Query beginnend mit einem "?"kommen.
  • Dazu gibt es noch 12000 /iarchive/ mit Links auf instagram und facebook. Ich vermute dass die Zahl im Pfad die tatsächliche Posting-ID ist.
  • Und schließlich noch 55000 /varchive/ mit Links auf youtube. auch dort ist die Videoid noch vorhanden.
Der großteil der Links mit Datumsangaben (8 oder 14stellig) kommt von einen einzigen User: Rlink2
für reguläre User ist die Lang-URL ohne externe Hilfsmittel praktisch nicht erreichbar, da alles auf die Kurz-URL zurückgeleitet wird. Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 19:06, 16. Feb. 2026 (CET)Beantworten

gipfelwelt.net

[Quelltext bearbeiten]

Hallo seth, danke für die Liste Mir war anfangs nur ein Eintrag aufgefallen, und dass hiernach vermeintlich nichts mehr kam, obwohl ich mit der Suche nach „Infos und Tourenbericht“ noch sieben andere Einträge des Wanderblogs fand, nicht jedoch die anders benannten. Hätte man mit Prüfung der IP noch eine andere Möglichkeit gehabt, die Einträge aufzuspüren als über den Spamcheck? (Danke, wieder etwas dazugelernt.) Dieser war von 15:20 Uhr, diesen von 11:43 fand ich als nächsten, dieser war vom Vorabend, dieser vom Morgen des Vortags und so weiter. Ihm muss also bewusst gewesen sein, dass reihenweise Einträge der Website mit gleichbleibendem TK leicht nachzuvollziehen sein würden, nehme ich an. Dann wäre der Wechsel der Konten – darauf muss man erstmal kommen – eine bewusste Verschleierung gewesen. Wie man ein Temporäres Konto wechselt, kommt noch dazu. Ich frage nach den IP, weil ich noch kein Einsichtsrecht habe . Gruß --Brighida (Diskussion) 07:33, 3. Apr. 2026 (CEST)Beantworten

Gudn Tach!
  • Das Spamcheck-Tool ist übrigens von CountCount. Falls du dich für den Link bedanken wolltest, bin ich der richtige Addressat. Falls du dich für das Tool bedanken wolltest, würde dein Dank CountCount gebühren. Das nur am Rande. :-)
  • Ansprache: Ah, cool, ich hatte nicht gesehen, dass eine erfolgte und die womöglich sogar Wirkung zeigte.
  • Zum Aufspüren: neben dem Spamcheck-Tool nutze ich vorwiegend special:linksearch (also z.b. special:linksearch/gipfelwelt.net). Zusätzlich kann eine gewöhnliche Suche helfen, falls jemand eine Domain unverlinkt platziert: special:search/gipfelwelt.net. Ansonsten siehe auch die Links in WP:Weblinks/Block/gipfelwelt.net oben.
  • IP-Adressen: Die sind im Falle der von dir verlinkten vier Edits sehr unterschiedlich. Es könnte also auch (muss aber nicht) sein, dass verschiedene Leute mehr oder weniger gleichzeitig die Idee mit dem Verlinken hatten. Typischerweise passiert sowas, wenn jemand z.B. via (anti-)social media die Werbetrommel rührt. Eine böse Absicht steckt meist nicht dahinter, sondern eher ein Missverständnis, was Wikipedia ist.
    Die IP-Adressen von gestern, die ich mir im Kontext der AAF-Meldung angesehen hatte, waren dagegen sehr ähnlich, weshalb ich da schon eher auf eine einzelne Person tippe (wobei nicht klar ist, ob es das Website-Betreiby, ein Fany oder ein Konkurrenty war). Denkbar ist auch eine Kombi. Meist erfährt man nicht, was dahintersteckt, sollte aber per WP:AGF immer davon ausgehen, dass die Leute nicht absichtlich der Wikipedia schaden, sondern nur ein Informationsdefizit haben. Insofern war deine Ansprache passend.
-- seth (Diskussion) 10:00, 3. Apr. 2026 (CEST)Beantworten
Der Dank gilt natürlich dir für den Link und weitere, und dass du dir die IP angesehen hast – und CountCount für das Spamcheck-Tool. Gut dass du darauf hinweist, besser nicht von vornherein schlechte Absichten zu unterstellen. Als ich über den ersten gipfelwelt.com-Link stolperte, war ich mir nicht mal sicher, ob ich den Eintrag nicht einfach sichten sollte, Weblink-Regeln hin oder her. Es hätte gut sein könnten, dass er Wikipedia-Besuchern einen echten Mehrwert gebracht hätte. Den habe ich nicht mehr gesehen, als ich die langatmigen Tourenbeschreibungen gelesen hatte. Viele Grüße --Brighida (Diskussion) 18:24, 3. Apr. 2026 (CEST)Beantworten

Aggregatoren etc.

[Quelltext bearbeiten]

Verschoben nach WP:Weblinks/Block/alchetron.com. Zusätzlich lege ich Redirects von den anderen Domains dorthin an. -- seth (Diskussion) 23:46, 16. Mai 2026 (CEST)Beantworten

camelbot

[Quelltext bearbeiten]

Pipes und [/] in Urls?

[Quelltext bearbeiten]

Gudden Tach! Der Bot hat in Alawiten (Difflink) gewütet, der mag wohl &#91 und &#93 nicht so ganz toll und hat beim Erzeugen dieser archive-url wieder eckige Klammern gemacht … und die mag Wikipedia bekanntlich gar nicht in URLs. Abgesehen davon hat er das Pipe im Parameter url nicht als Trennzeichen akzeptiert, sondern als Teil der URL. (Das hätte wohl als | maskiert werden sollen, aber das war schon vorher falsch). --Wurgl (Diskussion) 10:11, 18. Apr. 2019 (CEST)Beantworten

gudn tach user:Wurgl!
danke fuer den hinweis. hab's jetzt vorerst manuell gefixt.
das problem hatte ich bereits mal angegangen, allerdings wurde dann zu haeufig der url codiert. (die markierte zeile ist aktuell nicht aktiv.)
muss ich mir mal genauer anschauen. link-detektion ist immer ein grosser spass. -- seth 20:30, 18. Apr. 2019 (CEST)Beantworten

Spiegel.de Einzelnachweise

[Quelltext bearbeiten]

Hallo seth, dein Bot korrigiert ja seit einiger Zeit falsch formatierte Zeit Online Einzelnachweise, außerdem schon länger u.a. faz & taz Kurzlinks. Meinst du, du kannst ihm auch Korrekturen für Spiegel Online Einzelnachweise beibringen? Immer häufiger sehe ich in letzter Zeit sowas , richtig wäre es natürlich, wenn Spiegel als Werk, nicht als Autor genannt wird und dann auch nicht nochmal im Titel. Ein Blick in die Suche ergibt bei mir immerhin noch ein paar hundert Artikel mit dem gleichen Fehler.

Ist vielleicht zu geringfügig, um einfach so in nem Artikel zu editieren (ich selber korrigier das dann in einem Abwasch mit weiteren Verbesserungen ), aber sollte das ohne größere Schwierigkeiten gehen, könnte dein Bot z.B. bei jeder Zeit/FAZ/taz-Korrektur auch immer schauen, ob im gleichen Artikel noch ein Spiegel-Link gefixed werden kann? --Johannnes89 (Diskussion) 12:04, 17. Apr. 2021 (CEST)Beantworten

gudn tach!
camelbot korrigiert bereits gewisse spiegel-links. allerdings beschraenkt er sich bisher auf sowas wie:
DER SPIEGEL | Online-Nachrichten. Abgerufen am 2. Februar 2021.
(beachte auch den verlinkten url). daraus macht er dann
Jonas Breng: Bangladesch: Männer mit Macheten. In: Der Spiegel. 28. Mai 2016, abgerufen am 2. Februar 2021.
ich koennte ihm also grundsaetzlich da noch mehr beibringen. die frage ist, was er genau machen soll.
in deinem genannten beispiel koennte er
  • schauen, ob autor=DER SPIEGEL gesetzt und werk noch nicht gesetzt ist, und dann autor loeschen und dafuer werk setzen.
  • zusaetzlich koennte er im titel alles ab " - DER SPIEGEL - " loeschen.
  • ausserdem koennte er versuchen, den autor und das datum aus dem ziel-artikel zu extrahieren und nachzutragen, wenn diese daten noch nicht gesetzt sind.
waere das so ungefaehr das, was dir vorschwebt?
ich koennte es mir als todo notieren, werde aber vermutlich erst in ein paar wochen dazu kommen. -- seth 13:27, 18. Apr. 2021 (CEST)Beantworten
Hi seth, das klingt doch gut! Ich hatte vorallem an die ersten beiden Punkte gedacht. Wenn es ohne große Probleme klappt, auch noch Autor & Datum nachzutragen, wäre das natürlich auch super, aber mir persönlich jedenfalls weniger wichtig.
Dankeschön und viele Grüße --Johannnes89 (Diskussion) 13:54, 18. Apr. 2021 (CEST)Beantworten
Ich verwahre mich allerdings dagegen, spiegel.de/spiegel/print in die Vorlage:Internetquelle einzutragen; das ist ein generisches Druckwerk und als solches zu zitieren. Eine digitale Reproduktion ist dann allenfalls Beiwerk.
VG --PerfektesChaos 21:29, 18. Apr. 2021 (CEST)Beantworten
gudn tach!
stimmt, da hast du wieder mal recht. das betrifft nicht den von Johannnes89 genannten fall, aber mein beispiel. ausserdem ist offenbar der original-url gar nicht mehr verfuegbar, sodass man auf eine archivierte version ausweichen muesste:
das sollte dann also besser
Jonas Breng: Bangladesch: Männer mit Macheten. In: Der Spiegel. Nr. 22, 28. Mai 2016 (archive.org [abgerufen am 2. Februar 2021]).
lauten, oder? eigentlich wuerde ich dabei gerne noch "Jahr=2016" angeben, aber das laesst die vorlage zusammen mit der datumsangabe leider nicht zu. wie wuerde man es also richtig machen? "Sammelwerk=Der Spiegel 2016"? waere ja auch irgendwie nicht richtig. -- seth 23:49, 18. Apr. 2021 (CEST)Beantworten

Weitere Medien

[Quelltext bearbeiten]

Hallo lieber Seth, vielen Dank für die Korrekturdienste bei Zeit- und taz-Links, die sehr viel Zeit spart. Wäre eine ähnliche Funktion auch beim Redaktionsnetzwerk Deutschland und bei Jungle World möglich? Dort fehlen jeweils Titel, Werk, Autor und Datum, wenn ich das richtig sehe.--ChickSR (Diskussion) 09:05, 9. Nov. 2021 (CET)Beantworten

gudn tach!
der bot ist nicht so "intelligent", wie er vielleicht erscheinen mag. bei zeitlinks sucht er nur nach einem ganz bestimmten schema (naemlich links mit dem zeit-werbespruch, die immer gleich aufgebaut sind) und ersetzt diese, z.b. . weil das schema da immer gleich ist, kann er einfach den kompletten einzelnachweis ersetzen, ohne was kaputt zu machen der versehentlich zu loeschen. (und die zeit macht es einem auch recht leicht, automatisiert den autor zu bestimmen.)
bei rnd gibt's vermutlich nicht so ein bestimmtes verlinkungs-schema, oder? in stichproben habe ich jetzt ohnehin nur bei wenigen rnd-artikeln einen autor gefunden.
wahrscheinlich muesste ich dem bot einen etwas vernuenftigeren umgang mit templates beibringen und koennte dann auch leichter fehlende angaben ergaenzen lassen. ideen dazu habe ich bereits, aber werde dieses jahr sicher nicht mehr dazu kommen. -- seth 00:26, 10. Nov. 2021 (CET)Beantworten
Danke, dass du das auf dem Schirm hast. Ich habe leider keine Ahnung von Verlinkungs-Schemata, wollte einfach nur im Sinne der Verbesserung unserer Belege darauf hinweisen, dass bei einigen Medien beim automatischen Verlinken oft nur die Überschrift erscheint.--ChickSR (Diskussion) 11:04, 10. Nov. 2021 (CET)Beantworten
gudn tach!
ich hab mir's auf jeden fall als todo aufgeschrieben: .
jetzt brauch ich "nur" noch zeit. -- seth 23:00, 10. Nov. 2021 (CET)Beantworten

https-Änderungen bei Mementos

[Quelltext bearbeiten]

Hallo Lustiger seth, betrifft diesen Bot-Edit:

  • Sollten bzw. dürfen Originallinks, die mit Vorlage:Webarchiv als Mementos formatiert sind, verändert werden, hier: zu https? Selbst wenn: bringt das einen Vorteil?
  • Im Bsp. war zudem der taz-Link unter https (wieder?) live. Da wäre es wünschenswert, wenn der Bot letzteren einsetzen, von der Vorlage befreien oder wenigsten einen Hinweis auf möglichen live-status hinterlassen könnte.

Dank für technische Auskünfte sagt --Wi-luc-ky (Diskussion) 20:50, 31. Jul. 2021 (CEST)Beantworten

gudn tach!
danke fuer die anregungen!
archive.org scheint das protokoll zu ignorieren bzw. http und https intern immer auf denselben eintrag zu mappen. also sollte das kein problem sein.
allerdings sehe ich auch keinen grossen vorteil davon, allein das zu aendern.
tatsaechlich bin ich auch nicht so ganz zufrieden mit solchen mini-aenderungen. grundgedanke war eigentlich, dass der bot die taz-kurz-urls zu langen urls machen soll, also z.b. so. allerdings war mein algorithmus zum ersetzen etwas zu naiv, sodass der bot jetzt sehr streng auch teilweise nur das "www." bei der taz loescht.
ich moechte das noch verbessern, siehe auch WD:EL#einheitliche_urls.
zum zweiten punkt: ich denke, dass man das von-der-vorlage-befreien nicht automatisieren kann, weil es grundsaetzlich ja sein kann, dass sich der inhalt im wesentlichen punkt geaendert hat, was der bot nicht beurteilen kann. das sollte also besser manuell passieren. -- seth 23:12, 31. Jul. 2021 (CEST)Beantworten
Danke für die Rückmeldung, Lustiger seth. Dies sollten nur anregende Beobachtungen sein (archive.org ignoriert die http-/https-Differenz), im Pkt. 2 wohl Träumereien (war schon klar, dass ein Wegfall [zu] komplex ist; die live notice schon einfacher). Schönen Sonntag wünscht --Wi-luc-ky (Diskussion) 12:54, 1. Aug. 2021 (CEST)Beantworten
PS: Vllt. sollten Links mit Memento-Formatierung technisch auch jenseits von http/https grundsätzlich von der Änderung ausgeschlossen werden? Also im theoretischen Bsp.: Wenn https://taz.de/!5228454/ als Memento-Link mit VL formatiert stehen würde, dürfte der Bot nicht auf https://taz.de/Griechenland-vor-der-Wahl/!5228454/ ändern, obwohl wir wissen, dass beide Links live sind, was aber nicht Arbeitsfeld des Bots wäre. Gruß, --Wi-luc-ky (Diskussion) 13:06, 1. Aug. 2021 (CEST)Beantworten
gudn tach!
notice: sorry, auf den hinweis hatte ich vergessen zu antworten. ja, waere moeglich. ich weiss aber nicht, ob sich der aufwand dafuer lohnen wuerde. ich erstelle zumindest mal auf einen feature-request dafuer.
grundsaetzlich webarchive von korrekturen ausschliessen: ja, macht wohl sinn. bisher hatte ich mich darum nicht explizit gekuemmert, weil der bot einen link nur dann ersetzt, wenn das (neue) ziel einen 200er-status zurueckliefert. aus oben genannten gruenden, ist diese bedingung zu schwach. ich mache auch dafuer ein ticket auf. -- seth 18:22, 1. Aug. 2021 (CEST)Beantworten

Hallo seth, ich glaube, dass dein CamelBot in diesem Fall nicht richtig funktioniert. Kannst du das mal überprüfen. Gruß--Tfjt (Diskussion) 18:45, 4. Mär. 2020 (CET)Beantworten

gudn tach user:Tfjt!
vielen dank fuer den hinweis!
sieht sehr danach aus, als habest du recht. ein sehr seltsamer url ist das. und die parameter scheinen ueberfluessig zu sein.
ich hab mir's jedenfalls notiert als etwas, dass ich irgendwann mal beheben sollte. -- seth 23:16, 4. Mär. 2020 (CET)Beantworten
Danke!--Tfjt (Diskussion) 23:51, 4. Mär. 2020 (CET)Beantworten

Predatory Journals

[Quelltext bearbeiten]

Hallo Lustiger seth, im Nachgang des Redaktiontreffen der Redaktion Chemie hier nun eine Anfrage. Wir haben dort mit dem Umgang mit den Predatory Journals diskutiert die zahlreich in Artikel eingebaut werden und oft etwas belegen was im Grund falsch, unbelegbar oder zumindest zweifelhaft ist. Den Vorschlag das über Bearbeitsungsfilter zu verhindern habe sehe ich nicht für sinnvoll denn das würde meiner Kenntnis nach zu einer erheblichen Serverlast sorgen. Wäre hier die (globale) SBL denkbar/sinnvoll? Wir sollten solche Einfügungen wirksam verhindern denn das erfolgt oft nicht böswillig sondern aus reiner Unkenntnis von hochwertigen peer-reviewed-Quellen denn diese Journale geben sich durch Verwechselungnamen mit etablierten Namen einen seriösen Anstrich aber dort wird jeder Schrott gegen Geld angenommen. Grüße --codc senf 17:17, 12. Nov. 2022 (CET)Beantworten

gudn tach!
grundsaetzlich sehe ich beim verhindern von link-platzierungen durch wechselnde leute 3 moeglichkeiten: neben den von dir genannten (WP:SBL und WP:FILT) noch bot-gestuetzte wartungslisten und hinweise.
SBL und FILT sind vor allem nuetzlich bei intendierten regelverstoessen. die taugen also, um vandalen zu bremsen. allerdings sind sie meist nicht so gut geeignet, um versehentliche regelverstoesse zu verhindern. das problem ist naemlich, dass manche (relativ viele) leute ueberfordert mit den fehlermeldungen sind und nicht wissen, was sie dann tun sollen. es passiert leider nicht selten, dass man damit leute, insb. neulinge, verschreckt.
daher tendiere ich immer haeufiger in solchen faellen dazu, vorsichtiger, aber immerhin bot-gestuetzt vorzugehen.
beispiel:
  • wenn jemand einen link auf eine von mehreren definierten websites setzt, wird das automatisch in user:CamelBot/maintenance_list/seo_law_pages notiert.
  • ausserdem bekommt die link-plazierende person eine entsprechende nachricht (user:CamelBot/notice-seo_law_pages) auf ihre talk page geklatscht.
  • wird die nachricht verstanden und der link dann von derselben person nachtraeglich geloescht, haben wir einen aehnlichen effekt wie bei anwendung der SBL oder von FILT.
  • wird die nachricht nicht verstanden, ist trotzdem zumindest der beitrag nicht verloren (in der regel besser fuer wikipedia; ausserdem weniger frust beim neuling)
    • die wartungsliste kann von der chemie-redaktion hin und wieder mal angeschaut und abgearbeitet werden.
    • nachteil: etwas mehr aufwand fuer die redaktion (als bei SBL/FILT); vorteil: erleichterte kontrolle fuer die redaktion
  • der eintrag in der wartungsliste wird bei entfernung des links aus dem artikel automatisch wieder geloescht.
was haeltst du bzw. die chemie-redaktion davon? -- seth 19:46, 12. Nov. 2022 (CET)Beantworten
Die Liste der Domains wird recht lang werden und mir ist es und ich denke den anderen betroffenen Redaktionen ist es egal wie eine Lösung aussehen wird. Mit AGF werden diese Links als Quelle zu diesen Journalen nicht böswillig gesetzt sondern aus Unwissenheit – wie auch oft Wikipedia-Clone als Quellen benutzt werden. Mir ist bislang selber nur ein Fall aufgefallen wo irgendein Querdenker-Zeug in die WP mit einer solchen Quelle gebracht werden sollte. Ich setz mich morgen mal hin und versuche so eine Liste zu erzeugen – leider ist mein Skriptwissen ziemlich eingerostet so das es aber dauern kann und händisch wäre das eine unglaubliche Arbeit. --codc senf 20:31, 12. Nov. 2022 (CET)Beantworten
gudn tach!
deinen letzten satz hab ich nicht verstanden. was waere arbeit? wofuer braeuchstest du skriptwissen?
vielleicht hab ich mich auch ungeschickt ausgedrueckt? mein angebot ist, dass ich camelbot darauf ansetze und von ihm die wartungsliste erstellen sowie die linksetzenden leute informieren lasse. dafuer braeuchte ich nur eine liste von domains. aber die ist ja, wenn ich's richtig verstehe, schon durch WP:Redaktion_Medizin/PredJ-Prüfliste und das zugehoerige archiv gegeben, oder? -- seth 23:39, 12. Nov. 2022 (CET)Beantworten
Grundsätzlich kann ich Bash-Skripting aber brauche es einfach zu selten. Ich muss einfach schauen wo und wie ich die URL-Liste aufbaue weil ich das sicher nicht per Hand machen werde. Muss ich mir einfach zusammen suchen und heute war meine Internetverbindung echt schlecht und ständig Routingprobleme – hoffe ist morgen besser. Werde mich melden wenn ich damit weiter bin aber wollte erst einmal deine Meinung hören und auf Botbeschäftigung bin ich nicht gekommen sondern nur an SBL gedacht weil ich den Job für einen Filter (war der Vorschlag beim Treffen) für zu aufwändig sehe. --codc senf 23:52, 12. Nov. 2022 (CET)Beantworten
gudn tach!
um welche liste geht es? geht es um die URLs, die auf der redaktions-seite (und deren archiv) stehen? die brauchst du nicht zu extrahieren, das wuerde ich selbst hinbekommen.
oder geht's um die komplette liste von beall? die koennte ich mir ja von https://beallslist.net/#update ziehen. -- seth 00:01, 13. Nov. 2022 (CET)Beantworten
Ich wollte mir die komplette Liste von Beall anschauen aber da gibts noch mehr Listen die evtl. in Betracht kommen. Dieser Markt ist einfach ziemlich unübersichtlich und regelmäßig tauchen da auch neuerfundene Journale auf weils wohl als Geschäft sehr einträglich zu sein scheint. --codc senf 00:10, 13. Nov. 2022 (CET)Beantworten
gudn tach!
fuer beall's list habe ich das jetzt mal gemacht: user:CamelBot/link_list/predatory-scholarly.json.
jetzt muesste ich "nur" noch dem camelbot beibringen, die liste zu lesen. heute mach ich das allerdings nicht mehr. -- seth 01:14, 13. Nov. 2022 (CET)Beantworten

Haha, Lustiger Seth: Dein Bot hat „Exportweltmeister“ in seine Liste für die Media-viewer-Links eingetragen (Spezial:Diff/230008786). Eingefügt wurde es in den Artikel durch diese Änderung innerhalb eines Wartungsbausteins; der Verursacher ist mir entfernt bekannt ;-)X-) (Soeben von mir verbessert: Spezial:Diff/230019870.) — Speravir  03:08, 20. Jan. 2023 (CET)Beantworten

gudn tach!
aahrg, immer diese vandalen. danke fuer den hinweis. von wartungsbausteinen hat der bot noch keinen begriff. muesste ich ihm mal beibringen. -- seth 08:52, 20. Jan. 2023 (CET)Beantworten

Erzeugt Vorlagenfehler: Guten Rusch, --TenWhile6 (Disk | CVU) 23:58, 30. Dez. 2023 (CET)Beantworten

Gudn Tach!
Hmm, stimmt, schade. Der Bug ist bekannt, allerdings trat er bisher so selten auf, dass ich ihn auf die lange Bank geschoben hab. Dadurch, dass der Bot mittlerweile sehr viele Parameter löscht, kann das Problem häufiger auftreten. Muss ich mir morgen anschauen. Danke für den Hinweis. -- seth (Diskussion) 00:03, 31. Dez. 2023 (CET)Beantworten
Das Problem tritt nur innerhalb von Tabellen auf, sollte also weiterhin selten sein. Eine Behebung ist schwierig. Ich startete in der Vergangenheit bereits zwei Anläufe, dich ich aber aus Zeitgründen jeweils eingestellt habe. Hab gestern den dritten Anlauf gewagt, es bleibt schwierig. Die Behebung wird noch dauern. -- seth (Diskussion) 13:10, 1. Jan. 2024 (CET)Beantworten
Ok, alles fein. Wollte dich nur informieren. Frohes neues Jahr. --TenWhile6 (Disk | CVU) 13:15, 1. Jan. 2024 (CET)Beantworten
Gudn Tach!
Danke @TenWhile6 fürs weitere Anpingen. Eine programmiertechnisch saubere Lösung werde ich wohl in nächster Zeit (wegen Zeitmangels) nicht schaffen, aber vielleicht einen interimsmäßigen Work-Around implementieren. Sorry für den Aufwand und ping mich gerne weiter an. -- seth (Diskussion) 20:26, 13. Jan. 2024 (CET)Beantworten
Kein Problem, ich helfe gern. LG --TenWhile6 (Disk | CVU) 20:28, 13. Jan. 2024 (CET)Beantworten
Gudn Tach!
Ich hab jetzt erstmal die Wahrscheinlichkeit noch weiter reduziert, indem ich hartcodiert URLs, die nach einem url= kommen, nicht |title= enthalten lasse: . Das ist noch keine saubere Lösung, aber sollte die meisten (der ohnehin wenigen) Fälle abdecken.
Und irgendwann, wenn ich mal mehr Zeit hab, überleg ich mir was besseres.
Sollten dir noch Fehler auffallen, gerne wieder Bescheid geben, dann passe ich den Work-Around an. -- seth (Diskussion) 23:44, 14. Jan. 2024 (CET)Beantworten
Hey, kurze Rückmeldung: soweit ich das sehen konnte, hat diese hartcodierte Prüfung neue Fehler effektiv verhindern können. Super! LG, --TenWhile6 (Disk | CVU) 18:55, 3. Feb. 2024 (CET)Beantworten
Gudn Tach!
Vielen Dank für die Kontrolle! QS ist Gold wert! -- seth (Diskussion) 19:21, 3. Feb. 2024 (CET)Beantworten
Hi, sorry, aber ich glaube, hier ist mal wieder was schief gelaufen. Leserättin hat lediglich eine VL durchgeführt. Wenn, dann hätte ich den Hinweis bekommen sollen ;) LG, --TenWhile6 (Disk | CVU) 12:01, 5. Feb. 2024 (CET)Beantworten
Gudn Tach!
Stimmt, danke. Problem ist bekannt. Allerdings hat es relativ niedrige Priorität, weil Admins sich von sowas nicht so leicht irritieren lassen. Hab's mir aber notiert. -- seth (Diskussion) 12:09, 5. Feb. 2024 (CET)Beantworten
Ok. Die armen Admins… ;) --TenWhile6 (Disk | CVU) 12:12, 5. Feb. 2024 (CET)Beantworten

Selbstreferenzen

[Quelltext bearbeiten]

Hallo seth, hier hat dein Bot leider nicht richtig funktioniert: Ich habe lediglich ein falsch gesetztes Komma durch die fehlende Klammer ersetzt. Schönen Gruß, Qaswa (Diskussion) 01:08, 25. Feb. 2024 (CET)Beantworten

Gudn Tach!
Hmm, stimmt, seltsam. Sorry jedenfalls. -- seth (Diskussion) 01:12, 25. Feb. 2024 (CET)Beantworten

Ich bekam eine kuriose Nachricht von Camelbot wegen "Selbstreferenz" bezüglich WP archive.today-Eintrag, wo ich im Absatz bezüglich der Sperre von archive.today in der englischen Wikipedia einen Link zur Diskussion über die Sperre gesetzt habe. Das sollte in einer Demokratie normal sein, dass Originalquellen bezüglich politischer Entscheidungen gesetzt werden können. Auch wenn Parlamente etwas entscheiden, ist es ganz normal Links zu entsprechenden Dokumenten zu setzen anstatt nur Sekundärquellen in Mainstreammedien zu setzen.

WP als selbstverwaltetes Projekt sollte gerade die eigenen wichtigen Entscheidungen transparent offen legen. Vor allem, wenn das alle Benutzer*innen betrifft!

Vielleicht wäre es möglich, den Bot etwas differenzierter zu programmieren?

Gerade in der deutschen Wikipedia scheint die "schwarze Pädagogik" des Zurechtweisen sehr verbreitet zu sein. Kein Wunder, wenn immer mehr ehrenamtliche Mitarbeiter den Hut drauf hauen ... --Martin Mair (Diskussion) 10:15, 3. Mär. 2026 (CET)Beantworten

Gudn Tach!
Vielen Dank für deine Rückmeldung und dass du dir die Zeit genommen hast, die Situation zu schildern. Der Hinweis des Bots bezieht sich ausschließlich auf die formale Regel WP:WPIKQ und soll auf mögliche Probleme mit Selbstreferenzen aufmerksam machen.
Gerade deshalb ist die Nachricht bewusst vorsichtig formuliert: Sie enthält mehrere "falls"-Formulierungen, weist ausdrücklich darauf hin, dass der Bot sich irren kann, und stellt klar, dass niemand zu einer Änderung verpflichtet ist. Ziel ist, auf mögliche Verbesserungen hinzuweisen, ohne jemanden zurechtzuweisen oder Entscheidungen zu bewerten.
Dass du den Link zur Diskussion über die Sperre gesetzt hast, ist nachvollziehbar. Interne Entscheidungsseiten können in bestimmten Kontexten sinnvoll sein -- nur müssen sie im Rahmen der geltenden Richtlinien eingeordnet werden. Bots können diese Feinheiten naturgemäß nicht immer erkennen. Mein Bot verwendet keine semantische Textverarbeitung und kann es deshalb gar nicht.
Wenn du konkrete Vorschläge hast, wie die Formulierung der Benachrichtigung noch differenzierter oder hilfreicher gestaltet werden könnte, freue ich mich darüber. Die entsprechende Bot-Message liegt unter user:CamelBot/notice-self-ref und kann dort gerne gemeinsam verbessert werden.
-- seth (Diskussion) 23:51, 3. Mär. 2026 (CET)Beantworten

Dein Bot hat auch mich gerade erneut benachrichtigt, obwohl ich archive.today hier eben nicht verlinkt habe, sondern ausgeklammert darauf hingewiesen habe, wie man die TimeOut-Seite als Beleg überhaupt noch einsehen kann / wie ich das Originalzitat beziehen konnte. Ich habe nach dem ersten Hinweis durch deinen Bot vor ein paar Tagen extra keinen externen Link zu archive.today eingefügt, also wieso schlägt der Bot da an? Schlägt der dann auch an, wenn man archive.today auf Diskussionsseiten erwähnt? (Was ich evt. gleich erfahren werde.) --SeptemberWoman 03:24, 10. Mär. 2026 (CET)Beantworten

Gudn Tach!
Danke für den Hinweis und sorry für die falsche Benachrichtigung. Ja, es ist ein Bot-Fehler, denn der Bot ignoriert aktuell HTML-Kommentare nicht, sondern behandelt sie wie normalen Text. (Ich finde deine Lösung mit den auskommentierten archive.today-Links übrigens sehr sinnvoll.)
Ich schreibe es mir auf, bin aber aktuell gerade IRL Land unter und weiß nicht, wann ich dazu komme, das Bot-Problem zu beheben. Vielleicht am Wochenende.
Zwei Möglichkeiten, falls du bereits vorher vorbeugen möchtest, dass das wieder passiert:
  • Entweder CamelBot verbieten auf deiner talk page zu schreiben: Siehe dazu template:Bots.
  • Oder du lässt die Botmeldung einfach bei dir stehen, denn der Bot unterlässt es, einen über etwas zu informieren, wenn dazu schon dieselbe Überschrift vorhanden ist.
Diskussionsseiten sind dem Bot bzgl. archive.today egal.
-- seth (Diskussion) 00:21, 11. Mär. 2026 (CET)Beantworten

"." falsch gesetzt?

[Quelltext bearbeiten]

siehe : Aus Universität Göttingen.]]. wird Universität Göttingen.]]. Ich hätte erwartet, dass der Punkt außerhalb des Wikilinks stehen bleibt. Habe es bereits manuell korrigiert . VG --Bicycle Tourer 17:42, 25. Mai 2024 (CEST)Beantworten

Gudn Tach!
Ja, hast recht, in seltenen Fällen (so wie im genannten) sollte der Punkt draußen sein. Der Bot kann das nicht unterscheiden.
Da es extrem selten vorzukommen scheint, würde ich diesen kleineren Fehler ignorieren. Ich wüsste nicht, wie ich ihn behebe, und denke, dass die Vorteile der tatsächlich falschen entfernten Punkte überwiegen.
Danke für den Hinweis und die Korrektur! :-) -- seth (Diskussion) 18:23, 25. Mai 2024 (CEST)Beantworten

Benachrichtigung

[Quelltext bearbeiten]

Hi seth, ich hab' keine Idee, weshalb Dein Bot mir hierfür eine Benachrichtigung geschrieben hat. Vielleicht hast Du 'ne Idee, scheint mir aber eher falsch, oder? LG  @xqt 20:46, 16. Jul. 2024 (CEST)Beantworten

Gudn Tach!
Danke für den Hinweis und Sorry für die Bot-Meldung. Das ist ein Bug, von dem ich bisher dachte, dass er nur im Kontext mit gelöschten Versionen auftritt. Ich hatte vor, mich im Sommer darum zu kümmern. Oh, oh, jetzt ist ja schon Sommer. :-o Ich schau's mir demnächst an.
-- seth (Diskussion; bitte bewerte meine Admin-Arbeit) 00:50, 17. Jul. 2024 (CEST)Beantworten
Vielleicht hast Du ja nächsten Sommer gemeint 😉; zum Kontext: Der Artikel war gelöscht, ich habe ihn wieder hergestellt und dann die letzte Version revertiert. Ich habe aus der Botmeldung auch nicht entnehmen können. um welchen Link es eigentlich geht. Wäre vielleicht hilfreich, diesen in der Nachricht explizit zu erwähnen. LG  @xqt 06:11, 17. Jul. 2024 (CEST)Beantworten
  • Ah, ok, dann passt es zum bereits bekannten Bug.
  • Link explizit erwähnen: Tss, du hast vielleicht abwegige Ideen! ;-) Nein, hast recht, muss mal schauen, weshalb ich das bisher nicht gemacht hab.
-- seth (Diskussion; bitte bewerte meine Admin-Arbeit) 09:16, 17. Jul. 2024 (CEST)Beantworten
Ich überlasse das Raten auch manchmal dem geneigten Leser ein SmileysymbolVorlage:Smiley/Wartung/:d   @xqt 09:39, 17. Jul. 2024 (CEST)Beantworten

kl. Fehlerchen

[Quelltext bearbeiten]

Moin! Korrektur mit Spezial:Diff/250728542 Ursache war der Camelbot Spezial:Diff/250715878 und ja, verschachtelte Vorlagen sind teuflisch ;^) --Wurgl (Diskussion) 10:06, 27. Nov. 2024 (CET)Beantworten

Gudn Tach!
Oops, danke für den Hinweis. Ich hatte das Beispiel sogar bereits offline zum Testen durchexerziert und dachte, dass es so passt, aber vergaß, dass bei diesen Pipes ja eine andere Ersetzung nötig ist. Das betrifft nun mehrere Artikel. Aber da dort ohnehin Kontrolle nötig ist, überlasse ich das mal den Kontrollierenden.
-- seth (Diskussion) 20:47, 27. Nov. 2024 (CET)Beantworten
Auf meinen Fehlerlisten kommen die raus, wo im Namen der Vorlage eine # ist und das war der einzige solche Fall, zumindest so um 7-8 Uhr herum. --Wurgl (Diskussion) 20:56, 27. Nov. 2024 (CET)Beantworten
Gudn Tach!
Ach so, ok, umso besser. Ich dachte, dass ich noch sowas in einem Artikel gesehen hatte. Aber vielleicht konnte der Bot da keine Ersetzung vornehmen, weil er keinen passenden Link gefunden hat.
-- seth (Diskussion) 21:12, 27. Nov. 2024 (CET)Beantworten

Sichtungsanfragen

[Quelltext bearbeiten]

Frage zu WP:GV/A und zum CamelBot

[Quelltext bearbeiten]

Hallo seth, auf der Seite GV/A steht, man könne Seiten eintragen, die seit mind. 1 Tag nicht nachgesichtet worden sind. Ich bin gerade rein zufällig auf die Botnachricht auf BD:176.1.219.254 gestoßen. Zu dem Zeitpunkt hatte ich schon seit vielen Stunden eine neue IP, darum hat mich die Nachricht nicht mehr direkt erreichen können. Darüber habe ich mich gewundert und nun nachvollzogen, wie es zu der späten Botnachricht kam.

Zum zeitlichen Ablauf: Diese Kat hatte am 16.2. eine ungesichtete Version vom 21.1. Die Änderung hielt ich nicht für sinnvoll und habe sie revertiert. Da die erste der beiden ungesichteten Versionen fast einen Monat alt war, trug ich die Seite direkt mit ein auf GV/A. Ich nehme an, das ist auch so gedacht und man muss sich beim Eintrag nicht an der letzten ungesichteten Version orientieren. Denn sonst hätte der Bot sich ja direkt nach dem Eintrag gemeldet. Später wurden die beiden ungesichteten Versionen nacheinander gesichtet, um 7.53 und um 8.29 Uhr. Direkt nach der ersten Nachsichtung kam die Botnachricht auch um 7.53, also 19 Stunden nach dem Eintrag auf GV/A. Da die IP täglich wechselt, konnte mich die Nachricht gar nicht mehr erreichen. Und auf GV/A wurde der Eintrag auch nicht mehr nachträglich als verfrüht versteckt wie sonst üblich.

Nun mein Vorschlag für den Bot: Wäre es nicht sinnvoller, solche Nachrichten nur direkt nach Einträgen auf GV/A zu versenden, aber nicht mehr viele Stunden später? Denn entweder war der Eintrag zum Zeitpunkt des Eintrags verfrüht oder eben nicht. Aber er kann doch nicht plötzlich nach vielen Stunden verfrüht werden, wenn er es zum Zeitpunkt des Eintrags noch nicht war, oder? So etwas kann dann nur am stückweisen Nachsichten einzelner Beiträge auf der nachzusichtenden Seite liegen. Damit kann man ja nicht rechnen, denn genauso gut hätte alles auf einmal nachgesichtet werden können und dann wäre der Bot nicht tätig geworden. Es wäre also sinnvoller, wenn der Bot die 24 Stunden nur einmal beim neuen Eintrag auf GV/A prüfen würde, aber nicht Stunden später erneut. Was meinst du dazu? Viele Grüße —176.1.8.114 16:51, 18. Feb. 2025 (CET)Beantworten

Gudn Tach!
Danke für deine Nachricht. Ich schau's mir später an und antworte auch. Evtl. allerdings nicht mehr heute.
-- seth (Diskussion) 10:28, 19. Feb. 2025 (CET)Beantworten
Ist ok, es eilt ja nicht.
Deine Diskussionsseite ist übrigens auch sehr groß (auch, weil ich gerade schon auf einer 200 kB großen BD war, wo auch schon das Speichern schwierig wurde) und braucht lange zum Laden. Das erschwert Diskussionen. Manchmal klappt das Speichern oder das Laden dann auch nicht direkt. Bei dir sind es sogar mehr als 300 kB. Wie wäre es, wenn du mal wieder Altes archivieren würdest? Die Abschnitte reichen hier schon 5 Jahre zurück. Keine feste Diskussionsseite zu haben, hat auch gewisse Vorteile, die Seite bleibt kurz. ;-) Viele Grüße —176.1.5.158 16:42, 19. Feb. 2025 (CET)Beantworten
Gudn Tach!
Du hast mit allem vollkommen Recht. :-)
Vielen Dank für die Mühe, das Bot-Problem so präzise zu beschreiben. Ich habe mir dafür ein Todo erstellt. Ich weiß nur noch nicht, wann ich dazu komme, mich darum zu kümmern.
Archivierung: Ja, muss mal wieder. Nur jetzt ruft erstmal das Bett.
-- seth (Diskussion) 00:46, 20. Feb. 2025 (CET)Beantworten

Etwas zum Ansehen

[Quelltext bearbeiten]

Ich habe wieder einmal CamelBot die Arbeit abgenommen, die er wohl nicht erledigen wollte: Spezial:Diff/260393601/260393718.
Meine steile These: Der Überschriften-Text des Abschnitts passt nicht zum Link und auch nicht zum Lemma. Wie auch immer man das hinbekommt. Eigentlich sollten Einträge mittels Vorlage ja an der Stelle inhaltlich identisch sein (ich hab' mir die Vorlage aber auch nicht angesehen). Das Lemma selbst war auf jeden Fall schon gesichtet, bevor ich weitere gesichtet habe, welche wiederum vom Bot sauber aus der Liste abgeräumt wurden. Wenn Du magst, kannst Du dir das ja einmal anschauen. -- Martin (Mpns/BD) 13:51, 7. Okt. 2025 (CEST)Beantworten

Gudn Tach!
Ja, CamelBot weiß nicht, welcher Artikel tatsächlich gemeint ist und muss sich daher einen der drei aussuchen. Er sucht sich seit einiger Zeit bei den Sichtungsanfragen den zweiten (also im vorliegenden Fall den falschen) aus.
Zur Frage, wie man die Inkonsistenz hinbekommt: Durch den Versuch einer Korrektur.
-- seth (Diskussion) 19:30, 7. Okt. 2025 (CEST)Beantworten
dann ist es ja auch nichts, was du ändern kannst. die paar fehlerhaften Fälle die so auftreten, kann man ja von Hand abräumen. das ist ja schon toll dass man von dem bot einiges abgenommen bekommt. und die Frage war eher rhetorisch gemeint, eher im Sinne "warum macht man sowas?" -- Martin (Mpns/BD) 19:59, 7. Okt. 2025 (CEST)Beantworten
Moin seth,
dieser Fall gehört zu jenen, bei denen man doch etwas länger nachdenken sollte wie ich gestern... Grundsätzlich ist der Bezug auf eine der 3 Informationen ja erforderlich, das ist mir klar. Zumindest wäre es auch in meinen Augen zu Aufwändig, hier noch mehr Analyse zu betreiben. Aber genau in der Wahl des Eintrages liegt die Krux. Fehler in diesem Eintrag fallen erst einmal nicht auf, da dieser nur für das menschliche Auge bestimmt ist. Der gleiche Fehler im ersten Eintrag hätte hier einen ähnlichen Effekt gehabt - ein Blaulink, der nicht funktioniert, wäre das Ergebnis. Im dritten Eintrag jedoch hätte hier die Vorlage {{Sichten}} gemeckert und den Text "Der Artikel ... existiert nicht" ausgegeben (wie z.B. hier) und somit ein direktes Feedback zum Fehler ausgegeben. Vielleicht kannst Du CamelBot ja den Übergabeparameter der Vorlage als Kriterium beibringen... -- Martin (Mpns/BD) 07:44, 8. Okt. 2025 (CEST)Beantworten

Kann man dem Bot...

[Quelltext bearbeiten]

den automatischen Editwar bitte abgewöhnen? Templates bei bereits normal verlinkten Archivlinks sind nicht erforderlich. Siehe History von Mario Rönsch. MfG, EinBeitrag (Diskussion) 10:32, 16. Aug. 2025 (CEST)=Beantworten

Gudn Tach!
Danke für den Hinweis! (Und sorry fürs späte Reagieren, bin gerade IRL sehr eingespannt.)
Die zugrundeliegende Diskussion für die Änderungen ist, soweit ich es sehe: WP:Bots/Anfragen#Archive_von_externen_Links_als_Archiv_kennzeichnen.
Bis zur Klärung deaktiviere ich dann diese Ersetzungen erstmal wieder.
-- seth (Diskussion) 10:54, 17. Aug. 2025 (CEST)Beantworten
Hat der sich verselbständigt? EinBeitrag (Diskussion) 14:21, 18. Aug. 2025 (CEST)Beantworten
Gudn Tach!
Da hat er nur noch den taz-Link von einem nicht so aussagekräftigen http- zu einem deskriptiveren https-Link ersetzt. Das ist schon eine (kleine, aber) deutliche Verbesserung und hat ja nichts mit dem Templatisieren zu tun.
-- seth (Diskussion) 14:29, 18. Aug. 2025 (CEST)Beantworten
OK, stimmt. EinBeitrag (Diskussion) 23:38, 18. Aug. 2025 (CEST)Beantworten

Übersieht der Bot etwas

[Quelltext bearbeiten]

Aktuell (Spezial:PermanentLink/259239491) eine Sichtungsanfrage auf Das schönste Paar offen, obwohl seit 16:11 Uhr durch Benutzer:RudolfSimon bereits gesichtet (Log dazu). Und seitdem hat der Bot schon des öfteren gearbeitet. -- Martin (Mpns/BD) 18:19, 27. Aug. 2025 (CEST)Beantworten

Gudn Tach!
Hmm, seltsam. Ich hab mir das jetzt ne Stunde lang angeschaut, aber konnte den Fehler (ich stimme zu, es sieht nach einem Fehler aus) nicht reproduzieren. Das Problem ist, dass ich Datenbankabfragen mache und die Datenbank sich ständig ändert, sodass es schwierig ist, etwas später nochmal nachzustellen. Vielleicht hatte die Datenbank kurz ein replication lag? Erstmal sehe ich nicht, was ich tun kann.
Aber wenn dir nochmal sowas auffällt, gerne wieder Bescheid geben.
-- seth (Diskussion) 20:53, 27. Aug. 2025 (CEST)Beantworten
Na endlich! Endlich habe ich einmal einen Fall gefunden, den CamelBot's Herrchen nicht erklären kann ein SmileysymbolVorlage:Smiley/Wartung/;) . Natürlich halte ich aber auch weiterhin die Augen auf und melde mich, wenn ich etwas sehe. Aktuell bin ich nur etwas seltener auf GV/A unterwegs als noch vor Monaten. -- Martin (Mpns/BD) 21:10, 27. Aug. 2025 (CEST)Beantworten

Media-Viewer – Doppeleintrag

[Quelltext bearbeiten]

Tach, was ist denn hier schief gelaufen: Spezial:PermaLink/259325567? Einmal reicht doch. (Und Schade, dass Du nicht mehr Admin bist.) Speravir02:03, 31. Aug. 2025 (CEST)Beantworten

Gudn Tach!
Hmm, seltsam. Werde ich mir in Ruhe anschauen müssen, weil ich spontan nicht sehe, woran es liegt. Es stellen sich ja zwei Fragen: 1. weshalb der doppelte Eintrag und 2. weshalb wird er nicht automatisch entfernt?
Mal schauen, ob ich heute Nachmittag dazu komme.
Auf jeden Fall danke für den Hinweis! :-)
(Auch seltsam: seitdem ich nicht mehr Admin bin, treten gehäuft CamelBot-Bugs auf, als ob das alte Trampeltier damit eine Chance wittern würde, mehr Zuneigung zu erfahren. Hoffentlich bleibt das nicht so.)
-- seth (Diskussion) 09:19, 31. Aug. 2025 (CEST)Beantworten
Ich hab den Bot jetzt neugestartet. Zumindest hat er jetzt die Tabelle wieder abgeräumt: .
Das ursächliche Problem ist damit zwar nicht behoben, aber zumindest stimmt die Liste wieder.
-- seth (Diskussion) 21:53, 31. Aug. 2025 (CEST)Beantworten
Ich hatte leider erst nach meinem Beitrag hier in die Versionsliste geschaut und da ist mir Folgendes aufgefallen:
Der Bot ist das erste Mal angesprungen, als der Erstautor die Seite in den ANR verschob (Spezial:Diff/259312480 bzw. ). Dort (Spezial:PermaLink/259312480) ist der Link mit Unterstrichen statt Leerzeichen angegeben: [[:Rathaus_Kamenz#/media/Datei:KM_Rathaus.jpg|Foto]]. Das fiel mir auf, als ich nach dem Urheber des Mediaviewer-Eintrags suchte, um auf seiner Seite auf meine Reparatur hinzuweisen (hier Spezial:Diff/259331902). Aber ich sah auch noch, dass Aka später eine Änderung durchführte, wo er unter anderem „Links normiert[e]“ (Spezial:Diff/259324787), da ahnte ich etwas und tatsächlich sieht man es im verlinkten Diff: [[:Rathaus Kamenz#/media/Datei:KM Rathaus.jpg|Foto]]. Anscheinend hat Dein Bot das als neuen Link angesehen, nicht als Änderung des bestehenden.
Speravir03:14, 1. Sep. 2025 (CEST)Beantworten
Gudn Tach!
Das hatte ich gestern nach deiner Meldung auch im ersten Moment vermutet (zumal mich Aka bereits auf die Unterstrich-Geschichte hingewiesen hatte). Aber in der Bot-Tabelle waren die Unterstriche (in der Trigger-Spalte) nicht drin, sondern dort waren zwei identische Einträge, was ich eigentlich konzeptionell ausschließen will. Eigentlich sollte dafür sogar die zweite (Trigger-)Spalte egal sein. Ich vermute also, dass der Bot den ersten Eintrag irgendwie "vergessen" hatte.
Ich weiß, dass da noch (mind.) ein Bug besteht. Der tritt allerdings nur selten auf, was das Debugging erschwert.
-- seth (Diskussion) 08:07, 1. Sep. 2025 (CEST)Beantworten
Oh, schade. … — Speravir00:17, 2. Sep. 2025 (CEST)Beantworten

Hmmm, Doppeleintrag mit Änderung der Umlautschreibung beim ersten Eintrag. Erste Änderung mit Kodierung des Umlauts, die zum ersten Eintrag in der Liste führte, Änderung von Aka mit Aufhebung der Kodierung, die zum Doppeleintrag führte. — Speravir04:11, 20. Sep. 2025 (CEST)Beantworten

Gudn Tach!
Ach du liebe Zeit. Danke für die Links. Das muss ich mir mal in Ruhe anschauen, dauert also noch.
-- seth (Diskussion) 16:15, 21. Sep. 2025 (CEST)Beantworten

Durch Camelbot rückgängig gemachte Änderung

[Quelltext bearbeiten]

Hallo, hier hatte der Bot meine direkt davor durchgeführte Änderung rückgängig gemacht, vermutlich da wir beide als Ausgangsbasis die Bearbeitung direkt davor verwendet haben. Das sollte nie passieren. Normalerweise müsste da ein Bearbeitungskonflikt erzeugt werden, den der Bot nicht einfach ignorieren sollte. Ich hoffe, der Bot gibt entweder "basetimestamp" oder "baserevid" bei der Bearbeitung mit an (). -- Gruß, 𝓪𝓴𝓪 𝓢𝓬𝓱𝓶𝓾𝓷𝔃𝓮𝓵𝓼𝓽𝓾𝓫𝓮 15:11, 14. Jan. 2026 (CET)Beantworten

Gudn Tach!
Du hast recht, das ist ein bekannter Bug.
Da er bisher extrem selten auftrat, hab ich ihm keine höchste Prio gegeben und ihn daher noch nicht behoben.
-- seth (Diskussion) 20:22, 14. Jan. 2026 (CET)Beantworten

CamelBot Nachricht zu juristischen Quellen

[Quelltext bearbeiten]

Hi seth,

mir ist eine etwas seltsame Formulierung bei einer Nachricht des CamelBot aufgefallen, als ich eine Disk gelesen habe (hier). [...], die nach Auffassung des Portal:Rechts eher ungeeignet ist. Ich finde, Portal:Rechts etwas seltsam, da es wirkt, als handele es sich um die Richtungsangabe oder politische Ausrichtung rechts. Als Genitiv wäre evtl. eher die Formulierung ...des Portal:Recht oder ...des Portals:Recht geeignet. Ähnlich wie man sagen würde Einwohner des Ortes Meiningen und nicht Einwohner des Ort Meiningens.

Vielleicht ist das ja schon geändert, die Nachricht die ich sah ist immerhin schon zwei Monate alt, ansonsten magst du das ja vielleicht mal ändern. Oder aber du kommst zu einem anderen Schluss, und findest die bisherige Formulierung völlig in Ordnung :).

Jedenfalls LG, --Valeee04 (Diskussion) 18:48, 14. Apr. 2026 (CEST)Beantworten

Gudn Tach!
Danke für den freundlichen Hinweis. Du hast vollkommen rechts (hihihi, scnr). Eigentlich weiß ich das auch und hab es an anderer Stelle in derselben Meldung auch richtig gemacht, hab mich an der fraglichen Stelle jedoch einfach vertan. Hab's jetzt korrigiert.
-- seth (Diskussion) 20:08, 14. Apr. 2026 (CEST)Beantworten

Fehlerhaftes Verhalten

[Quelltext bearbeiten]

Hallo seth, der CamelBot hat einen Hinweis auf meiner Diskussionsseite hinterlassen, dass ich im Artikel Markow-Kette einen Link zu archive.today eingefügt hätte. Weder war da einer, noch habe ich einen hinzugefügt. Mir scheint, dass er sich am Link zu mathnet.ru stört (da kommt "archive" im Link vor). Viele Grüße, --Leon (Diskussion) 16:58, 22. Apr. 2026 (CEST)Beantworten

Gudn Tach @Leonry!
Sorry für die späte Antwort.
Du hast Recht. In dem URL "https://www.mathnet.ru/php/archive.phtml..." kommt der Teilstring "archive.ph" vor und das hat dem Bot irrtümlich gereicht. Ich habe soeben eine Anpassung vorgenommen, sodass zumindest ein Wort-Ende nach dem "ph" vorausgesetzt wird. Das sollte den ohnehin bereits selten vorkommenden Fall eines false positives noch weiter reduzieren.
Vielen Dank für den Hinweis! Das hilft bei der Verbesserung des Bots. :-)
-- seth (Diskussion) 17:21, 25. Apr. 2026 (CEST)Beantworten
Hallo, ich schließe mich hier gleich mal an, weil ich bei Benutzer Diskussion:Zweioeltanks#Hinweis zu Verlinkungen von archive.(today,is,fo,li,md,ph,vn) ebenfalls eine unzutreffende Meldung bekam. Ich habe keine Links zu archivierten Fassungen eingesetzt, sondern zu direkt zugänglichen Belegen, in deren URL nur zufällig "archive" vorkam. --Zweioeltanks (Diskussion) 15:07, 7. Mai 2026 (CEST)Beantworten
Gudn Tach!
Oops, ich hatte das im Bot-Code geändert, aber offenbar vergessen, es auf den Bot auf dem Tool-Server zu übertragen. Ich erinnere mich, dass ich das machen wollte, aber anscheinend kam mir was dazwischen und danach hatte ich's vergessen. Ein dummer Fehler meinerseits, sorry.
Ich hab den Bot auf dem Tool-Server jetzt aktualisiert und neugestartet.
Danke für den Hinweis! :-)
-- seth (Diskussion) 00:54, 8. Mai 2026 (CEST)Beantworten

Statista als Beleg

[Quelltext bearbeiten]

Hallo, ich habe gesehen, dass du in verschiedenen Artikel Verweise auf Statista durch "richtige Belege" ersetzt hast. Was ist das Problem mit Statista, das ihre Daten zu "unrichtigen" macht? Sollte man die generell nicht verwenden? Gruss, --Nico b. (Diskussion) 11:00, 11. Aug. 2022 (CEST)Beantworten

gudn tach!
ha, sehr gut. ich habe gehofft, dass ich mit den aenderungen etwas aufmerksamkeit auf das thema lenken kann. :-)
vorab: die daten selbst sind meines erachtens in der regel nicht falsch.
trotzdem hat statista hat mehrere nachteile. zum einen erheben die normalerweie nicht selbst daten, sondern kopieren sie nur woanders her und stellen sie (manchmal unentgeltlich) zur verfuegung. besser ist es, gleich die originalquelle zu verlinken.
ausserdem ist statista ein privatwirtschaftliches unternehmen in der hand eines werbe-unternehmens(!) und bietet viele informationen (z.b. die originalquelle) nur gegen eine gebuehr an.
ausfuehrlicher habe ich es auf WP:FZW#von_statista_unabhaengiger_werden begruendet.
zur letzten frage: die meingungen gehen (siehe verlinkte diskussion) auseinander. meiner ansicht nach sollte man statista moeglichst vermeiden. wenn man nix anderes findet, ist es besser als nix. aber haeufig findet man was besseres. -- seth 11:13, 11. Aug. 2022 (CEST)Beantworten
Danke für den Link, da muss ich mich wohl einmal einlesen.--Nico b. (Diskussion) 11:35, 11. Aug. 2022 (CEST)Beantworten

Danke!

[Quelltext bearbeiten]

Hallo, ich bin das TK das vor einiger Zeit den Vorschlag zur besseren Kommunikation bei Benutzersperren im Namensräumen gemacht hatte. Wie ich auf VM-Disk sehe, hast du dich drum gekümmert. Dafür wollte ich einfach Danke sagen. Gruß und einen schönen Abend. ~2026-24139-52 (Diskussion) 17:44, 19. Apr. 2026 (CEST)Beantworten

Gudn Tach!
Ich muss gestehen, dass ich schon gar nicht mehr wusste, wer den Vorschlag gemacht hat. Aber freut mich, wenn es die Person, die es vorschlug, auch mitbekommt. :-)
Eas ist jetzt nicht die große Lösung, dass die Namespaces ausgeschrieben/benannt werden, sondern es wird lediglich die Seite mit der tabellarischen Zuweisung ID -> Name verlinkt, aber das sollte dennoch hilfreich sein und ist vom Wartungsaufwand noch halbwegs handhabbar.
-- seth (Diskussion) 19:28, 19. Apr. 2026 (CEST)Beantworten

Opt Out CamelBot

[Quelltext bearbeiten]

Ist es möglich, mich bitte in Zukunft mit Mitteilungen des von Dir gesteuerten CamelBot zu verschonen? Ich hoffe ja, denn ein Bot sollte nicht "ich" sagen, zwangsgeduzt werden möchte ich auch nicht. -- Just N. (Diskussion) 19:52, 24. Apr. 2026 (CEST)Beantworten

Gudn Tach!
Danke für deine Rückmeldung. Ich verstehe, dass Bot-Mitteilungen nicht jedermanns Sache sind. CamelBot verwendet eine einheitliche, neutrale Ansprache und eine standardisierte Ich‑Form. Das ist bei Bots üblich. Bei einem Bot ist "ich" lediglich die Kurzfassung von "das Script, das zugrunde liegt, um die Aufgaben zu erfüllen, die die programmierende Person ... vorgab, wozu unter anderem diese vorliegende Textausgabe gehört". Das wäre aber zu lang und umständlich. Die Ich-Form ist da verständlicher und etabliert. Ebenso ist das Duzen in der deutschsprachigen Wikipedia der allgemeine Standard -- unabhängig davon, ob ein Mensch oder ein Bot schreibt. Eine individuelle Anpassung der Anrede habe ich technisch nicht vorgesehen und es würde mich zu viel Zeit kosten, die ich dann nicht hätte, um wichtigere Funktionen umzusetzen. Dafür bitte ich um Verständnis.
Der CamelBot ist so eingerichtet, dass er nur in bestimmten Fällen aktiv wird -- im vorliegenden Fall nämlich dann, wenn im Artikel eine Selbstreferenzierung auf Wikipedia auftaucht, die nach unseren Richtlinien problematisch ist. Solche Hinweise sollen dabei helfen, Bearbeitungen zu verbessern und typische Stolpersteine langfristig zu reduzieren. Im vorliegenden Fall war der Hinweis auch inhaltlich korrekt, wie sich ja inzwischen gezeigt hat, da dein Edit von einem Mensch revertiert wurde.
Wenn du Bot-Nachrichten auf deiner Diskussionsseite grundsätzlich nicht erhalten möchtest, kannst du das selbst steuern: Über das Template:Bots lässt sich bestimmten (oder allen) Bots der Zugriff auf die eigene Diskussionsseite untersagen. Das ist völlig legitim, bringt aber natürlich den Nachteil mit sich, dass hilfreiche Hinweise dann nicht mehr bei dir ankommen.
-- seth (Diskussion) 10:44, 25. Apr. 2026 (CEST)Beantworten

Erwähnung verboten?

[Quelltext bearbeiten]

Gudn Tach!
Wenn ich richtig gesehen habe, hast du auf meiner Diskussionsseite den Webservice archive.today (bzw. archive.is) verlinkt.

Dazu ein paar Anmerkungen:

  • archive.today ist ein intransparentes Projekt einer Einzelperson und ist folglich nicht langfristig gesichert. Einzelne vergangene Vorfälle haben das verstärkt und dazu geführt, dass manche Sprachversionen der Wikipedia die Website sogar blockieren. Dies schafft ein Vertrauensrisiko, gerade im Vergleich zur Website archive.org, die deutlich transparenter organisiert ist.
  • Wenn möglich, ist es immer besser, einen anderen, direkt zugänglichen Beleg zu nutzen -- etwa einen alternativen Artikel derselben Zeitung (notfalls hinter einer Paywall), eine andere seriöse Quelle oder eine offizielle Veröffentlichung.
  • Falls keine andere Quelle verfügbar ist und ein Webarchiv notwendig wird, sollte bevorzugt archive.org genutzt werden. Ob archive.today in Ausnahmefällen weiterhin verwendet werden darf, ist umstritten. Tendenziell wird es toleriert, wenn kein anderer Beleg verfügbar ist und die zu belegende Aussage wirklich relevant ist.

Falls bereits geklärt ist, ob die Seite nicht mehr genannt werden darf, brauchst du nichts weiter zu tun.

Diskussionen und weitere Infos zum Thema findest du unter:

Ich antworte bei dir, das macht mehr Sinn.
-- seth (Diskussion) 23:45, 3. Mai 2026 (CEST)Beantworten

Denglisch auf Gesichtete Versionen/Anfragen

[Quelltext bearbeiten]

Die Zusammenfassungszeile des Camel-Bots auf Wikipedia:Gesichtete Versionen/Anfragen lautet beim Verstecken einer verfrühten Anfrage: "verfruehte requests versteckt". Sorry, aber diese Mischung aus deutsch und englisch ist nicht schön, kann das bitte in „Anfrage“ geändert werden? Gruß --Itti 11:44, 11. Mai 2026 (CEST)Beantworten

Gudn Tach!
Ästhetik ("schön") liegt in den Auge der jeweiligen Betrachtenden. Der Bot hat da seine ganz eigenen Vorstellungen. ;-)
Es war schon schwierig genug, ihn davon abzuhalten, permament hessisch zu babbeln -- das würde Arbeit machen und vermutlich unnötige Diskussionen auslösen (die ja ich und nicht er führen müsste).
Da meine Zeit stark begrenzt ist, versuche ich mich bei Änderungen am Bot vor allem auf funktionale Themen und echte Bugs zu konzentrieren. Daher lehne ich solche Stil-Requests normalerweise ab. Aber da es im konkreten Fall wirklich keine große Sache ist und ich damit zudem gut das Singular-Plural-Problem addressieren kann, habe ich es gerne umgesetzt.
In ein paar Tagen werde ich den Bot mal wieder neustarten und dann wird die Änderung uebernommen.
-- seth (Diskussion) 12:11, 11. Mai 2026 (CEST)Beantworten
Vielen Dank, Viele Grüße --Itti 12:28, 11. Mai 2026 (CEST)Beantworten
Bot ist jetzt neugestartet.
-- seth (Diskussion) 22:35, 14. Mai 2026 (CEST)Beantworten

Verlinkungen auf Archive.xx

[Quelltext bearbeiten]

Hallo Seth,

ich behebe öfters tote Links oder kümmere mich um Archivlinks im Politikbereich und kenne die Diskussionen zu dem Thema Archive.today/.ph/et cetera. Ich habe nun jedoch schon mehrmals vom CamelBot die Benachrichtigung zu Links auf Archive.xx bekommen, zuletzt hier. Die Sinnhaftigkeit für Neulinge möchte ich überhaupt nicht in Frage stellen, könnte man aber evtl. einrichten, dass der Bot sich merkt, welche Diskussionsseiten diesen Hinweis schonmal erhalten, sodass er ihn dort nicht nochmal hinsendet? Oder eine Art Opt-Out o. ä.?

Danke, liebe Grüße und schönes Wochenende --Linus (c’est la vie) 22:48, 15. Mai 2026 (CEST)Beantworten

Gudn Tach!
Ah, ich schrieb dir auch gerade hatte und noch nicht gesehen, dass du mir bereits geschrieben hattest.
Ich habe mir auch schon überlegt, dass das mit den archive.today-Hinweisen nicht so gut ist und einige Leute nerven wird. Ich sah vor einiger Zeit darin die beste Möglichkeit, ein drohendes Blacklisting der Domains zu verhindern (was noch nerviger und meiner Ansicht nach tatsächlich schädlich gewesen wäre). Vielleicht hat sich das Thema etwas gelegt und ich könnte die Hinweise reduzieren. Ein Opt-Out für genau diese Meldung müsste ich erst noch implementieren, was ein zeitliches Problem ist. Was es gibt, wäre ein pauschales Opt-Out via template:bots, damit einen CamelBot einfach gar nicht mehr anquatscht. Aber das will man vielleicht auch wieder nicht. Es wäre zumindest eine Möglichkeit, die schon jetzt funktioniert.
Was anderes kann ich leider noch nicht anbieten, sorry.
-- seth (Diskussion) 00:14, 16. Mai 2026 (CEST)Beantworten
Hello,
danke für die schnelle Antwort! :) Ich kann deinen Punkt gut nachvollziehen. Kein Stress meinetwegen, ich überlege mir das pauschale Opt-Out per Template mal und ansonsten setze ich die Nachrichten einfach wie gehabt zurück. ^^
Liebe Grüße --Linus (c’est la vie) 01:53, 16. Mai 2026 (CEST)Beantworten
Noch als Tipp: Der Bot achtet darauf, dass er keinen Abschnitt erstellt, dessen Überschrift dann doppelt vorhanden wäre. Wenn du also eine Nachricht stehen lässt, kommt keine neue mit derselben Überschrift.
-- seth (Diskussion) 08:33, 16. Mai 2026 (CEST)Beantworten
Hallöchen,
ich hab das mal weitergedacht und die Überschrift auskommentiert auf meiner Disk eingefügt. Scheint zu funktionieren, von daher ist das Problem für mich gelöst.
Danke für deine Hilfe! --Linus (c’est la vie) 02:14, 24. Mai 2026 (CEST)Beantworten
Gudn Tach!
Ja, stimmt, das funktioniert, denn Camelbot schaut in diesem Fall nicht, ob die Gleichheitszeichen (der Überschrift) am Zeilenanfang stehen.
-- seth (Diskussion) 10:18, 24. Mai 2026 (CEST)Beantworten

Danke...

[Quelltext bearbeiten]

... für den CamelBot und die Erläuterungen, was Text-Fragment-Links sind. Ich werde zukünftig auf so etwas achten. Hat das vllt. etwas mit der Option "Bereinigte links aus der Browserzeile kopieren" bei Firefox und z.B. amazon links zu tun? Danke nochmals und viele Grüße Martin Bahmann (Diskussion) 13:40, 18. Mai 2026 (CEST)Beantworten

Gudn Tach!
Ja, die Funktion "copy clean link" von Firefox hat einen ähnlichen Nutzen. Damit werden z.B. Tracking-Parameter wie "si=..." bei YouTube-Links oder "utm_source=chatgpt.com" bei Links von ChatGPT entfernt.
Allerdings sind wir bei den Text-Fragment-Parametern noch etwas strenger als Firefox, denn diese Text-Fragmente haben eigentlich einen anderen Zweck als Tracking. Sie können aber sehr einfach für Tracking missbraucht werden und sind außerdem sehr häufig gar nicht so nützlich, weil sie z.B. nur die Suchbegriffe von derjenigen Person hervorheben, die den Link eingefügt hat. In den meisten Fällen werden sie unbeabsichtigt benutzt. Daher "entschärft" der Bot die Links und sagt Bescheid, damit Leute in seltenen Fällen ggf. die Text-Fragmente mit einem "sic" wieder einbauen.
-- seth (Diskussion) 20:50, 18. Mai 2026 (CEST)Beantworten

Anzeigen von EN

[Quelltext bearbeiten]

Hallo Seth, ich kann im Artikel Bundesverfassungsgericht die EN-Vorschau nicht sehen (Vector 2010). Es heißt "Es gibt ein Problem beim Anzeigen der Vorschau - Die Seite aufrufen". Ein Klick auf Die Seite aufrufen führt auch zu nichts. Passiert das bei Dir auch? Hast Du eine Erklärung? PS: Cache leeren bringt nichts. Ich verwende Firefox v151. --IsUpper (Diskussion) 19:14, 19. Mai 2026 (CEST)Beantworten

Gudn Tach!
Ich habe das Problem nicht verstanden. Wenn ich den Artikel aufrufe, in den Edit-Modus wechsle und auf "Preview" gehe, wird mir alles wie erwartet angezeigt.
-- seth (Diskussion) 01:06, 20. Mai 2026 (CEST)Beantworten
Hallo Seth, entschuldige, dass ich mich so unklar ausgedrückt habe. Ich meine diese Fehlermeldung, also wenn ich im Artikel-Modus mit der Maus über ein beliebiges Fußnotenzeichen fahre. Die Meldung tritt übrigens auch auf einem anderen PC und einen Tag später auf... --IsUpper (Diskussion) 07:13, 20. Mai 2026 (CEST)Beantworten
Wir haben uns das im Technische-Wünsche-Team kurz angeschaut. Fyi @DerHexer, du hattest vor ein paar Tagen das gleiche Problem in Stephen Gately bemerkt:
  • Mittels Purge kann man das Problem für betroffene Artikel beheben – hab ich bei den beiden Artikeln gemacht.
  • Das Problem tritt nur bei Nutzung von Parsoid auf, nicht im legacy Parser – alle Desktop-Skins sind davon betroffen, der Minerva-Skin und die Wikipedia-Apps nicht
  • Das Problem scheint nur angemeldete User zu betreffen, unangemeldet konnten wir es nicht reproduzieren.
  • Letzteres spricht dafür, dass die Ursache des Problems letztendlich bei irgendeinem Helferlein (oder einem von vielen Usern genutzten Benutzerskript) zu verorten ist, denn Parsoid ist ja auch für alle Lesenden Standard.
  • Einige zufällige Artikel aufgerufen, konnte ich bisher keine weiteren betroffenen Artikel finden. Womöglich hat im Zusammenspiel aus Parsoid und Gadgets irgendwas nicht funktioniert, was inzwischen auf Parsoid-Seite behoben wurde und bei manchen Artikeln hat sich der Cache danach nicht geupdated.
  • Da keine Lesenden betroffen sind und das Problem auch sonst nicht weit verbreitet zu sein scheint, denke ich, dass man es dabei erstmal belassen sollte. Wenn noch gehäuft weitere betroffene Artikel auffallen, lohnt es sich vermutlich, mal alle Helferlein und Skripte beim eigenen Konto zu deaktivieren und dann schrittweise wieder zu aktivieren, um zu testen, was wohl Schuld sein könnte.
--Johannes Richter (WMDE) (Diskussion) 10:37, 20. Mai 2026 (CEST)Beantworten
Jetzt funktioniert es wieder. Dankeschön! --IsUpper (Diskussion) 10:39, 20. Mai 2026 (CEST)Beantworten

Camelbot abbestellen?

[Quelltext bearbeiten]

Hallo lustiger_seth, kann ich deinen Camelbot abbestellen? Ich habe die Information jetzt hinreichend oft gelesen, verstanden und möchte eigentlich nicht weiter belästigt werden... Grüße, --Schotterebene (Diskussion) 17:21, 26. Mai 2026 (CEST) --seth (Diskussion) 17:28, 26. Mai 2026 (CEST)Beantworten

Gudn Tach @Schotterebene!
Ja, hab heute auch schon gesehen, dass du wiederholt angeschrieben wurdest, sorry.
Vermutlich hilft dir #c-Lustiger_seth-20260516063300-08Linus-20260515235300 weiter. Für eine bessere Lösung fehlt mir aktuell die Zeit. Passt die Lösung für dich?
-- seth (Diskussion) 17:30, 26. Mai 2026 (CEST)Beantworten
Nein, eher nicht - ich habe meine Disk gern aufgeräumt - aber das ist dann auch OK. Danke für die Antwort und Sorry für den Eintrag auf der falschen Seite... Grüße, --Schotterebene (Diskussion) 17:36, 26. Mai 2026 (CEST)Beantworten
Und hilft die Antwort unter der soeben verlinkten? Dann wäre die Diskussionsseite ja zumindest visuell aufgeräumt.
Notfalls kannst du dem Bot komplett verbieten, dich zu irgendwas zu benachrichtigen. Die Info dazu steht im selben Thread oben.
-- seth (Diskussion) 17:56, 26. Mai 2026 (CEST)Beantworten
-:Sorry, da bin ich jetzt überfordert. Ist schon OK... :-) --Schotterebene (Diskussion) 18:06, 26. Mai 2026 (CEST)Beantworten
Ach so, technisch? Kein Problem, ich kann es für dich umsetzen. Welches Schweinderl hätten's gern?
  • a) Bot komplett von deiner talk page fernhalten (per template:Bots) oder
  • b) Bot soll nicht mehr wegen archive.today nerven (per entsprechendem HTML-Kommentar auf deiner Seite)
Ich kann z.B. b) einfach umsetzen, und wenn's nicht passt, revertierst du's. Gleiches gilt auch für a). Meine Empfehlung wäre aber eher b).
-- seth (Diskussion) 18:11, 26. Mai 2026 (CEST)Beantworten
Bitte b) :-) Grüße, --Schotterebene (Diskussion) 18:50, 26. Mai 2026 (CEST)Beantworten
Ok, erledigt.
-- seth (Diskussion) 23:41, 26. Mai 2026 (CEST)Beantworten