Benutzer Diskussion:Aka/GlobalWPSearch
Interwiki links
Hi,
welcome to polish Wikipedia. I always try to look up and insert all interwikis manually, but your tool is very helpful. Thanks for it. -- Goto 15:51, 12. Dez 2004 (CET)
hello,
i think it's a great thing and a good step toward more automate interwiki system. it'll be nice if your tool make not only search list but also ready-to-paste interwiki list for given language. i also think it should have a special page on Meta-Wiki (since it can work with other Wikimedia projects too).
the next big thing would be intergrating searcher into Wikis, so the system makes automatic lists of interwiki links for human audit and acceptation.
more centralized interwiki system is also possible, but probably much harder to make and time to evaluate how to make it, so it's only a hint for now.
kocio 15:16, 13. Dez 2004 (CET)
- Hello Kocio, thanks for your comments. The "missing links" column is meant for "copy-and-paste", because it only shows the missing links which need to be pasted into the destination page. -- aka • 18:11, 13. Dez 2004 (CET)
Interwikis
Vielen Dank, Aka! Well, when I see what's missing, it would be ridiculous to add them to sv:... :) Really nice tool you wrote, by the way. I only wondered whether it searches a data dump or the "real" database? \Mikez 20:20, 13. Dez 2004 (CET)
- It searches the real thing. Therefore it is a little bit slow, but its live ;) -- aka • 20:36, 13. Dez 2004 (CET)
huwiki and automatic interlang links
Hello,
I see that you insert some kind of automatic linking to articles on huwiki. I strongly hope that you verify every insertion before submitting. GrinBot (who updates interlang on huwiki regularly) can use "check-same" algorithm, which basically means to use the same string on otherpedias as a starting point. It was my experience that this created vast amount of bad links, because some wikipedias redirect the name to something else, some wikipedias write about something completely different. This is the reason I do not use the switch at all.
It comes extremely unpractical when these false links start to propagate (since bots use other wikipedias interlang links to get new links) and soon they'll be on many wikipedias, crosslinking completely unrelated articles. It is quite hard to find and fix these links especially long after they were inserted.
If you verify these links please tell me, so I do not have to worry about them. If you do not, then please consider refraining from inserting them into huwiki.
Thank you for your help!
Tschüß, grin@huwiki
- It do verify them before. There is no bot inserting these links. There is just [1], which helps searching for them, mainly because no bot can inserting them for the reasons you told. -- aka • 11:02, 15. Dez 2004 (CET)
GlobalWPSearch
Hallo Aka,
dein Tool arbeitet leider nicht immer zuverlässig. Bei Artikeln wie http://ro.wikipedia.org/wiki/Bergeijk hat es Schwierigkeiten - sieh dir den Quelltext von dem Artikel an, dann weißt du, wo es hakt.
Ich halte das nicht direkt für ein Problem und weiß auch, dass das zu einer elenden Herumparserei führt - wenn dir das zuviel ist, lass es lieber. Musste nur mal gesagt werden. ;-) -- Eckhart Wörner 01:07, 9. Feb 2005 (CET)
- Danke für den Hinweis. Das ist in der Tat ein recht spezieller Spezialfall, den ich bisher so noch nicht gesehen habe. Ich habe http://vs.aka-online.de/globalwpsearch/ angepasst, so dass es jetzt auch Seiten mit solchen Konstrukten richtig verarbeitet. -- Gruß, aka • 08:04, 9. Feb 2005 (CET)
- Könnte man die cs.wikipedia auch noch in die Suche aufnehmen? -- Eckhart Wörner 13:05, 9. Feb 2005 (CET)
- Ich habe die Suche bisher aufgrund der besseren Trefferchance auf Seiten beschränkt, welche mehr als 10000 Artikel haben. Unabhängig davon ist jetzt auch http://cs.wikipedia.org dabei. Möglicherweise macht eine zusätzlicher Schalter Sinn, mit dem man die Suche auch auf kleinere Wikipedias ausdehnen kann. Ich denke mal drüber nach. -- Gruß, aka • 14:13, 9. Feb 2005 (CET)
- Könnte man die cs.wikipedia auch noch in die Suche aufnehmen? -- Eckhart Wörner 13:05, 9. Feb 2005 (CET)
Hallo Aka! Schade, dass diese Seite kein Wiki ist. Sonst hätte ich nämlich mal dein Englisch überarbeitet ;-) Hier ist die verbesserte Version des aktuellen Textes, Änderungen kursiv:
- This site allows for searching ["for" gebräuchlicher als "to"] all major Wikipedia sites for articles with the given name, which is useful [nur ein "l"] for building links between these Wikipedias.
- It doesn't [Apostroph-Setzung] do a word [meinst du das, oder meinst du "literal" = "wörtlich"] translation nor does it a full-text search. This site just checks whether an article with the given name exists, so it mainly makes sense with proper names of people, bands, towns, years and so on.
- Because no results will be displayed until the last server has answered, this search may take a while. You can limit the search time to a timeout value of your choice. Please be patient.
- Please help the Wikipedia project and insert a few of the missing links.
- If you have questions or comments, contact me using my discussion page. [eine einzelne Seite]
- Viele Grüße, Langec ☎ 21:29, 13. Feb 2005 (CET)
Strange Case
If Global Search has "effectivly" no result, there is a strange behavior: the engine returns pages with "start article template". It can be tried with "NORSAR". --Ilario 23:42, 23. Feb 2005 (CET)
- I just tried it and its working fine, as you can see here. I think the problems you've seen had something to do with the problems the Wikipedia servers had the last few days. -- aka • 09:04, 24. Feb 2005 (CET)
vs.aka-online.de/globalwpsearch
a
- Halló Aka! Danke für Deine Unterstützung bei ro:. Hatte bei http://vs.aka-online.de/globalwpsearch/ bereits vor einigen Tagen vorbeigeschaut, bekam aber keine Antwort.
- Ich denke, das hatte mit den Ausfällen der Wikipedia vor kurzem zu tun.
- Einige Fragen:
- Prüfst Du "live" oder bearbeitest Du einen "dump"?
- Es wird live geprüft.
- Prüfst Du Weiterleitungen?
- Ja, falls in einer Wikipedia ein Artikel mit dem Namen existiert, aber ein Redirect ist, wird dies erkannt, angezeigt und bei den vorgeschlagenen Links berücksichtigt.
- Hast Du schon mal nachgefragt wegen einem InterWiki prefix? Z.B. globalwpsearch:. Siehe meta:Help:Interwiki linking und meta:Interwiki map.
- Ich habe mir das eben mal angesehen, kann aber noch nicht den Sinn eines solchen Prefixes für globalwpsearch erkennen. Man könnte höchstens mit Hilfe interner Links auf ein Suchergebnis verweisen, aber ob es dafür viele Anwendungsfälle gibt?
- globalwpsearch:Trotsky findet zur Zeit nicht den Titel sondern eine Weiterleitung ro:Leon Trotsky und nicht ro:Lev Davidovici Troţki.
- Ich habe das gerade einmal überprüft und muss dir Recht geben. Der Grund ist, dass ro:Trotsky eine Weiterleitung auf ro:Leon Trotsky ist und sich dahinter wieder eine Weiterleitung auf ro:Lev Davidovici Troţki befindet. Die Suche berücksichtigt momentan nur eine Weiterleitungsebene, ich werde das aber gleich ändern.
- Ich bin administrator bei ro: und eo: sehr an interlanguage links interessiert und habe auch viel mit Vorlagen für Google-Suche experimentiert, siehe
- ro:Utilizator:GangleriBot/InterWiki/Listă de scriitori români
- ro:Discuţie Format:Lincuri/google/selectiv
- ro:Special:Whatlinkshere/Format:Lincuri/google/selectiv
- Muß leider außer Haus! Schau mal bei bugzilla:707 vorbei. Gruß aus München Gangleri | Th | T 09:37, 27. Feb 2005 (CET)
b
- War soeben mit den Hunden spazieren.
- Kannst Du die gefundenen Mehrfachweiterleitungen verwerten? Entweder:
- sofort fixen
- auf entsprechende Seiten en:Wikipedia:Multiple Redirects, en:Wikipedia:Double redirect posten
- auf Deiner Seite Listen je [[:xx:]] anzeigen, wobei dies dem wiki System wiederspricht, da man diese Listen nicht mit "erledigt" ändern könnte, eventuell hilft ein skript dabei
- Die Suche ist ja erst einmal nur ein Werkzeug. Es sucht nicht selbst systematisch nach solchen doppelten Redirects und speichert auch keine Ergebnisse - es zeigt sie nur an und überlässt die Auswerten dem Suchenden. Mehrfache Redirects selbst findet man wohl besser anhand der Dumps und einigen SQL-Abfragen. Ich könnte mir aber vorstellen, dass eine besondere Hervorhebung von gefundenen mehrfachen Redirects sinnvoll ist, damit der Nutzer das erkennen und - wenn er mag - gleich mit beheben kann. Im oben genannten Fall von ro:Trotsky wollte ich das gerade erledigen, aber du warst schneller ;)
- Weitere Fragen:
- Begriffsklärungen lassen sich "dummerweise" nur optisch erkennen. Vielleicht sollte man da projektübergreifend eine "Erkennung" einführen. Ich kenne mehrere Bespiele wo links zu Begriffsklärungen zu Konflikten bei den interlanguage links führen, die einen Bot "aus der vollautomatischen Bahn werfen, siehe en:User:GangleriBot/InterWiki/ambiguities 01.
Kannst Du links auf Begriffsklärungen vermeiden?- Stimmt - solche Links habe ich auch schon mehrfach gefunden. Sie sind einer der vielen Gründe, warum die Suche nur sucht und Änderungen den Nutzer überlässt. Dieser sollte sich die einzelnen Seiten ansehen, bevor er Interwiki-Links einfügt. Eine Erkennung ist, wie du selbst schon bemerkt hast, schwierig. Einige (vielleicht alle?) Wikipedias benutzen Vorlagen, welche man auf jeder Begriffserklärungsseite findet. Zumindestens für diese Wikipedias könnte man eine Anzeige im Suchergebnis einbauen.
- Ist Dein Quellcode GNU, PD oder ähnlich?
Würdest Du ihn bei sourceforge: zur Verfügung stellen?
Ich werde mich dort für $39/Jahr demnächst anmelden / registrieren lassen.- Naja, momentan ist er es nicht. Ich würde aber jedem, der daran Interesse hat, Zugriff darauf erlauben.
c
- Halló Aka! globalwpsearch:Herta MÜLLER ist ein Test bezüglich einer Konvention auf eo: Familiennamen in Großbuchtaben zu schreiben. Siehe eo:Herta MÜLLER verlinkt mit Herta Müller. Das läßt sich bestimmt auch implementieren. Du solltest nur beachten, dass in manchen Kulturkreisen der Familienname zuerst geschireben wird (ungarische, japanische Namen usw.) bzw. dass Namen aus weiteren Kulturkreisen, die Familiennamen nur in Ausnahmen verwenden (isländische Vaternamen, seltener Mutternamen) irgendwas (meist dem Buchhandel, der Filmindustrie folgend) in Großbuchstaben geschrieben wird: eo:Listo de biografioj - A ...
- GlobalWPSearch sucht momentan nur nach Artikeln, welche genau so wie eingegeben geschrieben sind. Für die von dir gewünschte Funktion müsste man speziell für Personennamen diese Suche sprachabhängig erweitern. Das ist ein durchaus interessanter Ansatz, der aber momentan nicht implementiert ist. Ich denke mal etwas darüber nach.
- Ich weiss nicht, ob Du Transkriptionen UTF-8 -> Latin-1 zumindestens für en: implementiert hast. Das erleichtert einiges.
- Für Wikipedias, welche (noch) nicht UTF-8 einsetzen, wird eine entsprechende Konvertierung vorgenommen.
- Kennst Du die Möglichkeit mit Seiten exportieren mehrere anscheinend Seiten (60 durch Bots) pro Wikipedia (anscheinend nicht gemischt aus mehreren Wikipedien) live herunterzuladen. Damit ließen sich gleichzeitig unterschiedliche Varianten z.B. München und München (Begriffsklärung) herunterladen auch Goethe Johann Wolfgang von Goethe Johann Wolfgang Goethe usw.
- Die Suche benutzt diese Export-Funktion, da dies die Wikipedia-Server weit weniger belastet als eine normale Seitenausgabe.
- Kennst Du http://wikipedia.mozdev.org/ ?
- Prinzipiell ja ;)
- Wass mich noch interessiert ist die Möglichkeit google Suchergebnisse zu filtern nach Sprachcodees zu ordnen. In den Vorlagen bei ro kann ich zum Beispiel aus den 3.380 Ergebnissen für http://www.google.com/search?newwindow=1&num=100&q=+site:wikipedia.org+goethe de herausfiltern http://www.google.com/search?newwindow=1&num=100&q=+site:wikipedia.org+-site:de.wikipedia.org+goethe . Mit http://www.google.com/search?newwindow=1&num=100&q=+site:wikipedia.org+-site:de.wikipedia.org+-site:en.wikipedia.org+-site:fr.wikipedia.org+-site:it.wikipedia.org+goethe (beachte sowohl "+" als auch "-" vor "site") bleiben noch 360 die besser nach Sprachcode geordnet werden sollten.
- http://www.google.com/search?newwindow=1&num=100&q=+site:wikipedia.org+-site:de.wikipedia.org+-site:en.wikipedia.org+-site:fr.wikipedia.org+-site:it.wikipedia.org+franz-kafka Manchmal findet man auch Ergebnisse "diese Seite existiert noch nicht" oder ähnlich. Diese sollten nicht oder in einer anderen Farbe abgezeigt werden.
- So eine Funktion wäre bestimmt auch sinnvoll um isolierte Artikel zu finden bzw. zu verlinken. Siehe auch bugzilla:707 und en:User:Gangleri/tests/google bugzilla:707. Gruß Gangleri | Th | T 22:08, 27. Feb 2005 (CET)
d
- Halló Aka! Was hällst Du davon unter Diskussion:Aka/globalwpsearch eine Beschreibung zu erstellen bzw. die Diskussion nach Benutzer Diskussion:Aka/globalwpsearch zu verschieben?
- erledigt.
- globalwpsearch:Timişsoara war ein Versehen; bietet den fehlerhaften link en:Timişsoara an bezieht sich auf en:Timisoara; globalwpsearch:Timişoara bietet jedoch die Latin-1 Varianten von globalwpsearch:Timisoara nicht (korrekt) mit an.
- Es sind ja verschiedene Suchbegriffe - GlobalWPSearch sucht genau nach den angegebenen Lemmas und interpretiert da nichts hinein.
- Es ist früh am Morgen. Vielleicht macht es Sinn mit globalwpsearch:München gemeinsam mit München, München (Begriffsklärung) auch Special:Allpages/München sowie Special:Whatlinkshere/München mit abzufragen und zu verarbeiten um Begriffsklärung effizienter lokalisieren zu können. Um damit auf en:User:GangleriBot/InterWiki/ambiguities 01 zurückzukommen:
- globalwpsearch:Tampere wurde durch [2] gefixed, siehe he:User talk:Harel#InterWiki conflict
- Ich denke, Begriffserklärungen kann man am besten durch die dabei verwendeten Bausteine erkennen.
- Vielleich solltest Du auch eine Sektion für Wikipedias, die keine lateinische Schrift verwenden unten anfügen ...
- Das wäre prinzipiell möglich, aber gibt es da so viele Wikipedias, welche da den gleichen Zeichenvorrat benutzen?
...
- Optionen folgende Projekte und deren InterWiki links mit einzubeziehen:
- commons
- wikisource
- wiktionary
- wikiquotes
wird gerade erstellt
Wachsende Akzeptanz
- Google:GlobalWPSearch, +site:wikipedia.org+GlobalWPSearch Gruß Gangleri | Th | T 22:14, 13. Mär 2005 (CET)
Norwegian
Thanks for this tool. It's great. The only problem I noticed was that it says interlanguage links to no: are missing even though an article already has a link to nb: (which redirects to the same place). For example, a search for Wikipedia shows:
- Català - ca - 2.6 - 2005-03-13 20:11:05 - Robbot - no:Wikipedia - Viquipèdia:Què és la Viquipèdia
Angela 06:21, 24. Mär 2005 (CET)
Andere Projekte
Hallo Aka, dein "Global Search" ist ganz toll. Es ist sehr nützbar. Ich möchte dir frage, ob du anderen Projekten benutzen dieses Search lassen möchtest. Ich bin aktiv auf Wikquote, wo viele Artikel interlang Links fehlen. Dein Search wärst eine Evangelium für uns, wenn du uns Hilfe geben würdest ;-) --Aphaea* ja 12:42, 3. Apr 2005 (CEST)
- Wikiquote, Wikisource und andere Projekte werden wahrscheinlich in der nächsten Wikimedia-Version genau so einheitlich verlinkt, wie dies momentan mit den von GlobalWPSearch verarbeiteten Interwikilinks der Fall ist. Sobald diese neue Version aktiv ist, werde ich die Suche entsprechend anpassen und dies mit unterstützen. -- Gruß, aka • 15:45, 12. Apr 2005 (CEST)
Suggestions
GlobalWPSearch is a great tool. I have two suggestions to improve it:
- Perhaps you should state that the GlobalWPSearch uses GFDL Licence.
- Another suggestion is that the found results of links to articles in different language wikipedias would be shown so that it is possible to copy links directly in the article without further editing.
Thanks. --en:User:Eleassar777 (in English Wikipedia), 18:28 CET
- How does the search deal with disambiguation stuff behind the name like Orange (color) and Orange (band). It looks like it only looks for exact matches right now, but what if something is named differently on another wiki because of a needed disambiguation tag? (en:w:User talk:MacGyverMagic)
Thanks for this great tool. Please add be: to searched wikipedias. --216.122.144.72 15:29, 18. Apr 2005 (CEST)
- Unfortunately be: doesn't support the latin charset and uses the cyrillic one, so supporting this with GlobalWPSearch is currently not possible. -- aka • 16:15, 18. Apr 2005 (CEST)
A copyright issue
Hallo Aka! I suppose you do not know? But the image "nohatlogo" you are using at the site is © Wikimedia foundation. I think you better ask for permission to use it, (if you not did already?). Or use some outher image. // Solkoll 18:17, 19. Apr 2005 (CEST)
- Oh. Well, are you really sure about this? I thought I found somewhere the note that this is a public domain image, but I do not find the source now. If I do not find the source anymore, I'll exchange it, of course. -- ɑkɑ 18:29, 19. Apr 2005 (CEST)
- Not compleatly sure, no. But at sv: we where thinking of using the small pice of puzzle in diffrent versions for giving each outher credits, (like the barnstars at en:) But in the end we had to make our own pice because the original one is copyrighted. From that I guessed this image is also copyrighted by the foundation. // Solkoll 20:14, 19. Apr 2005 (CEST)
- You are right. As I know now, the images are copyright by the Wikimedia foundation, so I'll have to change them. Thanks for your hint ;) -- aka 19:03, 21. Apr 2005 (CEST)
- Not compleatly sure, no. But at sv: we where thinking of using the small pice of puzzle in diffrent versions for giving each outher credits, (like the barnstars at en:) But in the end we had to make our own pice because the original one is copyrighted. From that I guessed this image is also copyrighted by the foundation. // Solkoll 20:14, 19. Apr 2005 (CEST)
Now at sv:RC
Hello again Aka! I did put up a link to GWPS at sv:Special:Recentchanges, (top, left column). I guess you are pleased with that? :) I also must say I love your images, these ar not just pics - it is rather good illustrations of many common objects. I'm using more and more of them at sv: Cheers! //Solkoll 17:47, 21. Apr 2005 (CEST)
- Oh. Well - thanks a lot for the link and for your comments ;) BTW, I like (your) fractals a lot and played with your fractal program, too. -- aka 19:18, 21. Apr 2005 (CEST)