Zum Inhalt springen

Wikipedia Diskussion:WikiProjekt Vorlagenauswertung

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 18. März 2007 um 10:15 Uhr durch Kolossos (Diskussion | Beiträge) (Andere Projekte). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 18 Jahren von Kolossos in Abschnitt Andere Projekte

Anzahl in der Liste

Hab gerade die alphabetische Liste aufgerufen. Da steht bei Infobox Bibliothek 37 und man denkt, das es 37 Bibliothekten gibt. Dann rufe ich die Detailtabelle auf, und es sind nur 10 Zeilen (also 10 Bibos drin) aber 37 Zellen sind gefüllt. Tim, kannst du den Zähler in der Hauptliste ändern, oder eine entsprechende Tabellenüberschrift setzen. Danke! -- sk 10:49, 16. Mär. 2007 (CET)Beantworten

Wie du dir wahrscheinlich schon denkst, ist die 37 die Anzahl der eingetragenen Variablen. Ich werde die Überschrift auf der Hauptliste wohl in "Entries" oder "Values" umbenennen, denn ein Auszählen der Artikel erscheint mir aus Performance-Gründen eher nicht umsetzbar. Kolossos 11:55, 16. Mär. 2007 (CET)Beantworten
Müsste doch einfacher umsetzbar sein, man muss doch nur die Feld Nr.0 der jeweiligen Vorlage zusammenzählen. Oder hab ist das schon zu Performance-lastig? -- sk 12:50, 16. Mär. 2007 (CET)Beantworten
Habs so gemacht, wäre auf die Idee im Moment garnicht gekommen. Kolossos 19:08, 16. Mär. 2007 (CET)Beantworten

Einbindung mal mit und mal ohne "Vorlage:"

Mir ist gerade aufgefallen, dass die "Vorlage:Alte Rechtschreibung" mal als {{Vorlage:Alte Rechtschreibung}} und mal als {{Alte Rechtschreibung}} eingebunden wird. Das sollten wir in einen Topf werden. Am besten in der Datenbank durch ersetzen vereinheitlichen. -- sk 11:07, 16. Mär. 2007 (CET)Beantworten

Das beste wäre es, wenn du das bei der Erstellung deiner CSV schon wegstripen könntest. Mir war auch aufgefallen, dass "_" durch " " ersetzt werden könnte. Vorallem ist oftmals am Ende eines Vorlagennames noch eine verschiedene Anzahl an Leerzeichen unser Problem.
So liefert:
http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film%20&lang=de&where=&is= 486 Ergebnisse
http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film&lang=de&where=&is= 3491 Ergebnisse und erst
wenn man MySQL mit einer Wildcard:
http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film%&lang=de&where=&is= austrickst, bekommt man alle 3979 Ergebbnisse. Da eine Vorlage aber beliebig weiter gehen könnte, wäre das sauberste das wegnehmen dieser Leerstellen schon in der CSV. Für müssen also Aufgrund des toleranten Parsers wohl noch etwas nachbessern. Kolossos 11:55, 16. Mär. 2007 (CET)Beantworten
Ok, hab die Leerstellenproblematik durch die Verwendung von RTRIM bis zur Herausgabe eines neuen Datensatzes erstmal gefixt. Aus Geschwindigeitsgründen sollten wir das dann aber wieder rausnehmen. Kolossos 12:18, 16. Mär. 2007 (CET)Beantworten
Ok, ich bau das gerade mal mit ein. -- sk 14:53, 16. Mär. 2007 (CET)Beantworten
Habs eingebaut, kann aber gerade nicht auf die Dumps zugreifen. Scheinbar ist funktioniert der mount gerade nicht. -- sk 15:00, 16. Mär. 2007 (CET)Beantworten

Anregungen

Interessantes Tool, danke dafür - allerdings fehlt mir eine wichtige Info: mit welchem Datenbestand wird gearbeitet? Wenn ich die Beschreibung richtig lese, dann ist es vermutlich der aktuelle Dump vom 7.2. - eine kurze Infozeile wäre allerdings nicht schlecht. -- srb  12:21, 16. Mär. 2007 (CET)Beantworten

Es ist glaube ich der Dump vom 24. Januar 2007, aber ich kann es gerade nicht nachprüfen. -- sk 12:47, 16. Mär. 2007 (CET)Beantworten
Habs gerade überprüft, es ist der Dump vom 24. Januar 2007. -- sk 15:02, 16. Mär. 2007 (CET)Beantworten

Andere Projekte

Was muss ich machen, damit auch der Dump der plattdeutschen Wikipedia ausgewertet wird? --::Slomox:: >< 13:32, 16. Mär. 2007 (CET)Beantworten

10.000 Trillionen Euro spenden! ;-) Nein, nix musst du machen! Das Skript läuft derzeit nur bei den allergrößten Dumps durch, die für das WP:GEO interessant sind (en,de,cs,es,ru,fr,fi,pt). Ich hab das Skript aber so angepasst, dass es auch für andere Sprachen laufen kann. Ich denke wir merzen erst einmal die Kinderkrankheiten aus, und dann machen wir mit den anderen Sprachen weiter. -- sk 13:44, 16. Mär. 2007 (CET)Beantworten
Dann muss ich wohl mal mein Sparschwein schlachten und zählen, ob es reicht ;-)
Ist die Aufnahme zusätzlicher Projekte denn sehr konfigurationsaufwändig? Der zusätzliche Rechenaufwand von vielleicht 0,1 Promille wird wohl kein Problem sein. --::Slomox:: >< 14:03, 16. Mär. 2007 (CET)Beantworten
Ich werde es mal nds auf den Toolserver downloaden und druchrödeln lassen. Wenn Tim dann Lust hat, kann er es mit einbauen. Sehr aufwendig bei der Datenextraktion ist es sicherlich nicht. -- sk 14:41, 16. Mär. 2007 (CET)Beantworten
Hmm, also ich kriegs gerade nicht auf die schnelle nicht hin, weil am Toolserver eine Verbindung zu dem Verzeichnis, in dem die Dumps gelagert werden nicht klappt (Meist kurzzeitiges Problem). -- sk 14:51, 16. Mär. 2007 (CET)Beantworten
Ersten, scheint der Toolserver im Moment etwas "bugy" zu sein, so dass es wohl das beste ist, erstmal nicht zu machen. Zweitens hoffe ich, was die Unterstützung kleinerer Sprachen angeht, dass sich jemand findet, der die Funktion in den Parser des Mediawikis integriert, der Parser muß Vorlagen sowieso auswerten und die Dimensionen der Tabelle sind im Verhältnis z.B. zu den Linktabellen gering. Dann hätten wir auch nahezu Echtzeitdaten und sogar ein Editieren wie bei einer Tabellenkalkulation erschiene möglich. Sobald die anderen großen Sprachen im System drin sind, kriegen wir auf jeden Fall Plattdeutsch auch hin, schließlich mag ich diese Sprache aufgrund ihres hohen Unterhaltungswertes.;-) Kolossos 10:15, 18. Mär. 2007 (CET)Beantworten

Ja geil!

Kennt ihr http://dbpedia.org/ ? Los, zusammenarbeiten! :-) -- Nichtich 15:51, 16. Mär. 2007 (CET)Beantworten

Kannte ich noch nicht. Scheint ebenso so ähnlich zu arbeiten. -- sk 16:10, 16. Mär. 2007 (CET)Beantworten
Soweit ich das überschauen kann, haben die aber nur die englischsprachige Wikipedia genutzt. Wir wollen in Zukunft aber auch die anderen Sprachen mit einbinden. Derzeit werden schon alle beim WP:GEO unterstützten Sprachen gefilter, aber halt nur "de" hier angezeigt. --