Wikipedia Diskussion:WikiProjekt Vorlagenauswertung
Anzahl in der Liste
Hab gerade die alphabetische Liste aufgerufen. Da steht bei Infobox Bibliothek 37 und man denkt, das es 37 Bibliothekten gibt. Dann rufe ich die Detailtabelle auf, und es sind nur 10 Zeilen (also 10 Bibos drin) aber 37 Zellen sind gefüllt. Tim, kannst du den Zähler in der Hauptliste ändern, oder eine entsprechende Tabellenüberschrift setzen. Danke! -- sk 10:49, 16. Mär. 2007 (CET)
- Wie du dir wahrscheinlich schon denkst, ist die 37 die Anzahl der eingetragenen Variablen. Ich werde die Überschrift auf der Hauptliste wohl in "Entries" oder "Values" umbenennen, denn ein Auszählen der Artikel erscheint mir aus Performance-Gründen eher nicht umsetzbar. Kolossos 11:55, 16. Mär. 2007 (CET)
- Müsste doch einfacher umsetzbar sein, man muss doch nur die Feld Nr.0 der jeweiligen Vorlage zusammenzählen. Oder hab ist das schon zu Performance-lastig? -- sk 12:50, 16. Mär. 2007 (CET)
- Habs so gemacht, wäre auf die Idee im Moment garnicht gekommen. Kolossos 19:08, 16. Mär. 2007 (CET)
- Müsste doch einfacher umsetzbar sein, man muss doch nur die Feld Nr.0 der jeweiligen Vorlage zusammenzählen. Oder hab ist das schon zu Performance-lastig? -- sk 12:50, 16. Mär. 2007 (CET)
Einbindung mal mit und mal ohne "Vorlage:"
Mir ist gerade aufgefallen, dass die "Vorlage:Alte Rechtschreibung" mal als {{Vorlage:Alte Rechtschreibung}} und mal als {{Alte Rechtschreibung}} eingebunden wird. Das sollten wir in einen Topf werden. Am besten in der Datenbank durch ersetzen vereinheitlichen. -- sk 11:07, 16. Mär. 2007 (CET)
- Das beste wäre es, wenn du das bei der Erstellung deiner CSV schon wegstripen könntest. Mir war auch aufgefallen, dass "_" durch " " ersetzt werden könnte. Vorallem ist oftmals am Ende eines Vorlagennames noch eine verschiedene Anzahl an Leerzeichen unser Problem.
- So liefert:
- http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film%20&lang=de&where=&is= 486 Ergebnisse
- http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film&lang=de&where=&is= 3491 Ergebnisse und erst
- wenn man MySQL mit einer Wildcard:
- http://tools.wikimedia.de/~kolossos/templatetiger/tt-table4.php?template=Infobox%20Film%&lang=de&where=&is= austrickst, bekommt man alle 3979 Ergebbnisse. Da eine Vorlage aber beliebig weiter gehen könnte, wäre das sauberste das wegnehmen dieser Leerstellen schon in der CSV. Für müssen also Aufgrund des toleranten Parsers wohl noch etwas nachbessern. Kolossos 11:55, 16. Mär. 2007 (CET)
- Ok, hab die Leerstellenproblematik durch die Verwendung von RTRIM bis zur Herausgabe eines neuen Datensatzes erstmal gefixt. Aus Geschwindigeitsgründen sollten wir das dann aber wieder rausnehmen. Kolossos 12:18, 16. Mär. 2007 (CET)
- Ok, ich bau das gerade mal mit ein. -- sk 14:53, 16. Mär. 2007 (CET)
- Habs eingebaut, kann aber gerade nicht auf die Dumps zugreifen. Scheinbar ist funktioniert der mount gerade nicht. -- sk 15:00, 16. Mär. 2007 (CET)
- Ok, ich bau das gerade mal mit ein. -- sk 14:53, 16. Mär. 2007 (CET)
Anregungen
Interessantes Tool, danke dafür - allerdings fehlt mir eine wichtige Info: mit welchem Datenbestand wird gearbeitet? Wenn ich die Beschreibung richtig lese, dann ist es vermutlich der aktuelle Dump vom 7.2. - eine kurze Infozeile wäre allerdings nicht schlecht. -- srb ♋ 12:21, 16. Mär. 2007 (CET)
- Es ist glaube ich der Dump vom 24. Januar 2007, aber ich kann es gerade nicht nachprüfen. -- sk 12:47, 16. Mär. 2007 (CET)
- Habs gerade überprüft, es ist der Dump vom 24. Januar 2007. -- sk 15:02, 16. Mär. 2007 (CET)
Andere Projekte
Was muss ich machen, damit auch der Dump der plattdeutschen Wikipedia ausgewertet wird? --::Slomox:: >< 13:32, 16. Mär. 2007 (CET)
- 10.000 Trillionen Euro spenden! ;-) Nein, nix musst du machen! Das Skript läuft derzeit nur bei den allergrößten Dumps durch, die für das WP:GEO interessant sind (en,de,cs,es,ru,fr,fi,pt). Ich hab das Skript aber so angepasst, dass es auch für andere Sprachen laufen kann. Ich denke wir merzen erst einmal die Kinderkrankheiten aus, und dann machen wir mit den anderen Sprachen weiter. -- sk 13:44, 16. Mär. 2007 (CET)
- Dann muss ich wohl mal mein Sparschwein schlachten und zählen, ob es reicht ;-)
- Ist die Aufnahme zusätzlicher Projekte denn sehr konfigurationsaufwändig? Der zusätzliche Rechenaufwand von vielleicht 0,1 Promille wird wohl kein Problem sein. --::Slomox:: >< 14:03, 16. Mär. 2007 (CET)
- Ich werde es mal nds auf den Toolserver downloaden und druchrödeln lassen. Wenn Tim dann Lust hat, kann er es mit einbauen. Sehr aufwendig bei der Datenextraktion ist es sicherlich nicht. -- sk 14:41, 16. Mär. 2007 (CET)
- Hmm, also ich kriegs gerade nicht auf die schnelle nicht hin, weil am Toolserver eine Verbindung zu dem Verzeichnis, in dem die Dumps gelagert werden nicht klappt (Meist kurzzeitiges Problem). -- sk 14:51, 16. Mär. 2007 (CET)
- Ersten, scheint der Toolserver im Moment etwas "bugy" zu sein, so dass es wohl das beste ist, erstmal nicht zu machen. Zweitens hoffe ich, was die Unterstützung kleinerer Sprachen angeht, dass sich jemand findet, der die Funktion in den Parser des Mediawikis integriert, der Parser muß Vorlagen sowieso auswerten und die Dimensionen der Tabelle sind im Verhältnis z.B. zu den Linktabellen gering. Dann hätten wir auch nahezu Echtzeitdaten und sogar ein Editieren wie bei einer Tabellenkalkulation erschiene möglich. Sobald die anderen großen Sprachen im System drin sind, kriegen wir auf jeden Fall Plattdeutsch auch hin, schließlich mag ich diese Sprache aufgrund ihres hohen Unterhaltungswertes.;-) Kolossos 10:15, 18. Mär. 2007 (CET)
- Hmm, also ich kriegs gerade nicht auf die schnelle nicht hin, weil am Toolserver eine Verbindung zu dem Verzeichnis, in dem die Dumps gelagert werden nicht klappt (Meist kurzzeitiges Problem). -- sk 14:51, 16. Mär. 2007 (CET)
- Ich werde es mal nds auf den Toolserver downloaden und druchrödeln lassen. Wenn Tim dann Lust hat, kann er es mit einbauen. Sehr aufwendig bei der Datenextraktion ist es sicherlich nicht. -- sk 14:41, 16. Mär. 2007 (CET)
Ja geil!
Kennt ihr http://dbpedia.org/ ? Los, zusammenarbeiten! :-) -- Nichtich 15:51, 16. Mär. 2007 (CET)
- Kannte ich noch nicht. Scheint ebenso so ähnlich zu arbeiten. -- sk 16:10, 16. Mär. 2007 (CET)
- Soweit ich das überschauen kann, haben die aber nur die englischsprachige Wikipedia genutzt. Wir wollen in Zukunft aber auch die anderen Sprachen mit einbinden. Derzeit werden schon alle beim WP:GEO unterstützten Sprachen gefilter, aber halt nur "de" hier angezeigt. --