Diese Seite dient der Ideensammlung und der Koordination rund um das Thema "automatisierte Umwandlung von Wikipedia-Artikeln in PDF-Dateien". Die Diskussion entstand aus der Frage heraus, ob man die WikiReader-Hefte auch ohne (größere) manuelle Bearbeitung erstellen könnte.
Wie erstellst Du das PDF im Moment? Das läßt sich garantiert auch (teil-)automatisiert aus den XML-Quellen generieren (das einzige Problem sehe ich in einer ansprechenden Platzierung der Bilder). Spätestens wenn sich der Testballon als erfolgreich erwiesen hat, sollten wir das angehen, um solche Reader mit weniger Aufwand auch für andere Themenbereiche zu erstellen und schnell zu aktualisieren. Auch das immer mal wieder geplante Kategorie-System wäre dafür eine große Hilfe. -- akl 02:22, 23. Feb 2004 (CET)
- Das gesamte Heft 1 ist in Handarbeit entstanden, ohne jede Automatisierung. (Das heisst: Ich habe Artikel für Artikel in der Druckansicht gespeichert, in ein Open Office Dokument eingefügt, umformatiert, und schliesslich im PDF-Format ausgegeben.) Zukünftig möchte ich einige manuelle Schritte von einem Skript erledigen lassen (etwa: Das Entfernen der Hyperlinks, das Entfernen des Headers und des Footers, ...) Eine vollautomatische Erstellung (oder auch nur Aktualisierung) halte ich aber zum jetzigen Zeitpunkt für utopisch. --Thomas 15:16, 23. Feb 2004 (CET)
Richtig genial wäre eine Automatisierung des Build-Prozesses, die Hefte bei Bedarf aktuell halten zu können. Leute wählen die Artikel und die Reihenfolge aus und das Skript backt sich die Version. Vor allem würde ich gerne sehen, was aus dem Reader in 2,4,6,12 Monaten würde. Oder in anderen Sprachen. Gaaanz wichtig ist als erster Schritt die genaue Benennung der Version, also Heft 1, Version 2004-02-20 oder so. -- Presroi 07:48, 23. Feb 2004 (CET)
- Dazu wäre sicher erst einmal die Verwendung der neuen Bildsyntax überall Voraussetzung. Denn nur dann könnte ein Skript automatisch ein größeres Bild verwenden. Die Vorschaubilder kann man in einem PDF nicht mehr zumuten. -- Eckhart Wörner 11:27, 23. Feb 2004 (CET)
- Automatisierung des Build-Prozesses hört sich gut an. Es bedarf zwar noch menschlichen Eingriffes, doch warum nicht eine menschlich erzeugte Liste von Artikeln entstehen lassen (eben nach dem Wiki-Prinzip), die Datenbasis dieser Artikel via LaTeX (oder für ganz harte TeX) in einen sinnvollen Textsatz bringen, der vielleicht Template-orientiert ist, das Cover der Ausgabe in Gemeinschaftsarbeit basteln (Wiki eben) und alles zusammen nebst automatisch generierter Infrastruktur (Inhaltsverzeichnis, Index, Bildindex, Tabelleindex, ...) in druckbarer Form auf Knopfdruck als PDF ausgeben lassen. Da das alles auf dem Server laufen kann, wäre es vielleicht auch nicht schlecht, das PDF einfach einmal am Tag zu erzeugen, so dass immer eine relativ aktuelle Version vorliegt, die dann irgendwann schlicht als "fertig" bezeichnet wird (also dann, wenn die Druckerei grad Zeit hat, sich drum zu kümmern) ... muss nun nur noch einer programmieren und ein sinnvolles LaTeX-Template basteln, der Rest ist dann Magie. Harko
Prototyp
Ich hab mal ein kleines Python-Skript gehackt, das den Wiki-Code in LaTeX umwandelt. Holt es euch von http://cowww.epfl.ch/~swalter/wiki2latex.py
Implementiert:
- Überschriften
- Fett und kursiv
- Links werden mit markiert
- Doppelte Anführungszeichen
- Listen mit Sternchen (eine Stufe)
Fehlt noch:
- Bilder
- Tabellen
- fast alle HTML-Tags
- Aufzählungen
Hier ist ein Beispiel (generiert vom Artikel "Richard Stallman"): http://cowww.epfl.ch/~swalter/rms.pdf
Immerhin ein Anfang... -- Stw 22:30, 4. Mär 2004 (CET)
- Ohne dir nahe treten zu wollen, aber da mach ich's dann lieber per Hand, auch wegen dem Korrekturlesen.
- Was mir ganz und gar nicht gefällt ist die Markierung von Links. Hat in einem gedruckten Werk nichts zu suchen. --TomK32 23:10, 4. Mär 2004 (CET)
- Ich kann den Server momentan nicht erreichen, und damit auch nicht das Beispieldokument. Aber grundsätzlich stimme ich Tom zu: Menschen machen es besser. :-) --Thomas 01:24, 5. Mär 2004 (CET)
- Ich kann den Server erreichen und es sieht auf den ersten Blick bereits sehr verführerisch aus. Die Pfeile wirken aufdringlich, aber damit kann man sicherlich experimentieren. Thomas hat recht: Menschen machen es besser und das gilt auch für ein python-script. :)) Stw: Well done und weiter so! -- Presroi 01:28, 5. Mär 2004 (CET)
- Was auch immer an Kritik kommt - bitte mach weiter! Wenn ich wüsste, wie man eine eigene Diskussionsseite anzettelt, so würde ich eine solche nur für die Automatisierbarkeit der Verdruckreifung von WikiPedia anlegen.
- Das ist wirklich wichtig, schon weil man auf diese Weise von einzelnen Artikeln druckreife Versionen bauen kann, die im Zweifel tatsächlich vom Server erzeugt werden und dem Leser auf Knoppdruck als PDF auf den Bildschirm flattern (entweder als täglicher Build, oder als on-the-fly Geschichte).
- Ab nächste Woche werd ich mich auch mit dem Python-Script und seinen Ausgaben beschäftigen, kann vielleicht entsprechende Wünsche anbringen usw. (auch wenn ich selbst kaum was mit Python anfangen kann, ein bissel kann ich mit LaTeX anfangen und Webspace nebst Rechenpower kann ich auch vorerst bieten - weil wegen eigener Server und so.
- Was die Markierung von Links betrifft: schau doch mal, ob Du die Sachen umsetzen kannst, die weiter unten in dieser Diskussion schon zu diesem Thema gesagt wurden. Falls es möglich ist, könnte man die Links ja auch im PDF-Dokument als solche klickbar unterbringen (ich bezweifle aber, dass es ein LaTeX-Macro gibt, das dieses bewerkstelligt ... oder doch?). Harko 01:29, 5. Mär 2004 (CET)