Wikipedia:Technik/Archiv/MediaWiki-Installation (2005–2011)
Wikipedia offline auf dem Rechner & im Browser
Das Wikipedialexikon kann man komplett als eine im Browser offline durchsuchbare Datenbank auf dem eigenen Rechner/Laptop installieren. Folgende Anleitung ist verfasst für "Ex&Hopp-Windowsnutzer" ohne jede Erfahrung mit Servern, Datenbanken und Befehlszeilenanweisungen. Man benötigt 30 Minuten für die Installation der Grundprogramme, danach werden die Wikipedia-Rohtexte in die installierte Datenbank eingespielt - und zwar braucht dieser Prozess einmalig 5 Stunden (bei 1,8 GHz Prozessorleistung als Referenz). Also am besten bis zum Abend warten, Befehl starten, Monitor aus und schlafen gehen. Am nächsten Morgen wird man beim Marmeladenbrötchen von einer fertigen Offline-Wikipedia zum Stöbern eingeladen.
Übrigens: In der Offline-Version kann man genauso bearbeiten, neu anlegen, wikifizieren und dies jeweils abspeichern, wie online. Erneut per Browser angesteuert, kopiert man bei Gelegenheit den Quelltext in die originale Online-Wikipedia und es haben fortan alle etwas davon. Zwischenzeitliche Veränderungen in den Online-Versionen sollte man allerdings berücksichtigen und nicht einfach "drüberbügeln"! Es eignet sich in erster Linie, um offline neue Artikel auszuarbeiten.
Für Eilige > Die Anweisungen "schnell&schmutzig"
1. Einleitung/Voraussetzungen
Die gesamten Artikel der Wikipedia werden fertig zum Download in Deutsch, Englisch, usw. ca. einmal im Monat aktualisiert in einer komprimierten „Dump“-Datei zur Verfügung gestellt unter http://download.wikipedia.org (dewiki=deutsch; enwiki=englisch). Der jeweilige Dump ist von Zeit zu Zeit in das installierte lokale Datenbank-Programm einzuspielen, wenn man über den aktuellen Online-Text verfügen will.
Es besteht auch die Möglichkeit, die deutsche Wikipedia offline per
http://www.Digitale-Bibliothek.de zu lesen ( halbjährlich als DVD). Die Bedienung ist jedoch umständlich (persönliche Meinung) und die umfangreichere, sehr gute englischsprachige Wikipedia bleibt außen vor. Bei der Digitalen Bibliothek ist die Installation einfach, die Bedienung aber sperrig. Hier ist es genau umgekehrt.
Man benötigt:
- Ein Entkomprimier-Programm, z.B. 7-Zip, http://www.7-zip.org (Freeware) oder das weitverbreitete WinRAR http://www.winrar.de (Shareware). Grundsätzlich ist jedes Packprogramm geeignet, das Archive mit den Endungen .tar, .gz, .bz2 öffnen kann, siehe im Zweifelsfall Liste der Datenkompressionsprogramme (Format-Angaben unvollständig) und Liste der Dateiendungen.
- Xampp für Windows (Installer-Version) von http://www.apachefriends.org/de/xampp-windows.html
- Den jeweils nach Datum aktuellen Datenbank-Dump in http://download.wikipedia.org. Beschränkt euch für das Lexikon auf den Dump mit den reinen Artikel-Seiten („dewiki...pages-articles“), ohne History und Diskussion (= 400 MB, entpackt ~1,7 GB, Feb 2006). Im Downloadbereich werdet ihr noch eine Reihe anderer Dateien finden, für das Lesen & Suchen sind diese unnötig! Darauf achten, dass neben der Datei, die ihr herunterladen wollt, "Done" oder "Fertig" o.ä. steht, sonst erhaltet ihr unter Umständen nur eine korrupte Teildatei.
- Windows NT, 2000, XP. - Win 95/98? Ausprobieren. Jedoch bitte das Xampp- und Mediawiki-FAQ befragen. Achtet u.a. auf unterschiedliche Vorgehensweisen für die Erweiterung der Umgebungsvariablen PATH und darauf, dass alle Dateigrößen unter 4 GB sein müssen, wenn eine FAT32- statt NTFS-Partition verwendet wird. Letzteres gilt für alle Nutzer.
- Einen Rechner ab ca. 500 MHz Prozessor (geschätzt) mit ca. 5-6 Gigabyte freiem Festplatten-Platz (mit Volltextindexierung zwischenzeitlich 7-8 GB). Die ausführenden Programme belegen unter 300 MB, ~1,7 GB nimmt die entpackte XML-Datei der reinen Artikel-Seiten in Anspruch; in die Datenbank importiert, werden daraus noch einmal 1,66 GB. Man sollte zeitweise freien Platz zum „Rudern“ zur Verfügung haben, d.h. Entpacken einer Datei, Kopieren derselben, usw.
Getestet und für gut befunden auf 1,8 GHz-Rechner, 256 MB Arbeitsspeicher, Windows XP Pro SP2, sowie
- Xampp für Windows 1.51
- Mediawiki 1.56
- Download-Datei für die Datenbank vom 20 Februar 2006: dewiki-20060220-pages-articles.xml.bzip2
Zum grundsätzlichen Verständnis:
„Xampp“ ist ein vorbereitetes Software-Paket, das den weitverbreiteten „ Apache“-Server in Windows installiert, und dann in den Server hinein eine Ausführungskonsole für die Programmiersprache „PHP“ plus die Datenbank „MySQL“ und dafür eine grafische Benutzeroberfläche namens „phpMyAdmin“ zur besseren Steuerung von MySQL. Nach Xampp installiert ihr/wir in dieser Anleitung das ebenso wichtige Frontend für die Wikipedia namens „Mediawiki“. (Frontend = die Benutzeroberfläche, das Programm, das das Design der Seiten, die man tatsächlich im Browser sieht, bestimmt.) Die in Hintergrund laufende Datenbank sieht man nicht, sie soll nur Rohdaten (die Texte) auswerfen. Mediawiki sorgt dafür, dass man diese auch ordentlich per Stichwort abfragen und im Browser lesen kann. Xampp ist sehr nützlich, weil man die Programme sonst einzeln installieren und aneinander anbinden müsste.
Warum ein „Server“? Ein Server ist im Normalfall eine Maschine/eine Plattform, die für andere Computer über das Internet Daten zur Verfügung stellt, z.B. die Wikipedia. Ihr/Wir installiert für
unsere Zwecke einen lokalen Server nur für den eigenen Browser, weil die Datenbank-Software der Wikipedia in PHP geschrieben ist, und Programme, die in dieser Programmiersprache geschrieben sind, laufen halt nur auf einem „Server“. Natürlich könnte man die Daten lokal auch
anders bereitstellen, aber dazu braucht man andere Programme, die erst noch jemand schreiben muss. Unser Browser nimmt nicht über das Internet mit einem fremden Server Kontakt auf, sondern flitzt im eigenen Rechner Richtung Server im Verzeichnis X und holt sich die Daten dort
ab. Die hausgemachte Wikipedia übernimmt das sogenannte „Client-Server“-Prinzip. Im Unterschied zu Servern à la Google bearbeitet unser eigener Server immer nur eine Anfrage gleichzeitig, deshalb brauchen wir keine High-End-Hardware.
.
2. Xampp installieren + Sicherheit
Getestet mit Xampp für Windows Version 1.51, Installer-Version.
Den Xampp-Installer starten und in ein beliebiges Verzeichnis installieren, z.B. C:\X\ . Während des Install-Dialogs wird in Version Xampp 1.51 gefragt, ob die Programme "auch als Dienst" installiert werden sollen. Der Begriff ist Windowsjargon und meint Art und Weise, wie in Windows hinein installiert wird. Bejaht man, startet der Server künftig sofort mit Windows, verneint man, müssen Apache und MySQL später immer über das Control-Panel per Hand angeworfen werden. Dies läßt sich nachträglich mehr so einfach ändern (Version 2.1). Um es zu ändern, öffnet man am besten Xampp und klickt dann rechts oben auf die Schaltfläche "Settings". Anschließend klickt man auf "SCM". Daraufhin wird die Windows-Diensteverwaltung geöffnet. Nun muss man den jeweiligen Dienst suchen (also Apache oder MySQL) und im Kontextmenü (Rechtsklick auf das Symbol) "Eigenschaften" anwählen. Im Register "Allgemein" ändert man im Dropdown-Menüfeld "Automatisch" auf "Manuell", um den automatischen Start mit Windows zu verhindern.
Performance-Probleme scheint es jedoch in keinem der beiden Modi zu geben, d.h. der aktive Server nimmt den anderen Programmen in Windows nicht zuviel Arbeitsspeicher weg und
der Rechner wird nicht langsam. Ich empfehle die Installation als Dienst. Den Server kann man über ein Control-Panel komplett abschalten. Dieses erscheint nach der Installation als Verknüpfung auf dem Desktop und im Startmenü.
Daneben gibt es je nach Installationsart andere Spezifikationen, d.h. Module und Ausführung sind innerhalb von Xampp anders geordnet. Für unsere Zwecke ist dies uninteressant, es sei nur der Vollständigkeit halber erwähnt.
Um die Wikipedia lesen zu können, müssen in Xampp der Apache und MySQL installiert/eingeschaltet sein. Ftp und Mail sind für einen echten Server nach außen gedacht und bedeuten in unserem Fall Datenmüll oder gar ein Sicherheitsloch.
Zum Thema Sicherheit: Vertrauen Sie einfach nicht auf eine einfache Personal Firewall, welche in Windows installiert ist. Um Windows 2K/XP/2003 sicher in Netz zu betreiben, müssen Sie die Dienste entsprechend sicher konfigurieren. Auf der Seite http://www.ntsvcfg.de/ gibt es dazu eine gute Anleitung. Bitte lesen Sie auch aufmerksam die Xampp-FAQ unter http://www.apachefriends.org/de/faq-xampp-windows.html. Um Missverständnissen sofort vorzubeugen: Für die Sicherheit des Windows-Rechners selbst sind die Servereinstellungen völlig uninteressant, solange nicht Ftp und Mail installiert sind. Es geht vor allem darum, dass jemand in der Xampp-Grundeinstellung (also nicht nach unserer Installation) ohne gesetztes Passwort von außen die Datenbank auf dem Server ansteuern, löschen oder euch aussperren könnte. Die Betonung liegt auf könnte. Das Ganze ist eher theoretischer Natur, solange man keine fest zugewiesene IP-Adresse hat, und eine solche hat man i.d.R. als Normaluser nicht. Trotzdem: Diese Anleitung richtet die wichtigste Sicherung, und zwar für die Datenbanksteuerung, unter Punkt 8 als Passwortabfrage ein. Zum Schluss - nach Abschluss unserer Installation - könnt ihr die lokale Xampp-Sicherheits-Testseite im eigenen Server http://localhost/security/ besuchen. Dort lässt sich ein weiteres Passwort für den Xampp-Verzeichnis-Schutz eintragen. Dabei nicht versehentlich erneut für die MySQL-Sektion ein Passwort setzen, das machen wir bereits in dieser Anleitung weiter unten!
.
3. Den Systempfad in Windows erweitern
Nach der Installation von Xampp zunächst Start>Ausführen aufrufen. Dort in die Zeile regedit bzw. regedit.exe eingeben und damit die Registrierung öffnen. In der Registry den Schluessel:
Arbeitsplatz/hkey_current_user/environment/PATH
suchen. (Dazu die +/- Zeichen anklicken und durch die Klappmenues hangeln)
Rechte-Maustaste-Klick auf PATH und dann 'Ändern' anklicken. PATH-Variable erweitern (wenn nichts drin steht, hineinschreiben) um folgenden Eintrag:
C:\X\xampp\php;
Verzeichnisname natürlich abändern zu deinem tatsächlich gewählten Installationsordner für Xampp!
Registry schließen (einfach rechts oben das Kreuz im Fenster). Vorsicht: Mit der Registry grundsätzlich nicht spielen, nichts sonst verändern!
Zum Abschluss den Rechner neu starten!
Alternative Vorgehensweise, getestet in XP: Start>Systemsteuerung>Leistung und Wartung>System (in der klassischen Ansicht Systemsteuerung>System). Auf der Karte Systemeigenschaften den Reiter Erweitert anklicken und dann unten Umgebungsvariablen. Je nachdem, ob man nur für den aktuellen Benutzer oder alle Nutzer des Rechners systemweit die Variable PATH erweitern will, im entsprechenden Fenster path blau hinterlegen, dann Bearbeiten und den Eintrag erweitern. (Einzelne Verzeichnisangaben immer mit Semikolon abschließen.)
Rechner neu starten.
(Wenn PHP 4-Version in Xampp eingestellt wird (brauchen wir nicht), zusätzlich C:\X\xampp\php\php4; eintragen. Der Pfad zur "aktiven" php.ini in \apache\ in Xampp muss nicht angegeben werden. Es könnte sein, dass es auch andersherum funktioniert, ist aber unwichtig.)
.
4. Systempfad überprüfen
Über Start>Programme>System>Zubehör>Eingabeaufforderung anklicken. Eine Shell/ein Fenster mit schwarzem Hintergrund und blinkendem Cursor (bei den meisten Windows-Konfigurationen hinter C:\Dokumente und Einstellungen\ Benutzername\ blink-blink) öffnet sich. Die Eingabeaufforderung - auch Shell, cmd-, Befehlszeilen-, Textkonsole oder Kommandozeile genannt - kann in Windows ebenso aufgerufen werden über Start>Ausführen>"cmd.exe". Um sich das Arbeiten im Folgenden zu erleichtern, ist es sinnvoll, eine Verknüpfung auf dem Desktop zu erstellen: Zubehör>Eingabeaufforderung, rechte Maustaste, Senden an>Desktop.
In der Shell das Wort path eingeben (+ wie immer mit Enter bestätigen). Hinter
PATH=C:\WINDOWS\System32;C:\WINDOWS;
und je nach individueller Rechner-Konfiguration diversen anderen Einträgen, müßte jetzt auch
C:\X\xampp\php;
im Pfad zu lesen sein. Also:
PATH=C:\WINDOWS\System32;C:\WINDOWS;…eventuell noch irgend etwas
anderes…;C:\X\xampp\php;
Es handelt sich um den „globalen Systempfad“, d.h. eine Sammlung von Verzeichnissen, in denen Windows nach jeder Eingabe sucht, um Befehle überall im Rechner ausführbar zu machen, d.h. nicht nur in dem Verzeichnis, in dem das zum Befehl gehörende (Interpretations)-Programm liegt. Ohne Erweiterung der PATH-Variablen können während der weiteren Installation php-Skripte in der Eingabeaufforderung nicht aus allen Verzeichnissen aufgerufen werden. Es erscheint die Fehlermeldung "...Befehl php ist entweder falsch geschrieben oder kann nicht gefunden werden".
Eingabeaufforderung schließen.
.
5. max_allowed_packet in MySQL vergrößern
Über Start>Programme>System>Zubehör den Editor aufrufen (für den Editor eine Verknüpfung auf dem Desktop erstellen). Im geöffneten Editor in der Menueleiste über Datei>Öffnen in das Windowsverzeichnis
C:\X\\xampp\mysql\bin\
vortasten. Wie sie sehen, sehen sie zunächst nichts. Ganz unten im Fenster unter Dateityp von Textdateien auf Alle Dateien umstellen. Nun die Datei „my“ (bzw. "my.cnf") ansteuern und öffnen. (Auf meinem Rechner zeigt sich My.cnf zunächst nur als Verknüpfung in Windows; ich weiß nicht, ob dies ein Fehler in meinem System ist, oder ob sich das auf allen Rechnern so darstellt. Die Datei ist keine Verknüpfung, sondern die zentrale Konfigurationsdatei für MySQL. Über das Menue im Editor lässt sie sich öffnen und editieren.)
Im Text den Parameter
[mysqldump]
quick
max_allowed_packet=1M
suchen und max_allowed_packet von 1M auf 16M abändern.
Es könnte sein das diese Einstellung bereits vorhanden ist.
In dieser Datei dann bei
[mysqld]
...
key_buffer = 16K
max_allowed_packet = 1M
table_cache = 4
...
den Wert ebenfalls von 1M auf 16M ändern.
Speichern und Datei schließen.
.
6. Lokale Server-Startseiten aufrufen
Getestet mit Internet Explorer 6.0, Firefox 1.5 und Opera 8.5:
http://localhost/xampp/splash.php aufrufen, Sprache wählen und die folgende Seite
http://localhost/xampp/index.php
in den Favoriten/Links ablegen. Herzlichen Glückwunsch, der Server selbst funktioniert schon mal!
.
7. "root" für MySQL ein Passwort zuordnen
Dazu im Browser auf http://localhost/xampp/index.php im Menue phpMyAdmin aufrufen (links, weit unten unter „Tools“). Es öffnet sich die phpMyAdmin-Hauptseite. Dort als erstes im Menue etwa in der Mitte den Unterpunkt „Rechte“ aufrufen. Auf der sich öffnenden Seite ziemlich in der Mitte die Zeile für den Benutzer " root | localhost | ja | ALL PRIVILEGES | ja | Bild mit Männchen mit Stift" beachten. Die Maus auf das Männchen mit Stift führen. Es müsste eine Schrift "Rechte ändern" zu sehen sein. Männchen anklicken. Auf der sich öffnenden Seite nach unten scrollen und im Feld "Kennwort ändern" eines eintragen (das Häkchen links aktiviert sich dann von selbst), als Beispiel für diese Anleitung "moses". OK. (Ihr wählt natürlich ein eigenes und verwendet dieses dann zusammen mit "root" während eurer gesamten Installation!) Keine andere Sektion auf dieser Seite verändern, vor allem nicht verwechseln mit dem darunter liegenden Feld "Logininformationen /Benutzer kopieren"!
Künftig kann sich "root" (das ist die Grundeinstellung/der Default-User in Xampp) nur noch zusammen mit dem Passwort "moses" an der Datenbank MySQL anmelden. Dies bemerkt ihr sofort, wenn ihr auf die phpMyAdmin-Hauptseite zurückgeht (das Häuschen im Menue ganz links anklicken). Ihr seht nichts außer einer Fehlerseite, die darauf hinweist, dass MySQL euch nicht mehr hereinlässt, und damit ist auch kein Zugriff auf die phpMyAdmin-Startseite möglich.
Warum dies? phpMyAdmin selbst ist nicht MySQL, sondern nur ein grafische Oberfläche, um MySQL zu konfigurieren. Die Oberfläche selbst merkt sich das Passwort nicht automatisch. Deshalb müsst ihr jetzt noch von Hand die Konfigurationsdatei für phpMyAdmin editieren.
Warum überhaupt diese Prozedur? MySQL ist das wichtige Programm, das unsichtbar im Hintergrund als Datenbank-Software für die Wikipedia fungiert und in eine noch zu erstellende Datenbank die Text-Rohdaten des Dumps aufnimmt. Diese Datenbank wird später von Mediawiki eingerichtet (automatisch bei der Installation/ Konfiguration), mit genau den entsprechenden Parametern, die die Wikipedia-Rohdaten brauchen. Mediawiki verlangt dabei jedoch zwingend die Angabe eines Benutzers mit zugeordnetem Passwort ("kein Einlass ohne Passwort"). Diesen Benutzer mit Passwort haben wir soeben erstellt. Indem man root (als den in Xampp voreingestellten Benutzer, der sowieso alle Rechte hat) wählt, schafft man zugleich Sicherheit auch nach außen in Richtung Internet.
Den Browser schließen (um diese Anleitung lesen zu können, nehmt halt einen zweiten Browser ;-).
.
8. phpMyAdmin das Passwort mitteilen
In den Windows-Ordner
C:\X\xampp\phpMyAdmin
wechseln.
Dort die Datei config.inc.php suchen und mit dem Editor wie bereits oben beschrieben starten und bearbeiten: (Eine alternative Vorgehensweise wäre: Mit der rechten Maustaste diese Datei anklicken und im Menue "öffnen" aktivieren. Es kommt ein Dialog "Datei kann nicht geöffnet werden ..., wie möchten Sie vorgehen? Dort "Aus einer Liste auswählen" aktivieren, aus der Liste den "Editor" heraussuchen und blau hinterlegen. Aber bevor ihr OK drückt "Datei immer mit dem ausgewählten Programm öffnen" deaktivieren, d.h. das Häkchen dort entfernen - wenn es denn vorhanden ist, ansonsten gar nicht erst mit dem Kästchen spielen.)
In der Menueleiste des Editors >Bearbeiten>Suchen öffnen und dort "root" als Suchwort eingeben. Nach unten hin suchen, vor der Suche darauf achten, das der Cursor (im Text) auf dem ersten Wort des gesamten Textes steht. Ihr findet die Zeile
$cfg['Servers'][$i]['user'] = 'root'; // MySQL user
Genauer gesagt findet Ihr die folgenden drei Zeilen untereinander:
$cfg['Servers'][$i]['auth_type'] = 'config'; // Authentication method (config, http or cookie based)?
$cfg['Servers'][$i]['user'] = 'root'; // MySQL user
$cfg['Servers'][$i]['password'] = ' '; // MySQL password (only needed // with 'config' auth_type)
Diese abändern in
$cfg['Servers'][$i]['auth_type'] = 'http'; // Authentication method (config, http or cookie based)?
$cfg['Servers'][$i]['user'] = 'root'; // MySQL user
$cfg['Servers'][$i]['password'] = 'moses'; // MySQL password (only needed // with 'config' auth_type)
Datei speichern und schließen.
In der Xampp-Grundeinstellung waren phpMyAdmin und MySQL zunächst offen zugänglich. Dann haben wir ein Passwort für MySQL gesetzt und dieses nun phpMyAdmn bekannt gemacht. Einschränkend wird jedoch als Sicherheitseinstellung ab sofort der ansprechende Browser, egal ob der eigene oder über das Internet einer in Honolulu, gezwungen, zuerst die Anmeldedaten per Dialogfenster abzufragen, und sie an den Server (d.h. phpMyAdmin und MySQL) zurückzusenden. Wenn jemand diese Sicherheitsbarriere nicht benötigt, dann die Zeile
$cfg['Servers'][$i]['auth_type'] = 'config'; // Authentication method (config, http or cookie based)?
nicht nach 'http' oder 'cookie' abändern. phpMyAdmin greift somit wieder ohne Passwortabfrage per Browsergraphik sofort auf MySQL zu. Dies ist jedoch nicht zu empfehlen, falls ihr auch nur kurzzeitig am Netz hängt. Die Zeile mit Passwort muss auf jeden Fall im Skript stehen, weil uns sonst MySQL über phpMyAdmin nicht einlässt, wie schon weiter oben beschrieben. (Oder ihr verwendet phpMyAdmin nie wieder, geht auch :-)
.
9. Entkomprimierprogramm installieren
Das Pack/Entpack-Programm 7-zip für Windows (oder ein anderes geeignetes eurer Wahl) installieren. 7-Zip bindet sich in den Rechte-Maustaste-Dialog ein. Wenn man auf die zu entpackende Datei mit Rechts klickt, sieht man einen Eintrag "7-zip" und dann „Entpacken“, „Hier entpacken“, usw. Dialoge werden erst nach Neustart des Rechners deutsch.
.
10. Mediawiki "dewiki" einrichten, Teil I.
Mit 7-Zip die heruntergeladene Datei Mediawiki-Versionsnummer.tar.gz zu Mediawiki-Versionsnummer.tar entpacken, und noch einmal mit 7-zip zum Ordner Mediawiki+Versionsnummer entpacken. Diesen Ordner samt Unterordnern, unverändert, (als ein Verzeichnisbaum) in den Windows-Ordner
C:\X\xampp\htdocs\
verschieben und umbenennen in
dewiki
Die exakte Umbenennung ist wichtig. Darauf achten, dass im Ordner dewiki nicht noch einmal ein Ordner Mediawiki+Versionsnummer liegt. Dann diesen in dewiki umbenennen und in htdocs legen (den anderen überschreiben)).
Also: C:\X\xampp\htdocs\dewiki
.
11. Mediawiki "dewiki" einrichten, Teil II.
Den Browser öffnen, Cache leeren und folgende Adresse aufrufen: http://localhost/dewiki/index.php
Dort sollte eine Blume zu sehen sein sowie der Link zur Konfigurations-Seite:
- Website-Name z.B. „DeWikipedia“
- Sprache der Dialoge/Skin: Deutsch
- GNU-Lizenz wählen
- Für den „XYSysop“-Namen irgendwelche Anmelde-Daten nehmen. (Das ist in öffentlichen Wikis der Administrator, der Löschen, Sperrungen, Bearbeiten usw. von erstellten Artikeln und History zulassen darf, für unsere Zwecke unwichtig).
- No Caching
- Email: Alles auf "disabled" setzen
- MySQL-Server : localhost
- (!) Bei der Frage nach dem Datenbank-Namen dewiki angeben (Keine andere Bezeichnung! Der Name soll genau derselbe sein wie bei dem unter Punkt 10 angelegten Verzeichnis „dewiki“).
- (!) Ebenso den Benutzernamen und das Passwort, die wir schon oben verwendet haben, angeben (root, moses).
- Datatable prefix : leer lassen
- Database charset: Backwards-compatible UTF-8
- SuperUser: Hier nichts verändern !
- Unten "Install"drücken.
Grundsätzlich: Es müssen genau dieselben Anmeldedaten wie bislang sein. Mediawiki konfiguriert sich nun (dauert ein paar Sekunden) und erstellt in MySQL eine leere Datenbank mit den richtigen Spezifikationen für Wikipedia und die Textdaten, die wir gleich importieren werden. Bei der Konfiguration verändert Mediawiki die künftigen Anweisungen für sich selbst über die Datei LocalSettings.php. Nach der Konfiguration die Datei LocalSettings.php per Hand aus dem Windows-Ordner
C:\X\xampp\htdocs\dewiki\config
in den Ordner
C:\X\xampp\htdocs\dewiki
verschieben (nicht kopieren!).
Hat man einmal erfolgreich konfiguriert, dann ist in Zukunft an der Adresse http://localhost/dewiki/index.php nicht mehr die Aufforderung mit dem Link zur Konfigurationsseite zu sehen, sondern ab sofort die Mediawiki-Hauptseite, d.h. die Seite, von der aus wir in Zukunft die Wikipedia-Datenbank abfragen. Man kann nur 1x erfolgreich konfigurieren, dann schaltet Mediawiki als Sicherheitsfeature um. Solange die Konfiguration nicht erfolgreich verlaufen ist, wird man immer wieder auf die Konfig-Seite zurückgeführt.
Browser schließen.
Wenn man beabsichtigt, die lokale Wikipedia-Kopie später einmal mit einer neueren Version der Texte zu ersetzen / "upzudaten", bitte jetzt (!) Punkt 15 dieser Anleitung "Wikipedia-Datenbank erneuern" lesen und beachten. Danach hierher zurückkehren.
.
12. AdminSettings.php aufsetzen
Den Windows-Ordner C:\X\xampp\htdocs\dewiki öffnen. Die Datei AdminSettings.sample kopieren. Diese Kopie in AdminSettings.php umbenennen.
AdminSettings.php mit dem Editor öffnen. Was ihr zu sehen bekommt, müsste in etwa so aussehen wie unten (in eurem Editor ist das noch etwas im Blocksatz verschoben und es gibt seltsame Quadrate im Text - diese nicht beachten). Den Text im Editor an den angegebenen Stellen ersetzen mit dem von euch in der Installation gewählten Passwort, also z.B.:
<?php
/**
- This file should be copied to AdminSettings.php, and modified
- to reflect local settings. It is required for the maintenance
- scripts which run on the command line, as an extra security
- measure to allow using a separate user account with higher
- privileges to do maintenance work.
- Developers: Do not check AdminSettings.php into CVS!
- @package MediaWiki
- //
- This data is used by all database maintenance scripts
- (see directory maintenance/). The SQL user MUST BE
- MANUALLY CREATED or set to an existing user with
- necessary permissions.
- This is not to be confused with sysop accounts for the
- wiki.
- /
- $wgDBadminuser = 'wikiadmin';
Vorhergehende Zeile veraendern zu: $wgDBadminuser = 'root';
- $wgDBadminpassword = 'adminpass';
Vorhergehende Zeile veraendern zu: $wgDBadminpassword = 'moses';
- Whether to enable the profileinfo.php script.
- $wgEnableProfileInfo = false;
?>
Ändern, speichern, Datei schließen.
Das Skript AdminSettings.php wird verwendet, um php-Skripte aus dem Verzeichnis \dewiki\maintenance in MySQL anzumelden und sichert deren korrekte Ausführung. Skripte aus \maintenance verwenden wir im Folgenden zweimal. Auch die Notwendigkeit PATH zu erweitern bezieht sich übrigens auf diese Skripte.
.
13. Dump für den Import vorbereiten
Die heruntergeladene Dump-Datei entpacken in eine Datei mit dem Format
NameXYZ.xml
Also zum Beispiel.: von dewiki-20060220-pages-articles.xml.tar.gz oder dewiki-20060220-pages-articles.xml.bz2 aus http://download.wikipedia.org
zu dewiki-20060220-pages-articles.xml
Diese .xml-Datei verschieben in den Windows-Ordner:
C:\X\xampp\htdocs\dewiki\maintenance
.
14. Import der Textdaten/Fertigstellung
Vor diesem Schritt muß sichergestellt sein, dass der mysql-Server nach Änderung seiner Konfigurationsdatei neu gestartet wurde. Sonst wird der geänderte max_allow_packet Wert nicht berücksichtigt, und der Prozess bricht mit einer Fehlermeldung ab. Ein Neustart von Windows startet auch den mysql-Server neu.
Zeit mitbringen!
Die Shell bzw. Eingabeaufforderung aufrufen und in folgendes Verzeichnis wechseln mit dem Befehl:
cd C:\X\xampp\htdocs\dewiki\maintenance
(+ Eingabe/Enter)
Vor dem blinkenden Cursor müsste jetzt
C:\X\xampp\htdocs\dewiki\maintenance> (blinkblink)
stehen. Den Import der Rohdaten starten, indem man am Cursor eingibt:
php importDump.php < dewiki-20060220-pages-articles.xml
(+ Eingabe/Enter)
... und laufen lassen.
(!) Den Namen der Datei dewiki-20060220-pages-articles.xml natürlich ersetzen durch den jeweils aktuellen Namen der von dir heruntergeladenen und entpackten Dump-Datei! Diese .xml-Datei muss im Windows-Ordner C:\X\xampp\htdocs\dewiki\maintenance\ liegen, die Eingabe des Befehls selbst muss in der Shell/Eingabeaufforderung im Verzeichnis C:\X\xampp\htdocs\dewiki\maintenance stattfinden. Nach erfolgtem Import in die Datenbank könnt ihr die .xml-Datei aus \maintenance löschen.
Der Rechner arbeitet nun das Programmscript importDump.php ab und gibt währenddessen an der Eingabeaufforderung Zeilen in 100er-Zählschritten nach folgendem Muster aus:
z.B. 722900 <58.6748937264 pages/sec 58.896826549 revs/sec>
Ab und an erscheint "Got bogus revision with null title" (nicht beachten), und zum Schluss - am nächsten Morgen :) - "Done!"
Alles schließen. Browsercache leeren und Mediawiki-Hauptseite http://localhost/dewiki/index.php aufrufen, Suchbegriff eingeben und in der Wikipedia schlau(er) lesen.
Herzlichen Glückwunsch zu deiner neuen Offline-Wikipedia!
.
15. Wikipedia-Datenbank erneuern
Wie erneuere ich die Wikipedia-Artikel, wenn der Inhalt meiner Datenbank veraltet ist?
Einfach die alten Daten überspielen, indem man importDump.php mit der dann aktuellen .xml-Datei laufen lässt. Also Punkt 13 & 14 wiederholen. Der Inhalt wird dabei allerdings doppelt auf der Festplatte angelegt, da alle Artikel danach in zwei Versionen vorhanden sind. (Auch die, die inzwischen gar nicht geändert wurden.) Ein Script um die Datenbank vorher zu leeren, existiert derzeit leider nicht. Ersatzweise kann man sich, wenn man keine alten Versionen haben möchte, bei der ersten Installation der Software, nachdem man "Mediawiki 'dewiki' einrichten Teil II" (Punkt 11) in dieser Anleitung durchgeführt hat, die noch (fast) leere Datenbank kopieren und diese leere Datenbank vor dem nächsten Importieren wieder über die alte Datenbank drüber kopieren (alten Ordner "dewiki" löschen, zwischengeparktes "dewiki" wieder einsetzen, danach weiter mit dem nächsten Import). Dies sollte man tunlichst bei heruntergefahrener Datenbank tun!
Die Datenbank findet sich im Verzeichnis C:\X\xampp\mysql\data\(dewiki). Diesen Ordner dewiki komplett irgendwo in ein persönliches Archiv kopieren zwecks Lagerung.
.
16. Deinstallation
Man deinstalliert, indem man zunächst das Verzeichnis dewiki per Hand aus dem Verzeichnis
C:\X\xampp\htdocs\
löscht (samt allen Unterordnern, ab in den Papierkorb). Danach startet man über Start>Programme>apachefriends>xampp>xampp-uninstall die Deinstallationsroutine, die die Jungs&Mädels von Xampp netterweise beigefügt haben.
.
17. Volltext-Indizierung einrichten
In der Regel benötigt man keinen Textindex, um Artikel in der Wikipedia zu finden. Entsprechen die Titel der Artikel nicht dem genauen Suchbegriff, gibt es häufig Redirect-Seiten. Auch kann man im Kategorienverzeichnis oder notfalls in thematisch verwandten Artikeln nach querverweisenden Links suchen.
Im Einzelfall jedoch können Einträge, die in der Datenbank zwar vorhanden sind, deren Titel aber unterschiedlich zum eingegebenen Suchwort / Suchworten verfasst worden sind, nicht gefunden werden. Abhilfe schafft die Einrichtung eines Volltextindex, so dass Teil-Übereinstimmungen in Titeln und einzelne Begriffe im Volltext identifiziert werden. Das Anlegen eines solchen Index' benötigt bei einer Textdatenbank von 1,7 GB noch einmal ca. 1,5 GB (Schätzung) zusätzlichen Speicherplatz. Darüber hinaus dauert die Abarbeitung des entsprechenden Befehls z.B. bei der deutschen Wikipedia, Feb 2006, mit einem 1,8 GHz Prozessor etwa 20 Stunden!
Falls gewünscht, die Eingabeaufforderung öffnen und - die bisherige Installation vorausgesetzt - am Cursor eingeben:
cd C:\X\xampp\htdocs\dewiki\maintenance
(+ Eingabe/Enter), dann
php rebuildtextindex.php
(+ Eingabe/Enter)
... und laufen lassen. Der Rechner löscht einen bislang nicht vorhandenen alten Index "Drop index", erstellt die Index-Felder neu und danach trägt er ein. Der Fortschritt wird in 500er-Schritten (von was auch immer) angezeigt, danach einfach "Rebuilding index...". Zum Schluss kommt die Meldung "Done" und das Zurückschalten hinter C:\X\xampp\htdocs\dewiki\maintenance> blink blink.
.
18. Mehrere Wikipedien parallel
Will man zusätzlich die englischsprachige Wikipedia, etc. installieren, lädt man die entsprechende Dump-Datei aus http://download.wikipedia.org und wiederholt die Schritte 10 bis 14, nennt das Verzeichnis enwiki statt dewiki und passt die weiteren Datenangaben an. Im Browser markiert man Favoriten für die jeweile Wiki-Hauptseite. Man installiert also jeweils erneut eine Mediawiki-Instanz (7 MB) für eine neue Sprache/Inhalt. Die einzuspielenden Datenbankinhalte selbst legen sich allesamt in xampp\mysql\-Verzeichnissen ab, für die korrekte Anbindung zum Frontend sorgt der Import per importDump.php aus dem korrekten wiki-Verzeichnis, also nicht aus dewiki\maintenance, sondern aus enwiki\maintenance.
.