PHP

Programmiersprache
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 4. März 2007 um 06:50 Uhr durch RobotQuistnix (Diskussion | Beiträge) (Bot: Ergänze: tg:PHP). Sie kann sich erheblich von der aktuellen Version unterscheiden.

PHP (rekursives Backronym für „PHP: Hypertext Preprocessor“, ursprünglich „Personal Home Page Tools“) ist eine Skriptsprache mit einer an Java bzw. Perl angelehnten Syntax, die hauptsächlich zur dynamischen Erstellung von Webseiten oder Webanwendungen verwendet wird. PHP ist Open-Source-Software.

PHP
Basisdaten
Erscheinungsjahr: 1995
Designer: Rasmus Lerdorf[1]
Entwickler: The PHP Group
Aktuelle Version: 5.2.1 (8. Februar 2007)
4.4.6  (1. März 2007)
Typisierung: dynamisch
Beeinflusst von: C++, Perl[2], C[2], Java[2], Tcl[3], HTML, JavaScript
Betriebssystem: plattformunabhängig
Lizenz: PHP License
www.php.net

PHP zeichnet sich besonders durch die leichte Erlernbarkeit, die breite Datenbankunterstützung und Internet-Protokolleinbindung sowie die Verfügbarkeit zahlreicher, zusätzlicher Funktionsbibliotheken aus. Es existieren beispielsweise Programmbibliotheken, um Bilder und Grafiken zur Einbindung in Webseiten dynamisch zu generieren.

Geschichte

PHP wurde 1995 von Rasmus Lerdorf entwickelt. Der Begriff stand damals noch für Personal Home Page Tools und war ursprünglich eine Sammlung von Perl-Skripten, die Rasmus Lerdorf zur Protokollierung der Zugriffe auf seinen Online-Lebenslauf geschrieben hatte. Bald schuf Lerdorf jedoch eine größere Umsetzung in C. In dieser Programmiersprache wird PHP heute noch entwickelt. Das schließlich veröffentlichte PHP/FI (FI stand für Form Interpreter) war Perl sehr ähnlich, wenn auch viel eingeschränkter, einfacher, und ziemlich inkonsistent.

PHP 3 wurde von Andi Gutmans und Zeev Suraski neu geschrieben, da das inzwischen erschienene PHP/FI 2 ihrer Meinung nach für eCommerce zu schwach war. Auch die Bedeutung der Abkürzung „PHP“ wurde hierbei geändert. Lerdorf kooperierte mit Gutmans und Suraski, und so wurde die Entwicklung von PHP/FI eingestellt. Obwohl PHP 3 für den professionellen Einsatz noch keine allzu große Funktionsvielfalt bot bzw. einige Schwächen aufwies, brachte es die Verbreitung von PHP bedeutend voran. Die von Gutmans und Suraski gegründete Firma Zend Technologies Ltd. entwickelte in der Folge die Zend Engine 1, die den Kern der PHP-4-Standardimplementation bildet. Der Name „Zend“ ist aus den beiden Vornamen der Entwickler Zeev und Andi gebildet. Mit PHP 4 wurden die Ausführungsgeschwindigkeit komplexer Applikationen und die Sicherheit bei Verwendung globaler Variablen verbessert. Eingeführt wurden die Unterstützung für viele weitere Webserver, das Sessionmanagment, die Ausgabepufferung sowie viele neue Sprachkonstrukte.

Da das World Wide Web Ende der 1990er-Jahre stark wuchs, bestand großer Bedarf an Skriptsprachen, mit denen sich dynamische Webseiten realisieren lassen. PHP wurde, für Webentwicklung, mit der Zeit populärer als der vorherige De-facto-Standard Perl, weil es durch seine Spezialisierung als einfacher erlernbar gilt.

Meilensteine

  • PHP 1.0 erschienen am 8. Juni 1995
  • PHP 2.0.0 bzw. PHP/FI, erschienen am 12. November 1997
  • PHP 3.0.0, erschienen am 6. Juni 1998
  • PHP 4.0.0, erschienen am 22. Mai 2000
  • PHP 5.0.0, erschienen am 13. Juli 2004
    • Erstmals ist durch viele hinzugefügte Sprachkonstrukte ernsthaftes objektorientiertes Programmieren möglich.
    • Exceptions hinzugefügt
    • Reflections API
    • MySQLi (MySQL improved, objektorientiert und auf aktuelle MySQL-Versionen zugeschnitten)
    • SQLite (vollständig client-basiertes, dem SQL Standard zu 95 % entsprechendes Datenbanksystem)
    • SimpleXML (einfacher XML-Parser, Änderungen von Einträgen sind möglich, aber es können keine neuen hinzugefügt oder gelöscht werden)
    • DOM-Unterstützung (objektorientiert)
  • PHP 5.1.0, erschienen am 24. November 2005
    • Datenbankabstraktionsschicht hinzugefügt (PDO)
  • PHP 5.2.0, erschienen am 2. November 2006
    • schnellere und effizientere Speicherverwaltung
    • Filter-Erweiterung hinzugefügt (Filtern und Verifizieren von Benutzereingaben)
    • JSON hinzugefügt (Serialisierung von PHP-Variablen in JavaScript-Syntax, nützlich im Zusammenspiel mit Ajax)
    • ZIP (Auslesen und Erstellen von ZIP-Archiven) hinzugefügt
    • objektorientierte Datum-Erweiterung (DateTime und DateTimeZone) hinzugefügt

Allgemein

 
Darstellung der Funktionsweise von PHP


PHP ist eine serverseitig interpretierte Sprache. Das bedeutet, dass der Quelltext – im Gegensatz zu JavaScript, das in der Regel clientseitig ausgeführt wird – nicht an den Browser übermittelt wird, sondern an einen Interpreter auf dem Webserver. Erst dessen Ausgabe wird an den Browser geschickt. In den meisten Fällen ist dies ein HTML-Dokument, wobei es mit PHP aber auch möglich ist, andere Dateitypen, wie z. B. Bilder oder PDF-Dateien, zu generieren.

Mit PHP lassen sich wie mit Perl auch Skripte schreiben, die nichts mit dem WWW zu tun haben. Die GTK-Erweiterung stellt sogar eine Programmierschnittstelle für eine grafische Oberfläche zur Verfügung, für die weder ein Webserver noch ein Browser benötigt werden. Verglichen mit „Allzweck“-Skriptsprachen wie Python und Perl sind die Schnittstellen für die grafische Oberfläche und zu anderen Betriebssystemfunktionen aber spärlich und werden kaum verwendet. PHP spielt seine Stärken vor allem beim Einsatz auf Webservern aus.

Um eine PHP-Datei im Rahmen einer Webanwendung ausführen zu können, benötigt man ein System, das mit den in der Datei enthaltenen Anweisungen umgehen kann. Aus diesem Grund wird durch eine Schnittstelle (beispielsweise ISAPI oder CGI) der Interpreter von einem Serverdaemon bzw. Serverdienst (z. B. Apache oder IIS) ausgeführt. Die Kombination von Linux/Windows als Betriebssystem, Apache als Webserver, MySQL-Server als Datenbank und PHP wird LAMP bzw. WAMP genannt. Fertige LAMP- und WAMP-Pakete, die das einzelne Laden und Konfigurieren von Paketen aus dem WWW unnötig machen, werden im Projekt XAMPP entwickelt, wobei es inzwischen Versionen für Linux, Solaris, Windows und Mac OS X gibt.

Die Vorteile der serverseitigen Ausführung sind, dass beim Client (Browser) keine speziellen Fähigkeiten erforderlich sind oder Inkompatibilitäten auftreten können, wie es beispielsweise bei JavaScript und den verschiedenen Browsern der Fall ist. Außerdem bleibt der PHP-Quelltext der Seite auf dem Server, und nur die generierten Daten sind für den Besucher einsehbar. Gleiches gilt für andere Ressourcen wie z. B. Datenbanken, die daher auch keine direkte Verbindung zum Client benötigen.

Nachteilig ist, dass jede Aktion des Benutzers erst bei einem erneuten Aufruf der Seite erfasst werden kann. Da PHP normalerweise in einer Webserverumgebung läuft, unterliegt es auch dem zustandslosen HTTP. Außerdem wird jede PHP-Seite vom Server interpretiert, wodurch dessen Belastung steigt. Diese Vor- und Nachteile sind nicht PHP-spezifisch, sondern treten bei grundsätzlich jeder Webanwendung auf. Zusätzlich liest, prüft und übersetzt der Interpreter den Quelltext bei jedem Aufruf erneut. Dies mindert die Reaktionsgeschwindigkeit des Servers und erhöht nochmals die Last. Um dem entgegenzuwirken, wurde eine Erweiterung namens MMCache entwickelt. Diese speichert eine zur Ausführung vorbereitete Version des Programms zwischen und beschleunigt somit den Zugriff auf diese Datei beim nächsten Aufruf. Der MMCache wird inzwischen nicht mehr weiterentwickelt, seine Stelle nimmt der Nachfolger eAccelerator ein.

Mängel

PHP ist zeitweise etwas ungesteuert gewachsen. So funktioniert der Zugriff auf eine Datenbank mittels der MySQL-Funktionen anders als über ODBC; noch deutlicher wird dies beispielsweise bei Inkonsistenzen der Funktionen zur String-Verarbeitung. Zwar unterstützt PHP bereits seit Version 3 grundlegend objektorientiertes Programmieren (in den Versionen 4 und 5 verbessert und erweitert), aber die gesamte Standardbibliothek von PHP 4 und der Großteil derer von PHP 5 sind noch prozedural angelegt. Auch bei objektorientierten Sprachen übliche Features wie Kapselung der Daten (z. B. private Variablen), Destruktoren oder Fehlerbehandlung per Exceptions sind erst in PHP 5 hinzugekommen. Die Funktionen register_shutdown_function(), set_error_handler() und error_reporting() in PHP 4 können diese wichtigen Sprachkonstrukte nicht ersetzen.

Die aktuelle Version PHP 5 mit der neuen Zend Engine 2 ist seit dem 13. Juli 2004 verfügbar. Um die Missstände aus der vorherigen Version zu beheben, wurden Änderungen am Verhalten von PHP selbst nötig. So sind Objekt-Variablen in PHP 5 wie bei den meisten Sprachen nur noch eine Referenz auf das Objekt und nicht wie in PHP 3 und 4 das Objekt selbst. In PHP 5 wurden außerdem wichtige OOP-Features wie z. B. Destruktoren und die Festlegung der Sichtbarkeit einer (Klassen-)Eigenschaft (public, private oder protected) ergänzt. Einige wichtige Teile der Standardbibliothek wie etwa die DOM-API sind seit PHP 5 objektorientiert. In PHP 5.1 wurde mit PHP Data Objects (PDO) eine neue objektorientierte Erweiterung aufgenommen, die einen einheitlichen Zugriff auf die verschiedenen SQL-Datenbanken ermöglicht.

Bemängelt wird aber noch immer der auch in der Version 5 unzureichende Support von Unicode. Bisher bietet PHP nur einige Funktionen, bei denen ein Zeichensatz (darunter auch UTF-8) angegeben werden kann, sowie Funktionen zur Konvertierung von und nach UTF-8, aber noch keine durchgehende Unterstützung. Für viele Probleme sorgen auch die „magic quotes“- und „autoglobals“-Mechanismen, die je nach Serverkonfiguration aktiviert oder deaktiviert sind. Ursprünglich waren sie als Bequemlichkeits-Feature und zusätzliches „Sicherheitsnetz“ für Anfänger gedacht, aber ein portables Skript muss mit allen möglichen Konfigurationen umgehen können, wodurch sich der Effekt ins Gegenteil verkehrt. Siehe dazu auch die englischsprachige PHP-Dokumentation[4].

Um mit diesem Missstand aufzuräumen, kündigte Andi Gutmans (zusammen mit Zeev Suraski der Entwickler von PHP) umfassende Unicode-Unterstützung auf Basis von ICU für die nächste große Version (6.0) an, die für das dritte Quartal 2007 geplant ist. In der Präsentation von Andrei Zmievski[5] von der PHP-Conference 2005 wird die Implementierung anhand vieler Beispiele erklärt. Unter anderem werden Konstrukte wie strlen($str) oder $str{1} problemlos mit Unicode funktionieren. Eine Diskussion über mögliche Änderungen in PHP 6 findet sich auf der Mailingliste php.internals[6].

Variablenmanipulation

Bei den Globalen Variablen (→Geltungsbereich von Variablen) existiert eine erhebliche Sicherheitslücke, die durch die Variablenvorbelegung von PHP zustande kommt. Über die URL einer Seite können beliebig Variablen geändert werden, wenn hierbei nachlässig programmiert wurde.

http://example.com?variable1=test&variable2=irgend_ein_wert

Durch diesen Aufruf erhält variable1 den Wert ‚test‘ und variable2 entsprechend ‚irgend_ein_wert‘. Vorhandene Variablen, die im PHP-Skript verwendet werden, könnten überschrieben werden. Um diese Art von Manipulation zu verhindern, sollte die automatische Variablenvorbelegung mit register_globals=off in der PHP-Konfiguration abgeschaltet werden (seit PHP 4.2.0 standardmäßig). Auf die per URL übergebenen Variablen kann dann seit PHP 4.1.0 mit den „Superglobals“ zugriffen werden.

$_GET['variable1'] oder $_POST['variable1'] (je nach Übertragungsart)

$HTTP_GET_VARS['variable1'] oder $HTTP_POST_VARS['variable1'] (bei PHP-Versionen vor 4.1.0)

Zu den Superglobals zählen eine Reihe „assoziativer Arrays“ die im ganzen PHP-Code zur Verfügung stehen und die diverse Informationen speichern (Informationen vom Nutzer, dem Server und der Serverumgebung). Die Inhalte der Arrays $_GET, $_POST und $_COOKIE sind seit PHP 4.1.0 zusätzlich in $_REQUEST zusammengefasst (http://www.php.net/manual/de/language.variables.predefined.php).

Anmerkung: Seit der Version 5.0 können die $HTTP_*_VARS deaktiviert werden (register_long_arrays=off)

Allerdings kann man im gewissen Rahmen eine Manipulation verhindern, falls z.B. bei einem Forum ausschließlich ein Integerwert benötigt wird. In diesem Falle kann man überprüfen, ob der übergebene Wert ein Integer ist, und ggf. abbrechen. Zudem gibt es Plugins, die eine URL überprüfen, ob unerlaubte Befehle mit übergeben wurden, z.B. CTracker. Diese brechen ab, falls bspw. in einer 'id'-Variable ein Befehl wie DROP TABLE (Lösche Tabelle) verwendet wird.

Code-Beispiel

Einfaches PHP-Script (gibt „Hallo Welt!“ aus):

<?php
  echo "Hallo Welt!"; 
?>

Anmerkung: Das ´echo´ kann auch durch ´print´ ersetzt werden und es können auch einfache Anführungszeichen (') statt doppelten (") verwendet werden. Da echo als Funktion betrachtet werden kann, kann auch echo ('Hallo Welt') verwendet werden. Die Unterscheidung der Anführungszeichen (' &" ) sorgt einerseits dafür den Variablenname im Sprachkonstrukt auszugeben, andererseits dafür den Inhalt der Variable auszugeben

Script in HTML integriert (gibt ebenfalls „Hallo Welt!“ auf der Webseite aus):

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
   "http://www.w3.org/TR/html4/loose.dtd">
<html>
  <head>
   <title>Hallo-Welt-Beispiel</title>
  </head>
  <body>
    <?php 
      echo "Hallo Welt!";
    ?>
  </body>
</html>

Lizenz und Bezug

PHP 3 wurde unter der GNU General Public License (GPL) vertrieben. Seit Version 4 wird PHP unter der PHP License vertrieben, da der neue Parser Zend von den Machern unter einer nicht GPL-kompatiblen Lizenz veröffentlicht wird. Die PHP-Lizenz ist eine Softwarelizenz, die die freie Verwendung und Veränderung der Quelltexte erlaubt. Die Software kann somit kostenlos aus dem Internet geladen werden; daneben ist PHP auch schon bei einigen Betriebssystemen (z. B. bei allen relevanten Linux-Distributionen oder Mac OS X) im Lieferumfang enthalten.

Performance

Setzt man PHP als CGI-Programm ein, ist die Performance sehr schlecht. Für jeden HTTP-Request startet der Webserver eine neue Instanz des PHP-Interpreters, welche jedes Mal den Quelltext des aufgerufenen Skriptes neu übersetzt. Um den Start der Interpreter-Instanzen zu sparen, setzt man PHP üblicherweise als Servermodul, d.h. Teil der Webserver-Prozesse, oder über FastCGI ein. Da bei kleinen Skripten das Starten des PHP-Interpreters bei weitem am meisten Zeit verbraucht, führt diese Maßnahme zu einer drastischen Leistungssteigerung.

Bei umfangreichen Projekten mit viel PHP-Quelltext kann es sich lohnen, auch das Neuübersetzen des Skriptes zu vermeiden. Dazu verwendet man einen sog. Opcode-Cache. Anders als bei Java ist es bei PHP nicht standardmäßig vorgesehen, die aus dem PHP-Quelltext erzeugten Opcodes zu speichern und später auszuführen. Die für PHP verfügbaren Opcode-Caches sind Erweiterungen, die man von Hand einbinden muss.

Beispiel für diese Caches sind Turck-mmCache und dessen Nachfolger eAccelerator, der Alternative PHP Cache, der IonCube-Accelerator (alles Open Source und Freeware) sowie der kommerzielle Zend Optimizer.

Der Leistungsgewinn hängt von der Art der Skripte ab. Je geringer die eigentliche Laufzeit des Skriptes im Vergleich mit dem Umfang des Quellcodes ist, desto mehr lohnt sich der Einsatz solcher Opcode-Caches. Die von den Anbietern angegebenen Leistungssteigerungen sind als Maximalwerte zu verstehen. [7]

Weiterhin kann man die Leistung von PHP dadurch steigern, dass man umfangreiche Teile des Quellcodes in separate Dateien auslagert und nur bei Bedarf einbindet. Dafür stellt PHP 5 mit „Autoloading“ eine geeignete Methode bereit [8]. Auch ohne Opcode-Caches spart man so das Übersetzen von Teilen des Quellcodes.

In einem kürzlich veröffentlichten Datenbank-Contest[9] der Zeitschrift c't ist - vielleicht etwas überraschend - eine Lösungsvariante mit PHP auf MySQL unter Linux mit der mit Abstand besten Performance (gegenüber Varianten in Java, C++ und anderen Sprachen) als Sieger hervorgegangen. Dabei wurde der oben erwähnte alternative PHP Cache (APC) eingesetzt.

Verbreitete PHP-Applikationen

Es gibt verschiedene, sehr weit verbreitete Applikationen, die in PHP geschrieben wurden. Hier eine kleine Auswahl:

Auch die Wikipedia basiert auf einer in PHP geschriebenen Applikation, dem MediaWiki.

Literatur

Gedruckte Werke zu PHP veralten aufgrund der permanenten Weiterentwicklungen von PHP schnell. Die aktuellen Informationen und Dokumentationen findet man auf der offiziellen Website php.net.

Wiktionary: PHP – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wikibooks: Websiteentwicklung: PHP – Lern- und Lehrmaterialien

Dies ist eine kleine Auswahl von Links zu PHP. Eine ausführliche Linksammlung findet sich im Open Directory Project.

Zeitschriften

Quellen

  1. lerdorf.com. (englisch, abgerufen am 31. Mai 2021).
  2. a b c PHP: Preface - Manual. (abgerufen am 25. August 2016).
  3. Rasmus Lerdorf | PHP on Hormones. 29. Juli 2013 (abgerufen am 19. März 2016).
  4. PHP Docs: Magic Quotes (englisch)
  5. PHP-Conference 2005: Präsentation von Andrei Zmievski
  6. PHP-Mailingliste: Diskussion über mögliche Änderungen in PHP 6 (englisch)
  7. Jean-François Bustarret: Benchmarking PHP accelerators, 11. Juli 2006
  8. The PHP Group: PHP: Autoloading - Manual, 11. Juli 2006
  9. c't: Datenbank Contest