Dieser Artikel beschäftigt sich mit der Skriptsprache Perl. Den Artikel zu der Gemeinde Perl im Saarland finden Sie unter Perl (Saarland) und den Schriftgrad Perl (5 Punkt) findet man unter Schriftgrad – Programmiersprachen mit ähnlichem Namen: Pearl.
Perl (Practical Extraction and Report Language, von Larry Wall teilweise auch scherzhaft als Pathologically Eclectic Rubbish Lister bezeichnet) ist eine Programmiersprache (genauer: Skriptsprache) zum Verfassen von Computerprogrammen. Die damit geschriebenen Programme sind von manchen als sehr unübersichtlich bezeichnet worden, vor allem wegen Variablennamen wie $_, $&, $# oder $~. Wie in jeder Programmiersprache hängt die Lesbarkeit aber vor allem von Stil, Disziplin und Erfahrung des Programmierers ab.
Geschichte
Perl wurde von Larry Wall entworfen, der es 1987 erstmals publizierte und 1993 der Allgemeinheit frei zu Verfügung stellte. Der Benutzer kann dabei zwischen der Artistic License und der GPL wählen. Heute wird Perl von vielen Menschen gemeinsam im Internet als Freie Software weiterentwickelt. Larry Wall bestimmt aber auch heute noch maßgeblich die Entwicklung mit.
Perls Entwurf bezog bewusst praktische Konzepte anderer Programmiersprachen wie C, awk, sed und sogar LISP ein bzw. entwickelte sie weiter. Programmierer dieser Sprachen finden so besonders leichten Zugang. Insgesamt kommt man mit Perl nach Überwindung einer ersten Hürde sehr schnell zu Erfolgserlebnissen.
Perl wurde ursprünglich unter Unix entwickelt, ist jedoch inzwischen für die meisten Betriebssysteme verfügbar.
Merkmale
Von Anfang an war Perl besonders auf die Verarbeitung von Texten und Textdateien sowie zur Ausgabe von Berichten ausgelegt. Durch zahlreiche Erweiterungen und zusätzliche Bibliotheken hat es sich jedoch längst zu einer auch universell einsetzbaren Sprache weiterentwickelt. Systemadministratoren und Webentwickler (siehe CGI) setzen sie besonders gern ein. Ein weiteres Hauptanwendungsfeld ist das Data-Munging, aber auch auf vielen anderen Gebieten ist Perl zu Hause – ausgenommen sind eigentlich nur Bereiche, in denen Skriptsprachen aus Geschwindigkeitsgründen prinzipbedingt ungeeignet sind.
Perl wurde für den praktischen Einsatz entwickelt und konzentriert sich daher auf einfache Programmierbarkeit, Vollständigkeit und Effizienz. Ein gern zitiertes Motto besagt, dass leichte Dinge einfach und komplexe Dinge möglich sein sollen.
Neben einer unkomplizierten Verwendung von Variablen (keine Festlegung von Datentypen notwendig,...) zeichnet sich Perl u. a. auch durch einen sehr ausgefeilten Mechanismus zur Textmustererkennung, die regulären Ausdrücke aus, der z. B. eine sehr effektive Programmierung von Filtern oder Reports gestattet. Mit Version 5 wurde es um die Möglichkeit objektorientierter Programmierung erweitert, die sich gut in das Konzept der Sprache einpasst.
Kenner schätzen an Perl neben den schon erwähnten Eigenschaften seine enorme Flexibilität. Typischerweise gibt es sehr viele mögliche Lösungsansätze für ein Problem, so dass jeder die ihm angenehmste Variante finden und verwenden kann. Hier wie auch an anderen Stellen merkt man dem Design die Anlehnung an natürliche Sprachen mit ihren reichen Formulierungsmöglichkeiten an. Viele Anweisungen und Befehle in Perl sind der englischen Sprache entlehnt, so zum Beispiel der Befehl my zur Variablenlokalisation. Viele boolsche Operatoren lassen sich auch durch die englischen Begriffe ersetzen, denen sie entsprechen, so zum Beispiel „||“ durch „or“ und „&&“ durch „and“. Dies ermöglicht zum einen einen sehr fließenden Programmierstil und verursacht eine gute Lesbarkeit der Programme, kann aber falsch angewendet auch den gegenteiligen Effekt - nämlich schwer lesbaren Programmcode - verursachen.
Kritiker missinterpretieren diese Flexibilität oft so, dass Perl dazu einlade, sehr unübersichtlichen Code zu produzieren, und gehen sogar so weit zu sagen, Perl sei die einzige Sprache, in der man „write-only“ programmieren könne. Tatsächlich bietet Perl nicht mehr oder weniger Möglichkeiten, unleserlichen Code zu produzieren, als andere Sprachen auch; Les- und Wartbarkeit eines Programms hängen in praktisch allen verbreiteten Sprachen vor allem vom Willen und Können seines Autors ab. Allerdings ermöglicht es Perl (scheinbar paradoxerweise) aufgrund seiner Flexibilität auch, besonders lesbaren Code zu schreiben.
Als Maskottchen von Perl dient ein Dromedar. Es zierte erstmals den Umschlag des Referenzwerkes Programming Perl, welches im O'Reilly Verlag herausgegeben wird und als das Kamel-Buch bekannt ist. In einem Interview sagte Tim O'Reilly scherzhaft als Begründung: Perl ist hässlich und kommt über lange Strecken ohne Wasser aus.
Datenstrukturen
Basisdatentypen in Perl sind skalare Variablen, Arrays und Hashes (assoziative Arrays).
In einer skalaren Variable können Strings, Zahlenwerte oder Referenzen auf andere Daten gespeichert sein. Dasselbe gilt für alle Elemente der Array- und Hash-Datenstrukturen. Referenzen als Spezialfälle skalarer Variablen erlauben so die Konstruktion beliebig komplexer Datenstrukturen. Auch Objekte werden über Referenzen verwaltet.
Charakteristisch für Perl ist, dass Datentypen durch ein Prefix (oder auch Sigil genannt) angezeigt werden, hier einige Beispiele.
$ für Skalare: ($scalar) @ für Arrays (@array) % für Hashes/assoziative Arrays (%hash) & für Funktionen (&function) * für Typeglobs (*alles)
Während Arrays natürliche Zahlen als Index verwenden (die Zählung beginnt standardmäßig mit 0), werden Hash-Einträge über einen alphanumerischen Schlüssel („Key“) angesprochen. Hashes und Arrays lassen sich einander zuweisen.
Kontrollstrukturen
Die grundlegenden Kontrollstrukturen unterscheiden sich kaum von denen in C, Java und JavaScript:
If-Then-Else-Strukturen
if (<condition>) { <statements> } elsif (<condition>) { <statements> } else { <statements> }
Negierte If-Then-Struktur:
unless (<condition>) { <statements> }
Schleifen
While-Schleife:
while (<condition>) { <statements> }
Do-While-Schleife:
do { <statements> } while (<condition>);
For-Schleife:
for ([<start expression>]; [<condition>]; [<update statement>]) { <statements> }
Foreach-Schleife, diese durchläuft Listen. $element ist eine Referenz auf das jeweilige Element:
foreach [ [my] $element] (<list>) { <statements> }
Nachgestellte Kontrollstrukturen
Eine interessante Option in Perl sind nachgestellte Kontrollstrukturen, die es erlauben, die wesentliche Funktion eines Codefragments durch Voranstellen herauszuarbeiten, und die den (englischsprachigen) Lesern das Verständnis durch natürlichsprachige Formulierungen erleichtern:
doSomething() if $Bedingung; # Normal: if ($Bedingung) {doSomething;} doSomething() unless $Bedingung; # Normal: unless ($Bedingung) {doSomething;} loop() for @list; # Normal: foreach @list {loop();} print while <STDIN>; # Normal: while(<STDIN>) {print;}
Beispiele
Perl wird häufig für so genannte Filterprogramme verwendet. Diese lesen Zeile für Zeile von der Standard-Eingabe-Datei, bearbeiten sie und schreiben das Ergebnis auf die Standard-Ausgabe-Datei.
Ein erster Entwurf könnte beispielsweise so aussehen:
while ($line = <STDIN>) { # bearbeite hier den Inhalt der Variable $line ... # ... und gib das Ergebnis aus print $line; }
Weil diese Art Aufgabe in Perl häufig vorkommt, gibt es dafür eine Abkürzung – das typische Idiom arbeitet implizit mit der Variablen $_. Hier ein Beispiel das alle eingelesenen Zeilen um einen <Tab> eingerückt ausgibt:
while (<>) { # Die eingelesene Zeile steht in $_ # Wir schieben ein <Tab> vor die Zeile ... $_ = "\t".$_;
# .. und geben diese aus. print; }
Anderes Beispiel: Einlesen einer Datei in ein Array von Zeilen. Dieses Beispiel ist aber speichertechnisch uneffizient, und sollte nur bei kleineren Dateien verwendet werden.
@meinArray = <STDIN>;
Noch ein Beispiel: Zählen von Wörtern und nach Häufigkeit (seltenste zuerst) ausgeben
ausführliche Version:
while ($zeile=<ARGV>) { @worte = split /\s+/, $zeile; foreach $wort (@worte) {$haeufigkeit{$wort}++;} } foreach $wort (reverse sort {$haeufigkeit{$a} <=> $haeufigkeit{$b}} keys %haeufigkeit) { print "$wort: $haeufigkeit{$wort}\n"; }
kurze Version:
map {$_{$_}++} split while <>; print "$_: $_{$_}\n" for reverse sort {$_{$a} <=> $_{$b}} keys %_;
(Man beachte hierbei, dass der Skalar $_
und der Hash %_
, auf dessen Elemente mit $_{schlüssel}
zugegriffen wird, unterschiedliche Variablen sind!)
Diese vielen verschiedenen Lösungsansätze spiegeln ein von Perl-Programmierern gerne zitiertes Motto There's more than one way to do it (kurz: TMTOWTDI) wieder. Insbesondere die Möglichkeit, Programme kurz zu halten, wird von Perl-Hackern sehr geschätzt.
Versionen
Ältere Versionen wie die noch sehr weit verbreitete 5.005 werden aktiv weiter gepflegt, erfahren aber nur noch minimale Erweiterungen. Der Einsatz einer Version kleiner 5.00503 ist heute allerdings nicht mehr zu empfehlen.
Das aktuelle Release der Version 5.8 ist 5.8.6. Weitere Releases dieser Version sollen zukünftig in regelmäßigen, verhältnismäßig kurzen Intervallen erscheinen.
Das aktuelle Development Release der kommenden Version 5.10 ist 5.9.1.
Version 6 wird zur Zeit komplett neu geschrieben. Sie verfügt über eine eigene, ebenfalls komplett neu entwickelte virtuelle Maschine namens Parrot. Mit der Fertigstellung von Perl 6 wird im dritten Quartal 2005 gerechnet.
Um Perl-5-Code auch in Zukunft zusammen mit Perl 6 verwenden zu können, entwickelt Arthur Bergman eine Implementierung von Perl 5 auf Parrot unter dem Codenamen Ponie.
Spaß mit Perl
Viele Spracheigenschaften von Perl laden dazu ein Programmcode humor- oder kunstvoll zu gestalten. Dies hat zu verschiedenen teils humorvollen, teils skurrilen Wettbewerben und Aktionen um die Programmiersprache Perl geführt.
Wettbewerbe
Unter Perl-Programmierern haben sich einige Sportarten entwickelt, welche mittlerweile bei vielen Menschen Anklang gefunden haben, so zum Beispiel das Perlgolf, ein Wettbewerb dessen Ziel es ist eine gestellte Aufgabe mit einem möglichst kurzem Programm zu lösen. Eine andere Spielart ist zum Beispiel Poesie in Perl. Dabei geht es darum Gedichte zu schreiben die in Perl kompilierbar sind. Da Perl viele Elemente der englischen Sprache beinhaltet ist dies durchaus möglich, so erscheinen zum Beispiel regelmäßig neue Gedichte in der Perl Poetry-Kategorie des englischsprachigen Perl Monks-Forums.
Mottos und Zitate
Es gibt viele bekannte Mottos und Zitate die sich mit Perl selbst oder den Möglichkeiten der Sprache beschäftigten, hier einige Kostproben.
- Perl: the Swiss Army Chainsaw of Programming Languages.
- There's more than one way to do it (Tim Toady)
- ... we often joke that a camel is a horse designed by a committee, but if you think about it, the camel is pretty well adapted for life in the desert. The camel has evolved to be relatively self-sufficient. On the other hand, the camel has not evolved to smell good. Neither has Perl. (Larry Wall über das Kamel als Perl Maskottchen)
Perligata
Das Perl-Modul Lingua::Romana::Perligata ist wohl eines der skurrilsten Module schlechthin, und allemal eine Erwähnung wert. Es ermöglicht dem Benutzer, Perl komplett in Latein zu schreiben. Von Variablen bis Referenzen und mehrdimensionalen Arrays ist alles in dieser neuen Sprachdefinition vorhanden. Nahezu alle Sonderzeichen wurden aus der Sprache entfernt, Variablen gleicher Namen aber unterschiedlicher Struktur (Beispielsweise $next und @next) werden dekliniert, um die entsprechende Variable zu adressieren. Ein bisschen Beispielcode:
insertum stringo unum tum duo excerpemento da. # Entspricht in Perl: substr($string,1,2) = $insert; clavis hashus nominamentum da. # Entspricht: @keys = keys %hash;
Dieses Perlmodul ist ein gutes Beispiel für den Zeitaufwand den viele Leute Perl widmen, Perl kann in diesem Sinne durchaus als Hobby durchgehen.
Literatur
- Larry Wall u.a.: Programmieren in Perl, O'Reilly Verlag, ISBN 3897211440
- Randal L. Schwartz, Tom Christiansen: Einführung in Perl, O'Reilly, ISBN 3897211475
- Damian Conway: Object Oriented Perl, Manning 2000, ISBN 1884777791 ((in schlechter Übersetzung) deutsch bei Addison-Wesley 2001: Objektorientiert Programmieren mit Perl, ISBN 3827318122)
- Randall, Sugalski, Tötsch: Perl 6 & Parrot Essentials, O'Reilly 2004, ISBN 059600737X
Konferenzen und Workshops
The Perl Conference ist ein großes, von O'Reilly ausgerichtetes, allerdings auch teures Treffen in Amerika. YAPCs (Yet Another Perl Conferences) versuchen, Entwickler in einem möglichst erschwinglichen Rahmen lokal zusammenzuführen und haben inzwischen beispielsweise in Amerika, Europa und Israel Tradition. Der Deutsche Perl-Workshop als Treffen für den deutschsprachigen Raum etablierte sich bereits vor den YAPCs mit ähnlichen Zielen und findet in Zusammenarbeit mit ihnen jährlich statt. Inzwischen werden auch in vielen anderen Ländern Workshops organisiert.
Termine
- Der 7. deutsche Perl-Workshop findet vom Mittwoch, 9. Februar 2005 (Aschermittwoch) bis Freitag, 11. Februar 2005 in Dresden statt. Dieser ist allerdings auf etwa 120 Teilnehmer begrenzt, und an professionelle Perl-Entwickler gerichtet, welche bereits an größeren Perl-Projekten beteiligt waren.
Weblinks
- http://history.perl.org/PerlTimeline.html – Timeline
- http://www.perl.com/
- http://www.activestate.com/ – Perl vorkompiliert für Windows und ein Cookbook-Archiv mit von Benutzern beigesteuerten „Kochrezepten“
- http://www.perldoc.com/ – Die Online-Version der Perl-Dokumentation
- http://perl-seiten.privat.t-online.de/ – Perl-Tutorial
- http://www.uni-essen.de/~hrz030/perl/ – sehr kompakte Perl-Einführung mit vielen kurzen Beispielcodestücken
- http://www.sthomas.net/roberts-perl-tutorial.htm – Englisches Perl-Tutorial
- http://www.perl-workshop.de/ – Homepage zum deutschen Perl-Workshop
- http://www.cpan.org – Comprehensive Perl Archive Network
- http://www.perlmonks.org – Englischsprachiges sehr großes Forum
- http://perl-community.de – Das grosse deutsche Perlforum
- http://www.thomas-fahle.de/pub/perl/ – Programmieren mit CPAN-Modulen
- http://pm.org - Perl Mongers - lokale Benutzergruppen
- http://de.wikibooks.org/wiki/Perldoc - Deutsche Übersetzung der Perl-Dokumentation bei Wikibooks