Perl (Programmiersprache)

Programmiersprache
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 24. Januar 2005 um 12:57 Uhr durch Zeno Gantner (Diskussion | Beiträge) (Beispiele: formatierung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Dieser Artikel beschäftigt sich mit der Skriptsprache Perl. Den Artikel zu der Gemeinde Perl im Saarland finden Sie unter Perl (Saarland) und den Schriftgrad Perl (5 Punkt) findet man unter Schriftgrad – Programmiersprachen mit ähnlichem Namen: Pearl.


Perl (Practical Extraction and Report Language, von Larry Wall teilweise auch scherzhaft als Pathologically Eclectic Rubbish Lister bezeichnet) ist eine Programmiersprache (genauer: Skriptsprache) zum Verfassen von Computerprogrammen. Die damit geschriebenen Programme sind von manchen als sehr unübersichtlich bezeichnet worden, vor allem wegen Variablennamen wie $_, $&, $# oder $~. Wie in jeder Programmiersprache hängt die Lesbarkeit aber vor allem von Stil, Disziplin und Erfahrung des Programmierers ab.

Geschichte

Perl wurde von Larry Wall entworfen, der es 1987 erstmals publizierte und 1993 der Allgemeinheit frei zu Verfügung stellte. Der Benutzer kann dabei zwischen der Artistic License und der GPL wählen. Heute wird Perl von vielen Menschen gemeinsam im Internet als Freie Software weiterentwickelt. Larry Wall bestimmt aber auch heute noch maßgeblich die Entwicklung mit.

Perls Entwurf bezog bewusst praktische Konzepte anderer Programmiersprachen wie C, awk, sed und sogar LISP ein bzw. entwickelte sie weiter. Programmierer dieser Sprachen finden so besonders leichten Zugang. Insgesamt kommt man mit Perl nach Überwindung einer ersten Hürde sehr schnell zu Erfolgserlebnissen.

Perl wurde ursprünglich unter Unix entwickelt, ist jedoch inzwischen für die meisten Betriebssysteme verfügbar.

Merkmale

Von Anfang an war Perl besonders auf die Verarbeitung von Texten und Textdateien sowie zur Ausgabe von Berichten ausgelegt. Durch zahlreiche Erweiterungen und zusätzliche Bibliotheken hat es sich jedoch längst zu einer auch universell einsetzbaren Sprache weiterentwickelt. Systemadministratoren und Webentwickler (siehe CGI) setzen sie besonders gern ein. Ein weiteres Hauptanwendungsfeld ist das Data-Munging, aber auch auf vielen anderen Gebieten ist Perl zu Hause – ausgenommen sind eigentlich nur Bereiche, in denen Skriptsprachen aus Geschwindigkeitsgründen prinzipbedingt ungeeignet sind.

Perl wurde für den praktischen Einsatz entwickelt und konzentriert sich daher auf einfache Programmierbarkeit, Vollständigkeit und Effizienz. Ein gern zitiertes Motto besagt, dass leichte Dinge einfach und komplexe Dinge möglich sein sollen.

Neben einer unkomplizierten Verwendung von Variablen (keine Festlegung von Datentypen notwendig,...) zeichnet sich Perl u. a. auch durch einen sehr ausgefeilten Mechanismus zur Textmustererkennung, die regulären Ausdrücke aus, der z. B. eine sehr effektive Programmierung von Filtern oder Reports gestattet. Mit Version 5 wurde es um die Möglichkeit objektorientierter Programmierung erweitert, die sich gut in das Konzept der Sprache einpasst.

Kenner schätzen an Perl neben den schon erwähnten Eigenschaften seine enorme Flexibilität. Typischerweise gibt es sehr viele mögliche Lösungsansätze für ein Problem, so dass jeder die ihm angenehmste Variante finden und verwenden kann. Hier wie auch an anderen Stellen merkt man dem Design die Anlehnung an natürliche Sprachen mit ihren reichen Formulierungsmöglichkeiten an. Viele Anweisungen und Befehle in Perl sind der englischen Sprache entlehnt, so zum Beispiel der Befehl my zur Variablenlokalisation. Viele boolsche Operatoren lassen sich auch durch die englischen Begriffe ersetzen, denen sie entsprechen, so zum Beispiel „||“ durch „or“ und „&&“ durch „and“. Dies ermöglicht zum einen einen sehr fließenden Programmierstil und verursacht eine gute Lesbarkeit der Programme, kann aber falsch angewendet auch den gegenteiligen Effekt - nämlich schwer lesbaren Programmcode - verursachen.

Kritiker missinterpretieren diese Flexibilität oft so, dass Perl dazu einlade, sehr unübersichtlichen Code zu produzieren, und gehen sogar so weit zu sagen, Perl sei die einzige Sprache, in der man „write-only“ programmieren könne. Tatsächlich bietet Perl nicht mehr oder weniger Möglichkeiten, unleserlichen Code zu produzieren, als andere Sprachen auch; Les- und Wartbarkeit eines Programms hängen in praktisch allen verbreiteten Sprachen vor allem vom Willen und Können seines Autors ab. Allerdings ermöglicht es Perl (scheinbar paradoxerweise) aufgrund seiner Flexibilität auch, besonders lesbaren Code zu schreiben.

Als Maskottchen von Perl dient ein Dromedar. Es zierte erstmals den Umschlag des Referenzwerkes Programming Perl, welches im O'Reilly Verlag herausgegeben wird und als das Kamel-Buch bekannt ist. In einem Interview sagte Tim O'Reilly scherzhaft als Begründung: Perl ist hässlich und kommt über lange Strecken ohne Wasser aus.

Datenstrukturen

Basisdatentypen in Perl sind skalare Variablen, Arrays und Hashes (assoziative Arrays).

In einer skalaren Variable können Strings, Zahlenwerte oder Referenzen auf andere Daten gespeichert sein. Dasselbe gilt für alle Elemente der Array- und Hash-Datenstrukturen. Referenzen als Spezialfälle skalarer Variablen erlauben so die Konstruktion beliebig komplexer Datenstrukturen. Auch Objekte werden über Referenzen verwaltet.

Charakteristisch für Perl ist, dass Datentypen durch ein Prefix (oder auch Sigil genannt) angezeigt werden, hier einige Beispiele.

$ für Skalare: ($scalar)
@ für Arrays (@array)
% für Hashes/assoziative Arrays (%hash)
& für Funktionen (&function)
* für Typeglobs (*alles)

Während Arrays natürliche Zahlen als Index verwenden (die Zählung beginnt standardmäßig mit 0), werden Hash-Einträge über einen alphanumerischen Schlüssel („Key“) angesprochen. Hashes und Arrays lassen sich einander zuweisen.

Kontrollstrukturen

Die grundlegenden Kontrollstrukturen unterscheiden sich kaum von denen in C, Java und JavaScript:

If-Then-Else-Strukturen

if (<condition>) {
  <statements>
} elsif (<condition>) {
  <statements>
} else {
  <statements>
}

Negierte If-Then-Struktur:

unless (<condition>) {
  <statements>
}

Schleifen

While-Schleife:

while (<condition>) {
  <statements>
}


Do-While-Schleife:

do {
  <statements>
} while (<condition>);


For-Schleife:

for ([<start expression>]; [<condition>]; [<update statement>]) {
  <statements>
}


Foreach-Schleife, diese durchläuft Listen. $element ist eine Referenz auf das jeweilige Element:

foreach [ [my] $element] (<list>) {
  <statements>
}

Nachgestellte Kontrollstrukturen

Eine interessante Option in Perl sind nachgestellte Kontrollstrukturen, die es erlauben, die wesentliche Funktion eines Codefragments durch Voranstellen herauszuarbeiten, und die den (englischsprachigen) Lesern das Verständnis durch natürlichsprachige Formulierungen erleichtern:

doSomething() if $Bedingung;
  # Normal: if ($Bedingung) {doSomething;}

doSomething() unless $Bedingung;
  # Normal: unless ($Bedingung) {doSomething;}

loop() for @list;
  # Normal: foreach @list {loop();}

print while <STDIN>;
  # Normal: while(<STDIN>) {print;}

Beispiele

Perl wird häufig für so genannte Filterprogramme verwendet. Diese lesen Zeile für Zeile von der Standard-Eingabe-Datei, bearbeiten sie und schreiben das Ergebnis auf die Standard-Ausgabe-Datei.

Ein erster Entwurf könnte beispielsweise so aussehen:

while ($line = <STDIN>) {
  # bearbeite hier den Inhalt der Variable $line
  ...
  # ... und gib das Ergebnis aus
  print $line;
}

Weil diese Art Aufgabe in Perl häufig vorkommt, gibt es dafür eine Abkürzung – das typische Idiom arbeitet implizit mit der Variablen $_. Hier ein Beispiel das alle eingelesenen Zeilen um einen <Tab> eingerückt ausgibt:

while (<>) {
  # Die eingelesene Zeile steht in $_
  # Wir schieben ein <Tab> vor die Zeile ...
  $_ = "\t".$_;
  # .. und geben diese aus.
  print;
}

Anderes Beispiel: Einlesen einer Datei in ein Array von Zeilen. Dieses Beispiel ist aber speichertechnisch uneffizient, und sollte nur bei kleineren Dateien verwendet werden.

@meinArray = <STDIN>;

Noch ein Beispiel: Zählen von Wörtern und nach Häufigkeit (seltenste zuerst) ausgeben

ausführliche Version:

while ($zeile=<ARGV>) {
  @worte = split /\s+/, $zeile;
  foreach $wort (@worte)
   {$haeufigkeit{$wort}++;}
}

foreach $wort (reverse sort {$haeufigkeit{$a} <=> $haeufigkeit{$b}} keys %haeufigkeit) {
   print "$wort: $haeufigkeit{$wort}\n";
}

kurze Version:

map {$_{$_}++} split while <>;
print "$_: $_{$_}\n" for reverse sort {$_{$a} <=> $_{$b}} keys %_;

(Man beachte hierbei, dass der Skalar $_ und der Hash %_, auf dessen Elemente mit $_{schlüssel} zugegriffen wird, unterschiedliche Variablen sind!)

Diese vielen verschiedenen Lösungsansätze spiegeln ein von Perl-Programmierern gerne zitiertes Motto There's more than one way to do it (kurz: TMTOWTDI) wieder. Insbesondere die Möglichkeit, Programme kurz zu halten, wird von Perl-Hackern sehr geschätzt.

Versionen

Ältere Versionen wie die noch sehr weit verbreitete 5.005 werden aktiv weiter gepflegt, erfahren aber nur noch minimale Erweiterungen. Der Einsatz einer Version kleiner 5.00503 ist heute allerdings nicht mehr zu empfehlen.

Das aktuelle Release der Version 5.8 ist 5.8.6. Weitere Releases dieser Version sollen zukünftig in regelmäßigen, verhältnismäßig kurzen Intervallen erscheinen.

Das aktuelle Development Release der kommenden Version 5.10 ist 5.9.1.

Version 6 wird zur Zeit komplett neu geschrieben. Sie verfügt über eine eigene, ebenfalls komplett neu entwickelte virtuelle Maschine namens Parrot. Mit der Fertigstellung von Perl 6 wird im dritten Quartal 2005 gerechnet.

Um Perl-5-Code auch in Zukunft zusammen mit Perl 6 verwenden zu können, entwickelt Arthur Bergman eine Implementierung von Perl 5 auf Parrot unter dem Codenamen Ponie.

Spaß mit Perl

Viele Spracheigenschaften von Perl laden dazu ein Programmcode humor- oder kunstvoll zu gestalten. Dies hat zu verschiedenen teils humorvollen, teils skurrilen Wettbewerben und Aktionen um die Programmiersprache Perl geführt.

Wettbewerbe

Unter Perl-Programmierern haben sich einige Sportarten entwickelt, welche mittlerweile bei vielen Menschen Anklang gefunden haben, so zum Beispiel das Perlgolf, ein Wettbewerb dessen Ziel es ist eine gestellte Aufgabe mit einem möglichst kurzem Programm zu lösen. Eine andere Spielart ist zum Beispiel Poesie in Perl. Dabei geht es darum Gedichte zu schreiben die in Perl kompilierbar sind. Da Perl viele Elemente der englischen Sprache beinhaltet ist dies durchaus möglich, so erscheinen zum Beispiel regelmäßig neue Gedichte in der Perl Poetry-Kategorie des englischsprachigen Perl Monks-Forums.

Mottos und Zitate

Es gibt viele bekannte Mottos und Zitate die sich mit Perl selbst oder den Möglichkeiten der Sprache beschäftigten, hier einige Kostproben.

  • Perl: the Swiss Army Chainsaw of Programming Languages.
  • There's more than one way to do it (Tim Toady)
  • ... we often joke that a camel is a horse designed by a committee, but if you think about it, the camel is pretty well adapted for life in the desert. The camel has evolved to be relatively self-sufficient. On the other hand, the camel has not evolved to smell good. Neither has Perl. (Larry Wall über das Kamel als Perl Maskottchen)

Perligata

Das Perl-Modul Lingua::Romana::Perligata ist wohl eines der skurrilsten Module schlechthin, und allemal eine Erwähnung wert. Es ermöglicht dem Benutzer, Perl komplett in Latein zu schreiben. Von Variablen bis Referenzen und mehrdimensionalen Arrays ist alles in dieser neuen Sprachdefinition vorhanden. Nahezu alle Sonderzeichen wurden aus der Sprache entfernt, Variablen gleicher Namen aber unterschiedlicher Struktur (Beispielsweise $next und @next) werden dekliniert, um die entsprechende Variable zu adressieren. Ein bisschen Beispielcode:

insertum stringo unum tum duo excerpemento da.
             # Entspricht in Perl: substr($string,1,2) = $insert;

clavis hashus nominamentum da.
             # Entspricht:         @keys = keys %hash;

Dieses Perlmodul ist ein gutes Beispiel für den Zeitaufwand den viele Leute Perl widmen, Perl kann in diesem Sinne durchaus als Hobby durchgehen.

Literatur

Konferenzen und Workshops

The Perl Conference ist ein großes, von O'Reilly ausgerichtetes, allerdings auch teures Treffen in Amerika. YAPCs (Yet Another Perl Conferences) versuchen, Entwickler in einem möglichst erschwinglichen Rahmen lokal zusammenzuführen und haben inzwischen beispielsweise in Amerika, Europa und Israel Tradition. Der Deutsche Perl-Workshop als Treffen für den deutschsprachigen Raum etablierte sich bereits vor den YAPCs mit ähnlichen Zielen und findet in Zusammenarbeit mit ihnen jährlich statt. Inzwischen werden auch in vielen anderen Ländern Workshops organisiert.

Termine

  • Der 7. deutsche Perl-Workshop findet vom Mittwoch, 9. Februar 2005 (Aschermittwoch) bis Freitag, 11. Februar 2005 in Dresden statt. Dieser ist allerdings auf etwa 120 Teilnehmer begrenzt, und an professionelle Perl-Entwickler gerichtet, welche bereits an größeren Perl-Projekten beteiligt waren.
Wikibooks: Perl-Programmierung – Lern- und Lehrmaterialien