Lex (Informatik)

Tokenizer zur Generierung von Tokenizern
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 17. August 2010 um 11:14 Uhr durch TXiKiBoT (Diskussion | Beiträge) (Bot: Ändere: zh:Lex). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Das Programm Lex wird im Übersetzerbau benutzt, um Scanner für die lexikalische Analyse von Quelltexten zu erstellen. Ein lexikalischer Scanner ist Teil eines Übersetzers.

Lex wird oft in Kombination mit Yacc, der für die syntaktische Analyse zuständig ist, genutzt.

Arbeitsweise

Damit Lex ein Analyseprogramm generieren kann, muss eine Beschreibungsdatei erstellt werden. In dieser Datei werden sogenannte Token mittels regulärer Ausdrücke definiert.

Hier ein Beispiel einer solchen Datei:

%{
   #include "y.tab.h"
   extern int yylval;
%}
   %%
   "="      { return EQ; }
   "!="     { return NE; }
   "+"      { return PLUS; }
   "-"      { return MINUS; }
   ";"      { return SEMICOLON; }
   "print"  { return PRINT; }
   [0-9]+   { yylval = atoi(yytext); return NUMBER; }
   …
   #endif

Das resultierende Analyseprogramm liest den Quellcode des zu kompilierenden Programmes ein und teilt diesen in Token ein. Sollte dies nicht möglich sein, liegt ein syntaktischer Fehler vor. Diese Token werden dann dem syntaktischen Analyseteil bzw. -programm eines Übersetzers übergeben.

Beispiel

Für einen Beispiel-Quelltext wie

print 15+5;

sind die Token:

  1. (PRINT, )
  2. (NUMBER, 15)
  3. (PLUS, )
  4. (NUMBER, 5)
  5. (SEMICOLON, )

Es ist zu beachten, dass Lex keine Kenntnis von erlaubter Syntax hat. Konkret bedeutet dies, dass der Beispielkode

15+ print; 5

ebenfalls in dieselben Token überführt würde (möglicherweise in anderer Reihenfolge).

Literatur

  • Herold, Helmut: lex & yacc. Die Profitools zur lexikalischen und syntaktischen Textanalyse. Addison Wesley, 2003, ISBN 3-82732-096-8
  • lex & yacc, o'Reilly. ISBN 1-56592-000-7
  • M. E. Lesk, E. Schmidt: Lex — A Lexical Analyzer Generator, Computing Science Technical Report No. 39, Bell Laboratories, Murray Hill, New Jersey 07974 (October 1975)

Siehe auch