Natural Language Toolkit
Das Natural Language Toolkit (kurz: NLTK) ist eine dem Anwendungsbereich Computerlinguistik und Sprachverarbeitung (Natural Language Processing, NLP) dienende Zusammenstellung von Bibliotheken und Programmen für die Programmiersprache Python (ab der Version 2.5). NLTK ist quelloffen und wird unter der Apache-Lizenz vertrieben.[1]
Die Entwicklung des NLTK begann im Jahr 2001 an der University of Pennsylvania unter Edward Loper und Steven Bird, beide leiten das Projekt seitdem gemeinsam mit Ewan Klein.[2] Da NLTK in erster Linie zu Lehrzwecken entwickelt und dementsprechend angelegt wurde, ist eine umfangreiche Dokumentation, inklusive einem begleitenden, von den NLTK-Entwicklern selbst verfassten, Lehrbuch zur (symbolischen wie auch statistischen) Sprachverarbeitung in Python[3] fester Bestandteil des Projekts. Verbreitung fand das NLTK daher insbesondere im Lehrbereich der Computerlinguistik, des Information Retrieval und Maschinellen Lernens, der Linguistik und Kognitionswissenschaften - es kann und wird darüber hinaus jedoch auch in der Forschung eingesetzt.
Einzelnachweise
- ↑ http://www.nltk.org/faq
- ↑ http://code.google.com/p/nltk/wiki/People
- ↑ Bird, Steven; Ewan Klein; Edward Loper (2009): Natural Language Processing with Python (O'Reilly Media Inc., ISBN 0-596-51649-5.)
Weblinks
- Offizielle Website
- Natural Language Processing with Python - freie Onlineversion des Buches
- Eine Präsentation des Natural Language Toolkit auf dem Google Campus 2007 (Video, auf YouTube)