Zum Inhalt springen

Natural Language Toolkit

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 10. April 2013 um 10:41 Uhr durch 193.72.19.168 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Natural Language Toolkit
Basisdaten

Entwickler das NLTK-Entwicklerteam (ursprünglich Steven Bird, Ewan Klein und Edward Loper)
Aktuelle Version 3.0a1
(Februar 2013)
Betriebssystem plattformunabhängig
Programmier­sprache Python[1]
Kategorie Toolkit für Natural Language Processing
Lizenz Apache 2.0
deutschsprachig ja
nltk.org

Das Natural Language Toolkit (NLTK) ist eine dem Anwendungsbereich Computerlinguistik und Sprachverarbeitung dienende Zusammenstellung von Bibliotheken und Programmen für die Programmiersprache Python (ab Version 2.6). NLTK ist quelloffen und wird unter der Apache-Lizenz vertrieben.[2]

Die Entwicklung des NLTK begann im Jahr 2001 an der University of Pennsylvania unter Edward Loper und Steven Bird, beide leiten das Projekt seitdem gemeinsam mit Ewan Klein.[3] Da NLTK in erster Linie zu Lehrzwecken entwickelt und dementsprechend angelegt wurde, ist eine umfangreiche Dokumentation, inklusive einem begleitenden, von den NLTK-Entwicklern selbst verfassten, Lehrbuch zur (symbolischen wie auch statistischen) Sprachverarbeitung in Python[4] fester Bestandteil des Projekts. Verbreitung fand das NLTK daher insbesondere im Lehrbereich der Linguistik bzw. Computerlinguistik, des Information Retrieval und Maschinellen Lernens sowie den Kognitionswissenschaften, es kann und wird darüber hinaus jedoch auch in der Forschung eingesetzt.

Einzelnachweise

  1. The nltk Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 19. Oktober 2018).
  2. http://www.nltk.org/faq
  3. http://code.google.com/p/nltk/wiki/People
  4. Bird, Steven; Ewan Klein; Edward Loper (2009): Natural Language Processing with Python, O'Reilly Media Inc., ISBN 0-596-51649-5.