Text Encoding Initiative
Die Text Encoding Initiative (TEI) ist eine 1987 gegründete Organisation (das TEI-Konsortium) und ein gleichnamiges Dokumentenformat zur Kodierung und den Austausch von Texten, das diese entwickelt hat und weiterentwickelt. Das Format basiert auf SGML (inzwischen XML) und ist in einer Dokumenttypdefinition (DTD) festgelegt. Seit der Version P5 wird auch an einem XML-Schema gearbeitet.
TEI hat sich zu einem De-facto-Standard innerhalb der Geisteswissenschaften entwickelt, wo es zum Beispiel zur Kodierung von gedruckten Werken (Editionswissenschaft) oder zur Auszeichnung von sprachlichen Informationen (Linguistik) in Texten verwendet wird.
Die TEI-Version "P3" wurde 1994 verabschiedet und ist 2002 durch die XML-Version "P4" abgelöst worden. Gleichzeitig gibt es die Version TEI lite mit einem abgespecktem Umfang an Elementen. 2005 wurde die Version P5 erarbeitet, die unter anderem einen Standard zur Beschreibung von Handschriften (MASTER) integriert.
Die TEI-DTD ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumenstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für textkritische Anmerkungen oder für Sprachkorpora, Terminologien und Wörterbücher enthalten.
Weblinks
- http://www.tei-c.org/ - Homepage des TEI-Konsortiums
- http://computerphilologie.uni-muenchen.de/praxis/teiprax.html - TEI in der Praxis
- http://tei.sourceforge.net/ TEI @ Sourceforge (englisch)
- http://www.onb.ac.at/sichtungen/beitraege/bruvik-tm-1a.html – Aufsatz "'Yesterday's Information Tomorrow'. Die Text Encoding Initiative"