Zum Inhalt springen

Text Encoding Initiative

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 29. April 2008 um 20:49 Uhr durch Codeispoetry (Diskussion | Beiträge) (Linkfix, Kosmetik AWB). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Text Encoding Initiative (TEI) ist eine 1987 gegründete Organisation (das TEI-Konsortium) und ein gleichnamiges Dokumentenformat zur Kodierung und den Austausch von Texten, das diese entwickelt hat und weiterentwickelt. Das Format basiert auf SGML (inzwischen XML) und ist in einer DTD festgelegt. Seit der Version P5 wird auch an einem XML-Schema gearbeitet.

TEI hat sich zu einem De-facto-Standard innerhalb der Geisteswissenschaften entwickelt, wo es zum Beispiel zur Kodierung von gedruckten Werken (Editionswissenschaft) oder zur Auszeichnung von sprachlichen Informationen (Linguistik) in Texten verwendet wird.

Die TEI-Version P3 wurde 1994 verabschiedet und ist 2002 durch die XML-Version P4 abgelöst worden. Gleichzeitig gibt es die Version TEI lite mit einem abgespeckten Umfang an Elementen. 2005 wurde die Version P5 erarbeitet, die unter anderem einen Standard zur Beschreibung von Handschriften (MASTER) integriert.

Die TEI-DTD ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumentstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für textkritische Anmerkungen oder für Sprachkorpora, Terminologien und Wörterbücher enthalten.

Siehe auch