Zum Inhalt springen

Text Encoding Initiative

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 13. Oktober 2004 um 19:44 Uhr durch Bierdimpfl (Diskussion | Beiträge) (+en:). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Text Encoding Initiative (TEI) ist eine 1987 gegründete Organisation (das TEI Konsortium) und ein gleichnamiges Dokumentenformat zur Kodierung und den Austausch von Texten, das diese entwickelt hat und weiterentwickelt. Das Format basiert auf SGML (inzwischen XML) und ist in einer Dokumenttypdefinition (DTD) festgelegt.

TEI hat sich zu einem de-facto-Standard innerhalb der Geisteswissenschaften entwickelt, wo es z. B. zur Kodierung von gedruckten Werken (Editionswissenschaft) oder zur Auszeichnung von Sprachlichen Informationen (Linguistik) in Texten verwendet wird.

Die TEI-Version "P3" wurde 1994 verabschiedet und ist 2002 durch die XML-Version "P4" abgelöst worden. Gleichzeitig gibt es die Version TEI lite mit einem abgespecktem Umfang an Elementen.

Die TEI-DTD ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumenstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für kritische Anmerkungen oder für Sprachkorpora, Terminologien und Wörterbücher enthalten.