Zum Inhalt springen

„Text Encoding Initiative“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Auszeichnungssprache als Link zu "Auszeichnung"
K Unerwünschte Doppelkategorisierung entfernt (Kategorie:XML-basierte SpracheKategorie:Beschreibungssprache)
 
(18 dazwischenliegende Versionen von 16 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
[[Datei:Text Encoding InitiativeTEI Logo.svg|mini|Offizielles Logo]]

Die '''Text Encoding Initiative''' (TEI) ist eine [[1987]] gegründete Organisation (seit 2000 als '''TEI-Konsortium''' organisiert) und ein gleichnamiges [[Dokumentenformat]] zur Kodierung und zum Austausch von Texten, das diese entwickelt hat und weiterentwickelt. In der aktuellen Version ''P5'' basiert das Format auf [[Extensible Markup Language|XML]] und ist in einer [[Metasprache]] definiert, aus der formale Schemata wie [[Dokumenttypdefinition|DTD]], [[XML Schema]] und [[RELAX NG|RELAX NG Schema]] abgeleitet werden können.
Die '''Text Encoding Initiative''' (TEI) ist eine [[1987]] gegründete Organisation (seit 2000 als '''TEI-Konsortium''' organisiert) und ein gleichnamiges [[Dokumentenformat]] zur Kodierung und zum Austausch von Texten, das diese entwickelt hat und weiterentwickelt. In der aktuellen Version ''P5'' basiert das Format auf [[Extensible Markup Language|XML]] und ist in einer [[Metasprache]] definiert, aus der formale Schemata wie [[Dokumenttypdefinition|DTD]], [[XML Schema]] und [[RELAX NG|RELAX NG Schema]] abgeleitet werden können.


TEI hat sich zu einem De-facto-Standard innerhalb der [[Geisteswissenschaft]]en entwickelt, wo es zum Beispiel zur Kodierung von gedruckten Werken ([[Editionswissenschaft]]) oder zur [[Auszeichnungssprache|Auszeichnung]] von sprachlichen Informationen ([[Sprachwissenschaft|Linguistik]]) in Texten verwendet wird.
TEI hat sich zu einem De-facto-Standard innerhalb der [[Geisteswissenschaft]]en entwickelt,<ref>{{Literatur |Autor=Matthew L. Jockers, Rosamond Thalken |Titel=Text Analysis with R: For Students of Literature |Hrsg= |Sammelwerk= |Band= |Nummer= |Auflage= |Verlag=Springer International Publishing |Ort=Cham |Datum=2020 |Reihe=Quantitative Methods in the Humanities and Social Sciences |ISBN=978-3-030-39642-8 |DOI=10.1007/978-3-030-39643-5 |Seiten=134 |Online=http://link.springer.com/10.1007/978-3-030-39643-5 |Abruf=2020-04-27}}</ref> wo es zum Beispiel zur Kodierung von gedruckten Werken ([[Editionswissenschaft]]) oder zur [[Auszeichnungssprache|Auszeichnung]] von sprachlichen Informationen ([[Sprachwissenschaft|Linguistik]]) in Texten verwendet wird.


== Geschichte ==
== Geschichte ==
TEI wurde seit 1988 auf der Grundlage von [[Standard Generalized Markup Language|SGML]] entwickelt, der erste Entwurf ''P1'' (''P'' für englisch ''proposal'' – ''Vorschlag'') erschien 1990. Nach einer Zwischenversion ''P2'' (1992), die Erweiterungen und Korrekturen enthielt, wurde 1994 die wiederum erweiterte TEI-Version ''P3'' – die erste stabile Version – verabschiedet. Mit der Entwicklung und Verbreitung von XML musste auch TEI weiterentwickelt werden. Zu diesem Zweck wurde im Jahr 2000 das TEI-Konsortium gegründet. Die erste XML-Version ''P4'' erschien 2002, gleichzeitig entstand die Version ''TEI&nbsp;Lite'' mit einem abgespeckten Umfang an Elementen. Seit 2005 wurde die Version P5 erarbeitet, die am 1.&nbsp;November 2007 freigegeben wurde.<ref>P5: Guidelines for Electronic Text Encoding and Interchange. Historical Background [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AB.html#ABTEI]</ref> Sie wurde technisch gründlich überarbeitet und inhaltlich erweitert, unter anderem wurde ein Standard zur Beschreibung von Handschriften ([[MASTER]]) integriert.
TEI wurde seit 1988 auf der Grundlage von [[Standard Generalized Markup Language|SGML]] entwickelt, der erste Entwurf ''P1'' (''P'' für englisch ''proposal'' – ''Vorschlag'') erschien 1990. Nach einer Zwischenversion ''P2'' (1992), die Erweiterungen und Korrekturen enthielt, wurde 1994 die wiederum erweiterte TEI-Version ''P3'' – die erste stabile Version – verabschiedet. Mit der Entwicklung und Verbreitung von XML musste auch TEI weiterentwickelt werden. Zu diesem Zweck wurde im Jahr 2000 das TEI-Konsortium gegründet. Die erste XML-Version ''P4'' erschien 2002, gleichzeitig entstand die Version ''TEI&nbsp;Lite'' mit einem abgespeckten Umfang an Elementen. Seit 2005 wurde die Version P5 erarbeitet, die am 1.&nbsp;November 2007 freigegeben wurde.<ref>P5: Guidelines for Electronic Text Encoding and Interchange. Historical Background [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/AB.html#ABTEI tei-c.org]</ref> Sie wurde technisch gründlich überarbeitet und inhaltlich erweitert, unter anderem wurde ein Standard zur Beschreibung von Handschriften ([[MASTER]]) integriert.


== Technik ==
== Technik ==
TEI ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumentstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für [[Textkritik|textkritische]] Anmerkungen oder für [[Sprachkorpus|Sprachkorpora]], [[Terminologie]]n und [[Wörterbuch|Wörterbücher]] enthalten. Es gibt einen Kern von Modulen, der allgemeine Elemente wie <code>&lt;p/&gt;</code> für Absätze enthält. Dieser Kern kann je nach Projekt um benötigte Module erweitert werden, die eine sehr differenzierte Auszeichnung von Textmerkmalen ermöglichen.
TEI ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumentstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für [[Textkritik|textkritische]] Anmerkungen oder für [[Sprachkorpus|Sprachkorpora]], [[Terminologie]]n und [[Wörterbuch|Wörterbücher]] enthalten. Es gibt einen Kern von Modulen, der allgemeine Elemente wie <code>&lt;p/&gt;</code> für Absätze enthält. Dieser Kern kann je nach Projekt um benötigte Module erweitert werden, die eine sehr differenzierte Auszeichnung von Textmerkmalen ermöglichen.
Das TEI-Schema für eine konkrete Anwendung wird selbst als TEI-Dokument in einer Metasprache definiert (genannt ODD-Dokument: ''One Document Does it all''). Aus dem ODD-Dokument können automatisch formale Schemata, etwa [[Document Type Definition|DTD]], [[XML Schema]] und [[RELAX NG|Relax-NG-Schema]] generiert werden.<ref>P5: Guidelines for Electronic Text Encoding and Interchange. The TEI Infrastructure [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ST.html]</ref> Sowohl für die Anpassung von TEI als auch für die Erzeugung der Schemata bieten die TEI-Webseiten Werkzeuge.
Das TEI-Schema für eine konkrete Anwendung wird selbst als TEI-Dokument in einer Metasprache definiert (genannt ODD-Dokument: ''One Document Does it all''). Aus dem ODD-Dokument können automatisch formale Schemata, etwa [[Document Type Definition|DTD]], [[XML Schema]] und [[RELAX NG|Relax-NG-Schema]] generiert werden.<ref>P5: Guidelines for Electronic Text Encoding and Interchange. The TEI Infrastructure [http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ST.html tei-c.org]</ref> Sowohl für die Anpassung von TEI als auch für die Erzeugung der Schemata bieten die TEI-Webseiten Werkzeuge.


== Beispiele ==
== Beispiele ==
=== Hallo Welt! ===
=== Hallo Welt! ===
<source lang="xml">
<syntaxhighlight lang="xml">
<?xml version="1.0" encoding="UTF-8"?>
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<TEI xmlns="http://www.tei-c.org/ns/1.0">
Zeile 34: Zeile 36:
</text>
</text>
</TEI>
</TEI>
</syntaxhighlight>
</source>


=== Praxisbeispiel ===
=== Praxisbeispiel ===
Das folgende Beispiel kodiert ein Gedicht mit detaillierten [[Bibliografie|bibliografischen Angaben]] sowie Angaben zur Zeilen- und Seitenzählung (TEI&nbsp;Lite).
Das folgende Beispiel kodiert ein Gedicht mit detaillierten [[Bibliografie|bibliografischen Angaben]] sowie Angaben zur Zeilen- und Seitenzählung (TEI&nbsp;Lite).


<source lang="xml">
<syntaxhighlight lang="xml">
<?xml version="1.0" encoding="UTF-8"?>
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<TEI xmlns="http://www.tei-c.org/ns/1.0">
Zeile 53: Zeile 55:
</titleStmt>
</titleStmt>
<publicationStmt>
<publicationStmt>
<p>aus Wikisource, der freien Quellensammlung
<p>aus Wikisource, der freien Quellensammlung
(<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
(<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
</publicationStmt>
</publicationStmt>
Zeile 107: Zeile 109:
</text>
</text>
</TEI>
</TEI>
</syntaxhighlight>
</source>


== Siehe auch ==
== Siehe auch ==
* [[DocBook]]
* [[DocBook]]
* [[Encoded Archival Description|EAD]]
* [[Encoded Archival Description|EAD]]
* [[Charter Encoding Initiative|CEI]]
* [[Music Encoding Initiative|MEI]]
* [[Analyse et traitement informatique de la langue française]]

== Weblinks ==
* [http://www.tei-c.org/ Offizielle Website des TEI-Konsortiums]
* [http://computerphilologie.digital-humanities.de/praxis/teiprax.html TEI in der Praxis]
* {{GitHub|TEIC/TEI}}
* [http://www.onb.ac.at/sichtungen/beitraege/bruvik-tm-1a.html Sichtungen online: „‘Yesterday’s Information Tomorrow’: Die Text Encoding Initiative“]
* [http://romanischestudien.de/index.php/rst/article/view/58 Christof Schöch, Ein digitales Textformat für die Literaturwissenschaft:] Die Richtlinien der Text Encoding Initiative und ihr Einsatz bei Textkonstitution und Textanalyse, Romanische Studien 4 (2016): 325–364.


== Einzelnachweise ==
== Einzelnachweise ==
<references/>
<references />


{{Normdaten|TYP=s|GND=4742996-3}}
== Weblinks ==
* [http://www.tei-c.org Offizielle Website des TEI-Konsortiums]
* [http://computerphilologie.uni-muenchen.de/praxis/teiprax.html TEI in der Praxis]
* [http://tei.sourceforge.net/ TEI bei Sourceforge (englisch)]
* [http://www.onb.ac.at/sichtungen/beitraege/bruvik-tm-1a.html Sichtungen online: „'Yesterday's Information Tomorrow': Die Text Encoding Initiative“]


[[Kategorie:Beschreibungssprache]]
[[Kategorie:Digitale Bibliothek]]
[[Kategorie:Bibliothekswesen]]
[[Kategorie:XML-basierte Sprache]]
[[Kategorie:XML-basierte Sprache]]
[[Kategorie:Digital Humanities]]

[[da:Text Encoding Initiative]]
[[en:Text Encoding Initiative]]
[[fr:Text Encoding Initiative]]
[[it:Text Encoding Initiative]]
[[pl:Text Encoding Initiative]]

Aktuelle Version vom 12. Juli 2020, 13:31 Uhr

Offizielles Logo

Die Text Encoding Initiative (TEI) ist eine 1987 gegründete Organisation (seit 2000 als TEI-Konsortium organisiert) und ein gleichnamiges Dokumentenformat zur Kodierung und zum Austausch von Texten, das diese entwickelt hat und weiterentwickelt. In der aktuellen Version P5 basiert das Format auf XML und ist in einer Metasprache definiert, aus der formale Schemata wie DTD, XML Schema und RELAX NG Schema abgeleitet werden können.

TEI hat sich zu einem De-facto-Standard innerhalb der Geisteswissenschaften entwickelt,[1] wo es zum Beispiel zur Kodierung von gedruckten Werken (Editionswissenschaft) oder zur Auszeichnung von sprachlichen Informationen (Linguistik) in Texten verwendet wird.

TEI wurde seit 1988 auf der Grundlage von SGML entwickelt, der erste Entwurf P1 (P für englisch proposalVorschlag) erschien 1990. Nach einer Zwischenversion P2 (1992), die Erweiterungen und Korrekturen enthielt, wurde 1994 die wiederum erweiterte TEI-Version P3 – die erste stabile Version – verabschiedet. Mit der Entwicklung und Verbreitung von XML musste auch TEI weiterentwickelt werden. Zu diesem Zweck wurde im Jahr 2000 das TEI-Konsortium gegründet. Die erste XML-Version P4 erschien 2002, gleichzeitig entstand die Version TEI Lite mit einem abgespeckten Umfang an Elementen. Seit 2005 wurde die Version P5 erarbeitet, die am 1. November 2007 freigegeben wurde.[2] Sie wurde technisch gründlich überarbeitet und inhaltlich erweitert, unter anderem wurde ein Standard zur Beschreibung von Handschriften (MASTER) integriert.

TEI ist aus verschiedenen sachbezogenen Modulen aufgebaut, die beispielsweise Elemente für die Dokumentstruktur, zur Auszeichnung von Gedichten und Dramen, zur Markierung einzelner Zeilen und Seiten, für Tabellen, für textkritische Anmerkungen oder für Sprachkorpora, Terminologien und Wörterbücher enthalten. Es gibt einen Kern von Modulen, der allgemeine Elemente wie <p/> für Absätze enthält. Dieser Kern kann je nach Projekt um benötigte Module erweitert werden, die eine sehr differenzierte Auszeichnung von Textmerkmalen ermöglichen. Das TEI-Schema für eine konkrete Anwendung wird selbst als TEI-Dokument in einer Metasprache definiert (genannt ODD-Dokument: One Document Does it all). Aus dem ODD-Dokument können automatisch formale Schemata, etwa DTD, XML Schema und Relax-NG-Schema generiert werden.[3] Sowohl für die Anpassung von TEI als auch für die Erzeugung der Schemata bieten die TEI-Webseiten Werkzeuge.

<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title>Hallo Welt!</title>
            </titleStmt>
            <publicationStmt>
                <p>Demo für Wikipedia</p>
            </publicationStmt>
            <sourceDesc>
                <p>Originales Werk, keine Vorlage</p>
            </sourceDesc>
        </fileDesc>
    </teiHeader>
    <text>
        <body>
            <p>Hallo Welt!</p>
        </body>
    </text>
</TEI>

Das folgende Beispiel kodiert ein Gedicht mit detaillierten bibliografischen Angaben sowie Angaben zur Zeilen- und Seitenzählung (TEI Lite).

<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title>Auf dem Brocken</title>
                <author>Heinrich Heine (1797–1856)</author>
                <respStmt>
                    <name>Wiki Autor</name>
                    <resp>Umwandlung in TEI-konformes XML</resp>
                </respStmt>
            </titleStmt>
            <publicationStmt>
                <p>aus Wikisource, der freien Quellensammlung
                    (<ptr target="http://de.wikisource.org/wiki/Auf_dem_Brocken"/>)</p>
            </publicationStmt>
            <sourceDesc>
                <biblFull>
                    <titleStmt>
                        <title level="a">Auf dem Brocken</title>
                        <title level="m">Buch der Lieder</title>
                        <title level="m" type="sub">Aus der Harzreise</title>
                        <author>Heine, Heinrich</author>
                    </titleStmt>
                    <publicationStmt>
                        <publisher>Hoffmann und Campe</publisher>
                        <pubPlace>Hamburg</pubPlace>
                        <date>1827</date>
                        <availability>
                            <p>Gemeinfrei, keine Nutzungsbeschränkungen</p>
                        </availability>
                    </publicationStmt>
                </biblFull>
            </sourceDesc>
        </fileDesc>
    </teiHeader>
    <text>
        <body>
            <pb n="302"/>
            <head>Auf dem Brocken.</head>
            <lg type="stanza">
                <l>Heller wird es schon im Osten</l>
                <l>Durch der Sonne kleines Glimmen,</l>
                <l>Weit und breit die Bergesgipfel,</l>
                <l>In dem Nebelmeere schwimmen.</l>
            </lg>
            <lg type="stanza">
                <l n="5">Hätt’ ich Siebenmeilenstiefel,</l>
                <l>Lief ich, mit der Hast des Windes,</l>
                <l>Ueber jene Bergesgipfel,</l>
                <l>Nach dem Haus des lieben Kindes.</l>
            </lg>
            <lg type="stanza">
                <l>Von dem Bettchen, wo sie schlummert,</l>
                <l n="10">Zög’ ich leise die Gardinen,</l>
                <l>Leise küßt’ ich ihre Stirne,</l>
                <l>Leise ihres Munds Rubinen.</l>
            </lg>
            <lg type="stanza">
                <l>Und noch leiser wollt’ ich flüstern</l>
                <l>In die kleinen Lilien-Ohren:</l>
                <l n="15">Denk’ im Traum, daß wir uns lieben,</l>
                <l>Und daß wir uns nie verloren.</l>
            </lg>
        </body>
    </text>
</TEI>

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Matthew L. Jockers, Rosamond Thalken: Text Analysis with R: For Students of Literature (= Quantitative Methods in the Humanities and Social Sciences). Springer International Publishing, Cham 2020, ISBN 978-3-03039642-8, S. 134, doi:10.1007/978-3-030-39643-5 (springer.com [abgerufen am 27. April 2020]).
  2. P5: Guidelines for Electronic Text Encoding and Interchange. Historical Background tei-c.org
  3. P5: Guidelines for Electronic Text Encoding and Interchange. The TEI Infrastructure tei-c.org