Ir al contenido

Text Encoding Initiative

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 16:19 10 ene 2017 por Leoncastro (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.
Logo oficial

La Text Encoding Initiative (TEI) es un consorcio que desarrolla y mantiene un estándar para la representación de los textos en forma digital. Se trata de un proyecto de investigación en humanidades digitales que goza de una amplísima difusión y utilización en bibliotecas y colecciones de texto digitales y en la creación de corpora lingüísticos. Se basa en el lenguaje XML, una versión simplificada del SGML.

Las TEI Guidelines

Las TEI Guidelines en su conjunto lo que hacen es definir una gramática XML. Difiere de otros formatos textuales (como el HTML y OpenDocument) en que se trata un marcado o etiquetado semántico y no presentacional, es decir, se preocupa por lo que es el texto no por cómo debe aparecer y establecen el significado de cada elemento y atributo. Las Guidelines describen más de 500 elementos textuales agrupados en una veintena de módulos a veces altamente especializados como el módulo para diccionarios, teatro, corpus lingüísticos, transcripción de fuentes primarias, mientras que otros son generales y básicos para cualquier documento TEI.

La TEI proporciona un esquema muy útil porque:

  1. Define y especifica varios cientos de distinciones textuales.
  2. Proporciona un juego de módulos que se pueden emplear para definir esquemas que tengan en cuenta esas distinciones (véase el cuadro de la página siguiente).
  3. Facilita un mecanismo de actualización y acomodación para modificar y combinar esas definiciones con las nuevas que se pudieran crear utilizando el mismo modelo conceptual.
  4. Ofrece hojas de estilo para transformar los textos codificados a HTML o PDF.
  5. Facilita el intercambio y la integración de los datos entre los investigadores.
  6. Es válido para todo tipo de textos, de cualquier lengua y de cualquier época.

Ejemplos

<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0">
     <teiHeader>
                      <!–- obligatorio -->
     </teiHeader>
<text>
     <front>
              <!–- opcional -->
     </front>
     <body>
                <!–- obligatorio -->
     </body>
     <back>
               <!–- opcional -->
     </back>
</text>
</TEI>

Un ejemplo práctico

<?xml version="1.0" encoding="UTF-8"?>
<syntaxhighlight lang="xml">
  <teiHeader>
      <fileDesc> 
         <titleStmt>
            <title>NACIMIENTO DE CRISTO</title>
            <author>Federico García Lorca</author>
         </titleStmt>
         <publicationStmt>
             <p>Ejemplo para Wikipedia</p>
         </publicationStmt>
         <sourceDesc>
             <p>Transcrito desde una vieja edición</p>
         </sourceDesc>
      </fileDesc>
  </teiHeader>
  <text>
     <body>
        <head>NACIMIENTO DE CRISTO</head>
           <lg>
               <l>Un pastor pide teta por la nieve que ondula</l>
               <l>blancos perros tendidos entre linternas sordas</l>
               <l>El Cristito de barro se ha partido los dedos</l>
               <l>En los filos eternos de la madera rota.</l>
           </lg>
           <lg>
               <l>¡Ya vienen las hormigas y los pies ateridos!</l> 
               <l>Dos hilillos de sangre quiebran el cielo.</l> 
               <l>Los vientres del demonio resuenan por los valles</l> 
               <l>golpes y resonancias de carne de moluscos.</l> 
           </lg>
           <lg>
               <l>Lobos y sapos cantan en las hogueras verdes</l> 
               <l>coronadas por vivos hormigueros del alba</l> 
               <l>La mula tienen un sueño de grandes abanicos</l> 
               <l>y un toro sueña un toro de agujeros y agua.</l> 
           </lg>
           <lg> 
               <l>El niño llora con un tres en la frente.</l>
               <l>San José ve en el heno tres espinas de bronce</l>
               <l>los pañales exalan un rumor de desierto</l>
               <l>con cítaras sin cuerdas y degolladas voces</l>
           </lg>
           <lg>
               <l>La nieve de Manhattan empuja los anuncios</l>
               <l>y lleva gracia pura por las falsas ojivas.</l>
               <l>Sacerdotes idiotas y querubes de pluma</l>
               <l>van detrás de Lutero por las altas esquinas.</l>
           </lg> 
     </body>
  </text>
</TEI>

Historia

La TEI nació en un congreso patrocinado por la Association for Computers and the Humanities (ACH), financiado por la U.S. National Endowment for the Humanities (NEH), que tuvo lugar en el Vassar College en 1987. Al año siguiente obtuvo financiación de la Comisión Europea y otras instituciones y en junio de 1999 se constituyó en un consorcio internacional.

Durante sus primeros desarrollos, hasta la versión P3, la TEI se desarrolló sobre la base del SGML, pero en 2002, bajo la denominación P4 apareció la primera especificación en XML. En 2005 aparecería la P5. La versión actual es la P5 2.8.0, presentada el 6 de abril de 2015. Existe una versión TEI Lite, que es una versión aligerada que puede satisfacer el 90% de las necesidades del 90% de la comunidad TEI.

Referencias

Bibliografía utilizada

Enlaces externos