Aller au contenu

Discussion:Extensible Markup Language

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 23 octobre 2002 à 23:00 et modifiée en dernier par Meszigues (discuter | contributions) (La nouvelle version de XML pour commentaire). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Autres discussions [liste]

La nouvelle version de l'article est une adaptation de l'article XML du wikipedia en anglais.

Dans les adaptations, j'ai intégré les éléments contenu dans l'article français qui n'étaient pas dans l'article anglais, j'ai précisé certaines informations et j'ai "neutralisé" l'article (XML n'est pas lle seul langage normalisé/standardisé) pour l'échange de données et de documents.

Ci dessous la nouvelle version, installée le 23/10 donc en commentaires et amélioration au moins pendant 1 semaine avant que je ne fasse le changement


meszigues


de:XML en:XML pl:XML

XML (eXtensible Markup Language ou langage de balisage extensible) est un standard (recommandation) du World Wide Web Consortium pour créer des langages balisés spécialisés, c’est un "méta langage". Il est suffisamment général que les langages basés sur XML puissent être utilisés pour décrire toutes sortes de données et de textes.

L’objectif initial de XML était de facilité le partage de textes et d’informations structurés au travers de l’internet en séparant le contenu (les données) du contenant (la présentation des données). Il constitue une simplification de SGML bien qu’il inclut des améliorations pour la portabilité.


Les langages basés sur XML (par exemple XHTML, RDF, SMIL, MathML, SVG...) sont décrits de façon formelle, permettant ainsi à des programmes de les modifier et de les valider sans connaissances préalables.


Les fichiers XML sont de simples fichiers textes. L’encodage des caractères est défini dans la première déclaration du document. Par défaut il s’agit de UTF-8 qui ne diffère pas de ISO Latin 1 si seul les caractères ISO Latin 1 sont utilisés. Physiquement, un document XML est composé d’entités :

  • Élément (un élément contient les données),
  • Commentaire,
  • Instruction de traitement (directive données au processeur XML),
  • Appel de caractère (permet de saisir les caractères qui n’existent pas au clavier),
  • Appel d'entité (permet l’appel d’une entité nommée qui une sorte de "macros" de texte).


XML, pour être efficace, est fortement dépendant de la structure, du contenu et de l’intégrité. Pour être considéré comme un document XML, un document doit être « bien formé », c’est à dire qu'il doit (au minimum) être conforme aux règles suivantes :

  • Dans sa première déclaration, le document doit être identifié comme un document XML. Cette première déclaration est nommée le prologue . Il doit contenir des informations sur la version de XML, l’encodage des caractères si nécessaire et aussi si le fichier XML est associé à une DTD ou un Schéma XML ou autonome.
  • Un document XML doit avoir une seule racine. Un document XML ne contient qu’un seul élément, tous les autres éléments sont contenus dans cet élément, l’élément document.
  • Les éléments XML doivent avoir une balise ouvrante et une balise fermante. Un élément vide peut être représenté par une balise d’élément vide qui ressemble à ceci : <exemple/>, cette balise est considérée comme étant une balise ouvrante et une balise fermante. Ceci est utilisé pour éviter d’écrire <exemple></exemple> tous en conservant la bonne formation.
  • Tous les attributs doivent être entre guillemets.
  • Les entités doivent être imbriquées et ne par se recouvrir, c’est à dire qu’une entité ne doit pas commencer dans une entité et se terminer dans une autre.


Il est à noter que XML est sensible aux majuscules et minuscules (case sensitive). Par exemple, "<Exemple></Exemple>" est une paire bien formée alors que "<Exemple></exemple>" n’en est pas une.


Contrairement à HTML, les balises XML peuvent indiquer ce que signifient les données plutôt que simplement la façon de les afficher.


Avant le succès d’un langage généraliste de description de données tel que XML, les concepteurs de logiciels avaient pour habitude de définir leurs propres formats de fichiers ou leur propres langages pour partager les données entre programmes. Ceci nécessite de concevoir et de programmer des analyseurs syntaxiques dédiés. Comme pour tout langage standardisé de description de données, un concepteur de logiciel peut aisément définir une structure de données. En XML, une structure de données simple est définie avec une DTD (Document Type Definition), une structure de données détaillée est définie avec un schéma XML. Il existe des outils (qui peuvent être gratuits ou libres) permettant la manipulation de ces définitions -- Processeurs XML. La disponibilité d’une syntaxe standard et d’outils réduit significativement le coût du cycle de développement.


Quand un document XML est bien formé et est conforme à la DTD ou au schéma XML auquel il est associé, ce document est qualifié de valide.


Un document XML peut être associé à des feuilles de style XSL qui permettent aux utilisateurs de décrire la présentation ou la transformation du document sans que ces instructions ne soient intégrées avec les données. Un document XML peut aussi être affiché par un navigateur Web (par exemple, Internet Explorer de Microsoft ou Mozilla) en utilisant une feuille de style CSS.


Le succès de XML s'explique aussi par la définiton d'API (interfaces de programmation) standards avec les processeurs XML. Les API les plus largement utilisées sont :

  • SAX utilisé pour les traitements de message à la volée (cette API est utilisée pour des traitements au fur et à mesure de la réception d’un document XML),
  • DOM utilisé pour les accès aléatoires aux éléments d’un document XML (cette API est utilisée quand le document est entièrement disponible).


Le format des fichiers d’OpenOffice.org (suite bureautique distribuée en logiciel libre) est basé sur XML. Une grande part de l'interface du navigateur Mozilla est construite avec des langages utilisant XML.


Voir aussi: XSL, HTML, XHTML, UIML, S-expression, RSS, ASN.1


Liens externes :