HTML à XML: extension du langage de balisage
Une grande majorité de personnes travaillant dans le secteur informatique savent ce qu'est le langage HTML (Hypertext Markup Language). Il existe depuis très longtemps et a été largement utilisé dans la conception de pages Web. Bien qu'il soit déjà rare de voir des pages Web écrites uniquement en HTML, il est considéré comme une connaissance de base pour l'ensemble du processus de création de pages Web..
XML (Extensible Markup Language), en revanche, est une technologie plus récente et beaucoup moins connue que le HTML. XML a été créé en 1996 par un groupe de 11 personnes en tant qu’adaptation du langage SGML (Standard Generalized Markup Language) à utiliser sur le Web. XML est un langage de balisage plus structuré et strict comparé au HTML qui permettait aux utilisateurs de créer leurs propres définitions et leur code modularisé. Il a été conçu pour créer des spécifications normalisées permettant de créer des langages de balisage personnalisés, désormais appelés dialectes XML. Cela n’apparaît peut-être pas instantanément, mais les langages de balisage personnalisés tels que HTML, RSS et Atom ont tous été construits à partir de XML comme moyen d’augmenter la convivialité d’Internet..
Depuis que XML a été adapté à partir de SGML, il contient beaucoup de code et de techniques qui étaient à l’origine de SGML, comme sa rigueur et sa soi-disant qualité de forme. Caractéristiques qui vont même aux descendants de XML. Certaines règles doivent toujours être prises en compte lors de la création d'un code basé sur XML. Il existe même une déclaration bien formulée avec chaque document pour indiquer le type de document et les règles sur lesquelles le traitement doit être basé. C’est très différent du codage très détendu utilisé en HTML..
Lorsque vous traitez une page HTML, vous obtenez un résultat, quelle que soit l'entrée. Le processeur HTML essaie de comprendre le contenu du document et crée une sortie qui, selon lui, représente le mieux les données d'entrée. Ce n'est pas vrai vient en XML. XML utilise un mécanisme de traitement des erreurs considéré comme "draconien". Chaque fois que le processeur XML rencontre quelque chose qu'il ne peut pas comprendre, il crée simplement un rapport d'erreur et met fin au traitement du fichier. Cela vous laisse avec une boîte d'erreur et aucun résultat du tout contrairement à HTML.
Pour mettre les choses en perspective, HTML est un langage de balisage utilisé pour afficher rapidement et facilement un type de sortie. Il ne se préoccupe pas de l'exactitude de l'entrée et essaie simplement de créer une sortie basée sur le fichier d'entrée. XML, en revanche, est un langage de balisage très strict qui n’est généralement pas utilisé pour créer du contenu. Son utilisation principale est comme outil pour créer d’autres langages de balisage créant le contenu nécessaire..