Le World Wide Web Consortium (W3C) dispose d’un certain nombre d’outils gratuits disponibles pour aider à la génération et au traitement corrects des fichiers HTML et XML. Le package HTML-XML est un ensemble d’utilitaires simples permettant de manipuler des fichiers HTML et XML à partir de la ligne de commande. Il est disponible pour de nombreuses distributions Linux différentes et peut être utile pour ceux qui doivent traiter régulièrement des fichiers HTML ou XML.
Pour installer le package sur Ubuntu, utilisez :
Il y a 31 outils dans ce package, voici un résumé de ce qu’ils peuvent faire :
Pour vous présenter la puissance de cet ensemble d’outils, voici quelques exemples sur la façon dont vous utiliseriez quelques-unes des commandes.
La commande « hxnormalize » reformatera un fichier HTML afin qu’il soit facile à lire et bien formaté. Pour tester cette commande, nous allons créer un code HTML moche. Sélectionnez et copiez les lignes suivantes et collez-les directement dans une fenêtre de terminal.
bonjour __EOF__
Cela créera un fichier appelé test.html. Le HTML manque certaines des balises de fermeture et est écrit sur une seule ligne. La commande hxnormalize reformatera le fichier et écrira la jolie version sur la sortie standard (stdout). Voici comment exécuter la commande :
L’indicateur « -e » indique à hxnormalize d’insérer toutes les balises de fermeture manquantes.
Vous pouvez également exécuter la commande sur une page Web en remplaçant « test.html » par une URL, par exemple :
La commande hxwls analysera un fichier HTML local ou un site Web et répertoriera les liens dans le code HTML. Par example:
Voici les premières lignes de sortie du site Web Make Tech Easier :
La commande hxtabletrans modifie une table afin que les lignes deviennent des colonnes et que les colonnes deviennent des lignes.
Créons un fichier HTML avec un tableau simple. Sélectionnez et copiez les lignes suivantes, puis collez-les directement dans une fenêtre de terminal.
Jill | Smith | 50 |
Eve< /td> | Jackson | 94 |
__EOF__
Le résultat est un fichier appelé table.html. Dans un navigateur Web, le tableau ressemblerait à ceci :
Si vous exécutez la commande hxtabletrans, elle écrira la table transposée sur la sortie standard. Les résultats peuvent être redirigés vers un autre fichier comme celui-ci :
Le nouveau fichier, table2.html, affichera Jill Smith et Eve Jackson en colonnes plutôt qu’en lignes comme dans l’original. Le tableau résultant sera quelque chose comme ceci :
La plupart des commandes sont utilisées de la même manière que les exemples ci-dessus, c’est-à-dire que vous devez spécifier un fichier ou une URL à traiter et la sortie est écrite dans la sortie standard. Essayez d’expérimenter avec les différentes commandes car elles pourraient vous être utiles.
Si vous avez des questions sur les utilitaires HTML-XML, n’hésitez pas à les poser dans les commentaires ci-dessous et nous verrons si nous pouvons vous aider.
Cet article est-il utile ? Oui Non