←back to Blog

Y’a pas que Tidy dans la vie pour nettoyer son code !

Tidy, pour rappel, est une librairie se présentant sous la forme d’une extension pour PHP. Elle permet de nettoyer, sécuriser, valider le code HTML.C’est une librairie très pratique lorsqu’on récupère un contenu HTML en provenance de Word par exemple.

Le problème de Tidy, c’est que généralement l’extension n’est pas activée sur les hébergements mutualisés !

Je suis tombé cet après-midi, en faisant des recherches pour une preg nettoyant le code HTML de MS Word, sur une alternative à Tidy écrit entièrement en PHP, j’ai nommé « htmLawed« . Comme le souligne l’auteur du script, les performances sont certes moins bonnes, mais on gagne en compatibilité vu que le script ne nécessite que PHP 4 !

Le script s’intègre d’ailleurs assez facilement avec WordPress, et il semble possible de remplacer le filtre KSES de WP sans trop de modifications. D’ailleurs, d’après ce que j’ai pu voir sur les forums de support de WordPress.org, un paquet de personnes milite pour le remplacement la vieillissante classe Kses par htmlLawed… On verra ;)

Pour ma part, j’ai rencontré quelques soucis avec les accents et l’encodage UTF-8, donc je reste prudent avec l’usage de htmlLawed !
Des personnes ont déjà essayé ?

2 réponses à “Y’a pas que Tidy dans la vie pour nettoyer son code !”

  1. Avatar de Kamotos
    Kamotos

    Le problème d’encodage est présent même avec Tidy, je cherchais une autre alternative pour remédier à ce bug justement!!

  2. Avatar de Canyon
    Canyon

    Tidy ne sert pas à sécuriser, il vise à nettoyer du mauvais code HTML et à le rendre valide.