Sigue la especificación original HTML5 oficial WHATWG.
El analizador está diseñado para manejar todas las versiones de HTML y analiza documentos no válidos utilizando reglas de manejo de errores bien definidos compatibles con el comportamiento de los principales navegadores web de escritorio.
La salida se palced dentro de una estructura de árbol.
Es compatible con la salida a elementtree, DOM y formatos de árboles lxml, así como un formato personalizado simple.
HTML5Lib está empaquetado con distutils.
HTML5Lib también está disponible en:
Ruby - descargar HTML5Lib para Ruby aquí .
Python - descargar HTML5Lib para Python aquí .
PHP - descargar HTML5Lib para PHP aquí
¿Qué hay de nuevo en esta versión:
- Analiza. documentos HTML válidos y no válidos a un árbol
- Soporte para minidom, elementtree (incluyendo cElementTree y lxml.etree), BeautifulSoup (en desuso) y formatos de salida simpletree encargo
- DOM al convertidor SAX
- Informes analizan errores
- Detección Codificación de caracteres
- Filtrado y serialización de los árboles
- HTML + CSS desinfectante
- Muchas pruebas unitarias
Comentarios que no se encuentran