Detalles de software:
Versión: 1.0.3
Fecha de carga: 13 Apr 15
Licencia: Libre
Popularidad: 77
Diseñado como una envoltura alrededor lxml, ahora se expande lxml con todas las características que normalmente se necesitan en la minería de datos HTML
Características :.
- Características Generales:
- selectores CSS Niza jQuery-como
- El simple acceso a los atributos de elemento
- Una forma sencilla para convertir HTML a otro formato (BBcode, Markdown, etc)
- Pocas buenas funciones para el trabajo con el texto
- Guarda todas las características originales de lxml
- Funciones para trabajar con texto puro:
- to_unicode - Convierte una cadena a cadena Unicode
- strip_accents - acentos de Gaza de una cadena
- strip_symbols - Strip feo símbolos Unicode de una cadena
- strip_spaces - Pele el exceso de espacios de una cadena
- strip_linebreaks - Pele los saltos de línea en exceso de una cadena
Requisitos :
- lxml
Comentarios que no se encuentran