pdfminer3k es un puerto de pdfminer escrito en Python 3.
PDFMiner es una herramienta para extraer información de los documentos PDF. A diferencia de otras herramientas relacionadas con PDF, se centra exclusivamente en la obtención y el análisis de datos de texto.
PDFMiner permite obtener la localización exacta de los textos en una página, así como otra información, como fuentes o líneas. Incluye un convertidor de PDF que puede transformar archivos PDF en otros formatos de texto (como HTML). Tiene un analizador PDF extensible que puede ser utilizado para otros fines en lugar de análisis de texto
¿Qué hay de nuevo en esta versión:.
- < li> pdfexplore Añadido, una herramienta para depurar archivos PDF mediante la exploración de sus datos.
- No trate de cajas de texto en grupo cuando hay demasiados (se tarda demasiado tiempo).
- referencias de objetos de apoyo como filtros en los arroyos.
- Analizar todo objeto en cuanto un objectid no se puede encontrar.
- Se ha mejorado el lenguaje de manejo de errores basados ESTRICTA.
¿Cuál es nuevo en la versión 1.2.4:
- Cuando las tablas de referencias externas son corruptos, analizar y caché todo objetos como un retroceso.
- Se ha corregido un afirmación falsa en los diseños.
¿Qué hay de nuevo en la versión 1.2.3:.
- Se ha corregido un accidente en códigos CMAP desiguales
- Se ha corregido un meta-accidente causado por el mal repr PSParser.
Requisitos :
- Python
Comentarios que no se encuentran