PDFTextStream

Software captura de pantalla:
PDFTextStream
Detalles de software:
Versión: 2.6.0
Fecha de carga: 20 Feb 15
Licencia: Shareware
Precio: 1900.00 $
Popularidad: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream proyecto es una biblioteca de extracción de texto PDF y metadatos disponibles para Java, Python y .NET.
Es compatible con todas las versiones de la especificación del documento PDF, (incluyendo v1.6, utilizados por Acrobat 7), la extracción de texto codificado utilizando conjuntos de caracteres de doble byte (incluyendo el chino, japonés y coreano), el descifrado de 40 bits y 128 documentos bits cifrado, y la extracción de todos los metadatos de documentos proporcionados por los documentos PDF (incluyendo los datos del formulario, marcadores y anotaciones).
Fácil integración con Jakarta Lucene se incluye

¿Cuál es nuevo en esta versión:.

  • Esta versión incluye una variedad de arreglos hechos para garantizar PDFTextStream es capaz de extraer texto de documentos PDF que están disconformes con la especificación PDF.
  • También incluye una variedad de mejoras de rendimiento.

¿Cuál es nuevo en la versión 2.3.0:

  • Añadido un método .isStruckThrough () para com. snowtide.pdf.TextUnit, que indica si un personaje tiene un tachado dibujado a través de él.
  • Soporte mejorado de PDFTextStream para asignaciones de carácter embebidos.
  • El cálculo de espacio en blanco entre las palabras se ha corregido para tener en cuenta adecuadamente los espacios en blanco que está codificado explícitamente en los documentos fuente PDF.
  • Gestión mejorada de PDFTextStream de codificaciones de contenido compuestos, que antes podían fallar resultando en algunos rangos de contenido PDF siendo 'ignorado' durante la extracción.
  • Se ha corregido un error en VisualOutputTarget donde el texto de una sola línea se divide en varias líneas
  • Mejora de la alineación vertical del texto extraído por medio de VisualOutputTarget
  • Mejora extractos VisualOutputTarget produjo a eliminar espacios en blanco adicionales espuria entre palabras estrechamente adyacentes

¿Cuál es nuevo en la versión 2.2.5:

  • Esta versión añade soporte para la extracción de datos de formularios XFA como XML.
  • Mejora significativamente el rendimiento de la extracción de texto usando VisualOutputTarget. El apoyo a los documentos PDF de más de 2 GB.
  • Una solución para un error por el que las codificaciones de fuentes Type1 incrustados eran previamente no se aplica correctamente en algunas circunstancias.
  • Una solución para un problema que a veces se hace caso omiso de nuevo contenido en los documentos PDF actualizados.
  • Una solución para un problema en el que los marcadores y metadatos PDFDocEncoding codificada no estaban siendo decodificados correctamente.
  • Un método en com.snowtide.pdf.Bookmark .getDestinationName ().

Requisitos :

  • Apache Lucene

Comentarios a la PDFTextStream

Comentarios que no se encuentran
Añadir comentario
A su vez en las imágenes!