Apache parqué es un formato de almacenamiento de datos "en columna" que fue creado específicamente para el Apache Hadoop de la familia de los proyectos.
Se recomienda
parqué para ser utilizado con datos de gran tamaño, principalmente debido a que utiliza un sistema de compresión de datos complejos, basándose en una serie de algoritmos de trituración de grabación y re-montaje optimizados.
datos
Esto permite desglosar, organizado en un formato anidado, y volver a montar cada vez consultado.
El formato de parqué también se puede utilizar fuera del ecosistema Hadoop, que se ha diseñado específicamente para ser tan agnóstico como sea posible, trabajar con cualquier tipo de entorno de procesamiento de datos y modelo de almacenamiento de datos.
< strong> ¿Qué es la nueva en esta versión:
- Cambiar el nombre de los paquetes y experto coordina a org.apache
- Añadir estadísticas de codificación para ColumnMetaData li>
- Streaming API de segunda mano
- Nuevos tipos lógicos
¿Qué es la nueva en la versión 2.3.0:
- Cambiar el nombre de los paquetes y experto coordina a org.apache
- Añadir estadísticas de codificación para ColumnMetaData li>
- Streaming API de segunda mano
- Nuevos tipos lógicos
Limitaciones
- El proyecto está todavía en fase de desarrollo en el repositorio Apache Incubadora y podría cambiar drásticamente de la versión a la versión.
Comentarios que no se encuentran