Apache Hive se desarrolló primero como un Hadoop sub-proyecto para proporcionar a los administradores de Hadoop con un fácil de usar, lenguaje de consulta competente para sus datos.
Debido a esto, la colmena se desarrolló desde el principio para trabajar con grandes cantidades de información para cada consulta y está perfectamente adaptado para las bases de datos a gran escala y los entornos empresariales.
Herramientas se incluyen para que sea fácil de cargar, la extracción y transformación de los datos, mientras que las estructuras de datos personalizados pueden ser forzados a un amplio conjunto de formatos de datos.
Ya que es un proyecto relacionado con Hadoop el HDFS y HBase proyectos también se apoyan de forma automática.
HiveQL es probablemente la mejor parte del proyecto, proporcionando un lenguaje de consulta sencilla, innovadora y eficiente, al mismo tiempo ser capaz de manejar cartógrafos y reductores en las situaciones en la sintaxis SQL nativo no puede obtener los datos deseados.
¿Qué hay de nuevo en esta versión:
- Soporte subconsultas no correlacionadas en la cláusula WHERE
- Añadir NULL DEFINIDO COMO a remar especificación de formato
- Base de datos Ccreate / gota debe rellenar entradas / salidas y comprobar la concurrencia y el permiso de usuario
- Soporte escala especificando y precisión con el tipo colmena decimal
- Que no haya Tez
- Una función que incluye la posición del elemento de la matriz explotar
- Agregar tipo de datos char
- Crear recoger UDF y hacer evaluador reutilizable
- Extender interfaces de registro escritor y ORC lector / escritor para proporcionar estadísticas
- Implementar las estadísticas que proporcionan ORC escritor y el lector las interfaces
- Anotar árbol operador colmena con estadísticas del MetaStore
- Proporcionar estadísticas de columnas de nivel de la raya en ORC
- Soporte subconsulta: no permitir la anidación de subconsultas
- Soporte subconsulta: permite expresiones subconsulta en tener cláusula
- soporte subconsulta: más pruebas
- Nativo Apoyo Parquet en Colmena
- colmena debe ser capaz de saltar de encabezado y pie filas al leer el archivo de datos para una tabla
- Añadir DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR tipos apoyar en HCAT
- Usar mapa de unirse y toque para almacenar en caché resultado intermedio
- Añadir UDF para calcular la distancia entre las coordenadas geográficas
¿Qué hay de nuevo en la versión 1.2.0:
- Soporte subconsultas no correlacionadas en la cláusula WHERE
- Añadir NULL DEFINIDO COMO a remar especificación de formato
- Base de datos Ccreate / gota debe rellenar entradas / salidas y comprobar la concurrencia y el permiso de usuario
- Soporte escala especificando y precisión con el tipo colmena decimal
- Que no haya Tez
- Una función que incluye la posición del elemento de la matriz explotar
- Agregar tipo de datos char
- Crear recoger UDF y hacer evaluador reutilizable
- Extender interfaces de registro escritor y ORC lector / escritor para proporcionar estadísticas
- Implementar las estadísticas que proporcionan ORC escritor y el lector las interfaces
- Anotar árbol operador colmena con estadísticas del MetaStore
- Proporcionar estadísticas de columnas de nivel de la raya en ORC
- Soporte subconsulta: no permitir la anidación de subconsultas
- Soporte subconsulta: permite expresiones subconsulta en tener cláusula
- soporte subconsulta: más pruebas
- Nativo Apoyo Parquet en Colmena
- colmena debe ser capaz de saltar de encabezado y pie filas al leer el archivo de datos para una tabla
- Añadir DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR tipos apoyar en HCAT
- Usar mapa de unirse y toque para almacenar en caché resultado intermedio
- Añadir UDF para calcular la distancia entre las coordenadas geográficas
¿Qué hay de nuevo en la versión 1.1.0:
- Soporte subconsultas no correlacionadas en la cláusula WHERE
- Añadir NULL DEFINIDO COMO a remar especificación de formato
- Base de datos Ccreate / gota debe rellenar entradas / salidas y comprobar la concurrencia y el permiso de usuario
- Soporte escala especificando y precisión con el tipo colmena decimal
- Que no haya Tez
- Una función que incluye la posición del elemento de la matriz explotar
- Agregar tipo de datos char
- Crear recoger UDF y hacer evaluador reutilizable
- Extender interfaces de registro escritor y ORC lector / escritor para proporcionar estadísticas
- Implementar las estadísticas que proporcionan ORC escritor y el lector las interfaces
- Anotar árbol operador colmena con estadísticas del MetaStore
- Proporcionar estadísticas de columnas de nivel de la raya en ORC
- Soporte subconsulta: no permitir la anidación de subconsultas
- Soporte subconsulta: permite expresiones subconsulta en tener cláusula
- soporte subconsulta: más pruebas
- Nativo Apoyo Parquet en Colmena
- colmena debe ser capaz de saltar de encabezado y pie filas al leer el archivo de datos para una tabla
- Añadir DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR tipos apoyar en HCAT
- Usar mapa de unirse y toque para almacenar en caché resultado intermedio
- Añadir UDF para calcular la distancia entre las coordenadas geográficas
¿Qué hay de nuevo en la versión 1.0.0:
- Soporte subconsultas no correlacionadas en la cláusula WHERE
- Añadir NULL DEFINIDO COMO a remar especificación de formato
- Base de datos Ccreate / gota debe rellenar entradas / salidas y comprobar la concurrencia y el permiso de usuario
- Soporte escala especificando y precisión con el tipo colmena decimal
- Que no haya Tez
- Una función que incluye la posición del elemento de la matriz explotar
- Agregar tipo de datos char
- Crear recoger UDF y hacer evaluador reutilizable
- Extender interfaces de registro escritor y ORC lector / escritor para proporcionar estadísticas
- Implementar las estadísticas que proporcionan ORC escritor y el lector las interfaces
- Anotar árbol operador colmena con estadísticas del MetaStore
- Proporcionar estadísticas de columnas de nivel de la raya en ORC
- Soporte subconsulta: no permitir la anidación de subconsultas
- Soporte subconsulta: permite expresiones subconsulta en tener cláusula
- soporte subconsulta: más pruebas
- Nativo Apoyo Parquet en Colmena
- colmena debe ser capaz de saltar de encabezado y pie filas al leer el archivo de datos para una tabla
- Añadir DATE, TIMESTAMP, DECIMAL, CHAR, VARCHAR tipos apoyar en HCAT
- Usar mapa de unirse y toque para almacenar en caché resultado intermedio
- Añadir UDF para calcular la distancia entre las coordenadas geográficas
¿Cuál es nuevo en la versión 0.8.1:
- Herramientas para permitir el extracto de datos fácil / transformar / carga (ETL).
- Un mecanismo para imponer estructura en una variedad de formatos de datos.
- El acceso a los archivos almacenados ya sea directamente en Apache HDFS (TM) o en otros sistemas de almacenamiento de datos, tales como Apache HBase (TM).
- ejecución de consultas a través de MapReduce.
¿Cuál es nuevo en la versión 0.8.0:
- Herramientas para permitir el extracto de datos fácil / transformar / carga (ETL)
- Un mecanismo para imponer estructura en una variedad de formatos de datos
- El acceso a los archivos almacenados ya sea directamente en Apache HDFS (TM) o en otros sistemas de almacenamiento de datos, tales como Apache HBase (TM)
- ejecución de consultas a través de MapReduce
¿Qué hay de nuevo en la versión 0.7.1:
- Errores:
- Excepción en las ventanas cuando se utiliza el controlador JDBC. & quot; IOException:. El sistema no puede encontrar la ruta especificada & quot;
- scripts de creación de esquemas son incompletos, ya que dejan de lado las tablas que son específicas de DataNucleus.
- Mejoras:
- Mejorar mensajes de error diversos.
- Vuelta correctas principales números de versión / menor para JDBC Colmena controlador.
- Añadir a la aplicación HivePreparedStatement basado en actual COLMENA apoyado por el tipo de datos.
- Tareas:
- Colmena en Maven.
- Proporcione MetaStore actualización de guiones y esquemas predeterminados para PostgreSQL.
¿Qué hay de nuevo en la versión 0.7.0:
- Nueva función:
- infraestructura Autorización para Hive
- Implementar Indexación en Colmena
- Añadir reflejar () UDF para la invocación reflejo de los métodos de Java
- Hive TypeInfo / ObjectInspector al apoyo de la Unión (además de estructura, arreglo, y el mapa)
- Implementar GenericUDF str_to_map
- Parche para apoyar cláusula en Colmena TENER
- Siga las uniones que se está convirtiendo en un mapa a unirse automáticamente
- frecuencia de llamada y duración de HiveMetaStore vía jmx
- Mantener LastAccessTime en el MetaStore
- Mejoras:
- Proporcionar opción para exportar un encabezado
- Soporte para la selección distinta en dos o más columnas
- Describir salida de mesa / partición extendida es críptica
- Falta de algunas funciones Jdbc como getTables, getColumns y HiveResultSet.get * métodos basados en nombre de la columna.
- Al tocar los registros de procesos hijos
- Soporte pushdown filtro contra las tablas no nativos
- Reemplazar dependencias HBase obsoleta API
- Añadir QueryID mientras que el bloqueo
- Actualizar transident_lastDdlTime sólo si no se especifica
- Agregue más información de depuración para el bloqueo de la colmena
- HiveInputFormat o CombineHiveInputFormat siempre sincronizar bloques de fichero de recursos dos veces
- Mostrar el tiempo de la tarea local toma
- Crear una nueva instancia ZooKeeper cuando el bloqueo de volver a intentar, y más información para depuración
- Añadir una opción para ejecutar la tarea de revisar el mapa-join posibilidad en modo no local
- Más de depuración para el bloqueo
- Añadir una opción en inserciones de particiones dinámicas a un error si se crean particiones 0
- Errores:
- & quot; LOAD DATA LOCAL INPATH & quot; falla cuando la tabla ya contiene un archivo con el mismo nombre
- NULL no se maneja correctamente en unirse a
- HiveInputFormat.getInputFormatFromCache & quot; golondrinas & quot; causa excepción al lanzar IOExcpetion
- Añadir progresos en unirse y groupby
- UDAFs simples con más de 1 parámetro accidente en consulta fila vacía
- campo UDF () no funciona
- insertos particiones dinámicas izquierda archivos vacíos sin limpiar en Hadoop 0.17 modo local
- Saltar actualización mostrador cuando RunningJob.getCounters () devuelve null
métricas
¿Qué hay de nuevo en la versión 0.5.0:.
- Deje usuario especificar serde para scripts personalizados
- Añadir UDF unhex.
- Eliminar importación lzocodec de FileSinkOperator.
- NullPointerException controlador al llamar getResults sin antes compilación.
- Mejora del rendimiento para el fichero de recursos y ColumnarSerDe en la colmena.
Comentarios que no se encuentran