Apache Solr

Software captura de pantalla:
Apache Solr
Detalles de software:
Versión: 7.2.1 Actualizado
Fecha de carga: 22 Jun 18
Promotor: Yonik Seeley
Licencia: Libre
Popularidad: 3

Rating: 2.0/5 (Total Votes: 1)

Apache Solr es un servidor de búsqueda de código abierto, gratuito, independiente de la plataforma y de alto rendimiento basado en el proyecto Apache Lucene, que utiliza API XML / HTTP y JSON. El proyecto está actualmente bajo incubación en la Apache Software Foundation.


Características de un vistazo

Las características clave incluyen resaltado de visitas, búsqueda facetada, almacenamiento en caché, replicación, una interfaz de administración basada en web, capacidades avanzadas de búsqueda de texto completo, está optimizado para tráfico web de alto volumen, así como interfaces abiertas basadas en estándares, como HTTP , XML y JSON.

Además, viene con interfaces de administración HTML integrales, estadísticas de servidor, replicación automática de índices, recuperación automática y conmutación por error, indexación casi en tiempo real, adaptable y flexible con configuración XML y una arquitectura extensible de complementos.

El proyecto no tiene esquemas, lo que permite al usuario comenzar rápidamente con Apache Solr. En este momento, se admiten tanto el esquema como los modos sin esquema, pero este último conducirá a un entorno de producción fuerte.

Solr admite varios tipos, incluidos los Tipos de campo, que le ayudarán a mezclar y combinar los analizadores Lucene sin escribir ningún fragmento de código. Además, el proyecto admite campos dinámicos que se pueden habilitar sobre la marcha.

Entre otras características interesantes, podemos mencionar la funcionalidad de campo de copia que permite a los usuarios analizar fácilmente el mismo contenido utilizando diferentes métodos, compatibilidad con tipos explícitos para eliminar la necesidad de adivinar tipos de campos, configuraciones personalizadas basadas en archivos externos, como así como numerosos componentes adicionales de análisis de texto.


Debajo del capó y la disponibilidad

Echando un vistazo bajo el capó de Apache Solr, podemos observar que la aplicación se ha escrito enteramente en el lenguaje de programación Java y admite distribuciones de Linux de 32 y 64 bits, así como de Microsoft Windows y Mac OS X sistemas operativos.

Para su comodidad, se distribuye como archivos binarios y de origen, por lo que puede comenzar fácilmente con Apache Solr en el menor tiempo posible y sin demasiada molestia.

¿Qué es? nuevo en este lanzamiento:

  • Supervisor nunca puede procesar algunos últimos mensajes.
  • Cambiar el nombre del núcleo en modo independiente de Solr no se conserva.
  • El análisis de parámetro rq de QueryComponent ya no considera el parámetro defType.
  • Repara NPE en SolrQueryParser cuando los términos de la consulta dentro de una cláusula de filtro se reducen a nada.

Qué hay de nuevo en la versión:

  • Además de muchas otras mejoras en el marco de seguridad, Solr ahora incluye un AuthenticationPlugin que implementa HTTP Basic Auth que almacena las credenciales de forma segura en ZooKeeper. Esta es una forma simple de requerir un nombre de usuario y contraseña para cualquier persona que acceda a la API o la pantalla de administración de Solr.
  • En AuthorizationPlugin incorporado que proporciona un control detallado sobre la implementación de ACL para diversos recursos con reglas de permisos que se almacenan en ZooKeeper.
  • La API JSON Facet ahora puede cambiar el dominio para comandos de facetas, básicamente haciendo una combinación de bloques y pasando de padres a hijos o hijos a padres antes de calcular los datos de facetas.
  • Mejoras importantes en el rendimiento del nuevo Facet Module / JSON Facet API.
  • Facetas de consulta y rango en Pivot facets. Al igual que la API JSON Facet, las facetas dinámicas pueden incluir otros tipos de facetas, como el rango y las facetas de consulta.
  • Más como esta opción de Analizador de consultas. El MoreLikeThis QParser ahora es compatible con todas las opciones proporcionadas por el controlador MLT. El analizador de consultas es mucho más versátil que el manejador, ya que funciona tanto en modo nube como en cualquier lugar donde se pueda especificar una consulta normal.
  • Se agregó compatibilidad de API de Schema en SolrJ
  • Se agregó el modo de puntuación para unirse en tiempo de consulta y unirse en bloque.
  • Se agregó el formato de respuesta de Sonrisa

Qué hay de nuevo en la versión 4.10.3:

  • Solr 4.10.2 incluye 10 correcciones de errores, así como Lucene 4.10.2 y sus 2 correcciones de errores.

Qué hay de nuevo en la versión 4.6.1:

  • Apache Tika 1.4
  • Carrot2 3.8.0
  • Velocity 1.7 y Velocity Tools 2.0
  • Apache UIMA 2.3.1
  • Apache ZooKeeper 3.4.5
  • Corrección de errores:
  • SOLR-5408: CollapsingQParserPlugin puntúa incorrectamente cuando se utilizan varios criterios de clasificación
  • (Brandon Chapman, Joel Bernstein)
  • SOLR-5416: CollapsingQParserPlugin rompe la etiqueta / Excluye Faceting
  • (David Boychuck, Joel Bernstein)
  • SOLR-5442: el cliente de Python no puede analizar la respuesta por proxy cuando es servido por Tomcat.
  • (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
  • SOLR-5445: las respuestas de proxy deberían propagar todos los encabezados en lugar del primero para cada clave.
  • (Patrick Hunt, Mark Miller)
  • SOLR-5479: La lógica de reintento de SolrCmdDistributor se detiene si no se puede encontrar un líder para la solicitud en 1 segundo.
  • (Mark Miller)
  • SOLR-5532: la validación de tipo de contenido de SolrJ es demasiado estricta para algunos contenedores web / proxies.
  • (Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler, Mark Miller)
  • SOLR-5547: la creación de un alias de colección utilizando SolAdj CollectionAdminRequest establece el nombre de alias y las colecciones en un alias con el mismo valor.
  • (Aaron Schram, Mark Miller)
  • SOLR-5577: la caducidad probable de ZooKeeper no debería ralentizar las actualizaciones de una cantidad dada, sino que corta las actualizaciones después de un tiempo determinado.
  • (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
  • SOLR-5580: NPE cuando se crea un núcleo con shard explícito y coreNodeName.
  • (YouPeng Yang, Mark Miller)
  • SOLR-5552: el proceso de recuperación de líderes puede seleccionar el líder incorrecto si todas las réplicas de un fragmento están inactivas y tratando de recuperarse, así como también perder las actualizaciones que deberían haberse recuperado.
  • (Timothy Potter, Mark Miller)
  • SOLR-5569 Una réplica no debe intentar recuperarse de un líder hasta que se haya publicado que está ACTIVO.
  • (Mark Miller)
  • SOLR-5568. SolrCore no puede decidir ser el líder solo porque el estado del clúster dice que no hay otros SolrCore activos.
  • (Mark Miller)
  • SOLR-5496: deberíamos compartir un administrador de conexión http en HttpClients que no sean de búsqueda y asegurarnos de que todos los administradores de conexión http cierren.
  • (Mark Miller)
  • SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished puede esperar para siempre si el servicio del ejecutor está apagado.
  • (Mark Miller)
  • SOLR-5586: todos los ZkCmdExecutor deben inicializarse con el tiempo de espera del cliente zk.
  • (Mark Miller)
  • SOLR-5587: las implementaciones de ElectionContext deberían usar ZkCmdExecutor # ensureExists para garantizar que sus rutas de elección se creen correctamente.
  • (Mark Miller)
  • SOLR-5540: HdfsLockFactory debería crear explícitamente el directorio padre de bloqueo si es necesario.
  • (Mark Miller)
  • SOLR-4709: la recarga del núcleo después de la replicación si los archivos de configuración han cambiado puede fallar debido a una condición de carrera. (Mark Miller, Hossman))
  • SOLR-5503: Vuelva a intentar las solicitudes de "reenviar al líder" de forma menos agresiva, en lugar de hacerlo en IOException y en el estado 500, ConnectException.
  • (Mark Miller)
  • SOLR-5588: PeerSync no cuenta todas las fallas de conexión como exitosas.
  • (Mark Miller)
  • SOLR-5564: hl.maxAlternateFieldLength debe aplicarse al campo original cuando se intenta realizar un repliegue
  • (janhoy)
  • SOLR-5608: No permita que un SolrCore cerrado publique estado en ZooKeeper.
  • (Mark Miller, Shawn Heisey)
  • SOLR-5615: interbloqueo al intentar recuperar después de la expiración de una sesión ZK.
  • (Ramkumar Aiyengar, Mark Miller)
  • SOLR-5543: los intercambios principales dieron como resultado entradas de núcleo duplicadas en solr.xml cuando se usa la persistencia de solr.xml.
  • (Bill Bell, Alan Woodward)
  • SOLR-5618: corrige las coincidencias de falsa caché en queryResultCache cuando los hashCodes son iguales y existen consultas de filtro duplicadas en una de las solicitudes
  • (hossman)
  • SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished puede regresar antes de que todas las actualizaciones agregadas previamente hayan finalizado. Esto podría causar actualizaciones distribuidas destinadas a la pérdida de réplicas.
  • (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
  • SOLR-5645: una recarga de SolrCore a través del CoreContainer intentará y se registrará nuevamente en zk con el nuevo SolrCore.
  • (Mark Miller)
  • SOLR-5636: SolrRequestParsers realiza algunas búsquedas xpath en cada solicitud, lo que puede causar problemas de concurrencia.
  • (Mark Miller)
  • SOLR-5658: commitWithin y overwrite no se distribuyen a las réplicas ahora que SolrCloud usa javabin para distribuir actualizaciones.
  • (Mark Miller, Varun Thacker, Elodie Sannier, shalin)
  • Optimizaciones:
  • SOLR-5576: mejore la concurrencia cuando se registre y espere que todos los SolrCore registren un estado DOWN.
  • (Christine Poerschke a través de Mark Miller)

Qué hay de nuevo en la versión 4.6.0:

  • Muchas mejoras y mejoras para las opciones de división de fragmentos
  • New AnalyzingInfixLookupFactory para aprovechar el AnalyzingInfixSuggester
  • Nuevo CollapsingQParserPlugin para el colapso de campo de alto rendimiento en campos de cardinalidad alta
  • Nuevas API de SolrJ para la gestión de colecciones
  • Nuevo DocBasedVersionConstraintsProcessorFactory que proporciona soporte para reglas de control de versiones centradas en doc configuradas por el usuario
  • Nuevo formato de índice predeterminado: Lucene46Codec
  • Nuevo tipo de EnumField

Qué hay de nuevo en la versión 4.5.1:

  • Solr 4.5.1 contiene una serie de correcciones de errores, incluidas 2 que se consideran bastante graves.

Qué hay de nuevo en la versión 4.5.0:

  • Compatibilidad con sharding personalizado, enrutamiento mejorado y facetado de subprocesos múltiples.

Qué hay de nuevo en la versión 4.2.0:

  • Una API REST del lado de lectura para el esquema. Siempre quiso introspectivamente el esquema sobre http? Ahora usted puede. Parece que el lado de escritura vendrá después.
  • DocValues ​​se han integrado en Solr. Los DocValues ​​se pueden cargar mucho más rápido que la memoria caché de campo y también pueden usar diferentes algoritmos de compresión, así como también en RAM o en representaciones de disco. Las consultas de Faceting, Sorting y Function se benefician. ¿Qué tal el sistema operativo que maneja facetas y clasifica cachés fuera de montón? ¿No hay más ajustes de montones de 60 gigabytes? ¿Qué tal un nuevo método de faceting DocValues ​​por segmentación por segmento? ¿Se ha mejorado la faceta numérica? Dulce.
  • Aliasing de la colección. ¿Tienes datos basados ​​en el tiempo? ¿Desea volver a indexar en una colección temporal y luego cambiarla a producción? Hecho. Estén atentos para Shard Aliasing.
  • Respuestas API de recopilación. La API de colecciones todavía era muy nueva en 4.0, y aunque mejoró bastante en 4.1, sin duda se necesitaban respuestas, pero no se alcanzó el límite. Inicialmente, tomamos la decisión de hacer que la API de recopilación fuera tolerante a fallas, lo que hacía que las respuestas fueran más difíciles de hacer. Nadie quiere buscar en los archivos de registro para ver cómo resultaron las cosas. Hecho en 4.2.
  • Interactúa con cualquier colección en cualquier nodo. Hasta 4.2, solo podía interactuar con un nodo en su clúster si albergaba al menos una réplica de la colección que deseaba consultar / actualizar. Ya no más: consulta cualquier nodo, ya sea que tenga una parte de tu colección deseada o no y obtén una respuesta por proxy.
  • Permitir nombres de fragmentos personalizados para que las nuevas direcciones de host puedan hacerse cargo de los fragmentos retirados. ¿Trabajando en Amazon sin ips elásticos? Esto es para ti.
  • optimizaciones de Lucene 4.2 como vectores de términos comprimidos.

Qué hay de nuevo en la versión 3.3.0:

  • Agrupamiento / Colapsamiento de campo
  • Una nueva implementación de sugerencia / autocompletar basada en autómatas que ofrece un orden de magnitud menor en el consumo de RAM.
  • KStemFilterFactory, una implementación optimizada de una lectora menos agresiva para inglés.
  • Solr adopta por defecto una nueva política de fusión más eficiente (TieredMergePolicy). Consulte http://s.apache.org/merging para obtener más información.
  • Correcciones de errores importantes, incluido el uso de RAM extremadamente alto en la revisión ortográfica.
  • Correcciones de errores y mejoras de Apache Lucene 3.3

Qué hay de nuevo en la versión 3.2.0:

  • Posibilidad de especificar overwrite y commitWithin como parámetros de solicitud cuando se utiliza el formato de actualización JSON
  • TermQParserPlugin, útil al generar consultas de filtro a partir de los términos devueltos desde el campo facetado o el componente de términos.
  • DebugComponent ahora admite usar NamedList para modelar objetos de Explicación en sus respuestas en lugar de Explanation.toString
  • Mejoras en las integraciones de UIMA y Carrot2
  • Correcciones de errores y mejoras de Apache Lucene 3.2

Qué hay de nuevo en la versión 3.2.0:

  • Se realizaron mejoras en la actualización de JSON.
  • Se mejoró la agrupación de resultados de búsqueda y la integración de UIMA.
  • Se corrigieron los errores.

Comentarios a la Apache Solr

Comentarios que no se encuentran
Añadir comentario
A su vez en las imágenes!