Detalles de software:
Versión: 4.0
Fecha de carga: 3 Jun 15
Licencia: Libre
Popularidad: 2
Sherlock Holmes es un motor de búsqueda universal, un sistema de recogida y la indexación de datos textuales (archivos de texto, páginas web, etc.), tanto a nivel local y en la red.
Características .
- Recopila archivos a través de HTTP o desde archivos locales
- Analiza archivos de texto, HTML, PDF y otros formatos utilizando analizadores externos (como MS Word y PostScript).
- Todo el sistema es modular, por lo que añadir sus propias fuentes de datos o programas de análisis es sólo cuestión de conectar el módulo a la derecha (así, por lo general también escribirlo).
- Funciona bien en el entorno de juego de caracteres mixtos.
- Considera múltiples ocurrencias del mismo archivo (incluso con cambios menores) un documento único con múltiples URL.
- Todo es altamente configurable. Usted puede escribir reglas de filtrado en un lenguaje especial que permite ajustar las variables de configuración dependiendo del documento que se está procesando.
- La búsqueda de palabras, frases y expresiones booleanas. Buscando en los nombres de archivos y textos de enlace.
- Búsqueda de proximidad y cercanía ponderación de búsquedas regulares.
- El reconocimiento de idiomas, fácil integración de lematizadores y diccionarios sinonímicas.
- El corrector ortográfico basado en frecuencias de palabras observadas en los datos indexados, haciendo alusión al usuario de que su consulta puede ser mal escrito.
- Resultados de la búsqueda incluyen contexto en cada documento.
- Escalas bien a decenas de millones de documentos sobre el hardware de PC normal.
- Interfaz de usuario (front-end) está completamente separado del resto del sistema, por lo que es fácil de modificar y también para incrustar el motor de búsqueda en las aplicaciones existentes.
- descargado los archivos y los índices se comprimen para ahorrar espacio.
Comentarios que no se encuentran