Arco es una extensión de código abierto de Apache Nutch (a, altamente escalable motor de búsqueda de propósito general) de búsqueda de intranet. No contento con su motor de búsqueda de empresa? No es sorprendente, muy pocas personas son. A lo mejor de nuestro conocimiento, no existen motores de intranet que trabajan, así como la búsqueda de la Web mundial que hace Google. Hay una razón fundamental para esto: los algoritmos utilizados por Google en la Web mundial (o similar) no funcionan tan bien en intranets de la falta de datos estadísticos. Arco (por fin!) Resuelve este problema. Se utiliza un método novedoso para entregar resultados de búsqueda de alta precisión que funciona muy bien. No lo crea? herramientas de evaluación de pruebas ciegas están incluidos. Puede implementar Arco y comparar su rendimiento con su motor de búsqueda actual y / o Google (en la parte pública de su sitio) usando una metodología de ensayo ciego.
Además de la excelente calidad de búsqueda, Arco tiene muchas características críticas para entornos corporativos:
- La seguridad de documento. Los usuarios pueden encontrar solamente documentos que están autorizados a ver.
- Las actualizaciones de índice de bajo costo. Arch es capaz de mantener los índices actualizados regularmente y evitar vuelvan a rastrearse sitio completo.
- 24/7 disponibilidad. Siempre hay un índice de trabajo disponible, incluso si falla un rastreo.- Soporte para la indexación y búsqueda simultánea de múltiples sitios web, con la capacidad de buscar y administrar cualquier sitio por separado, si es necesario. Dinámico añadiendo y la eliminación de los sitios web es fácil.
- Un directorio de sitio generado automáticamente.
- Bajo costo de soporte una vez desplegado.
- Interfaz Dual (PHP y Java) para una fácil implementación y personalización.
- Búsqueda por facetas "fuera de la caja".
- Un conjunto amplio de programas de análisis y extensible para analizar una variedad de formatos de archivo: HTML, PHP, PDF, MS Office, Open Office, etc.
- Una arquitectura modular, basada en complementos que pueden ser fácilmente personalizado y ampliado.
- Se incluye el código fuente.
- Alto rendimiento y escalabilidad. Arco puede ejecutarse en clusters de ordenadores a índices muy grandes conjuntos de datos
¿Qué hay de nuevo en esta versión:.
Versión 1.9.2: análisis mejorado documento, portado en Nutch 1.9 .
¿Qué es la nueva en la versión 1.7:.
análisis de seguridad añadida, portado en Nutch 1.7
Requisitos
Java 1.7, Cygwin
Comentarios que no se encuentran