DKPro TC es un código abierto y totalmente gratuito marco de clasificación de texto escrito en el lenguaje de programación Java, basado en el marco UIMA Apache, y construido en la cima de Weka Machine Learning Toolkit, DKPro Core y DKPro Lab. Está diseñado especialmente para mitigar los experimentos de aprendizaje automático supervisado que implica cualquier tipo de datos textual.
DKPro TC dispone de un código de ejemplo Fetting-comenzado que se puede utilizar para las colecciones de texto estándar, tales como el Reuters-21578 Texto corpus Categorización, en Groovy y Java; numerosos extractores de características genéricas, como POS-tags y n-gramas; conveniente funcionalidad de optimización de parámetros; extenso informe, apoyo un montón de medidas de rendimiento estándar; apoyo para la clasificación de documentos de pares; . apoyo a una sola etiqueta y clasificación multi-etiqueta p>
Requisitos :
- Java 2 Standard Edition Runtime Environment
Comentarios que no se encuentran