LanguageTool es un programa de revisión de código abierto diseñado para encontrar errores que las herramientas regulares corrector ortográfico no pueden detectar. Es un estilo y gramatical que encontrar errores para el que se define una regla en sus archivos de configuración XML, como mezclar y ldquo basan en reglas, su y rdquo; con y ldquo;. allí y rdquo;
Detecta diversos problemas de gramática
El programa también puede detectar varios problemas de gramática y viene con soporte para más de 20 idiomas, incluyendo Inglés, alemán, polaco, francés, español, sueco, griego, chino, danés, japonés, islandés, portugués y portugués brasileño.
Además, cuenta con una interfaz gráfica de usuario fácil de usar, simple y sencillo que permite a cualquier persona para pegar el texto que necesita ser comprobado hechizo. Se puede comprobar el texto en el portapapeles, el texto de etiqueta, cortar / copiar / pegar texto, y residir en el área de la bandeja del sistema.
Detecta una amplia gama de problemas
En el diálogo Opciones, puede permitir que el tipo de problemas de la aplicación puede detectar, incluyendo mal estilo, errores gramaticales, argot, errores de puntuación, los posibles errores tipográficos, frases redundantes, comúnmente confusas palabras, colocaciones, la capitalización, la semántica, así como frases no estándar.
LanguageTool para LibreOffice y OpenOffice
Además de ser una aplicación independiente, LanguageTool también está disponible como una extensión de dos de las suites de oficina de código abierto más populares y poderosos, LibreOffice y OpenOffice.org Apache, permitiendo a los usuarios corrigen sus textos, haga clic en frases seleccionadas o párrafos.
LanguageTool para Mozilla Firefox
Además, la aplicación también está disponible para su descarga como un add-on para el mundo y rsquo; s más popular navegador web de código abierto en el mundo, Mozilla Firefox. No requiere reinicio y coloca un pequeño botón en la barra de herramientas principal, lo que le permite corrija el texto resaltado de los sitios web o formas.
Bajo el capó y la disponibilidad
La aplicación está escrita completamente en el lenguaje de programación Java, lo que significa que y rsquo; sa software multiplataforma, diseñado para funcionar con cualquier distribución de GNU / Linux, así como la BSD, Solaris, Microsoft Windows y Mac OS X operativo sistemas, donde está instalado el Java Runtime Environment.
¿Qué hay de nuevo en esta versión:
- catalán:
- diccionario etiqueta POS actualizado
- añade nuevas reglas
- falsas alarmas fijos
- Inglés:
- Alta algunas reglas y fija unos falsas alarmas
- Añadido muchas reglas del nuevo estilo aportados por Heikki Lehvaslaiho. A medida que estos pueden causar falsas alarmas, no se activan por defecto. Puede activarlos mediante la activación de todas las reglas en la nueva categoría 'Inglés Simple'.
- Esperanto:
- añadió algunas reglas nuevas
- Francés
- diccionario etiqueta POS actualizado y diccionario Hunspell para Dicollecte-5.3
- Alemán:
- añadió algunas reglas nuevas y falsas alarmas fijos
- añadida una nueva regla que comprueba la concordancia entre sujeto verbo. Por ahora, sólo se admiten los casos con 'ist', 'sind', 'la guerra', y 'Waren'. Ejemplo de los errores que se detectan: '. Der Hund sind SCHA y para; n', 'Die Autos schnell ist. Para que esto funcione regla, frases están unificados en disambiguation.xml: por ejemplo, 'Mann' en la frase 'ein Mann "sólo conservará su lectura nominativa (SUB: NOM: SIN: MAS), mientras que solía tener también lecturas acusativo y dativo (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
- Italiano:
- mejoró algunas reglas
- polaco:
- añadido varias reglas nuevas
- portugués:
- agregados / mejorados varias reglas
- 3.695 palabras compuestas (antes de la reforma) - la base de datos libre más grande
- Ruso:
- añadió y normas mejoradas
- ucraniano:
- gran actualización diccionario
- nuevas reglas gramaticales
- nuevo sencillo reemplazar regla para sugerencias suaves
- mejoras desambiguador
- mejoras etiquetado compuesto y de ortografía
- iniciales etiquetado
- frases y palabras mejoras tokenizing
- mejora del control de stres símbolo y guión de separación
- reglas Bitext:
- añade una regla simple para comprobar si traducciones terminan con la misma marca de puntuacion que el original (esto incluye solamente.?! Caracteres).
- ahora es posible añadir archivos de reglas bitextos externos en la línea de comandos, utilizando
- opción -bitextrule. La ruta del archivo tiene que ser absoluta. Nota:. Esto permite el uso de reglas Bitext también para las lenguas que no tienen reglas Bitext incluidos por defecto
- Ortografía:
- Los nuevos archivos en /hunspell/spelling.txt se puede utilizar para agregar palabras aceptadas para el corrector ortográfico que también se considera la hora de crear las sugerencias para las palabras mal escritas. Esto es similar a los archivos /hunspell/ignore.txt, que la lista de palabras que se acepta * no * es usado cuando se crea sugerencias para las palabras mal escritas.
- API:
- JLanguageTool.activateDefaultPatternRules () y JLanguageTool.activateDefaultFalseFriendRules () se han eliminado - todas las reglas de patrones y reglas falso amigo (si se especifica un segundo idioma) están activados automáticamente cuando se llama al constructor de JLanguageTool. Si necesita un corrector sin las reglas de patrones basados en XML, ampliar su clase de idioma (por ejemplo, 'Inglés') con uno que sobrescribe los método getPatternRules () y devuelve una lista vacía allí.
- ManualTagger.lookup () ha sido sustituido por ManualTagger.tag () después de haber sido en desuso desde la última versión
- Todos los métodos y campos de la clase 'Idioma' estáticas han sido trasladados a la nueva clase 'Idiomas'. Por ahora, / aún existen los métodos de campos en la clase de idiomas, pero han quedado en desuso.
- LanguageIdentifierTools se ha eliminado. Uso LanguageIdentifier lugar.
- Eliminado (por defecto) ResourceDataBroker.setResourceDir () y setRulesDir (), ya que se pueden establecer con el constructor
- Se ha limpiado hasta Sénior clase, por ejemplo, eliminando getRemark ()
- Category.setDefaultOff () se ha eliminado, se puede establecer a través de constructor ahora
- clases renombrados: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
- Otras limpiezas API pequeños que no deben afectar a los casos de uso comunes, por ejemplo, IncorrectExample.getCorrections () devuelve la lista y no modificable ahora, la eliminación de los métodos obsoletos.
- servidor incorporado:
- escape XML se ha solucionado, esto podría causar que los documentos XML no válidos a devolver
- nueva opción de archivo de configuración 'maxWorkQueueSize' que le permite establecer el tamaño máximo de la cola de peticiones - si se pone más grande que esto, las solicitudes serán rechazadas (503 Servicio no disponible)
- El servidor ahora responde con códigos de estado HTTP más específicas a estas condiciones de error: 413 Solicitud Entidad demasiado grande - si el texto excede el máximo tamaño de texto 503 Service Unavailable - si cheque excede el tiempo máximo de verificación
- GUI:
- La interfaz gráfica de usuario independiente ahora puede tomar un archivo de texto plano como un argumento, este archivo y luego se carga en el arranque (Github edición # 232).
- de línea de comandos:
- Ahora es posible añadir un archivo de reglas externas al llamar LanguageTool desde la línea de comandos. Utilice --rulefile añadir un archivo. Si el nombre de archivo tiene un formato que contiene un nombre de idioma, se utiliza junto con otras normas; de lo contrario, que reemplazará las reglas. También puede cargar un archivo externo con falsos amigos usando los --falsefriends opción. El nombre del archivo debe ser una ruta de archivo absoluta, y los archivos de amigos falsos siempre se añaden a las que se cargan por la lengua. (Github edición # 192)
- sintaxis Regla:
- Una regla puede tener ahora una sola oración de ejemplo el tiempo que tiene un atributo 'corrección' - esto puede ahorrar algo de redundancia si la única frase correcta es la misma que la frase incorrecta con la corrección aplicada. Antes, una regla necesitaba al menos dos frases de ejemplo.
- 'ejemplo' elemento: type = "incorrectos" ahora es opcional si hay un atributo 'corrección'. El atributo 'corrección' implica que la sentencia no es correcta.
- 'ejemplo' elemento: type = "correcta" es ahora opcional. Ningún atributo "tipo" y ningún atributo 'corrección' implica que la sentencia es correcta.
- Interno:
- Hemos cambiado de Apache Tika al lenguaje-detector (https://github.com/optimaize/language-detector) para identificar automáticamente el idioma del texto. Debería ser más rápido y los resultados deben ser más fiable. Detección del asturiano y gallego tuvo que ser desactivado debido a que la calidad de detección era demasiado bajo y también afectó a la detección de español.
- Se ha corregido un regresión que hizo imposible cargar archivos de reglas externas en la interfaz gráfica de usuario.
Mejoras
¿Qué hay de nuevo en la versión 2.8:
- asturiano:
- dependencia eliminado en Hunspell, ahora utiliza Morfologik para la corrección ortográfica
- Breton:
- agregó y mejoró algunas reglas
- catalán:
- diccionario actualizado
- añadió y normas mejoradas
- falsas alarmas fijos
- holandesa:
- añadido y mejorado muchas reglas
- Inglés:
- algunas reglas nuevas (gracias a Nick Hough)
- actualizado los diccionarios tagger y sintetizador, la fijación de la edición # 202
- nuevo filtro que se utilizará para que coincida con el partofspeech de partes de palabras, por ejemplo:. En * Esto sólo mantendrá partidos para las palabras que empiezan con "en" y donde la parte después de la 'en' es un adjetivo (etiqueta POS 'JJ'). El 'no: 1' es la posición razón, es decir, aquí la primera (y única) correspondiente se denomina .
- Francés:
- agregó y mejoró algunas reglas
- Alemán:
- agregó y mejoró algunas reglas
- polaco:
- añadido y mejorados varias reglas
- agregó y mejoró falsos amigos con Inglés
- portugués:
- agregados / mejorados varias reglas
- Español:
- dependencia eliminado en Hunspell, ahora utiliza Morfologik para la corrección ortográfica
- archivo de reglas Nuevo formato
- Añadido más reglas
- tagalo:
- dependencia eliminado en Hunspell, ahora utiliza Morfologik para la corrección ortográfica
- el carácter guión ("") es un delimitador de ahora, cuando tokenizar el texto
- Ruso:
- añadió y normas mejoradas
- añadió algunas reglas falso amigo (Ruso / Inglés)
- ucraniano:
- muchas reglas nuevas (incluyendo un acuerdo con los sustantivos, expresiones de tiempo, etc.)
- mejora la cobertura regla
- Actualización diccionario (grandes mejoras para los nombres propios y caso vocativo)
- nueva etiqueta y gobernar para advertir sobre ortografía alternativa
- añadido información de frecuencia de palabras para mejorar sugerencias de ortografía
- algunas nuevas reglas desambiguador
- Regla Sintaxis:
- ... ahora puede ser añadido a un RuleGroup a afectar a todos los procedimientos de ese grupo
- Si usted desarrolla sus propias reglas que no son parte de LT ahora usted puede agregar externa = "sí" a sus categorías para prevenir el enlace regla a community.languagetool.org aparezcan en nuestra GUI independiente (el enlace no funcionaría normas que no son parte de la distribución principal de LT). (Github edición # 223)
- Si un grupo regla especifica default = "off", las reglas dentro del grupo de reglas no pueden especificar también default = "on" / "off".
- API:
- clases y métodos que habían sido eliminados en desuso desde 2,7 o más
- servidor incorporado:
- Las opciones del archivo de configuración 'requestLimit' y 'requestLimitPeriodInSeconds' ahora también puede ser utilizado para el servidor HTTP (no sólo para el servidor HTTPS)
- Nueva opción de archivo config 'trustXForwardForHeader': ajústelo a "verdadero" si ejecuta el servidor detrás de un proxy inverso y desea que el límite de solicitud para trabajar en las direcciones IP originales proporcionados por la cabecera HTTP "Xforwardedfor ', por lo general fijada por el proxy. Si ejecuta detrás de un proxy, pero no establece esta propiedad en true, un usuario puede utilizar todas las peticiones para que otros usuarios también recibirán un mensaje de error debido al límite de solicitud.
- Fix respuesta de Después de la modalidad Plazo: ... a veces era vacía, confundiendo el cheque texto en WordPress
- reglas Bitext no fueron desactivadas correctamente, incluso si se especificaron con un parámetro adecuado para el servidor; ahora se ha fijado
- Arreglado el problema con posiciones inadecuadas para algunas reglas Bitext (edición # 218)
- GUI:
- Un nuevo ajuste 'errorColors' se ha añadido al archivo de configuración languagetool.cfg. Se puede utilizar para establecer el color de fondo de errores. Por ejemplo, errorColors = tipográfico: # b8b8ff, estilo: # ffb8b8 mostrará errores tipográficos '' con un fondo azul y errores "estilo" con un fondo de color rojo en la parte superior de la ventana LT. "Tipográfico" y "estilo" son los tipos que se establecen en grammar.xml como "type = ...". No hay ninguna interfaz de usuario aún para configurar estos colores. Tenga en cuenta que sólo se debe editar el archivo languagetool.cfg cuando LT no se está ejecutando.
- Interno:
- Solución de error: reglas dentro de un grupo de reglas no habían sido activados, si una norma anterior de la misma RuleGroup utiliza por defecto = "off"
- Las palabras no se tienen en cuenta más por el corrector ortográfico sólo porque se producen en la sugerencia de una regla. Si desea que el corrector ortográfico ignore las palabras a nivel mundial, añadirlos a hunspell / ignore.txt. Hacer caso omiso de ellas, dependiendo del contexto, añadir una regla 'ignore_spelling' a disambiguation.xml.
- Un archivo 'hunspell / prohibit.txt' ahora se puede utilizar para marcar palabras como errores de ortografía, incluso si el corrector ortográfico normalmente aceptarlas. Esto es útil para mejorar la LanguageTool corrector ortográfico sin esperar a que el corrector aguas arriba ser actualizado. El archivo 'prohibit.txt' es lo contrario de 'ignore.txt', lo que hace que el corrector ortográfico de ignorar palabras.
- El etiquetador partofspeech para la mayoría de los idiomas puede ahora extenderse añadiendo entradas al archivo org / LanguageTool / recurso / XX / added.txt (XX es el código de idioma). El formato es "postag representación base fullform", tres columnas separadas por tabuladores. Esto hace que sea más fácil para los usuarios (y desarrolladores) para ampliar el POS tagger, ya que no necesitan exportar, modificar y volver a crear el diccionario binario para cada cambio.
¿Qué hay de nuevo en la versión 2.7:
- Breton:
- añadió y normas mejoradas
- Nueva regla que comprueba si un día de la semana coincide con una fecha, por ejemplo, detecta "Gwener 28 un EOST a saber 2014", ya que esa fecha no es un viernes.
- catalán:
- añadió y normas mejoradas
- falsas alarmas fijos
- holandesa:
- añadido y mejorado muchas reglas
- cambió al corrector ortográfico basado en Morfologik
- -Inglés:
- ¿Quieres ser parte del equipo que desarrolla herramienta de revisión de código abierto más poderoso del mundo? Estamos buscando a un mantenedor de las normas de inglés en LanguageTool. Ver http://wiki.languagetool.org/tasks-for-language-maintainers para más detalles.
- Todos los diccionarios se han ampliado para incluir las clases de frecuencia de palabras para mejorar las sugerencias del corrector ortográfico (los datos de frecuencia se toma de https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME / Latino / diccionarios, como para otros idiomas que ya utilizan esta función).
- Mejores sugerencias para los estudiantes de inglés: verbos irregulares, sustantivos y adjetivos ahora suelen tener una mejor sugerencia. Por ejemplo, 'thinked' sugiere 'pensó', 'mujer' sugiere 'mujeres'.
- Más faltas de ortografía proporcionan sugerencias ahora, por ejemplo, 'Garentee' (garantía), 'agradecido' (agradecido). Esto puede causar una disminución del rendimiento de ~ 10% (más de textos con una gran cantidad de palabras desconocidas).
- Nueva regla que comprueba si un día de la semana coincide con una fecha, por ejemplo, detecta "Lunes, 07 de octubre 2014", ya que esa fecha no es un lunes. Esta regla sólo funcionará si detecta el formato de fecha en uso. Hasta el momento, estos formatos son compatibles: * "Lunes, 07 de octubre 2014" * "Lunes, 07 de octubre 2014" * "Lunes, 07 de octubre 2014" * "Lunes, 07 de octubre 2014" * (esto también funciona con semana abreviada días como Mo o Mon para el lunes)
- Esperanto:
- Nueva regla que comprueba si un día de la semana coincide con una fecha, por ejemplo, detecta "Vendredon la 28-an de AAgusto 2014", ya que esa fecha no es un viernes.
- Francés:
- diccionario etiqueta POS actualizado y diccionario Hunspell para Dicollecte-5.2
- añade un sintetizador - la regla de acuerdo ahora puede hacer sugerencias de algunos errores
- agregados / mejorados varias reglas
- Nueva regla que comprueba si un día de la semana coincide con una fecha, por ejemplo, detecta "vendredi 28/08/2014", ya que la fecha no es un viernes.
- Alemán:
- Se ha corregido un NullPointerException rara y un ArrayIndexOutOfBoundsException
- Fijos varias falsas alarmas
- Añadido y normas mejoradas
- Nueva regla que comprueba si hay frases sin verbo (desactivado por defecto debido al riesgo de falsas alarmas)
- Nueva regla que comprueba si un día de la semana coincide con una fecha, por ejemplo, detecta "Dienstag, 29.09.2014", ya que esa fecha no es un martes.
- Mejoras de rendimiento para las sugerencias de corrección ortográfica
- persa:
- añadido soporte inicial para Persa (farsi)
- polaco:
- agregó y mejoró algunas reglas
- nueva regla que comprueba si un día de semana coincide con una fecha
- portugués:
- agregados / mejorados varias reglas
- añadió muchas docenas de palabras compuestas
- Ruso:
- añade nuevas reglas
- fijar SourceForge solicitud función # 38 (comprobar si hay diferentes comillas)
- añadió algunas reglas falso amigo (Ruso / Inglés)
- nueva regla que comprueba si un día de semana coincide con una fecha, por ejemplo, detecta "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? y ETH; & micro; & ETH; & frac12; N & sbquo; N ?? y ETH; & plusmn; N & euro; N ?? 2014 y ETH; & SUP3 ;. ", ya que la fecha no es un lunes .
- regla compuesto ruso ampliado con nuevas palabras del diccionario postag
- Español:
- Alta nueva categoría POS Z (para los números de espelta, por ejemplo, 'uno', 'dos', ...)
- Números Deletreado ahora pueden ser detectados y gestionados tanto en desambiguación y las reglas.
- Se han solucionado algunos lemas incorrectos en el diccionario de POS.
- Añadido híbrido chunker-desambiguador.
- Tamil:
- Añadido soporte inicial para Tamil. Si la fuente de Tamil no se visualiza correctamente en su computadora y usted está utilizando Windows, puede que tenga que aplicar el trabajo alrededor describe aquí: https://bugs.openjdk.java.net/browse/JDK-8008572
- ucraniano:
- gran actualización para el diccionario de POS (correcciones y nuevas palabras)
- alguna etiqueta POS renombrado de coherencia; nuevas etiquetas para abreviaturas y palabras raras
- muchas nuevas reglas y correcciones para las normas existentes
- nueva regla que comprueba si un día de semana coincide con una fecha, por ejemplo, detecta "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N y ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & párrafo; & ETH; & frac34; & ETH; & sup2; 2014 ", ya que esa fecha no es un lunes
- mejora del rendimiento normalización símbolo
- la integración de LibreOffice:
- No se deje confundir por las notas al pie de LibreOffice 4.3 y más tarde (ahora nos proporciona las posiciones del pie de página como metadatos, por lo que podemos ignorarlos).
- API:
- Las principales mejoras de rendimiento para el caso de uso multi-hilo, donde JLanguageTool se crea por hilo, pero el objeto de lenguaje (por ejemplo, "alemán") se crea una sola vez. Overhead para crear JLanguageTool ahora debería ser mucho menor.
- quitado las varias clases y métodos que se habían quedado en desuso desde la versión 2.6
- DutchSpellerRule Eliminado - utilizar MorfologikDutchSpellerRule lugar
- La firma de Language.getRelevantRules () ha cambiado
- Los constructores JLanguageTool y MultiThreadedJLanguageTool no declaran a lanzar una IOException más
- WhitespaceRule ha sido renombrado a MultipleWhitespaceRule (WhitespaceRule todavía existe, pero se ha quedado en desuso)
- desuso algunos métodos cuya visibilidad se reducirá (por ejemplo, de lo público a los protegidos)
- MorfologikSpellerRule.getRuleMatch (String, int) ha sido renombrado a MorfologikSpellerRule.getRuleMatches (String, int)
- El constructor RuleMatch ahora lanza una excepción si toPosition no es mayor que fromPosition
- Introducido un nuevo TextLevelRule clase abstracta que amplía la Regla y que puede ser utilizado para las reglas que cubren más de oraciones simples.
- Línea de comandos:
- Activación y desactivación de reglas específicas, al mismo tiempo está permitido. Con el fin de probar sólo algunas reglas (incapacitantes todo el resto), que anteriormente se hizo con "LIST_OF_RULES --enable", ahora utilizan "LIST_OF_RULES --enabledonly --enable" (o "-eo -e LIST_OF_RULES").
- servidor incorporado:
- Dos nuevas opciones se puede configurar en el archivo de propiedades para hacer LanguageTool devolver el mismo formato XML como Después de la fecha límite (ATD). De esta manera se puede utilizar como una gota en el reemplazo por AtD: * Modo - 'LanguageTool' o 'AfterTheDeadline' * afterTheDeadlineLanguage - Código de idioma por defecto si el modo está ajustado en 'AfterTheDeadline' NOTA: el modo 'AfterTheDeadline' debe ser considerado experimental por ahora.
- 'maxCheckThreads' La nueva opción permite establecer el número máximo de subprocesos de trabajo en las peticiones en paralelo. El valor predeterminado es 10, lo que solía ser.
- Internos:
- Nueva AbstractDateCheckFilter regla abstracta que permite comprobar si un partido de semana día y la fecha. Por ejemplo, "Martes, 29 de septiembre 2014" se pudo detectar, como 29 de septiembre 2014 no es en realidad un martes. Esto utiliza la nueva interfaz RuleFilter experimental que se puede llamar desde XML con el nuevo elemento de "filtro". "Filtro" toma estos atributos: "clase": el nombre completo de una clase Java que implementa RuleFilter, por ejemplo, "org.languagetool.rules.de.DateCheckFilter" 'args': una cadena como "año: 1 mes: 2 días: 3 Día de la semana: 4", es decir, una lista separada por espacios de pares clave / valor, donde x se resolvió valor simbólico del patrón (como en el elemento "mensaje")
- La regla compuesto ahora ignora las fichas que han sido inmunizados en el disambiguation.xml
- La acción de "filtro" en el desambiguador ahora se aplica únicamente a las etiquetas de punto de venta que coincidan con la etiqueta POS dado. Si no coinciden, la regla no se aplica.
- Si está extendiendo las reglas XML como se describe en http://wiki.languagetool.org/tips-and-tricks#toc2, los archivos de reglas y desambiguación externos ahora puede estar alojada en un servidor protegido por contraseña mediante la especificación una URL como esta: http: // usuario: password@example.org/path/user-rules.xml
- El guión largo ("a & euro;" ") es ahora un personaje tokenizing para todos los idiomas
- Nueva función:
- El uso de modelos de lenguaje
- LanguageTool ahora puede hacer uso de los datos Ngram. datos ngram es información acerca de cómo ocurren a menudo frases en un idioma. Actualmente, este utiliza frases de longitud 3.
- Los datos se utilizan por una regla de Inglés para encontrar errores homophone, como mezclar grueso / curso o toque / cohete. LanguageTool tenía algunas reglas de este tipo antes, pero la nueva regla ahora es compatible con unos 900 de tales palabras pares / conjuntos.
- Los datos necesarios para que esto no es enorme (7 GB de Inglés) y por lo tanto una parte o LanguageTool.
- Los datos (Inglés solamente por ahora) y más documentación está disponible en http://wiki.languagetool.org/finding-errors-using-big-data li>
- Uso de N-gramas hace LanguageTool ligeramente más lento cuando los datos se almacenan en un disco SSD.
- Si no se almacenan en un disco SSD, el rendimiento puede disminuir drásticamente.
- Utilice la nueva opción --languagemodel con el cliente de línea de comandos para activar la regla de que utiliza los datos. Esa opción no está disponible todavía para la interfaz gráfica de usuario independiente.
¿Qué hay de nuevo en la versión 2.4.1:
- Actualizado bibliotecas Morfologik a 1.8.3 para solucionar sugerencias lentos en el corrector ortográfico, que afectó al menos en-US
¿Qué hay de nuevo en la versión 2.4:
- Breton:
- SRX frase tokenización
- agrega / mejoró algunas reglas
- fijos algunas falsas alarmas
- fijo sugerencias incorrectas gracias a pruebas agregadas correcciones
- catalán:
- agregados / mejorados varias reglas
- falsas alarmas fijos
- adiciones y correcciones al diccionario etiquetador
- retirado unas palabras del diccionario de síntesis (ver filterarchaic.txt)
- agrega datos de frecuencia al diccionario etiquetador; lista de palabras de frecuencia viene del proyecto Gaia, con Apache License, versión 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
- Inglés:
- agrega / mejoró algunas reglas
- fijos algunas falsas alarmas
- Francés:
- agregados / mejorados varias reglas
- fijos algunas falsas alarmas
- Alemán:
- agregados / mejorados varias reglas
- añade un sintetizador de la regla de acuerdo ahora pueden hacer sugerencias para algunos errores (no todas las sugerencias son correctas, sin embargo)
- polaco:
- agrega / mejora de varias normas, en especial para el guión y el uso de instrumentos
- añadió la información de frecuencia para el diccionario de corrección ortográfica; lista de palabras de frecuencia viene del proyecto Gaia, con Apache License, versión 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
- fijos algunas falsas alarmas
- portugués:
- agrega / mejora de varias reglas (que ahora incluye normas de género "a" / "o")
- ahora tiene 3400+ palabras compuestas
- el archivo JAR ha sido renombrado a languagetool.jar, desde antes languagetoolstandalone.jar para evitar la confusión acerca de lo que 'independiente' significa en este contexto (github edición # 29)
- para idiomas con muchas reglas (como el francés o el alemán) el rendimiento en textos largos se ha incrementado en cerca de 2.030%
- solución para threadsafety (podría causar colgar en MultiWordChunker)
- arreglado un error en las anotaciones del pedazo no fueron probados en grupos
- fix: 1 y no había sido evaluado en ...
- corregido un error en el mecanismo de unificación que descarta algunas de las interpretaciones coincidentes prematuramente
- añadido soporte para las anotaciones del pedazo del desambiguador, y se fija un bug en las fichas de filtrado con anotaciones trozo
- actualizadas bibliotecas Morfologik a 1.8.2 (correcciones de errores, más estrictas de sanidad de entrada de cheques, añadir los datos de frecuencia de diccionarios)
- añadió la opción de incluir datos de frecuencia a taggging o de ortografía diccionarios. El formato esperado de las listas de palabras de frecuencia es el que está en el proyecto Gaia, con Apache License, versión 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
- nuevas herramientas de línea de comandos para exportar y crear diccionarios binarios:
- org.languagetool.dev.DictionaryExporter
- org.languagetool.dev.POSDictionaryBuilder
- Integración LibreOffice / OpenOffice:
- añadió una solución para detección incorrecta sentencia por el caso de que una nota al pie apareció después de un punto y oración (Sourceforge el bug # 191)
- GUI independiente:
- El diálogo abierto por el "... Más" elemento en el menú contextual de un error ahora también mostrar ejemplos de oraciones correctas e incorrectas
- API:
- SentenceTokenizer es ahora una interfaz, la aplicación ha sido movido a RegexSentenceTokenizer, pero esto está obsoleto y SRXSentenceTokenizer debe utilizarse en lugar
- Algunos métodos de org.languagetool.tools.StringTools se han trasladado a la clase org.languagetool.gui.Tools en el proyecto languagetoolguicommons
- LanguageToolListener.languageToolEventOccured () se ha cambiado el nombre a LanguageToolListener.languageToolEventOccurred ()
- org.languagetool.tools.SymbolLocator no es pública más (no debe afectar a cualquier persona)
- eliminado DanishSentenceTokenizer que había quedado en desuso desde hace tres años
- Rule.getCorrectExamples () y Rule.getIncorrectExamples () no devolverá null más pero una lista vacía si no hay ejemplos. En consecuencia, setCorrectExamples () y setIncorrectExamples () no aceptan nula ya.
- Rule.getId () puede devolver cualquier cadena de ahora, no sólo ASCIIonly cuerdas (en realidad esto ha sido el caso antes, como la restricción ASCIIonly nunca se aplicó y sólo se menciona en el javadoc)
- languagetoolwikipedia: las opciones de línea de comandos para el control de un vertedero de Wikipedia se han simplificado. El comando ahora se puede llamar así: jar java languagetoolwikipedia.jar CheckData l en f enwiki20130621pagesarticles.xml Llame sólo "jar java languagetoolwikipedia.jar CheckData" para conseguir un mensaje de uso. Más de un archivo se puede especificar con la opción f. Además de Wikipedia volcados XML, ahora también se admiten archivos CSV desde Tatoeba (http://tatoeba.org), tienen que ser filtrados primero para contener sólo el idioma correspondiente.
¿Qué hay de nuevo en la versión 2.3:
- Breton:
- agrega / mejoró algunas reglas
- falsas alarmas fijos
- diccionario POS actualizado de Apertium (svn r47282)
- catalán:
- añadido soporte para código de idioma ca-ES-valencia (catalán valenciano), para ser utilizado en LibreOffice 4.2.0
- añadió una sencilla regla de sustituir con cientos de sugerencias de reemplazo
- agregados / mejorados varias reglas
- falsas alarmas fijos
- Chino:
- añadió una solución para un StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
- Inglés:
- añadió patrones de reemplazo para el corrector ortográfico para hacer sugerencias mejor (ahora ofrece 'enseña' para 'impartido')
- agrega / mejoró algunas reglas
- Francés:
- agrega / mejoró algunas reglas
- falsas alarmas fijos
- diccionario etiqueta POS actualizado y diccionario Hunspell para Dicollecte-4.12
- Alemán:
- agregados / mejorados varias reglas
- portugués:
- agrega / mejoró algunas reglas
- ahora tiene 3300 + palabras compuestas
- ucraniano:
- agregados / mejorados varias reglas
- el código fuente ha sido movido a github: https://github.com/languagetool-org/languagetool
- LanguageTool requiere Java 7 ahora
- LanguageTool hace uso de múltiples hilos ahora para comprobar el texto en el hardware moderno, mejorando el rendimiento (esto afecta a la versión independiente, la versión de línea de comandos y la extensión de LibreOffice / OpenOffice)
- sintaxis Regla:
- soporte preliminar para nuevos atributos min / max que permiten para que coincida con un elemento que aparezca el número determinado de veces. Por ejemplo: foo coincidirá con nada o "foo", es decir, "foo" es foo opcional coincidirá con "foo" o foo "foo foo" coincidirá con nada, "foo", o "foo foo" Uso max = "- 1" para permitir ocurrencias ilimitadas. Para min, sólo 0 o 1 se admite (1 es el valor predeterminado).
- Soporte para O-declaraciones. Por ejemplo: a nivel interno y en tiempo de ejecución, una regla que contiene o declaraciones se convierte en varias reglas sin O-declaraciones .
- Inglés tiene ahora un chunker para detectar, entre otros, trozos sustantivo en singular y plural. Esto está documentado en http://wiki.languagetool.org/using-chunks
- versión independiente:
- La versión independiente ahora subraya los errores con un rojo (errores de ortografía) o azul (otros errores) línea (Panagiotis Minos)
- Recuerde la selección de idioma para el próximo inicio
- Mejora de la ventana y la colocación de diálogo en una configuración multi-monitor
- servidor embebido: utiliza el puerto por defecto (8081) de nuevo si se inicia sin argumentos
- actualizado el morfologik despalillado biblioteca a la versión 1.7.1 para permitir mejores sugerencias, incluyendo el manejo adecuado de los signos diacríticos y patrones de sustitución (equivalentes de las características del mapa y REP en los diccionarios Hunspell)
- OpenOffice integración / LibreOffice:
- solución: el "Acerca de" de diálogo no funcionaba en Apache OpenOffice 4.0
- fix: normas específicas de cada país (como por British Inglés) no funcionaba
- API:
- En la clase de Lengua, getCountryVariants () ha sido renombrado a getCountries (), y un nuevo método getVariant ha agregado.
- Algunos métodos están en desuso
- Algunos métodos se han trasladado de la clase Herramientas (LanguageTool-core) para la nueva clase CommandLineTools (LanguageTool-comandos)
¿Qué hay de nuevo en la versión 2.2:
¿Qué hay de nuevo en la versión 2.1:
¿Qué hay de nuevo en la versión 2.0:
Requisitos :
- Java 2 Standard Edition Runtime Environment
Comentarios que no se encuentran