El reconocimiento óptico de caracteres (OCR) es la traducción de mapas de bits ópticamente escaneadas de los caracteres de texto impresos o escritos en códigos de caracteres, como ASCII. Esta es una forma eficaz para convertir materiales impresos en archivos de datos que pueden ser editados y manipulados de otro modo en un equipo. Esta es la tecnología utilizada durante mucho tiempo por las bibliotecas y agencias de gobierno para hacer documentos extensos rápidamente disponible en formato electrónico. Los avances en la tecnología OCR han estimulado su uso cada vez mayor de las empresas. Para muchas tareas documento de entrada, OCR es el más rentable y el método rápido disponible. Y cada año, la tecnología libera acres de espacio de almacenamiento, una vez entregados a armarios y cajas llenas de documentos en papel de archivo. Antes de OCR se puede utilizar, el material de origen deben ser escaneados utilizando un escáner óptico (ya veces una placa de circuito especializado en el PC) para leer en la página como un mapa de bits (un patrón de puntos). También se requiere de software para reconocer las imágenes.
Nuestro paquete de software se propone resolver la clasificación de caracteres y dígitos de los personajes UJI Pluma conjunto de datos utilizando Redes Neuronales manuscritas aisladas. Los datos consisten en muestras de 26 caracteres y 10 dígitos escritos por 11 autores en un Tablet PC. Los personajes (en formato estándar Unipen) están escritos tanto en mayúsculas y minúsculas y hay un conjunto de dos conjunto de caracteres por el escritor. Así que la salida debe estar en una de las clases 35. El objetivo final es la construcción de un modelo independiente escritor para cada personaje.
La selección de las valiosas funciones es crucial en el reconocimiento de caracteres, por lo tanto, un nuevo y significativo conjunto de características, el uniforme Diferencial Normalizado Coordenadas (UDNC), introducida por C. Agell, se adopta. Estas características se muestran para mejorar la tasa de reconocimiento utilizando algoritmos de clasificación simples por lo que se utilizan para entrenar una red neuronal y evalúe su desempeño en la UJI Pen Caracteres conjunto de datos.
Índice Términos:. Matlab, fuente, código, ocr, reconocimiento óptico de caracteres, texto escaneada, texto escrito, ascii, de carácter aislado
Requisitos :
Matlab
Comentarios que no se encuentran