¿Qué es OCR?

ocr

El término OCR es el acrónimo en inglés –cuyo significado es sigla que se pronuncia como una palabra y que por el uso termina por lexicalizarse- de Optical Character Recognition, llamado en español “Reconocimiento Óptico de Caracteres”. La creación de esta tecnología data de 1974, y la realizó Raymond Kurzwell (inventor estadounidense, músico, empresario, escritor y científico) para que, originalmente, una pc pueda leer en voz alta un documento impreso a personas ciegas.

Clase: acrónimo.



Definición de OCR



La definición de Reconocimiento Óptico de Caracteres (OCR) es el proceso destinado a digitalizar textos escritos a mano o a máquina en un papel para transformarlos en un documento informático que a su vez, puede modificarse en unaocr computadora. Aquellos escritos son identificados automáticamente por este programa a partir de una imagen, caracteres o también símbolos que pertenecen a un determinado alfabeto. De esta manera se almacenan en forma de datos, y así se puede interactuar con ellos a través de un programa de edición de texto o similar.

Mediante este software también se pueden editar artículos de revista, folletos, contratos en pdf, etc. que se hayan escaneado. Ya que este programa en primer lugar, analiza la estructura de la imagen del documento. Luego, divide la página en elementos tales como bloques de texto, imágenes, tablas si las hay. Divide a su vez las líneas en palabras y luego en caracteres.  Estos son comparados con un conjunto de imágenes del patrón. De esta manera avanza hacia hipótesis sobre qué es ese carácter. Basándose en esas hipótesis, el software analiza las diversas variantes de ruptura de líneas en palabras y de las palabras en caracteres. Luego de efectuar un procesamiento de un número de esas hipótesis probabilísticas, finalmente el programa toma la decisión, y presente el texto reconocido.

Ejemplos de uso y frases

“Para poder utilizar uno u otro programa de OCR se necesita personal capacitado que lo haya aprendido en un tiempo prudencial”. Se refiere en este caso a los conocimientos y tiempo necesario para aprender a trabajar con este software.

“Como el OCR se ha convertido en un gran ayudante, ya hay muchos sitios en internet que permiten acceder a este programa gratuitamente”. En este ejemplo se usa con el sentido de las diferentes páginas que ofrecen bajarlo gratis.

“En la empresa se está realizando conversión de los documentos impresos en archivos informáticos mediante el programa de OCR”. Aquí señala una de sus utilidades dentro de una organización.