ATENCIÓN: este contenido tiene más de 2 años de antigüedad y, debido a su temática, podría contener información desactualizada o inexacta en la actualidad.

La tecnología de reconocimiento óptico de caracteres (OCR) permite crear aplicaciones avanzadas basadas en reconocer e interpretar la escritura. Con un OCR se pueden reconocer los textos que se ven en una imagen y acceder a ellos como si fueran texto. Esto permite crear todo tipo de aplicaciones: traducción, búsqueda de textos dentro de imágenes, extraer el texto de un artículo a partir de una foto, etc...
La tecnología capaz de hacer esto con confianza no está al alcance de cualquiera pues se requieren algoritmos avanzados de visión artificial, procesos heurísticos que van a aprendiendo con la práctica, disponer de un gran diccionario de palabras en varios idiomas...
Ahora Microsoft ha liberado su Microsoft OCR Library for Windows Runtime, en formato de paquete NuGet para usar directamente desde Visual Studio. Esta biblioteca es totalmente gratuita y siempre lo va a ser, incluyendo sus mejoras futuras.
Funciona en Windows 8 y Windows Phone 8, no requiere comunicaciones ya que se ejecuta totalmente en el dispositivo, soporta 21 idiomas y permite tomar las imágenes desde varias fuentes: las cámaras del dispositivo, el sistema de archivos o recursos de red. En tus programas además puedes efectuar reconocimientos de texto especializados, como por ejemplo obtener todas las direcciones de email, números de teléfono o direcciones web que hay en una imagen. Aparte, claro está, de hacer reconocimiento de texto en general.
MSDN ya tiene la documentación disponible sobre la biblioteca OCR, y además existe una aplicación OCR completa de ejemplo desarrollada para que te sirva de base.
Fecha de publicación: