Para ser sincero, la investigación de OCR para el análisis de documentos no es realmente uno de los campos “candentes” en la investigación en este momento. Muchas empresas comerciales tienen marcos decentemente precisos para el análisis y la conversión de documentos.
Sin embargo, en una línea similar, tiene detección de texto de escena. Eso ha despegado en los últimos tiempos con una gran cantidad de investigación sobre cómo se comportan las redes profundas al clasificar y localizar texto en imágenes naturales. También ha demostrado ser un campo con múltiples aplicaciones que incluyen VR, AR, publicidad y navegación. Para una tesis de MTech, le sugiero que mire el reconocimiento y la localización del texto de la escena utilizando principios de aprendizaje profundo junto con el procesamiento del lenguaje natural. Si puede trabajar en la creación de un marco que combine lo mejor del procesamiento del lenguaje natural y la visión por computadora para reconocer mejor el texto encontrado en imágenes naturales, le sugiero que lo consulte con su profesor.