Sitios y programas gratuitos para extraer texto de un documento escaneado y convertir imágenes, faxes y fotocopias en archivos de Word editables

LOC es el acrónimo que significa Optical Character Recognition (reconocimiento óptico de caracteres) y es una tecnología que permite convertir un documento en papel a PDF y en otros formatos, edítelos con programas de texto normales (como Microsoft Word). Sin entrar en detalles técnicos, un software OCR le permite, por lo tanto, tomar la imagen de una hoja escrita y convertirla en un documento digitallisto para editar o compartir rápidamente por correo electrónico.
Este tipo de software es fiel compañero de escánervisto que a menudo se generarán imágenes en lugar de un documento listo para usar; gracias al OCR podemos reconocer textos escritos sobre una imagen JPEG o en otros formatos gráficos y así obtener un texto legible, para ser posteriormente guardado en formato de documento digital (PDF o Word).
En este artículo vemos cuáles son los mejores programas y sitios web gratuitos para convertir un documento en papel (impresión, fax, archivo, etc.) en un documento PDF digital o en un archivo editable (con Microsoft Word o programas similares).
LEA TAMBIÉN: Reconocer y extraer texto de la imagen en Android con aplicaciones de OCR
Programas de conversión de OCR
PDF24Creador
El primer programa que te recomendamos probar para convertir imágenes o fotos a papel y PDF a texto editable es PDF24Creadordescargable desde el sitio oficial.

Con esta potente suite de PDF podemos convertir documentos de texto en papel en PDF editables en unos sencillos pasos. Para usar este programa, abra la aplicación PDF24, presione en el menú Reconocer textopresionamos Agregar archivos y finalmente presionamos arriba comienzo para empezar a reconocer los caracteres escaneados. Al final de la conversión, presione Guardar archivo en la parte superior para guardar los nuevos archivos PDF con el texto escaneado.
microsoft una nota
Otro programa válido que podemos utilizar en nuestro PC para convertir fotos en documentos mediante OCR es el programa microsoft una notadisponible para descarga gratuita desde Microsoft Store.

Para extraer el texto de las imágenes, primero agregue la imagen a una de las notas del programa haciendo clic en en la parte superior insertar y presionando en el menú Imágenes.
Después de agregar la imagen a la página de notas, hacemos clic derecho sobre ella y usamos la voz Copiar texto de la imagen para iniciar el OCR incluido en el programa; si la imagen contiene más páginas para importar también podemos usar la voz Copie el texto de todas las páginas de la impresiónpara obtener todo el texto en OCR.
OpenOCR cognitivo
Si por el contrario buscamos un programa gratuito y de código abierto para utilizar OCR, te aconsejamos que lo pruebes Cognitivo OpenOCR (cuneiforme).

Cognitive OpenOCR (Cuneiform) es un programa de código abierto que le permite realizar el reconocimiento óptico de caracteres (OCR) y, por lo tanto, convertir imágenes en documentos de texto editables con Word u otros programas.
Cuneiform admite 23 idiomas, incluidos El Italiano y tiene algoritmos especiales para reconocer texto de impresoras, faxes y fotocopias. Reconoce automáticamente bloques de texto, tablas e imágenes sin dificultad de uso y conserva perfectamente el diseño de la página.
Para usarlo, simplemente haga clic en el Asistente de reconocimiento y siga los pasos guiados para importar una imagen y convertirla rápidamente en un archivo de texto digital.
Sitios web para conversión OCR
Documentos de Google
Si queremos usar un sitio para convertir hojas de papel y PDF en textos editables, podemos confiar en Documentos de Googlela suite ofimática gratuita ofrecida por Google y accesible en el sitio web oficial.

Para aprovechar esta posibilidad, primero vaya a Google Drive, presione el ícono de ajustes en la esquina superior derecha, abra el menú Ajustes y, en la ventana que aparecerá, active el elemento Convierta los archivos cargados al formato del editor de Google Docs.
Ahora basta con subir cualquier documento PDF o imagen a Google Docs para poder modificarlo con las herramientas que ofrece el sitio, con la conversión OCR que se realizará automáticamente, como también se ve en la guía. Extraiga texto de un PDF o una imagen con Google Docs.
onlineocr.net
Otro servicio web válido para convertir hojas con OCR es onlineocr.net.

Para utilizar este servicio cargamos los archivos de imagen pulsando sobre Selecciona archivosseleccione el idioma del texto, elija el formato del archivo de imagen final (Word o Excel) y finalmente presione la tecla Convertirpara que puedas descargar los documentos de texto editables creados a partir del OCR de las imágenes subidas.
me convierto
Otro servicio web que te recomendamos utilizar para convertir hojas de papel y PDFs en textos editables es me convierto.

Utilizando este servicio tendremos 10 páginas disponibles para convertir gratis, solo tenemos que pulsar el botón Seleccionar archivos (pero también podemos acceder a archivos de imagen desde la nube), esperar el reconocimiento de texto y finalmente comenzar a descargar el documento, que puede guardarse en Word, PDF u otros formatos de texto conocidos.
Otros sitios y programas para OCR
Aunque los sitios y programas vistos anteriormente son capaces de satisfacer todo tipo de tareas donde es necesario utilizar un OCR, en Internet siempre podemos encontrar nuevas herramientas, herramientas y sitios para OCR. Si estamos buscando alternativas válidas, echemos un vistazo a la siguiente información:
- Transcribir texto en fotos con Google Keep es la forma más fácil aunque no funciona con archivos PDF.
- SimpleOCR es un programa sencillo y básico capaz de realizar textos editables escritos en papel y escaneados a la computadora, con reconocimiento óptico de caracteres. Con SimpleOCR es posible convertir cualquier documento en papel en texto electrónico editable para ser utilizado también con Word.
- OCR de pantalla fácil es un programa gratuito para Windows 10 y Windows 7 que te permite extraer y capturar texto de cualquier imagen o captura de pantalla. La herramienta Easy Screen OCR (reconocimiento óptico de caracteres) es capaz de capturar y convertir capturas de pantalla en texto. Puede extraer texto de una imagen, video, sitio web, documentos. Con la tecnología de Google OCR, que garantiza una alta precisión de reconocimiento, este programa gratuito es compatible con más de 100 idiomas.
- Convertidor OCR gratuito de Boxoft es otro gran programa gratuito que le permite extraer texto de todo tipo de imágenes (incluidas las de papel escaneado), en varios idiomas, incluidos inglés, francés, alemán, italiano, holandés, español, portugués y más. Además de imágenes, también puede escanear copias impresas de documentos y convertirlas en texto editable.
- NuevoOCR actualmente solo ofrece extracción de texto de archivos de imágenes y fotos, pero admite algunas otras características que muchos sitios de OCR en línea no ofrecen, como configurar múltiples idiomas de reconocimiento, lo que también es útil para obtener una traducción correcta del texto. Si la imagen está inclinada, también puede rotarla dinámicamente.
- OCR.espacio Definitivamente es una de las opciones más sólidas que hemos encontrado, una de las mejores herramientas de OCR que también admite el formato de archivo WEBP además de PNG, JPG y PDF. Además, no necesita cargar un archivo, puede usar la URL de una imagen en línea. Otras funciones son la rotación automática, el escaneo de recibos, el reconocimiento de mesas y el cambio de tamaño automático. El texto extraído también se puede guardar en un PDF o como un archivo JSON.
- Buen lector en línea es un sitio web para convertir una imagen en un archivo de texto o un archivo pdf en uno de Word, siempre editable. Esta última función, la conversión de archivos de .pdf a .doc también se puede realizar con otro software específico para editar archivos pdf. Cuando hablamos de una imagen convertida en archivo de texto, en este caso, nos referimos a una página escaneada y guardada mediante el programa de gestión de un escáner normal, en un archivo jpeg, gif, bmp o tiff. Para utilizar el sitio es necesario registrarse y se reconoce la conversión de archivos escritos en cualquier idioma, incluyendo el idioma italiano.
- OCR A Palabra es un programa simple y poderoso capaz de extraer texto de un PDF o documento escaneado. El texto extraído se puede editar en Word.
- Captura2Texto es un programa capaz de copiar texto de imágenes fácilmente y con una interfaz muy sencilla de utilizar
Antes de elegir, vamos a probarlos todos, así será más fácil convertir las imágenes que tenemos en documentos digitales perfectos.
Conclusiones
El rendimiento de estos programas depende mucho de la calidad de la imagen que se quiera reconocer y de la sensibilidad del escáner utilizado: se pasa de textos reproducidos de forma idéntica a casos en los que no se reconoce ni una sola palabra.
Todos los programas y sitios web funcionan muy bien, pero el poder de OCR depende mucho de la calidad de la imagen que se envía a estas herramientas avanzadas.
En otra guía hemos visto cómo hacerlo Copie y pegue texto en fotos, imágenes y videos en Internet con Chrome.
Si por el contrario buscamos un programa válido para el escáner en el PC, podemos leer nuestra guía Los mejores programas para usar el escáner con PC con Windows.








