El OCR consta de reconocimiento óptico de caracteres. El software de OCR permite extraer texto de una imagen y convertirla en un documento de texto editable. Si necesita el texto de una imagen para que no tenga que sentarse y escribir todo el texto. Sólo échele un vistazo al texto y luego usar una herramienta de OCR para convertirlo en texto editable.
Hay muchos software OCR disponibles, sin embargo, la mayoría de ellos tienen más características, pero tiene que instalarlos y son comerciales y costosos. No tiene mucho sentido gastar tanto dinero en él si dispone de herramientas gratuitas.
Pero no se olvide que querrá hacer una comprobación de validez de ese texto que se devuelve a usted, ya que hay una gran cantidad de complicaciones que pueden surgir en el reconocimiento y el proceso de traducción. Pero corregir su texto es mucho más rápido y más fácil que tener que escribir todo en un carácter a la vez.
La tecnología moderna es maravillosa, tomar una imagen escaneada (o tomar una instantánea con una cámara móvil / Digicam) y el software OCR extrae toda la información de la imagen en formato de texto fácilmente editable.
Optical character recognition (OCR) es un sistema de conversión de escaneados impresos / archivos de imágenes escritas a mano en su formato de texto máquina legible. El software de OCR funciona mediante el análisis de un documento y comparándolo con las fuentes almacenadas en su base de datos y / o señalando las características típicas de caracteres. Algunos software de OCR también lo expresan a través de un corrector ortográfico para "adivinar" las palabras no reconocidas. Una precisión del 100% es dificil de conseguir, pero la aproximación cercana es lo por que la mayoría del software lucha.
Tal vez ya sabe cómo extraer texto de imágenes (OCR) de correos y utilizar JOCR, la herramienta gratuita de software OCR. O bien, podría haber establecido su preferencia con algunas herramientas de OCR en línea. Por otra parte, si ha pensado en las maneras de explotar el software de OCR para los atajos de productividad, entonces vamos a darle algunas herramientas más para jugar.
Vamos a describir 5 piezas libres de software OCR y para empezar a ver los dos vecinos que ya están instalados en nuestros sistemas.
OCR con Microsoft OneNote 2007
- Recortes de pantalla del Web
- Copias impresas de documentos o diapositivas en OneNote (Insertar > Archivos como copias impresas)
- Las imágenes realizadas desde su dispositivo móvil con OneNote Mobile, como la imagen de una tarjeta de presentación
- Arrastre desde un escáner o una imagen guardada en OneNote. También puede utilizar OneNote para recortar parte de la pantalla o una imagen en OneNote.
- Haga clic con el botón derecho sobre la imagen insertada y seleccione Copy Text from Picture. El texto copiado ópticamente reconocido entra en el portapapeles y ahora se puede pegar en cualquier programa como Word o Bloc de notas.
OCR usando Microsoft Office Document Imaging
Haciendo uso de la herramienta OCR Document Imaging que es un poco limitante, ya que sólo acepta los formatos TIFF (o MDI). Pero eso no es demasiada molestia ya que cualquier aplicación gráfica se puede utilizar para convertir una imagen a TIFF. Puede utilizar MS Paint para convertir un archivo JPEG a TIFF.
- Abrir el archivo en Microsoft Office Document Imaging – File ““ Abrir.
- Haga clic en el icono – Reconocer Texto Usando OCR.
- Clic en el icono MS Word ““ Enviar Texto a Word.
- Un archivo de MS Word se abre con el texto editable convertido.
- Como alternativa, también se puede usar MS Paint para seleccionar un área específica y copiarla en el portapapeles. Abrir MS Office Document Imaging "" Seleccionar Página "" Pegar para copiar la página de selección de OCR.
Por lo tanto, ahora vamos a dejar a la familia Microsoft atrás y mirar tres herramientas gratuitas que se llaman "software OCR".
SimpleOCR
Si tiene un escaner y desea evitar volver a escribir sus documentos, SimpleOCR es la manera rápida, y libre de hacerlo. El freeware SimpleOCR es 100% libre y no se limita en modo alguno. Cualquier persona puede utilizar SimpleOCR gratis - los usuarios domésticos, las instituciones educativas, incluso los usuarios corporativos.
- El software puede ser configurado para leer directamente desde un escaner o mediante la adición de una página (jpg, tiff, bmp).
- SimpleOCR ofrece cierto control sobre la conversión a través de la selección de texto, la selección de imagen y las características de ignorar texto.
- La conversión a texto toma el proceso en una etapa de validación, el usuario puede corregir las discrepancias en el texto convertido usando un incorporado corrector ortográfico.
- El archivo convertido se pueden guardar en un formato doc o txt.
TopOCR
La imagen procedente de una cámara o un escaner en la ventana de la izquierda se convierte al formato de texto en el editor de texto de la derecha. Las funciones del editor de texto como WordPad pueden utilizar el texto a motor de voz.
- El software soporta los formatos JPEG, TIFF, GIF y BMP.
- Los ajustes de imagen como brillo, color, contraste, afilar, etc, se puede utilizar para mejorar la legibilidad de la imagen.
- La configuración de la cámara de filtro también se puede configurar para mejorar la imagen.
- El archivo convertido se pueden guardar en una variedad de formatos ““ PDF, RTF, HTML y TXT.
- Las funciones TopOCR están bien con el texto directamente orientado, pero la falta de costumbre de OCR con el texto de columnas permanece.
- El software, sin embargo, analiza una página mixta (texto más gráficos) y procesa bien el texto único.
- El software funciona con 11 idiomas.
FreeOCR
FreeOCR tiene una sencilla interfaz de Windows para el código subyacente.
- Es compatible con la mayoría de los archivos de imagen y archivos de varias páginas TIFF.
- Puede manejar formatos PDF y también es compatible con dispositivos TWAIN como escáneres.
- FreeOCR también tiene la interfaz familiar de doble ventana con la configuración fácil de entender.
- Antes de iniciar el proceso de conversión con un solo clic, puede ajustar el contraste de la imagen para una mejor legibilidad.
Aunque las herramientas gratuitas eran adecuadas con el texto impreso, no pudieron con normalidad con el texto manuscrito en cursiva. Mi preferencia personal para el uso de OCR improviso se inclina hacia los dos productos de Microsoft que he mencionado al principio.
Sus propios asuntos dicen. ¿Cuál es su herramienta de elección? ¿Es gratis su software OCR y que reconoce a través de él? Y lo más importante, ¿reconoces lo que tira hacia usted? Háganos saber.
Artículos relacionados:
24 Plantillas Responsive Bootstrap por ThemeForest...
5 Aplicaciones Gratuitas para Desbloquear los Archivos Pdf
Los Mercados Online de Envato:
ebooks, tutoriales, vídeos, cursos, temas para WordPress y App
GT Text también es muy útil
ResponderEliminarhttps://code.google.com/p/gttext/wiki/GTTextES
Gracias! Gracias! Gracias! Gracias!
ResponderEliminarMe has ahorrado un montón de trabajo, es lo que estaba buscando para sacar textos a una web.
Mil gracias!
Un saludo,
Alciia
Hi,
ResponderEliminarVery nice post. There are a lot of efficient ocr software nowadays that can be found online which could help your problems about any type of scanned documents.
http://bit.ly/W1s6Kg