5 Herramientas de Software Gratuito de OCR Para Convertir Imágenes en TextoSocial Media

viernes, 24 de agosto de 2012

5 Herramientas de Software Gratuito de OCR Para Convertir Imágenes en Texto

Thai OCR in Abbyy FineReader Pro 9

El OCR consta de reconocimiento óptico de caracteres. El software de OCR permite extraer texto de una imagen y convertirla en un documento de texto editable. Si necesita el texto de una imagen para que no tenga que sentarse y escribir todo el texto. Sólo échele un vistazo al texto y luego usar una herramienta de OCR para convertirlo en texto editable.

Hay muchos software OCR disponibles, sin embargo, la mayoría de ellos tienen más características, pero tiene que instalarlos y son comerciales y costosos. No tiene mucho sentido gastar tanto dinero en él si dispone de herramientas gratuitas.

Pero no se olvide que querrá hacer una comprobación de validez de ese texto que se devuelve a usted, ya que hay una gran cantidad de complicaciones que pueden surgir en el reconocimiento y el proceso de traducción. Pero corregir su texto es mucho más rápido y más fácil que tener que escribir todo en un carácter a la vez.

http://amzn.to/1KXcDTH

La tecnología moderna es maravillosa, tomar una imagen escaneada (o tomar una instantánea con una cámara móvil / Digicam) y el software OCR extrae toda la información de la imagen en formato de texto fácilmente editable.

Optical character recognition (OCR) es un sistema de conversión de escaneados impresos / archivos de imágenes escritas a mano en su formato de texto máquina legible. El software de OCR funciona mediante el análisis de un documento y comparándolo con las fuentes almacenadas en su base de datos y / o señalando las características típicas de caracteres. Algunos software de OCR también lo expresan a través de un corrector ortográfico para "adivinar" las palabras no reconocidas. Una precisión del 100% es dificil de conseguir, pero la aproximación cercana es lo por que la mayoría del software lucha.

Tal vez  ya sabe cómo extraer texto de imágenes (OCR) de correos y utilizar JOCR, la herramienta gratuita de software OCR. O bien, podría haber establecido su preferencia con algunas herramientas de OCR en línea. Por otra parte, si ha pensado en las maneras de explotar el software de OCR para los atajos de productividad, entonces vamos a darle algunas herramientas más para jugar.

Vamos a describir 5 piezas libres de software OCR y para empezar a ver los dos vecinos que ya están instalados en nuestros sistemas.

OCR con Microsoft OneNote 2007


Para el ocasional OCR básico, MS OneNote tiene función óptica de reconocimiento de caracteres que es un ahorro de tiempo. Es posible que lo haya perdido "| Se llama Copiar Texto de Imagen. OneNote puede reconocer el texto incluido en imágenes que haya insertado en sus notas. Esto le permite volver a utilizar o buscar la información de su bloc de notas, aunque esté dentro de imágenes, como:
  • Recortes de pantalla del Web
  • Copias impresas de documentos o diapositivas en OneNote (Insertar > Archivos como copias impresas)
  • Las imágenes realizadas desde su dispositivo móvil con OneNote Mobile, como la imagen de una tarjeta de presentación
  • Arrastre desde un escáner o una imagen guardada en OneNote. También puede utilizar OneNote para recortar parte de la pantalla o una imagen en OneNote.
  • Haga clic con el botón derecho sobre la imagen insertada y seleccione Copy Text from Picture. El texto copiado ópticamente reconocido entra en el portapapeles y ahora se puede pegar en cualquier programa como Word o Bloc de notas.
OneNote es la simplicidad personificada. Pero no es demasiado grande para los caracteres escritos a mano o en sus formas más difusas. Pero para un trabajo rápido, yo estoy a favor del clip de OneNote.

OCR usando Microsoft Office Document Imaging


Otra herramienta poco utilizada dentro de la familia Microsoft. Está ahí en el MenúMicrosoft Office ““ Herramientas Microsoft Office – Microsoft Office Document Imaging.

Haciendo uso de la herramienta OCR Document Imaging que es un poco limitante, ya que sólo acepta los formatos TIFF (o MDI). Pero eso no es demasiada molestia ya que cualquier aplicación gráfica se puede utilizar para convertir una imagen a TIFF. Puede utilizar MS Paint para convertir un archivo JPEG a TIFF.

  • Abrir el archivo en Microsoft Office Document Imaging – File ““ Abrir.
  • Haga clic en el icono – Reconocer Texto Usando OCR.
  • Clic en el icono MS Word  ““ Enviar Texto a Word.
  • Un archivo de MS Word se abre con el texto editable convertido.
  • Como alternativa, también se puede usar MS Paint para seleccionar un área específica y copiarla en el portapapeles. Abrir MS Office Document Imaging "" Seleccionar Página "" Pegar para copiar la página de selección de OCR.
Una vez más, MODI (MS Office Document Imaging) maneja hábilmente texto impreso, pero mi texto manuscrito fue recibido con un "~ OCR realizado pero no podía reconocer el texto del mensaje. Por supuesto, inténtalo con su puño y letra.

Por lo tanto, ahora vamos a dejar a la familia Microsoft atrás y mirar tres herramientas gratuitas que se llaman "software OCR".

SimpleOCR


SimpleOCR es el popular software freeware de OCR con cientos de miles de usuarios en todo el mundo. SimpleOCR es también libre de regalías SDK OCR para que los desarrolladores lo utilicen en sus aplicaciones personalizadas.

Si tiene un escaner y desea evitar volver a escribir sus documentos, SimpleOCR es la manera rápida, y libre de hacerlo. El freeware SimpleOCR es 100% libre y no se limita en modo alguno. Cualquier persona puede utilizar SimpleOCR gratis - los usuarios domésticos, las instituciones educativas, incluso los usuarios corporativos.
  • El software puede ser configurado para leer directamente desde un escaner o mediante la adición de una página (jpg, tiff, bmp).
  • SimpleOCR ofrece cierto control sobre la conversión a través de la selección de texto, la selección de imagen y las características de ignorar texto.
  • La conversión a texto toma el proceso en una etapa de validación, el usuario puede corregir las discrepancias en el texto convertido usando un incorporado corrector ortográfico.
  • El archivo convertido se pueden guardar en un formato doc o txt.
SimpleOCR estaba bien con texto normal, pero su manejo con los diseños de varias columnas dan un bajón. En mi opinión, la precisión de la conversión de las herramientas de Microsoft era considerablemente mejor que SimpleOCR. SimpleOCR (v3.1) es una descarga de 9 MB y es compatible con Windows.

TopOCR


TopOCR está diseñado para ser simple y fácil de usar para la digitalización de documentos con cámaras fotográficas, cámaras de documentos, cámaras web, teléfonos inteligentes, enfoque automático y sí, incluso los escáneres. Sólo tiene que conectar el dispositivo en el puerto USB de su PC, y puede abrir archivos de imagen en la ventana de la imagen y ver automáticamente el resultado del OCR en la ventana de texto. TopOCR combina un completo editor de imagen y funciones del procesador de textos con procesamiento avanzado de imágenes de alta velocidad y tecnología de reconocimiento óptico de caracteres. Para cámaras de documentos y cámaras web de enfoque automático, un solo clic con el botón "Previsualización" en tiempo real la imagen de la webcam y el diálogo "Capture" hace que sea fácil el colocar adecuadamente los documentos para escanear.

La imagen procedente de una cámara o un escaner en la ventana de la izquierda se convierte al formato de texto en el editor de texto de la derecha. Las funciones del editor de texto como WordPad pueden utilizar el texto a motor de voz.
  • El software soporta los formatos JPEG, TIFF, GIF y BMP.
  • Los ajustes de imagen como brillo, color, contraste, afilar, etc, se puede utilizar para mejorar la legibilidad de la imagen.
  • La configuración de la cámara de filtro también se puede configurar para mejorar la imagen.
  • El archivo convertido se pueden guardar en una variedad de formatos ““ PDF, RTF, HTML y TXT.
  • Las funciones TopOCR están bien con el texto directamente orientado, pero la falta de costumbre de OCR con el texto de columnas permanece.
  • El software, sin embargo, analiza una página mixta (texto más gráficos) y procesa bien el texto único.
  • El software funciona con 11 idiomas.
Para obtener los mejores resultados con su cámara leer aquí: Cómo conseguir los mejores resultados con TopOCR. TopOCR (v4.4) es una descarga de aproximadamente 8 MB y es compatible con Windows. 

FreeOCR


Este software gratuito de OCR utiliza el motor de OCR Tesseract. Tesseract OCR, este código fue desarrollado en los laboratorios de HP entre 1985 y 1995 y en la actualidad con Google. Está considerado como uno de los más precisos motores de OCR de código abierto disponibles.

FreeOCR tiene una sencilla interfaz de Windows para el código subyacente.
  • Es compatible con la mayoría de los archivos de imagen y archivos de varias páginas TIFF.
  • Puede manejar formatos PDF y también es compatible con dispositivos TWAIN como escáneres.
  • FreeOCR también tiene la interfaz familiar de doble ventana con la configuración fácil de entender.
  • Antes de iniciar el proceso de conversión con un solo clic, puede ajustar el contraste de la imagen para una mejor legibilidad.
FreeOCR (v.2.03) require Microsoft Net 2.0 framework. El Software compatible (4.38MB)  para Windows XP/Vista también se puede descargar desde este sitio alternativo.

Las herramientas FreeOCR vienen con sus propias limitaciones. Y si está escaneando una página tiene que ver mucho con las resoluciones, los contrastes y la claridad de las fuentes. Desde la perspectiva de un usuario medio, el 100% de precisión OCR sigue siendo una quimera.

Aunque las herramientas gratuitas eran adecuadas con el texto impreso, no pudieron con normalidad con el texto manuscrito en cursiva. Mi preferencia personal para el uso de OCR improviso se inclina hacia los dos productos de Microsoft que he mencionado al principio.

Sus propios asuntos dicen. ¿Cuál es su herramienta de elección? ¿Es gratis su software OCR y que reconoce a través de él? Y lo más importante, ¿reconoces lo que tira hacia usted? Háganos saber.

Artículos relacionados:

24 Plantillas Responsive Bootstrap por ThemeForest...
5 Aplicaciones Gratuitas para Desbloquear los Archivos Pdf



Los Mercados Online de Envato: ebooks, tutoriales, vídeos, cursos, temas para WordPress y App

Enhanced by Zemanta

3 comentarios :

  1. GT Text también es muy útil
    https://code.google.com/p/gttext/wiki/GTTextES

    ResponderEliminar
  2. Gracias! Gracias! Gracias! Gracias!
    Me has ahorrado un montón de trabajo, es lo que estaba buscando para sacar textos a una web.
    Mil gracias!
    Un saludo,
    Alciia

    ResponderEliminar
  3. Hi,

    Very nice post. There are a lot of efficient ocr software nowadays that can be found online which could help your problems about any type of scanned documents.
    http://bit.ly/W1s6Kg

    ResponderEliminar

Puedes dejar tu comentario--muchas gracias--You can leave a comment-- Thank you very much--