Foro de elhacker.net

Programación => PHP => Mensaje iniciado por: uluigi en 23 Julio 2015, 11:13 am



Título: [Duda] Lectura de una imagen y transformación a texto en PHP
Publicado por: uluigi en 23 Julio 2015, 11:13 am
Tengo una duda y es que me gustaría saber si hay alguna forma de leer una imagen monocromática con PHP en la que sólo los colores negro y blanco definieran los números 0 y 1 y pasar el texto por pantalla con un echo.

La cosa sería hacer que la función lea de izquierda a derecha y de arriba a abajo.

Espero que podáis aclarar mi duda, un saludo.


Título: Re: [Duda] Lectura de una imagen y transformación a texto en PHP
Publicado por: engel lex en 23 Julio 2015, 11:20 am
nunca lo he intentado, pero lo que buscas se llama "OCR"

creo que esto te puede ayudar
http://www.tufuncion.com/phpocr (http://www.tufuncion.com/phpocr)
https://code.google.com/p/php-tesseract/ (https://code.google.com/p/php-tesseract/)


Título: Re: [Duda] Lectura de una imagen y transformación a texto en PHP
Publicado por: moikano→@ en 23 Julio 2015, 13:00 pm
Con tesseract se puede sacar incluso algunos catchas. Eso si, tienes que tratar la imagen antes y hacer pruebas para sacar el máximo de carácteres correctos.

Alguna de las combinaciones se necesita convertir la imagen a otros formatos, ya que tesseract ( al menos cuanod yo lo usaba ) transforma con ficheros tiff.

El programa que yo usaba, aparte de tesseract, era convert, para transformar la imagen de tamaño, colores, saturacion,hacer mas finas las líneas o mas gordas,...

Te paso un par de ejemplos de comandos que usaba entonces, no te digo lo que hacen exactamente porque no me acuerdo y no tengo tiempo de desmigarlos.
Por cierto, en tesseract puedes decirle que busque un número concreto de carácteres y también un rango, de esta forma es mas fino a la hora de acertar.

Código:
convert a68954685dd.png -resize 700% captchar.tif  &&  convert captchar.tif -threshold 50% captchabw.tif  &&  convert captchabw.tif -negate captchan.tif  &&  convert captchan.tif -morphology Erode Disk:8 captchae.tif  &&  convert captchae.tif -morphology Dilate Disk:13 captchad.tif  &&  convert captchad.tif -crop 660x310+20+20 captchac.tif  &&  convert captchac.tif -negate captchaf.tif  &&  convert captchaf.tif -resize 20% captchaff.tif  &&  tesseract -psm 8 captchaff.tif captcha config.tess  &&  cat captcha.txt

Código:
convert 53394E8000005431.jpeg -compress none -threshold 30% captchabw.tif && tesseract -psm 8 captchabw.tif captcha config.tess && cat captcha.txt && display captchabw.tif

Suerte.