Vous n'êtes pas identifié(e).
Pages :: 1
Allez, ca faisait longtemps que je n'avais pas posté un petit truc ici.. marche uniquement dans le cas de captcha hyper simple .. oubliez les modèles robustes. De toute manière c'est juste un tips, pas une solution prête à l'emploi .. bah oui quoi faut bosser des fois !!
les libs as usual :
les bases :
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
on passe dans le bout de code ci-dessus l'image à la librairie RMagick et on lance une instance de Tesseract, un moteur de reconnaissance d'image bien connu ..
Et enfin la partie la plus intéressante :
La première ligne applique un pré-traitement à l'image, une balance (scale). La ligne suivante décode le contenu du texte, et la dernière l'affiche.
Il y a déjà de quoi s'amuser dans le sens où la librairie RMagick contient un paquet de filtre à appliquer, donc vous pourrez prendre une image, la modifier dans tous les sens pour voir si un des filtres marche bien. De mon coté, et ca fera peut être l'objet d'un autre topic si ca intéresse, je bosse sur une solution de captcha audio (enfin pas que ca, mais entre autre).
edit : another tips dans la foulée, il faut agrandir l'image source pour une meilleure reconnaissance .. et sinon une petite recherche gg sur => captcha tesseract
Dernière modification par conquering_lion (2014-03-15 15:32:30)
🔴 Hors ligne
humm, interessant...
Tu obtient de bon % de resultat ?
Ou c'est juste pour le fun ?
Je connaissait pas tesseract, a tester
----
Chili con seo
🔴 Hors ligne
tu as aussi le logiciel eponyme tessercap .. sous windows
sinon j'ai testé rapidement sur des images contenant du texte simple et pas trop biscornu et ca marche pas mal .. mais faut inclure du pre traitement d'images pour que ca soit plus robuste
🔴 Hors ligne
Pages :: 1