Salut,
J’ai un petit paquet d’image de pas trop mauvaise qualité tiré d’une vidéo contenant du texte parfaitement lisible a l’œil mais que je n’arrive pas a extraire via l’OCR tesserac.
J’ai trouvé un script basé sur imageMagic qui est censé améliorer la lisibilité des images pour les OCR mais ça ne donne pas grand chose entre mes mains. Il y a quelques paramètres à ajuster et je n’ai pas l’impression de trouver les bon réglages.
Le truc c’est que en passant par une GUI windows propriétaire (TopOCR) de cet OCR et en appliquant un filtre maison («MagnifyX2») j’obtiens des résultats tout a fait correcte. J’ai même repris l’image «améliorée» par ce soft et fait passé à la main l’OCR et il me ressort les même résultats. Le truc c’est que je sais qu’il double la taille de l’image et la passe en nuance de gris, mais à part ça je ne sais pas et ça doit se jouer a pas grand chose.
Donc je sais que c’est le pré-traitement qui me fait défaut pour automatiser toute ma chaîne de reconnaissance.
Donc si certain ont une idée, ou des compétences (je peux transmettre les images) pour me faire avancer ça serais sympa.