L’outil à installer va ouvrir une image ou scanner directement et convertir en texte et en Français.
– OCRfeeder possède un bouton : exporter dans un fichier .odt (Word/Writer)
– YAGF permet le copier-coller du texte brut (encore plus pratique !)
1) Installer Tesseact + module Tesseract en français , via la Logitheque ou via Terminal :
$ sudo apt-get install tesseract-ocr
$ sudo apt-get install tesseract*fr* (pour install modules en français)
2) Utiliser OCR en ligne de commande (test du 22/1/18 : ok)
Comme tesseract lit mal les .PDF > le convert en image :
$ convert devis.pdf -density 300 -depth 8 -strip -background white -alpha off devis.tiff
puis
$ tesseract devis.tiff -l fra devis.txt
Option : On peut aussi installer une interface graphique : OCRfeeder ou YAGF , via la Logitheque ou via Terminal :
soit : sudo apt-get install ocrfeeder
ou mieux : sudo apt-get install yagf