1106 shaares
4 results
tagged
OCR
source : http://www.barryhubbard.com/linux/converting-pdf-to-text-using-tesseract/
imagemagic me donnant des erreurs, je suis passé par ghostscript en utilisant ce script bash.
Le résultat est parfait! Et je dois noté qu'avec cette méthode, cela consomme beaucoup moins de ressources machine.
imagemagic me donnant des erreurs, je suis passé par ghostscript en utilisant ce script bash.
Le résultat est parfait! Et je dois noté qu'avec cette méthode, cela consomme beaucoup moins de ressources machine.
Parce que j'avais oublié
convert -density 300 file.pdf -depth 8 file.tiff
tesseract file.tiff output
600dpi peux aussi être utilisé
convert -density 300 file.pdf -depth 8 file.tiff
tesseract file.tiff output
600dpi peux aussi être utilisé
Online OCR tool (français aussi)
Un projet a suivre. archivage numerique.