Comment créer un pdf oceriser ?

Rédigé par pul le 17 mai 2013 | Classé dans Non classé
Mots clés : oceriser, pdf, ocr, hocr, tesseract, google books

6038 commentaires

Voilà vous avez déjà du voir que sur les livres de google books on pouvant sélectionner le texte, alors que le pdf contenait une image, je vais vous expliquer comment faire.

Il faut installer exactimage, et tesseract ou tout autre ocr qui fournit le format hocr en sortie

Puis créer un fichier "config" vous mettez dedans "tessedit_create_hocr T" c'est tout, vous enregistrez

puis en ligne de commande mettez:

"tesseract votre_fichier_a_oceriser output config"

puis enfin:

"hocr2pdf -i votre_fichier_a_oceriser -o le_nom_du_pdf_que_vous_creez.pdf < output"

Et vous vous retrouverez avec un pdf oceriser

MATHS

PHYSIQUE

LATEX

OCAML/CAML

AUTRE

CONSEILS

Creative Commons License