Questions générales sur Manjaro Linux.
S'il vous plaît, avant de poster, essayez la fonction de recherche du forum.
Répondre

Recherche application spécifique

#1Messageil y a 4 ans

Bonsoir,

Dans le cadre de mon deuxième boulot, qui consiste en la fabrication de livres au format ePub, j'ai un petit problème.

En effet, j'avais le projet de tout faire sous Linux, ce qui n'est pas évident.

En effet, au niveau de l'OCR (logiciel de reconnaissance de caractères), sous Linux et Manjaro en particulier, j'utilise Tesseract qui s'est pas mal amélioré.

J'utilise aussi Scantailor, excellent logiciel de découpe et de mise en forme d'images qui proviennent de scans.

Mais pour pouvoir utiliser ce dernier, je dois absolument faire la conversion des PDF au format images. C'est-à-dire découper chaque page d'un PDF et le convertir en images de préférence au format tiff ou png.

Si vous connaissiez des logiciels que vous avez employés sous Manjaro afin de faire ces découpes et conversions, voulez-vous bien m'aider en m'en signalant le(s) meilleur(s) que vous avez employé(s) ?

Merci beaucoup.

Recherche application spécifique

#2Messageil y a 4 ans

Bonsoir Obélix j'ai un peut chercher et j'ai trouver une liste de programme qui peuvent faire de l'ocr sur des documents pdf.

https://doc.ubuntu-fr.org/ocr

Edit :

Après en avoir tester je te conseil

gimagereader-gtk avec tesseract-data-fra pour le français. Il marche plutôt pas mal ( tester avec pdf et image et gère les scan )

Recherche application spécifique

#3Messageil y a 4 ans

Merci beaucoup Cyberdr3am.

Je connais ce logiciel et l'ai déjà installé.

Ce que je cherche, je me suis peut-être mal exprimé est un logicile de découpe de PDF en images et qui convertit ces images en tiff, png.

Tout ceci afin de les optimiser avec scantailor et employer tesseract et le logiciel ocr que tu m'as donné pour faire la reconnaissance de caractères.

En effet, si ces images ne sont pas retravaillées, l'ocr est épouvantable ;)

Recherche application spécifique

#4Messageil y a 4 ans

Gimp peut ouvrir des fichier pdf et tu peut les enregistrer au format image sinon en ligne de commande ImageMagick avec la commande convert

Edit : Je n'ai pas eu de soucis avec les pdf en ocr sans retoucher les images tu a bien installer le français ?

Recherche application spécifique

#5Messageil y a 4 ans

:salut:
Il y a dans Aur:

aur/cups-ocr 0.1.2-4 (1) (0,00)
    Print directly to a tiff file which feeds an OCR engine which will output 
    a text file. Modelled after cups-pdf.
On devrait pouvoir "imprimer dans un fichier", mais pas sur que ce soit pratique.
Sinon, perso j'utilise tout simplement xfce4-screenshooter en mode sélection de zone (3), et j'enregistre au format jpeg. Il suffit de sélectionner via un cadre ce que tu veux utiliser.
J'ai traduit un mode d'emploi d'un auto-cuiseur écrit en langage exotique comme ça. :mrgreen:

Recherche application spécifique

#6Messageil y a 4 ans

Salut,

Je ne comprends pas trop pourquoi tu pars d'un format pdf alors que tu peux scanner directement au format tiff.
Inkscape permet d'éditer des documents pdf.
Je n'ai que l'expérience de création d'epub à partir de textes ou de modification d'epubs existants.
Les éditeurs d'ebooks comme Calibre ou Sigil acceptent le format html, si ton pdf était un document fini, une conversion pdf vers html suffirait.

Recherche application spécifique

#7Messageil y a 4 ans

Salut,

Pas trop sur de bien répondre à ta demande mais je te propose les logiciels suivants: :saispas::roll::o

gimagereader

pdfarranger

Recherche application spécifique

#8Messageil y a 4 ans

Smurf a écrit : il y a 4 ans Salut,

Je ne comprends pas trop pourquoi tu pars d'un format pdf alors que tu peux scanner directement au format tiff.
Inkscape permet d'éditer des documents pdf.
Je n'ai que l'expérience de création d'epub à partir de textes ou de modification d'epubs existants.
Les éditeurs d'ebooks comme Calibre ou Sigil acceptent le format html, si ton pdf était un document fini, une conversion pdf vers html suffirait.
Car parfois, je ne suis pas obligé de scanner moi-même.
Soit ce sont des scans récupérés chez Gallica, soit ce sont d'autres membres de chez Ebooks libres et gratuits qui me fournissent les scans qui sont déjà en format pdf ;)

Gimagereader a ,malheureusement, sur de gros projets, la fâcheuse habitude de planter (même avec 16 Go de Ram).
L'autre, je ne connais pas, c'est à tester :)
Répondre