Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
tesseract-ocr [Le 29/10/2018, 16:40] bcag2 [Utilisation] note sur préférer le format tiff |
tesseract-ocr [Le 07/03/2019, 10:14] RolandG [Pour une reconnaissance optique directe dans LibreOffice Writer de fichiers PNG ou JPG] correction ortografic mineure |
||
---|---|---|---|
Ligne 40: | Ligne 40: | ||
Pour traiter plusieurs fichiers, vous pouvez faire : | Pour traiter plusieurs fichiers, vous pouvez faire : | ||
<code>for i in *.jpg ; do tesseract -l fra $i $i.txt; done;</code> | <code>for i in *.jpg ; do tesseract -l fra $i $i.txt; done;</code> | ||
+ | |||
+ | Pour traiter un pdf image de plusieurs pages : | ||
+ | <code>pdftoppm -r 300 -tiff texte.pdf texte | ||
+ | for f in *.tif;do tesseract $f $f -l fra;done | ||
+ | cat *.txt > document.txt</code> | ||
+ | |||
==== Les options de langues ==== | ==== Les options de langues ==== | ||
Ligne 108: | Ligne 114: | ||
- Placez sur le bureau vos fichiers numérisés au format PNG (le mieux est un PNG en valeurs de gris et 300 dpi avec Xsane, mais vous pouvez essayer avec d'autres PNG déjà numérisés), | - Placez sur le bureau vos fichiers numérisés au format PNG (le mieux est un PNG en valeurs de gris et 300 dpi avec Xsane, mais vous pouvez essayer avec d'autres PNG déjà numérisés), | ||
- Vous pouvez placer sur le bureau plusieurs fichiers PNG sur lesquels vous voulez procéder à la reconnaissance optique, mais ne dépassez pas 3-4 fichiers si vous voulez une opération relativement rapide. \\ Les contenus des différents fichiers seront placés les uns à la suite des autres dans un même document Libreoffice. | - Vous pouvez placer sur le bureau plusieurs fichiers PNG sur lesquels vous voulez procéder à la reconnaissance optique, mais ne dépassez pas 3-4 fichiers si vous voulez une opération relativement rapide. \\ Les contenus des différents fichiers seront placés les uns à la suite des autres dans un même document Libreoffice. | ||
- | - Cliquez sur le raccourci précédemment créé ou directement sur le script... patientez un peu... Libreoffice s'ouvrira avec le contenue du texte tel qu'il a été reconnu | + | - Cliquez sur le raccourci précédemment créé ou directement sur le script... patientez un peu... Libreoffice s'ouvrira avec le contenu du texte tel qu'il a été reconnu |
- Il vous reste a effectuer les corrections orthographiques et la mise en page. | - Il vous reste a effectuer les corrections orthographiques et la mise en page. | ||