Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
ocropus [Le 12/07/2017, 16:32] L'Africain mise en forme wiki |
ocropus [Le 11/09/2022, 11:34] (Version actuelle) moths-art Suppression des espaces en fin de ligne (détecté et corrigé via le bot wiki-corrector (https://forum.ubuntu-fr.org/viewtopic.php?id=2067892) |
||
---|---|---|---|
Ligne 5: | Ligne 5: | ||
====== OCRopy : pour une ROC avec prise en compte de la mise en page ====== | ====== OCRopy : pour une ROC avec prise en compte de la mise en page ====== | ||
- | **OCRopy**, autrefois **OCRopus** est en passe de devenir un outil performant de reconnaissance optique de caractères (ROC/OCR), utilisant notamment le moteur de ROC Tesseract, et capable d'analyser une mise en page complexe (contenant par exemple des colonnes et des encadrés). OCRopus ne reconstitue pas la mise en page dans un traitement de texte, mais effectue la ROC dans un ordre logique après avoir analysé la mise en page. Même si son utilisation en ligne de commande est très simple, OCRopus n'est pas encore disponible sous forme d'interface graphique, ni intégré dans un outil graphique déjà existant (comme [[gscan2pdf]] ou [[XSane]]...)... | + | **OCRopy**, autrefois **OCRopus** est en passe de devenir un outil performant de reconnaissance optique de caractères (ROC/OCR), utilisant notamment le moteur de ROC Tesseract, et capable d'analyser une mise en page complexe (contenant par exemple des colonnes et des encadrés). OCRopus ne reconstitue pas la mise en page dans un traitement de texte, mais effectue la ROC dans un ordre logique après avoir analysé la mise en page. Même si son utilisation en ligne de commande est très simple, OCRopus n'est pas encore disponible sous forme d'interface graphique, ni intégré dans un outil graphique déjà existant (comme [[gscan2pdf]] ou [[XSane]]...)... |
=====Pré-requis===== | =====Pré-requis===== | ||
Ligne 24: | Ligne 24: | ||
====Utilisation==== | ====Utilisation==== | ||
Pour tester si cela fontionne, lancez la commande (toujours dans le dossier **ocropy** : <code>./run-test</code> | Pour tester si cela fontionne, lancez la commande (toujours dans le dossier **ocropy** : <code>./run-test</code> | ||
- | Pour utiliser ocropy, lancez la commande suivantes successivement, (ici l'exemple test/ersch.png doit être modifier par le chemin de votre image à reconnaître) : <code bash> | + | Pour utiliser ocropy, lancez successivement les commandes suivantes (en remplaçant test/ersch.png par le chemin de votre image à reconnaître) : <code bash> |
# perform binarization | # perform binarization | ||
./ocropus-nlbin tests/ersch.png -o book | ./ocropus-nlbin tests/ersch.png -o book | ||
Ligne 47: | Ligne 47: | ||
</code> | </code> | ||
- | FIXME où trouver des modèles en français?? | + | ===== Modèles ===== |
+ | Comme indiqué [[https://github.com/tmbarchive/ocropy/tree/master/models|sur le github d'ocropy]], on peut trouver différents modèles (à enregistrer dans le dossier 'models/' du répertoire d'installation) ici: | ||
+ | https://github.com/tmbarchive/ocropy/wiki/Models | ||
===== Désinstallation ===== | ===== Désinstallation ===== | ||
Supprimez le dossier téléchargé avec git (ocropy). | Supprimez le dossier téléchargé avec git (ocropy). | ||
Ligne 54: | Ligne 57: | ||
===== Références ===== | ===== Références ===== | ||
- | * [[http://askubuntu.com/questions/686513/ocropus-installing-problem|La source de la partie installation de cette documentation]] (en), | + | * [[https://askubuntu.com/questions/686513/ocropus-installing-problem|La source de la partie installation de cette documentation]] (en), |
* [[https://github.com/tmbdev/ocropy| le site officiel sur github]] (en), | * [[https://github.com/tmbdev/ocropy| le site officiel sur github]] (en), | ||
* [[tesseract-ocr]], | * [[tesseract-ocr]], | ||
* [[:XSane]], | * [[:XSane]], | ||
- | * [[http://graal.hypotheses.org/786|Tuto pour ROC sur des manuscrits]] (en), | + | * [[https://graal.hypotheses.org/786|Tuto pour ROC sur des manuscrits]] (en), |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr). | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=78804| Le fil de discussion du forum Ubuntu-fr dédié à la Reconnaissance Optique de Caractères.]] (fr). |
------ | ------ |