Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
ocr [Le 13/09/2017, 08:22]
77.204.135.22
ocr [Le 29/05/2018, 13:40]
93.24.31.3 avec yassin
Ligne 18: Ligne 18:
 ====Cuneiform ==== ====Cuneiform ====
  
-[[http://​cognitiveforms.com/​ru/​products_and_services/​Cuneiform.html#​1189-Cuneiform|cuneiform]] (en russe, ou en [[http://​en.cognitiveforms.ru/​products/​cuneiform/​|anglais]]) est un OCR multi-plateforme,​ qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'​erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'​image. Il supporte les fichiers images en bmp, png, tiff,  Il peut exporter en format texte, html, rtf, et d'​autres.+[[http://​cognitiveforms.com/​ru/​products_and_services/​Cuneiform.html#​1189-Cuneiform|cuneiform]] (en russe, ou en [[http://​en.cognitiveforms.ru/​products/​cuneiform/​|anglais]]) est un OCR multi-plateforme,​ qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'​erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'​image. Il supporte les fichiers images en bmp, jpg, png, tiff,  Il peut exporter en format texte, html, rtf, et d'​autres.
  
 Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://​code.launchpad.net/​cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://​launchpad.net/​cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. ​ Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://​code.launchpad.net/​cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://​launchpad.net/​cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. ​
Ligne 81: Ligne 81:
   * Choisir son moteur d'OCR : ouvrir Xsane et dans //​Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par :    * Choisir son moteur d'OCR : ouvrir Xsane et dans //​Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : 
       * pour  **gocr** avec la reconnaissance des caractères accentués <​code>​gocr -f UTF8</​code>​       * pour  **gocr** avec la reconnaissance des caractères accentués <​code>​gocr -f UTF8</​code>​
-      * pour **tesseract** <code >​xsane2tess ​ -l  fra</​code>​+      * pour **tesseract** <code >​xsane2tess -l fra</​code>​
       * pour **cuneiform** <code >​cuneiform -l fra</​code>​       * pour **cuneiform** <code >​cuneiform -l fra</​code>​
   * dans la zone à droite de la cible, sélectionner //​Enregistrer//​ ;​   * dans la zone à droite de la cible, sélectionner //​Enregistrer//​ ;​
Ligne 139: Ligne 139:
  
 ==== gImageReader ==== ==== gImageReader ====
- +[[gimagereader|gImageReader]] est une interface graphique très simple d'​emploi pour **[[:tesseract-ocr|tesseract-ocr]]**.\\
-{{ gimagereader_xenial.png?​450}} +
-[[https://​github.com/​manisandro/​gImageReader|gImageReader]] est une interface graphique ​pour **tesseract-ocr** sous [[:Gnome]]. Il est très simple d'​emploi.\\ +
-Pour l'​utiliser,​ [[:​tutoriel:​comment_installer_un_paquet|installez le paquet]] ** [[apt>​gimagereader]]** et pour avoir la reconnaissance du français le paquet ​**[[apt>tesseract-ocr-fra]]**. +
- +
- +
-Fonctionnalités :​ +
-    -Traite images et fichiers PDF, +
-    -Acquisition depuis scanner, +
-    -Sélection des parties de l'​image à traiter, +
-    -Supporte différentes langues, +
-    -Comparaison cote à cote de la source et du résultat,​ +
-    -Supprime les saut de lignes dans le texte résultant,​ +
-    - prise en charge des dictionnaires myspell, +
-    - lecture des lignes tordues, +
-    - interface graphique ergonomique. +
  
 ==== YAGF ==== ==== YAGF ====
 [[YAGF]] est une interface graphique pour [[#​cuneiform|cuneiform]] (donc une bonne capacité de reconnaissance comme indiqué plus haut) et [[#​tesseract|tesseract]]. [[YAGF]] est une interface graphique pour [[#​cuneiform|cuneiform]] (donc une bonne capacité de reconnaissance comme indiqué plus haut) et [[#​tesseract|tesseract]].
  
-**(en)** [[http://​symmetrica.net/​cuneiform-linux/​yagf-en.html|Site officiel du logiciel]]+**(en)** [[http://​symmetrica.net/​cuneiform-linux/​yagf-en.html|Site officiel du logiciel]] ​LIEN POLLUÉ
  
  
  • ocr.txt
  • Dernière modification: Le 09/04/2024, 20:21
  • par UntuJLuc