Contenu | Rechercher | Menus

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
tesseract-ocr [Le 27/11/2017, 19:52]
82.232.236.21 [Tesseract OCR]
tesseract-ocr [Le 01/12/2017, 19:36] (Version actuelle)
L'Africain
Ligne 5: Ligne 5:
 ====== Tesseract OCR ====== ====== Tesseract OCR ======
  
-**Tesseract OCR** est un moteur de [[:​ocr|reconnaissance optique de caractères ]] (acronymie : ROC ou OCR en Anglais) qui a été conçu par les ingénieurs de Hewlett Packard<​sup>​®</​sup>​ de 1984 à 1995, avant d'​être abandonné. \\ Après 10 ans de purgatoire, son code est ouvert en 2005, et le développement est repris sous la houlette de Google. \\ Les premiers résultats sont prometteurs. \\ Enfin un bon logiciel libre d'OCR sous %%GNU/​Linux%%?​ L'​avenir nous le dira… Il permet déjà d'​obtenir une reconnaissance optique de qualité sur un certain nombre de documents (sans mise en page complexe).+**Tesseract OCR** est un moteur de [[:​ocr|reconnaissance optique de caractères ]] (acronymie : ROC ou OCR en Anglais) qui a été conçu par les ingénieurs de Hewlett Packard<​sup>​®</​sup>​ de 1984 à 1995, avant d'​être abandonné. \\ Après 10 ans de purgatoire, son code est ouvert en 2005, distribué sous [[wpfr>​Licence Apache]], et le développement est repris sous la houlette de Google. \\ Les premiers résultats sont prometteurs. \\ Enfin un bon logiciel libre d'OCR sous %%GNU/​Linux%%?​ L'​avenir nous le dira… Il permet déjà d'​obtenir une reconnaissance optique de qualité sur un certain nombre de documents (sans mise en page complexe).
  
-La page de la documentation sur Github: ​https://​github.com/​tesseract-ocr/​tesseract/​blob/​master/​README.md+La page de la documentation sur [[https://​github.com/​tesseract-ocr/​tesseract/​blob/​master/​README.md|Github]].
  
 Tesseract a pour vocation d'​être utilisé : Tesseract a pour vocation d'​être utilisé :
   * soit directement,​ en ligne de commandes soit par l'​intermédiaire d'une interface graphique comme [[gscan2pdf|gscan2pdf]] ou [[xsane|xsane]] (cf. aussi [[xsane2tess|xsane2tess]]),​ pour reconnaître du texte avec mise en page basique ; cet usage est déjà fonctionnel.   * soit directement,​ en ligne de commandes soit par l'​intermédiaire d'une interface graphique comme [[gscan2pdf|gscan2pdf]] ou [[xsane|xsane]] (cf. aussi [[xsane2tess|xsane2tess]]),​ pour reconnaître du texte avec mise en page basique ; cet usage est déjà fonctionnel.
   * soit avec des surcouches gérant les mises en page complexes, etc., comme [[:​ocropus]] (encore en [[wpfr>​Version_d'​un_logiciel#​Version_b.C3.AAta|Version Bêta ou β-test]]).   * soit avec des surcouches gérant les mises en page complexes, etc., comme [[:​ocropus]] (encore en [[wpfr>​Version_d'​un_logiciel#​Version_b.C3.AAta|Version Bêta ou β-test]]).
- 
- 
-**Tesseract** est distribué sous [[wpfr>​Licence Apache]], c'​est-à-dire pour simplifier qu'il est [[wpfr>​Open source|Open Source]]—{__**Développement collaboratif du code source**__},​ mais pas [[wpfr>​Copyleft|Copyleft]] —{__**Copie sans abandon des droits inhérents à la création de l’œuvre**__}. 
- 
-===== Pré-requis ===== 
-  * Disposer des [[:​sudo|droits d'​administration]];​ 
-  * Disposer d'une connexion à Internet configurée et activée. 
  
 ===== Installation ===== ===== Installation =====
Ligne 147: Ligne 140:
   * [[https://​github.com/​tesseract-ocr/​tesseract/​wiki/​TrainingTesseract|La page où on parle de l'​apprentissage avec tesseract (anglais)]]   * [[https://​github.com/​tesseract-ocr/​tesseract/​wiki/​TrainingTesseract|La page où on parle de l'​apprentissage avec tesseract (anglais)]]
   * [[:ocr|La page de la documentation francophone Ubuntu sur la reconnaissance optique de caractères]]   * [[:ocr|La page de la documentation francophone Ubuntu sur la reconnaissance optique de caractères]]
-  * <​del>​[[http://​ubunteros.tuxfamily.org/​spip.php?​article148 |Le duo scan2pdf et tesseract sur Linux on the Root (en français)]]</​del>​DELETEME 
   * [[https://​gist.github.com/​stesie/​42dff3d14fbfac60524f381babb8f81d|script « scan2pdf+ocr.sh » sur le GITHUB]]   * [[https://​gist.github.com/​stesie/​42dff3d14fbfac60524f381babb8f81d|script « scan2pdf+ocr.sh » sur le GITHUB]]
 ---- ----
  
 //​Contributeurs : [[:​utilisateurs:​teolemon|Pierre S.]], [[:​utilisateurs:​Hector]] et [[:​utilisateurs:​Sorbus]],​ [[:​utilisateurs:​eagle08]] : liens.// //​Contributeurs : [[:​utilisateurs:​teolemon|Pierre S.]], [[:​utilisateurs:​Hector]] et [[:​utilisateurs:​Sorbus]],​ [[:​utilisateurs:​eagle08]] : liens.//


Le contenu de ce wiki est sous licence : CC BY-SA v3.0