Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
reconnaissance_vocale [Le 04/11/2007, 14:39]
teolemon
reconnaissance_vocale [Le 15/02/2024, 18:30] (Version actuelle)
bjacquem [Dictée vocale en ligne]
Ligne 1: Ligne 1:
-Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.+{{tag>​portail accessibilité audio multimédia}}
  
-Il est à noter que KDE intègre d'ores et déjà un module de reconnaissance vocale basique basée sur CMU Sphinx, mais beaucoup plus simple à utiliser et intégré en série.+----
  
-Gnome possède également une telle fonctionnalité,​ mais il faut l'​installer en installant gnome-voice-control+====== Reconnaissance vocale ======
  
-Enfin, pour aider l'​amélioration des modèles libres de reconnaissance vocale pour Linux, nous vous invitons à consulter le site suivant : 
-Vous pourrez y enregistrer un texte qui permettra d'​intégrer votre voix dans les modèles de reconnaissance,​ et ainsi les améliorer. 
  
-=== gnome-voice-control === +Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.
-Site Internet: http://live.gnome.org/​GnomeVoiceControl+
  
-Pour l'​installercherchez ​ le dans Synaptic ou cliquez ​sur le lien suivant dans Firefox : [[apt://gnome-voice-control]] +[[:KDE]] intègre un module de reconnaissance vocalebasique et simple à utiliser, basé sur [[https://en.wikipedia.org/​wiki/​CMU_Sphinx|CMU Sphinx]].
  
-  - Ajoutez ​l'applet sur votre tableau ​de bord :+Enfin, pour aider l'amélioration des modèles libres ​de reconnaissance vocale pour Linux, consultez le site [[http://​www.voxforge.org/​fr|Voxforge.org]]. 
 +Vous pouvez y enregistrer un texte qui permettra d'​intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.
  
-    * Clic droit sur le tableau de bord +La [[synthèse vocale]], qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.
-    * Ajouter au tableau de bord +
-    * Catégorie ??? +
-    * Choisir Gnome-Voice-Control +
-    * Ajouter+
  
-  - Une icône est rajoutée sur votre tableau ​de bord. +===== Logiciels ​de reconnaissance vocale ===== 
-  - Vous pouvez commencer à commander votre PC à la voix (en anglais pour le moment) !+==== Pour la commande vocale ====
  
 +  * [[:​NoComprendo]] : commande vocale pour Linux
 +  * [[:​Perlbox]] : permet de commander l'​environnement [[KDE]] par la voix. Basé sur Sphinx.
 +  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://​sourceforge.net/​projects/​speech2text/​]]
 +  * **VoiceExecute** : permet de lancer des logiciels par la voix
 +  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
 +  * [[https://​github.com/​kalliope-project/​kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
 +  * [[https://​github.com/​claritylab/​lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://​sirius.clarity-lab.org/​|Sirius]]. Visitez le [[http://​lucida.ai/​|site Web]] pour le tutoriel, et [[http://​groups.google.com/​forum/#​!forum/​lucida-users|Lucida-users]] pour de l'​aide. Le projet est publié sous [[https://​github.com/​claritylab/​lucida/​blob/​master/​LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.
 +  * [[http://​jasperproject.github.io/​|Jasper]],​ pour raspberry
  
-Actions possibles:+==== Pour la dictée vocale via une application ==== 
 +  * **[[https://​flathub.org/​apps/​net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]],​ vous pouvez l'​installer via [[gnome-software|logiciel]]. 
 +  * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante. 
 +  * [[wp>​Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://​appdb.winehq.org/​appview.php?​versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'​interface [[http://​thenerdshow.com/​platypus.html|Platypus]]. 
 +   * **[[https://​www.thenerdshow.com/​freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]]. 
 +   * **[[https://​alphacephei.com/​vosk/​|VOSK]]** : [[https://​forge.chapril.org/​tykayn/​transcription|mode d'​emploi pour transcrire un fichier audio]] par Tykayn 
 +   * **[[https://​doc.linto.ai/#/​services/​linstt|LinSTT]]** : service Speech-To-Text de l'​assistant vocal LinTO
  
-  * FILE .. OPEN +==== Dictée vocale en ligne ====
-  * FILE .. PRINT +
-  * FILE .. NEW +
-  * SELECT ALL +
-  * DELETE +
-  * UNDO +
-  * REDO +
-  * HELP .. ABOUT +
-  * RUN TERMINAL +
-  * RUN BROWSER +
-  * RUN MAIL +
-  * MAXIMIZE WINDOW +
-  * MINIMIZE WINDOW +
-  * CLOSE WINDOW +
-  * NEXT WINDOW +
-  * RUN TEXT EDITOR+
  
 +   * [[https://​speechnotes.co/​fr/​|SpeechNotes]] ou [[https://​voicenotebook.com/​|VoiceNotebook]] marchent dans Chrome/​Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
 +   * [[https://​docs.google.com/​document/?​usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale//
 +   * [[https://​voicenotebook.com/​|Voice notebook]] : reconnaissance vocale via une application (multi plateforme),​ ou extension Chrome
  
-===  CMU Sphinx === 
  
-http://cmusphinx.sourceforge.net/html/cmusphinx.php+==== Autres ==== 
 +   * [[http://www.speech.cs.cmu.edu/sphinx/​doc/​Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C 
 +   * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech) 
 +  
 +Logiciels dont le développement est arrêté : 
 +   * [[http://www.kiecza.net/​daniel/​linux/​index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002
  
-=== X voice ===+=====Voir aussi=====
  
-http://xvoice.sourceforge.net/+  *[[https://forum.ubuntu-fr.org/viewtopic.php?​id=60231&​p=4|Discussion "​Reconnaissance vocale"​]] sur le forum ubuntu-fr 
 +  *[[synthese_vocale|Synthèse vocale]] (Opération inverse)
  
-=== Perlbox ​===+===== Pages en rapport ​===== 
 +{{topic>​reconnaissance_vocale&​header}}
  
-Il permet de commander KDE à la voix. Perlbox repose pour la reconnaissance vocale sur Sphynx, qui est développé par une université,​ la version actuelle de Perlbox utilise Sphynx2 qui ne permet qu'une reconnaissance sans apprentissage qui est donc très limité, d'où sa limitation au pilotage de l'​interface uniquement. Sphynx3 (http://​cmusphinx.sourceforge.net/​sphinx3/​s3_description.html) est plus développé et permet un apprentissage. Ils comptent a priori l'​utiliser dans le futur pour Perlbox. 
- 
--Page sur le site officiel de KDE 
-http://​developer.kde.org/​summerofcode/​speech.html 
- 
--Tuto pour la reconnaissance vocale sur KDE: http://​kubuntu.free.fr/​blog/​index.php?​p=43 
- 
--Site internet de Perlbox 
-http://​perlbox.org 
- 
-=== Autres === 
- 
-- http://​www.kiecza.net/​daniel/​linux/​index.html (n'est plus soutenu par son créateur depuis 2002) 
- 
-- http://​www.gear21.com/​speech/​html/​ (également daté) 
- 
-=== Remarque === 
-- Dragon Naturally Speaking marche sous Wine (http://​appdb.winehq.org/​appview.php?​versionId=3227) 
- 
--Il est bien évidemment possible de faire tourner Windows dans une session virtuelle, mais ça n'est bien évidemment pas la panacée. 
  • reconnaissance_vocale.1194183572.txt.gz
  • Dernière modification: Le 30/01/2008, 15:31
  • (modification externe)