Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
reconnaissance_vocale [Le 07/03/2018, 16:20]
89.227.251.131 [Logiciels de reconnaissance vocale]
reconnaissance_vocale [Le 15/02/2024, 18:30] (Version actuelle)
bjacquem [Dictée vocale en ligne]
Ligne 2: Ligne 2:
  
 ---- ----
- 
- 
  
 ====== Reconnaissance vocale ====== ====== Reconnaissance vocale ======
Ligne 10: Ligne 8:
 Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux. Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.
  
-Canonical prévoit d'​intégrer prochainement le logiciel libre [[speechcontrol]] pour ubuntu linux, développé par canonical, et pourrait faire à l'​avenir de la [[synthèse vocale]] également. +[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[https://​en.wikipedia.org/​wiki/​CMU_Sphinx|CMU Sphinx]].
- +
-[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[http://​en.wikipedia.org/​wiki/​CMU_Sphinx|CMU Sphinx]].+
  
 Enfin, pour aider l'​amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://​www.voxforge.org/​fr|Voxforge.org]]. Enfin, pour aider l'​amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://​www.voxforge.org/​fr|Voxforge.org]].
Ligne 21: Ligne 17:
 ===== Logiciels de reconnaissance vocale ===== ===== Logiciels de reconnaissance vocale =====
 ==== Pour la commande vocale ==== ==== Pour la commande vocale ====
 +
 +  * [[:​NoComprendo]] : commande vocale pour Linux
   * [[:​Perlbox]] : permet de commander l'​environnement [[KDE]] par la voix. Basé sur Sphinx.   * [[:​Perlbox]] : permet de commander l'​environnement [[KDE]] par la voix. Basé sur Sphinx.
-  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[http://​sourceforge.net/​projects/​speech2text/​]]+  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://​sourceforge.net/​projects/​speech2text/​]]
   * **VoiceExecute** : permet de lancer des logiciels par la voix   * **VoiceExecute** : permet de lancer des logiciels par la voix
   * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.   * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
-  * [[https://​github.com/​kalliope-project/​kalliope|Kalliope]] est un assistant personnel ​intelligent basé sur la parole avec une personalisation à l'​aide ​de script ​(Supporte le français et l'​anglais)+  * [[https://​github.com/​kalliope-project/​kalliope|Kalliope]] est un framework permettant de créer son propre ​assistant personnel. Le programme supporte plusieurs langues, possède des modules ​de reconnaissance vocale(STToffline et self-hosted.
   * [[https://​github.com/​claritylab/​lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://​sirius.clarity-lab.org/​|Sirius]]. Visitez le [[http://​lucida.ai/​|site Web]] pour le tutoriel, et [[http://​groups.google.com/​forum/#​!forum/​lucida-users|Lucida-users]] pour de l'​aide. Le projet est publié sous [[https://​github.com/​claritylab/​lucida/​blob/​master/​LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.   * [[https://​github.com/​claritylab/​lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://​sirius.clarity-lab.org/​|Sirius]]. Visitez le [[http://​lucida.ai/​|site Web]] pour le tutoriel, et [[http://​groups.google.com/​forum/#​!forum/​lucida-users|Lucida-users]] pour de l'​aide. Le projet est publié sous [[https://​github.com/​claritylab/​lucida/​blob/​master/​LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.
   * [[http://​jasperproject.github.io/​|Jasper]],​ pour raspberry   * [[http://​jasperproject.github.io/​|Jasper]],​ pour raspberry
  
-==== Pour la dictée vocale ==== +==== Pour la dictée vocale ​via une application ​==== 
-  * [[:X voice]] : utilise une librairie ViaVoice d'IBM qui est payante.  +  ​* **[[https://​flathub.org/​apps/​net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]],​ vous pouvez l'​installer via [[gnome-software|logiciel]]. 
-  * [[http://​en.wikipedia.org/​wiki/​Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://​appdb.winehq.org/​appview.php?​versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'​interface [[http://​thenerdshow.com/​platypus.html|Platypus]]. +  * **X voice** ​: utilise une librairie ViaVoice d'IBM qui est payante. 
-   * [[https://​www.thenerdshow.com/​freespeech.html|**FreeSpeech**]]  +  * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://​appdb.winehq.org/​appview.php?​versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'​interface [[http://​thenerdshow.com/​platypus.html|Platypus]]. 
 +   * **[[https://​www.thenerdshow.com/​freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]]. 
 +   * **[[https://​alphacephei.com/​vosk/​|VOSK]]** : [[https://​forge.chapril.org/​tykayn/​transcription|mode d'​emploi pour transcrire un fichier audio]] par Tykayn 
 +   * **[[https://​doc.linto.ai/#/​services/​linstt|LinSTT]]** : service Speech-To-Text de l'​assistant vocal LinTO
  
-==== Autre ==== +==== Dictée vocale en ligne ==== 
-   * [[http://​www.speech.cs.cmu.edu/​sphinx/​doc/​Sphinx.html|:CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C+ 
 +   * [[https://​speechnotes.co/​fr/​|SpeechNotes]] ou [[https://​voicenotebook.com/​|VoiceNotebook]] marchent dans Chrome/​Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google. 
 +   * [[https://​docs.google.com/​document/?​usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale// 
 +   * [[https://​voicenotebook.com/​|Voice notebook]] : reconnaissance vocale via une application (multi plateforme),​ ou extension Chrome 
 + 
 + 
 +==== Autres ​==== 
 +   * [[http://​www.speech.cs.cmu.edu/​sphinx/​doc/​Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C 
 +   * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech)
    
 Logiciels dont le développement est arrêté : Logiciels dont le développement est arrêté :
    * [[http://​www.kiecza.net/​daniel/​linux/​index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002    * [[http://​www.kiecza.net/​daniel/​linux/​index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002
-   * gnome-voice-control : permet de contrôler l'​environnement [[GNOME]] par la voix. N'est plus dans les dépôts d'​Ubuntu depuis 12.04. 
- 
-=== DeepSpeech le projet de Mozilla === 
-[[https://​research.mozilla.org/​machine-learning/​|DeepSpeech]] de la fondation mozilla, buts: 
-  * Web Speech API 
-  * Speech recognition 
-  * Speech-to-Text 
  
 =====Voir aussi===== =====Voir aussi=====
  
-  *[[http://​forum.ubuntu-fr.org/​viewtopic.php?​pid=3532304|Discussion "​Reconnaissance vocale"​]] sur le forum ubuntu-fr+  *[[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=60231&​p=4|Discussion "​Reconnaissance vocale"​]] sur le forum ubuntu-fr
   *[[synthese_vocale|Synthèse vocale]] (Opération inverse)   *[[synthese_vocale|Synthèse vocale]] (Opération inverse)
-  * (en) Tutoriel [[http://​www.gear21.com/​speech/​html/​|Automatic Speech Recognition on Linux]] date de 2002 
-  * [[http://​www.bostonherald.com/​business/​technology/​general/​view.bg?​articleid=1303065&​srvc=rss|Google launches next phase of voice-recognition project]] ( dec 2010 ) 
  
 ===== Pages en rapport ===== ===== Pages en rapport =====
 {{topic>​reconnaissance_vocale&​header}} {{topic>​reconnaissance_vocale&​header}}
  
  • reconnaissance_vocale.1520436025.txt.gz
  • Dernière modification: Le 07/03/2018, 16:20
  • par 89.227.251.131
  • Actuellement bloqué par: 3.16.66.206,10.42.2.254