Différences

Ci-dessous, les différences entre deux révisions de la page.

--- reconnaissance_vocale [Le 10/02/2007, 12:02]
teolemon
+++ reconnaissance_vocale [Le 15/02/2024, 18:30] (Version actuelle)
bjacquem [Dictée vocale en ligne]
@@ Ligne 1: / Ligne 1: @@
-Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.
+{{tag>portail accessibilité audio multimédia}}
-===  CMU Sphinx ===
+----
-http://cmusphinx.sourceforge.net/html/cmusphinx.php
+====== Reconnaissance vocale ======
-=== X voice ===
-http://xvoice.sourceforge.net/
+Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.
-=== Perlbox ===
+[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[https://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]].
-Il permet de commander KDE à la voix. Perlbox repose pour la reconnaissance vocale sur Sphynx, qui est développé par une université, la version actuelle de Perlbox utilise Sphynx2 qui ne permet qu'une reconnaissance sans apprentissage qui est donc très limité, d'où sa limitation au pilotage de l'interface uniquement. Sphynx3 (http://cmusphinx.sourceforge.net/sphinx3/s3_description.html) est plus développé et permet un apprentissage. Ils comptent a priori l'utiliser dans le futur pour Perlbox.
+Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]].
+Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.
--Page sur le site officiel de KDE
+La [[synthèse vocale]], qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.
-http://developer.kde.org/summerofcode/speech.html
--Tuto pour la reconnaissance vocale sur KDE: http://kubuntu.free.fr/blog/index.php?p=43
+===== Logiciels de reconnaissance vocale =====
+==== Pour la commande vocale ====
--Site internet de Perlbox
+  * [[:NoComprendo]] : commande vocale pour Linux
-http://perlbox.org
+  * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx.
+  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://sourceforge.net/projects/speech2text/]]
+  * **VoiceExecute** : permet de lancer des logiciels par la voix
+  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
+  * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
+  * [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aide. Le projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.
+  * [[http://jasperproject.github.io/|Jasper]], pour raspberry
-=== Autres ===
+==== Pour la dictée vocale via une application ====
+  * **[[https://flathub.org/apps/net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]], vous pouvez l'installer via [[gnome-software|logiciel]].
+  * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante.
+  * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]].
+   * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]].
+   * **[[https://alphacephei.com/vosk/|VOSK]]** : [[https://forge.chapril.org/tykayn/transcription|mode d'emploi pour transcrire un fichier audio]] par Tykayn
+   * **[[https://doc.linto.ai/#/services/linstt|LinSTT]]** : service Speech-To-Text de l'assistant vocal LinTO
-- http://www.kiecza.net/daniel/linux/index.html (n'est plus soutenu par son créateur depuis 2002)
+==== Dictée vocale en ligne ====
-- http://www.gear21.com/speech/html/ (également daté)
+   * [[https://speechnotes.co/fr/|SpeechNotes]] ou [[https://voicenotebook.com/|VoiceNotebook]] marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
+   * [[https://docs.google.com/document/?usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale//
+   * [[https://voicenotebook.com/|Voice notebook]] : reconnaissance vocale via une application (multi plateforme), ou extension Chrome
+==== Autres ====
+   * [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C
+   * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech)
+Logiciels dont le développement est arrêté :
+   * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002
+=====Voir aussi=====
+  *[[https://forum.ubuntu-fr.org/viewtopic.php?id=60231&p=4|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr
+  *[[synthese_vocale|Synthèse vocale]] (Opération inverse)
+===== Pages en rapport =====
+{{topic>reconnaissance_vocale&header}}
-=== Remarque ===
-- Dragon Naturally Speaking marche sous Wine (http://appdb.winehq.org/appview.php?versionId=3227)
--Il est bien évidemment possible de faire tourner Windows dans une session virtuelle, mais ça n'est bien évidemment pas la panacée.