Différences

Ci-dessous, les différences entre deux révisions de la page.

--- reconnaissance_vocale [Le 04/11/2007, 14:39]
teolemon
+++ reconnaissance_vocale [Le 15/02/2024, 18:30] (Version actuelle)
bjacquem [Dictée vocale en ligne]
@@ Ligne 1: / Ligne 1: @@
-Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.
+{{tag>portail accessibilité audio multimédia}}
-Il est à noter que KDE intègre d'ores et déjà un module de reconnaissance vocale basique basée sur CMU Sphinx, mais beaucoup plus simple à utiliser et intégré en série.
+----
-Gnome possède également une telle fonctionnalité, mais il faut l'installer en installant gnome-voice-control
+====== Reconnaissance vocale ======
-Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, nous vous invitons à consulter le site suivant :
-Vous pourrez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance, et ainsi les améliorer.
-=== gnome-voice-control ===
+Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.
-Site Internet: http://live.gnome.org/GnomeVoiceControl
-Pour l'installer, cherchez  le dans Synaptic ou cliquez sur le lien suivant dans Firefox : [[apt://gnome-voice-control]]
+[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[https://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]].
-  - Ajoutez l'applet sur votre tableau de bord :
+Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]].
+Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.
-    * Clic droit sur le tableau de bord
+La [[synthèse vocale]], qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.
-    * Ajouter au tableau de bord
-    * Catégorie ???
-    * Choisir Gnome-Voice-Control
-    * Ajouter
-  - Une icône est rajoutée sur votre tableau de bord.
+===== Logiciels de reconnaissance vocale =====
-  - Vous pouvez commencer à commander votre PC à la voix (en anglais pour le moment) !
+==== Pour la commande vocale ====
+  * [[:NoComprendo]] : commande vocale pour Linux
+  * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx.
+  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://sourceforge.net/projects/speech2text/]]
+  * **VoiceExecute** : permet de lancer des logiciels par la voix
+  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
+  * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
+  * [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aide. Le projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.
+  * [[http://jasperproject.github.io/|Jasper]], pour raspberry
-Actions possibles:
+==== Pour la dictée vocale via une application ====
+  * **[[https://flathub.org/apps/net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]], vous pouvez l'installer via [[gnome-software|logiciel]].
+  * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante.
+  * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]].
+   * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]].
+   * **[[https://alphacephei.com/vosk/|VOSK]]** : [[https://forge.chapril.org/tykayn/transcription|mode d'emploi pour transcrire un fichier audio]] par Tykayn
+   * **[[https://doc.linto.ai/#/services/linstt|LinSTT]]** : service Speech-To-Text de l'assistant vocal LinTO
-  * FILE .. OPEN
+==== Dictée vocale en ligne ====
-  * FILE .. PRINT
-  * FILE .. NEW
-  * SELECT ALL
-  * DELETE
-  * UNDO
-  * REDO
-  * HELP .. ABOUT
-  * RUN TERMINAL
-  * RUN BROWSER
-  * RUN MAIL
-  * MAXIMIZE WINDOW
-  * MINIMIZE WINDOW
-  * CLOSE WINDOW
-  * NEXT WINDOW
-  * RUN TEXT EDITOR
+   * [[https://speechnotes.co/fr/|SpeechNotes]] ou [[https://voicenotebook.com/|VoiceNotebook]] marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
+   * [[https://docs.google.com/document/?usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale//
+   * [[https://voicenotebook.com/|Voice notebook]] : reconnaissance vocale via une application (multi plateforme), ou extension Chrome
-===  CMU Sphinx ===
-http://cmusphinx.sourceforge.net/html/cmusphinx.php
+==== Autres ====
+   * [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C
+   * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech)
+Logiciels dont le développement est arrêté :
+   * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002
-=== X voice ===
+=====Voir aussi=====
-http://xvoice.sourceforge.net/
+  *[[https://forum.ubuntu-fr.org/viewtopic.php?id=60231&p=4|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr
+  *[[synthese_vocale|Synthèse vocale]] (Opération inverse)
-=== Perlbox ===
+===== Pages en rapport =====
+{{topic>reconnaissance_vocale&header}}
-Il permet de commander KDE à la voix. Perlbox repose pour la reconnaissance vocale sur Sphynx, qui est développé par une université, la version actuelle de Perlbox utilise Sphynx2 qui ne permet qu'une reconnaissance sans apprentissage qui est donc très limité, d'où sa limitation au pilotage de l'interface uniquement. Sphynx3 (http://cmusphinx.sourceforge.net/sphinx3/s3_description.html) est plus développé et permet un apprentissage. Ils comptent a priori l'utiliser dans le futur pour Perlbox.
--Page sur le site officiel de KDE
-http://developer.kde.org/summerofcode/speech.html
--Tuto pour la reconnaissance vocale sur KDE: http://kubuntu.free.fr/blog/index.php?p=43
--Site internet de Perlbox
-http://perlbox.org
-=== Autres ===
-- http://www.kiecza.net/daniel/linux/index.html (n'est plus soutenu par son créateur depuis 2002)
-- http://www.gear21.com/speech/html/ (également daté)
-=== Remarque ===
-- Dragon Naturally Speaking marche sous Wine (http://appdb.winehq.org/appview.php?versionId=3227)
--Il est bien évidemment possible de faire tourner Windows dans une session virtuelle, mais ça n'est bien évidemment pas la panacée.