| Les deux révisions précédentesRévision précédente | |
| synthese_vocale [Le 23/04/2026, 18:12] – L'Africain | synthese_vocale [Le 05/05/2026, 13:16] (Version actuelle) – L'Africain |
|---|
| ====== Synthèse vocale ====== | ====== Synthèse vocale ====== |
| |
| La **synthèse vocale** (ou TTS, pour //Text To Speech//) consiste à transformer un texte en suite de sons se rapprochant autant que possible de la parole humaine. Une des applications les plus évidentes de la synthèse vocale est l’accessibilité pour les mal-voyants. Il existe plusieurs synthétiseurs vocaux sous Linux, cette page ne se veut pas exhaustive. | La **synthèse vocale** (ou TTS, pour //Text To Speech//) consiste à transformer un texte en suite de sons se rapprochant autant que possible de la parole humaine. Une des applications les plus évidentes de la synthèse vocale est l'accessibilité pour les mal-voyants. Il existe plusieurs synthétiseurs vocaux sous Linux, cette page ne se veut pas exhaustive. |
| |
| La synthèse vocale procède en trois temps : | La synthèse vocale procède en trois temps : |
| Ce document a pour but de présenter la mise en œuvre de quelques solutions. | Ce document a pour but de présenter la mise en œuvre de quelques solutions. |
| |
| Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d’intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. | Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. |
| |
| <note tip>Certains logiciels libres sont compatibles avec les voix Windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]]).</note> | <note tip>Certains logiciels libres sont compatibles avec les voix Windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]]).</note> |
| |
| =====Speech Dispatcher : l’approche unifiée===== | =====Speech Dispatcher : l'approche unifiée===== |
| |
| **Speech Dispatcher** est une interface standardisée pour la synthèse vocale sous Linux. De nombreuses applications (comme Orca, Firefox) l'utilisent pour parler sans avoir à connaître le moteur TTS sous-jacent. | **Speech Dispatcher** est une interface standardisée pour la synthèse vocale sous Linux. De nombreuses applications (comme Orca, Firefox) l'utilisent pour parler sans avoir à connaître le moteur TTS sous-jacent. |
| ==== Choisir son moteur TTS par défaut ==== | ==== Choisir son moteur TTS par défaut ==== |
| |
| Speech Dispatcher peut utiliser différents moteurs : espeak, festival, svox-pico, piper, etc. | Speech Dispatcher peut utiliser différents moteurs : espeak, festival, piper, etc. |
| |
| **1. Voir les modules disponibles :** | **1. Voir les modules disponibles :** |
| **2. Changer le moteur par défaut :** | **2. Changer le moteur par défaut :** |
| |
| [[:tutoriel:comment_modifier_un_fichier|Éditez le fichier de configuration utilisateur]] : | Éditez le fichier de configuration système avec les droits d'administration : |
| ''~/.config/speech-dispatcher/speechd.conf'' | ''/etc/speech-dispatcher/speechd.conf'' |
| |
| Décommentez ou ajoutez : | Décommentez ou ajoutez : |
| Exemples : | Exemples : |
| <file> | <file> |
| DefaultModule pico-generic # voix naturelle (recommandé) | DefaultModule espeak-ng # voix robotique mais rapide |
| DefaultModule espeak-generic # voix robotique mais rapide | DefaultModule festival # voix festival (si installé) |
| DefaultModule festival # voix festival (si installé) | DefaultModule piper # voix neuronale (voir ci-dessous, recommandé) |
| DefaultModule piper-generic # voix neuronale (voir ci-dessous) | |
| </file> | </file> |
| **3. Créer un fichier generic pour votre moteur (exemple avec piper :** | |
| <file piper-generic.conf> | |
| DefaultVoice "fr_FR-siwis-low" | |
| AddVoice "fr" "FEMALE1" "fr_FR-siwis-low" | |
| AddVoice "fr" "MALE1" "fr_FR-upmc-medium" | |
| |
| GenericCmdDependency "sox" | **3. Redémarrer Speech Dispatcher après modification :** |
| GenericCmdDependency "jq" | |
| GenericExecuteSynth \ | |
| "cd /home/cyrille/.local/share/speech-dispatcher-piper && \ | |
| ./check_piper_voice.sh $VOICE && \ | |
| printf %s \'$DATA\' \ | |
| | ./piper/piper --model \'voices/$VOICE.onnx\' --output_raw \ | |
| | sox -v $VOLUME -r $(jq .audio.sample_rate < \'voices/$VOICE.onnx.json\') -c 1 \ | |
| -b 16 -e signed-integer -t raw - -t wav - tempo $RATE pitch $PITCH norm \ | |
| | $PLAY_COMMAND" | |
| | |
| GenericRateAdd 1 | |
| GenericPitchAdd 1 | |
| GenericVolumeAdd 1 | |
| GenericRateMultiply 1 | |
| GenericPitchMultiply 750 | |
| GenericVolumeMultiply 1 | |
| </file> | |
| | |
| **4. Redémarrer Speech Dispatcher après modification :** | |
| |
| <code bash> | <code bash> |
| sudo systemctl restart speech-dispatcher | pkill -f speech-dispatcher; speech-dispatcher |
| </code> | </code> |
| |
| **5. Tester la voix :** | **4. Tester la voix :** |
| |
| <code bash> | <code bash> |
| spd-say "Bonjour, ceci est un test de synthèse vocale" | spd-say "Bonjour, ceci est un test de synthèse vocale" |
| </code> | </code> |
| | |
| | ==== Intégration avec Piper (voix neuronales) ==== |
| | |
| | Pour utiliser [[:piper_tts|Piper]] comme moteur par défaut de Speech Dispatcher, consultez la [[:piper_tts|page dédiée à Piper TTS]]. La configuration correcte pour Ubuntu 24.04 utilise le module générique ''sd_generic'' avec ''paplay'' (PulseAudio) pour éviter les conflits audio avec les navigateurs web. |
| |
| ===== Logiciels de synthèse vocale ===== | ===== Logiciels de synthèse vocale ===== |
| | |
| | ==== Piper TTS (voix neuronales de haute qualité) ==== |
| | |
| | **[[:piper_tts|Piper]]** est un moteur TTS moderne utilisant des réseaux de neurones pour produire des voix très naturelles, proches de l'humain. Il est **totalement hors-ligne** et rapide. Voir la [[:piper_tts|page dédiée]]. |
| |
| ==== Svoxpico ==== | ==== Svoxpico ==== |
| [[:Svoxpico]] : était le premier lecteur vocal d’Android, de loin celui qui donnait les meilleurs résultats pour un usage courant. Il permet de lire n’importe quelle sélection. | [[:Svoxpico]] : était le premier lecteur vocal d'Android, de loin celui qui donnait les meilleurs résultats pour un usage courant. Il permet de lire n'importe quelle sélection. |
| |
| ==== gSpeech ==== | ==== gSpeech ==== |
| |
| **Installation via un PPA :** | **Installation via un PPA :** |
| * [[:PPA|Ajouter le PPA]] **ppa:jerem-ferry/tts**((https://launchpad.net/~jerem-ferry/+archive/ubuntu/tts)) dans vos sources de logiciels; | * [[:PPA|Ajouter le PPA]] **ppa:jerem-ferry/tts**((https://launchpad.net/~jerem-ferry/+archive/ubuntu/tts)) dans vos sources de logiciels; |
| * [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gspeech]]**. | * [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gspeech]]**. |
| |
| Vous pouvez trouver les sources sur [[https://github.com/mothsart/gSpeech.git|Github]]. | Vous pouvez trouver les sources sur [[https://github.com/mothsart/gSpeech.git|Github]]. |
| |
| ==== Piper TTS (voix neuronales de haute qualité) ==== | |
| |
| **[[Piper]]** est un moteur TTS moderne utilisant des réseaux de neurones pour produire des voix très naturelles, proches de l'humain. Il est **totalement hors-ligne** et rapide. | |
| |
| ==== eSpeak ==== | ==== eSpeak ==== |
| [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. | [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. |
| |
| [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>espeak,espeak-data]]**. | [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>espeak-ng,espeak-ng-data]]**. |
| |
| ==== Festival ==== | ==== Festival ==== |
| [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>festival,festvox-rablpc16k]]**. | [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>festival,festvox-rablpc16k]]**. |
| |
| <note>Festival est moins utilisé aujourd'hui au profit de svox-pico ou Piper.</note> | <note>Festival est moins utilisé aujourd'hui au profit de Piper.</note> |
| |
| ==== MBROLA ==== | ==== MBROLA ==== |
| En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous licence GNU GPL3 Afero.** | En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous licence GNU GPL3 Afero.** |
| |
| [[:tutoriel:comment_installer_un_paquet|**Installation :** | [[:tutoriel:comment_installer_un_paquet|Installez le paquet]] **[[apt>mbrola]]**. |
| <code bash> | |
| sudo apt install]] **[[apt>mbrola]]**. | |
| |
| Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:depots|dépôts officiels]], pour les installer faites une recherche dans votre [[:gestionnaire de paquets]] avec le mot clé **Mbrola**. | Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:depots|dépôts officiels]], pour les installer faites une recherche dans votre [[:gestionnaire de paquets]] avec le mot clé **Mbrola**. |
| espeak -v mb/mb-fr4 "Bonjour" | mbrola /usr/share/mbrola/fr4/fr4 - -.au | aplay | espeak -v mb/mb-fr4 "Bonjour" | mbrola /usr/share/mbrola/fr4/fr4 - -.au | aplay |
| </code> | </code> |
| |
| MBROLA est également disponible sous forme de fichiers binaires téléchargeables [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|première partie de la page]]. ((Il y a aussi des « .deb » [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|ici]] (troisième ligne linux)...)) On extrait le fichier qui correspond à son [[:architecture matérielle|architecture]] dans un répertoire au choix, de préférence /usr/share/mbrola (là où se fait l'installation par les dépôts). | |
| |
| ==== Autres ==== | ==== Autres ==== |
| * [[:Orca]] : outil par défaut d’Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) |
| * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! | * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! |
| * [[http://www.letime.net/vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte. | |
| |
| ==== Logiciels en console ==== | ==== Logiciels en console ==== |
| * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix, | * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix. |
| * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. | * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. |
| | |
| =====Synthèse vocale intégrée à certaines applications===== | =====Synthèse vocale intégrée à certaines applications===== |
| | |
| ==== Synthèse vocale dans Pidgin==== | ==== Synthèse vocale dans Pidgin==== |
| |
| * [[apt>stardict-plugin-festival|le plugin Festival]] | * [[apt>stardict-plugin-festival|le plugin Festival]] |
| * [[apt>stardict-plugin-espeak|le plugin Espeak]] | * [[apt>stardict-plugin-espeak|le plugin Espeak]] |
| | |
| ==== Dans le dictionnaire Goldendict==== | ==== Dans le dictionnaire Goldendict==== |
| [[:Goldendict]] est un peu le remplaçant de [[:Stardict]] il permet aussi, dans sa dernière version, d'intégrer un synthétiseur vocale, Pour cela : | [[:Goldendict]] est un peu le remplaçant de [[:Stardict]] il permet aussi, dans sa dernière version, d'intégrer un synthétiseur vocal. Pour cela : |
| * Installez [[:eSpeak]] et éventuellement [[#Mbrola]] | * Installez [[:eSpeak]] et éventuellement [[#Mbrola]] |
| * Appuyer sur F3 pour ouvrir la fenêtre des dictionnaires | * Appuyer sur F3 pour ouvrir la fenêtre des dictionnaires |
| |
| Si vous souhaitez ajouter la lecture en d'autres langues, modifiez la commande **f** par celle de la langue souhaitée. | Si vous souhaitez ajouter la lecture en d'autres langues, modifiez la commande **f** par celle de la langue souhaitée. |
| |
| |
| ====Synthèse vocale dans LibreOffice ==== | ====Synthèse vocale dans LibreOffice ==== |
| ==== Activer la lecture à voix haute dans Firefox ==== | ==== Activer la lecture à voix haute dans Firefox ==== |
| |
| Firefox dispose d’une fonction de lecture à voix haute intégrée, accessible via le **Mode Lecture**. Voilà comment l’utiliser : | Firefox dispose d'une fonction de lecture à voix haute intégrée, accessible via le **Mode Lecture**. Elle utilise Speech Dispatcher et donc le moteur TTS configuré par défaut (par exemple Piper). Voilà comment l'utiliser : |
| * Ouvrir une page compatible,le mode lecture n’est disponible que sur les pages contenant du texte (articles, blogs, documentations). Il n'apparaît pas sur les pages d’accueil ou les sites complexes. | * Ouvrir une page compatible : le mode lecture n'est disponible que sur les pages contenant du texte (articles, blogs, documentations). Il n'apparaît pas sur les pages d'accueil ou les sites complexes. |
| * Activer le Mode Lecture : Repérez l’icône en forme de **page ou de document** dans la barre d’adresse, à droite. Cliquez sur cette icône. La page se transforme en vue simplifiée, sans publicités ni menus. | * Activer le Mode Lecture : repérez l'icône en forme de **page ou de document** dans la barre d'adresse, à droite. Cliquez sur cette icône. La page se transforme en vue simplifiée, sans publicités ni menus. |
| * Lancer la lecture à voix haute. Une fois en mode lecture, une barre d’outils apparaît sur le **côté gauche** de la page. Cliquez sur le bouton **"Lecture à voix haute"** (icône de haut-parleur). | * Lancer la lecture à voix haute : une fois en mode lecture, une barre d'outils apparaît sur le **côté gauche** de la page. Cliquez sur le bouton **"Lecture à voix haute"** (icône de haut-parleur). |
| |
| Vous pouvez également utiliser Mathspeak pour la lecture de formule mathématique.\\ | <note important>Firefox garde parfois le périphérique audio ALSA en exclusivité. Si la lecture à voix haute ne fonctionne pas ou plante, assurez-vous que votre configuration Speech Dispatcher utilise **paplay** (PulseAudio) plutôt que **aplay** pour la sortie audio. Voir la [[:piper_tts|page Piper TTS]] pour la configuration correcte.</note> |
| Faites une recherche dans les modules complémentaires pour voir les différents choix possibles. | |
| | Vérifiez également dans ''about:config'' que ''media.webspeech.synth.enabled'' est à ''true''. |
| |
| ====Synthèse vocale dans Brave/Chromium ==== | ====Synthèse vocale dans Brave/Chromium ==== |
| Avec [[:Svoxpico]] l’ajout d'une extension est inutile, **Pico** faisant déjà le travail de lecture.\\ | Il existe différentes extensions qui permettent la synthèse vocale des pages consultées : |
| Cependant sachez qu'il existe différentes extensions qui permettent la synthèse vocale des pages consultées : | Installez l'extension [[https://chrome.google.com/webstore/detail/speak-text/dchmahpmnpogmfofejmdndonfljkjhdm?hl=fr|SpeakIt]] ou claroRead Chrome. |
| Installez l'extension [[https://chrome.google.com/webstore/detail/speak-text/dchmahpmnpogmfofejmdndonfljkjhdm?hl=fr|SpeakIt]] ou claroRead Chrome. | |
| |
| ===Outil par défaut proposé par Brave=== | ===Outil par défaut proposé par Brave=== |
| |
| Le **Speedreader** est un lecteur proposé par défaut sur Brave. Mais il ne semble pas fonctionner correctement. Toujours est-il voici la procédure pour l’utiliser. **Speedreader** supprime les éléments superflus des pages qu’il identifie comme des articles et les affiche dans un format simplifié. Il est similaire aux « modes lecture » fournis avec d’autres navigateurs, mais avec quelques différences clés. La principale différence est que, contrairement à la plupart des fonctions de « mode lecture », le Speedreader de Brave modifie le contenu de la page //avant// que la page ne soit chargée, plutôt qu’après, ce qui vous permet d’économiser des données et d'obtenir des temps de chargement plus rapides. | Le **Speedreader** est un lecteur proposé par défaut sur Brave. Pour l'activer : |
| | * Dans Brave, allez dans **Menu → Paramètres → Apparence** et activez l'option Speedreader. |
| Pour activer le mode Speedreader : | * Le navigateur détecte automatiquement si une page peut être simplifiée. Si c'est le cas, l'icône du mode lecture apparaît dans la barre d'adresse. |
| *Pour activer ou désactiver la fonction Speedreader : lancez Brave, allez dans **Menu → Paramètres → Apparence** et activez/désactivez l’option Speedreader. | * Cliquez dessus pour afficher la page en format simplifié avec les commandes Speedreader. |
| * Dans Brave, le navigateur détecte automatiquement si une page peut être « distillée » (simplifiée) pendant la navigation. Si c'est le cas, vous verrez l'icône par défaut du « mode lecture » dans la barre d'adresse, | |
| * Lorsque vous cliquez dessus, l'icône devient bleue et la page que vous lisez est rechargée dans un format simplifié, | |
| * Une fois activé, observez les commandes du Speedreader qui apparaissent en haut de la page que vous visualisez, | |
| * En cliquant sur l'icône « Personnaliser le mode lecture » sur le côté gauche des commandes, vous pouvez demander au navigateur d’activer le Speedreader par défaut pour le site spécifique sur lequel vous vous trouvez et/ou de l'activer par défaut globalement sur tous les sites (notez que vous pouvez également activer/désactiver ces options en cliquant avec le bouton droit sur l'icône Speedreader dans la barre d’adresse). | |
| |
| ===== Intégration dans l'environnement de bureau ===== | ===== Intégration dans l'environnement de bureau ===== |
| |
| Il est possible d’intégrer ces solutions dans votre environnement de bureau, afin de faire lire le contenu des répertoires ou des pages internet par exemple. | |
| ==== Sous Unity et Gnome==== | ==== Sous Unity et Gnome==== |
| Par défaut sous [[:Unity]] et [[:Gnome]] en général, [[:Orca]] permet de lire le contenu affiché à l’écran. | Par défaut sous [[:Unity]] et [[:Gnome]] en général, [[:Orca]] permet de lire le contenu affiché à l'écran. |
| Ce qui suit sont des alternatives, à travers des scripts à intégrer à l'environnement Gnome. Pensez à adapter la configuration du script à votre convenance. Les scripts qui suivent doivent être intégrés à [[:nautilus_scripts|nautilus-scripts]] pour leur utilisation. | |
| FIXME Comment les arrêter? Refaire cette opération pendant la lecture en cours interrompra la lecture. | |
| * Lire le texte sélectionné à l'écran : | |
| FIXME Semble ne pas fonctionner ? | |
| Pour utiliser ce script, il faut [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>xclip]]**, puis l'enregistrez selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''LecteurdeSelection.sh'': | |
| | |
| <file bash ~/.local/share/nautilus/scripts/LecteurdeSelection.sh>#!/bin/bash | |
| | |
| ##### Affiche le menu Zenity ##### | |
| | |
| choix=`zenity --list --title="Choisissez la langue" --column="N°" --column="Langue" --height="200" \ | |
| 1 français \ | |
| 2 anglais ` | |
| | |
| ##### Sélection automatique de la langue choisie dans le menu Zenity ##### | |
| | |
| case $choix in | |
| 1 ) VOIX=/usr/share/mbrola/fr4/fr4 && TYPE=mb/mb-fr4 ;; # pour une voix de femme en français | |
| 2 ) VOIX=/usr/share/mbrola/us1/us1 && TYPE=mb/mb-us1 ;; # pour une voix de femme en anglais | |
| esac | |
| | |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) && sleep 2 | |
| fi | |
| | |
| # On traduit la sélection en phonèmes grâce à Espeak, et on l'envoie à Mbrola | |
| xclip -o | espeak -v $TYPE -s 150 -p 40 "$@" | mbrola $VOIX - -.au | aplay | |
| | |
| </file> | |
| | |
| * Lire le contenu d'un fichier texte : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''Readfile.sh'': | |
| | |
| <file bash ~/.local/share/nautilus/scripts/Readfile.sh>#!/bin/bash | |
| | |
| ######### Début de la section de configuration ######### | |
| | |
| # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin : | |
| VOIX=/usr/share/mbrola/fr4/fr4 | |
| #VOIX=/usr/share/mbrola/fr1/fr1 # à décommenter si vous vous voulez une voix d'homme | |
| TYPE=mb/mb-fr4 | |
| # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme | |
| | |
| ######### Fin de la section de configuration ######### | |
| | |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) | |
| | |
| else | |
| # On traduit le fichier en phonèmes grâce à espeak, et on l'envoie à Mbrola | |
| espeak -v $TYPE -s 150 -f "$@" | mbrola $VOIX - -.au | aplay | |
| fi</file> | |
| | |
| * Lire la liste des éléments contenus dans un dossier : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''ReadFolder.sh'': | |
| | |
| <file bash ~/.local/share/nautilus/scripts/ReadFolder.sh>#!/bin/bash | |
| | |
| ######### Début de la section de configuration ######### | |
| | |
| # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin | |
| VOIX=/usr/share/mbrola/fr4/fr4 | |
| TYPE=mb/mb-fr4 # si vous avez téléchargé une voix de femme | |
| # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme | |
| | |
| ######### Fin de la section de configuration ######### | |
| | |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) | |
| | |
| else | |
| | |
| #On liste les fichiers contenus dans le répertoire ou bien ceux sélectionnés par la souris | |
| FICHIERS=`ls -1 --quoting-style=c "$@"` | |
| | |
| for TEXTE in $FICHIERS | |
| do | |
| | |
| # On traduit le fichier texte temporaire en phonèmes grâce à Espeak, et on l'envoie à Mbrola | |
| espeak -v $TYPE -s 140 -p 40 $TEXTE | mbrola $VOIX - -.au | aplay | |
| done | |
| | |
| fi</file> | |
| | |
| * Lire le contenu du presse papier ou de la sélection à l'aide d'un raccourci clavier : FIXME ne semble pas fonctionner? | |
| * [[:tutoriel:comment_installer_un_paquet|installez les paquets]] **[[apt>xclip,recode,xbindkeys|xclip recode xbindkeys]]**. | |
| * Enregistrez le script [[http://forum.ubuntu-fr.org/viewtopic.php?pid=3686193#p3686193|suivant]], toujours avec [[:Nautilus_scripts|Nautilus-scripts]] | |
| | |
| À partir de là vous pouvez faire lire votre sélection de texte ou le contenu du presse-papier (texte copié par [Ctrl+C] par exemple) en cliquant avec le bouton droit sur le bureau ou une fenêtre nautilus et en choisissant "scripts / lit le contenu..." | |
| | |
| Pour définir un raccourci clavier reportez-vous à la page [[:xbindkeys]]. | |
| | |
| Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : | |
| | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413946|Script de diction de l'heure]] | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413943|Script de diction du pourcentage de batterie restant]] | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413944|Réglage du volume avec assistance vocale]] | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413945|Consultation de la boite Gmail]] | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413950|Aide à la navigation Nautilus]] | |
| |
| ==== Sous KDE ==== | ==== Sous KDE ==== |
| |
| Grâce à **kttsd** KDE offre une manière élégante et simple de lire du texte affiché à l'écran mais par défaut il utilise [[#Festival]], il n'y a donc pas de français, c'est pourquoi il faudra aussi installer **[[:eSpeak]]**. | Grâce à **kttsd** KDE offre une manière élégante et simple de lire du texte affiché à l'écran. |
| |
| Pour le mettre en place il suffit d’[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>espeak]]** et **[[apt>kttsd]]** qui contient: | Pour le mettre en place il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>espeak]]** et **[[apt>kttsd]]** qui contient: |
| * le démon kttsd, | * le démon kttsd, |
| * Jovie, une application permettant de lire un document copié ou que l'on tape. | * Jovie, une application permettant de lire un document copié ou que l'on tape. |
| * La synthèse vocale sera également intégrée dans [[:Konqueror]] et dans [[:Kate]]. | * La synthèse vocale sera également intégrée dans [[:Konqueror]] et dans [[:Kate]]. |
| |
| Pour configurer la synthèse vocale : | |
| * Faites un clic droit sur l’icône dans le tableau de bord sur l'icône Jovie, //Configurer Jovie//, dans l'onglet //Locuteurs// entrez un nom, choisissez le locuteur français cliquez sur Ajouter, | |
| * Pour lire du texte sélectionner du texte et cliquer sur l'icône Jovie ou clic droit, //Lire le contenue du presse-papier//.\\ | |
| * Lorsque vous utilisez le navigateur [[:Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé. | |
| * Pour prononcer du texte depuis l'éditeur de texte [[:Kate]], assurez-vous que Jovie est lancé et activez l'extension **Synthèse vocale Jovie** de KTextEditor dans la fenêtre de configuration de Kate. Sélectionnez le texte que vous voulez entendre puis choisissez //Outils → Énoncer le texte//. Après un moment, le texte sélectionné devrait être prononcé.\\ | |
| Il n'est pas indispensable de sélectionner du texte. Si vous ne le faites pas, tout le fichier sera prononcé. | |
| |
| |
| ===== Voir aussi ===== | ===== Voir aussi ===== |
| ==== Liens ==== | ==== Liens ==== |
| |
| Pages officielles de ces projets, et d'autres : | |
| * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. | * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. |
| * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) |
| * [[https://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) | * [[https://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) |
| * [[https://github.com/rhasspy/piper|Piper TTS]] - Voix neuronales hors-ligne | * [[https://github.com/rhasspy/piper|Piper TTS]] - Voix neuronales hors-ligne |
| * [[https://freebibleapps.org/tts/|Free Bible TTS]] - Voix bibliques gratuites | * [[https://huggingface.co/rhasspy/piper-voices|Toutes les voix Piper sur HuggingFace]] |
| * [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonétique (à utiliser avec un autre logiciel). Conçu pour le français. | |
| * [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | |
| * [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | |
| * [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | |
| * [[https://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] | |
| * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | |
| |
| Sur [[https://help.ubuntu.com/community/TextToSpeech|la documentation ubuntu anglaise]]. | Sur [[https://help.ubuntu.com/community/TextToSpeech|la documentation ubuntu anglaise]]. |
| |
| * [[http://emofilt.sourceforge.net/|emofilt]] un logiciel open-source qui permet d'ajouter de l'émotion à la parole | |
| |
| Wiki rassemblant des liens de synthèse vocale : | |
| * [[http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole|Wiki eagle usb]] | |
| |
| ==== Tutoriels ==== | |
| |
| * [[http://blinuxman.net/edu/fr/EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]] | |
| * [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutôt kde) | |
| * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | |
| * [[https://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] | |
| |
| ==== Ressources : des voix ==== | |
| |
| * Il existe la voix française [[http://rs211.rapidshare.com/files/108331417/Virginie.exe|virginie de microsoft(sapi) : gratuit mais non libre]]. ([[http://sharebee.com/789d0c18|lien miroir]] ) | |
| * Lernout & Hauspie TruVoice TTS engine (voix gratuite française) : http://activex.microsoft.com/activex/controls/agent2/lhttsfrf.exe | |
| * Trouver d'autres voix sapi sur ce site : http://www.cross-plus-a.com/fr/balabolka.htm (Anciennement: http://www.cross-plus-a.com/balabolka_fr.htm) | |
| * Des voix sur sayz me : http://www.datafurnace.net.au/sayzme/html/voices.html | |
| |
| ===== Pages en rapport ===== | ===== Pages en rapport ===== |
| | [[:piper_tts|Piper TTS]] (voix neuronales)\\ |
| [[:reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) | [[:reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) |
| |
| ---- | ---- |
| |
| //Contributeurs : Page initiale par [[http://forum.ubuntu-fr.org/profile.php?id=7326|Skippy le Grand Gourou]], [[utilisateurs/herberts]], [[http://forum.ubuntu-fr.org/profile.php?id=7540|Balkoth]] et [[http://forum.ubuntu-fr.org/profile.php?id=41914|Dud]], à partir du sujet http://forum.ubuntu-fr.org/viewtopic.php?pid=1469124. Corrections et compléments par [[utilisateurs/Mysteroïd]], [[:utilisateurs:psychederic|Psychederic]] [[:utilisateurs:mohican|mohican]] : refonte pour la simplicité d'abord, et ajout de compléments. Mise à jour avec Speech Dispatcher et Piper TTS.// | //Contributeurs : Page initiale par [[http://forum.ubuntu-fr.org/profile.php?id=7326|Skippy le Grand Gourou]], [[utilisateurs/herberts]], [[http://forum.ubuntu-fr.org/profile.php?id=7540|Balkoth]] et [[http://forum.ubuntu-fr.org/profile.php?id=41914|Dud]]. Corrections et compléments par [[utilisateurs/Mysteroïd]], [[:utilisateurs:psychederic|Psychederic]], [[:utilisateurs:mohican|mohican]]. |