Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
synthese_vocale [Le 09/01/2018, 15:13]
80.14.250.176 [MBROLA]
synthese_vocale [Le 08/09/2023, 22:31] (Version actuelle)
92.184.110.27 [eSpeak] gespeaker n'est plus dans les dépôts des versions soutenues.
Ligne 1: Ligne 1:
-{{tag>​portail accessibilité audio multimédia}}+{{tag>​portail accessibilité audio multimédia ​synthèse vocale tts}}
  
 ---- ----
Ligne 14: Ligne 14:
 Pour en savoir plus : [[wpfr>​Synthèse_vocale|Wikipedia]] (fr), [[http://​download.gna.org/​lliaphon/​devguide.pdf|Llia-Phon]] (fr). Pour en savoir plus : [[wpfr>​Synthèse_vocale|Wikipedia]] (fr), [[http://​download.gna.org/​lliaphon/​devguide.pdf|Llia-Phon]] (fr).
  
-Ce document a pour but de présenter la mise en œuvre de quelques solutions. ​+Ce document a pour but de présenter la mise en œuvre de quelques solutions.
  
 Comme la [[:​reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://​www.voxforge.org/​fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'​intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. Comme la [[:​reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://​www.voxforge.org/​fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'​intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.
Ligne 23: Ligne 23:
 ===== Logiciels de synthèse vocale ===== ===== Logiciels de synthèse vocale =====
 ====Svoxpico==== ====Svoxpico====
-[[:​Svoxpico]]:​ le lecteur vocal d'​Android,​ de loin celui qui donne les meilleurs résultats, permet de lire n'​importe quelle sélection,+[[:​Svoxpico]]:​ le lecteur vocal d'​Android,​ de loin celui qui donne les meilleurs résultats, permet de lire n'​importe quelle sélection
 + 
 +====gSpeech==== 
 +{{ :​applications:​gspeech.png?​50}} 
 + 
 +**gSpeech** est une GUI par dessus **Svoxpico** tout en améliorant sa prononciation sur les mots/​expressions les plus courantes. 
 +Une description de **gSpeech** est disponible ici : [[https://​wiki.primtux.fr/​doku.php/​gspeech|présentation de gSpeech]]. 
 +Un descriptif plus technique de l'​avancement est également disponible sur [[https://​linuxfr.org/​news/​gspeech-passe-en-0-10|linuxfr]] 
 +===Via un ppa=== 
 +Vous pouvez installer gSpeech en ajoutant un ppa : 
 +  * [[:​PPA|Ajouter le PPA]] **ppa:​jerem-ferry/​tts**((https://​launchpad.net/​~jerem-ferry/​+archive/​ubuntu/​tts)) dans vos sources de logiciels;  
 +  * [[:​tutoriel:​comment_installer_un_paquet|Installer le paquet]] **[[apt>​gspeech]]**.  
 + 
 +Vous pouvez trouver les sources sur [[https://​github.com/​mothsart/​gSpeech.git|Github]].
 ====eSpeak==== ====eSpeak====
   * [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "​robotique",​ mais combiné avec mbrola, il peut donner de bons résultats.   * [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "​robotique",​ mais combiné avec mbrola, il peut donner de bons résultats.
-  *[[:​Gespeaker]] : Interface graphique à eSpeak, pour faire lire le texte que vous tapez dans une case texte. +
-  * **[[apt>​espeak-gui]]** : Autre interface utilisateur graphique pour l'​utilisation d'​eSpeak,​ les résultats semblent de meilleure qualité.+
  
 ====Festival==== ====Festival====
- * **[[http://​www.cstr.ed.ac.uk/​projects/​festival/​|Festival]]** est un synthétiseur vocal, pour lequel il n'​existe apparemment pas de voix française directement pour l'​instant ([[http://​phantomsdad.blogspot.com/​2005/​06/​ktts-and-french-connection.html|avis aux amateurs]]...). ​+ * **[[https://​www.cstr.ed.ac.uk/​projects/​festival/​|Festival]]** est un synthétiseur vocal, pour lequel il n'​existe apparemment pas de voix française directement pour l'​instant ([[http://​phantomsdad.blogspot.com/​2005/​06/​ktts-and-french-connection.html|avis aux amateurs]]...).
  
 Mais il existe un [[wpfr>​Fork (développement logiciel)|fork]] pour festival afin d'​avoir les voix françaises : Où ? Mais il existe un [[wpfr>​Fork (développement logiciel)|fork]] pour festival afin d'​avoir les voix françaises : Où ?
Ligne 52: Ligne 64:
 ==== MBROLA ==== ==== MBROLA ====
  
-Le projet **[[http://​tcts.fpms.ac.be/​synthesis/​mbrola.html|MBROLA]]** ​est développé à la faculté Polytechnique ​de Mons, et comporte un grand nombre de langages/​voix. ​Hélas ​MBROLA [[http://eupat.ffii.org/pikta/xrani/​mbrola/​index.fr.html|n'est pas libre]].+Le projet **[[http://​tcts.fpms.ac.be/​synthesis/​mbrola.html|MBROLA]]** ​a été développé à l'​Université ​de Mons ([[https://​web.umons.ac.be/​numediart/​fr/​|Institut NUMEDIART]]), et comporte un grand nombre de langages/​voix. 
 + 
 +En 2019, **MBROLA ​a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous license GNU GPL3 Afero.**
 Pour l'​installer,​ il suffit d'​[[:​tutoriel:​comment_installer_un_paquet|installer le paquet]] **[[apt>​mbrola]]**. Pour l'​installer,​ il suffit d'​[[:​tutoriel:​comment_installer_un_paquet|installer le paquet]] **[[apt>​mbrola]]**.
  
 Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:​depots|dépôts officiels]],​ pour les installer faites une recherche dans votre [[:​gestionnaire de paquets]] avec le mot clé **Mbrola**.\\ Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:​depots|dépôts officiels]],​ pour les installer faites une recherche dans votre [[:​gestionnaire de paquets]] avec le mot clé **Mbrola**.\\
-Mbrola ne fait pas directement la transformation de texte en voix. Il traite des fichiers de phonèmes. Une autre application,​ capable de décomposer du texte en phonème ​est donc nécessaire,​ comme [[:​eSpeak]].+Mbrola ne fait pas directement la transformation de texte en voix. Il traite des fichiers de phonèmes. Une autre application,​ capable de décomposer du texte en phonèmes ​est donc nécessaire,​ comme [[:​eSpeak]].
 Les voix de Mbrola donnent un rendu plus naturel que celles de eSpeak (lesquelles sont très "​robotiques"​),​ d'où l'​intérêt de combiner les deux. Les voix de Mbrola donnent un rendu plus naturel que celles de eSpeak (lesquelles sont très "​robotiques"​),​ d'où l'​intérêt de combiner les deux.
 Par défaut les voix de Mbrola s'​installent dans **/​usr/​share/​mbrola/​**. Pour le français il existe fr1, une voix masculine, et fr4 une voix féminine.\\ Par défaut les voix de Mbrola s'​installent dans **/​usr/​share/​mbrola/​**. Pour le français il existe fr1, une voix masculine, et fr4 une voix féminine.\\
 Si vous les mettez ailleurs, [[:eSpeak]] ne les trouvera pas. Si vous les mettez ailleurs, [[:eSpeak]] ne les trouvera pas.
  
-Si vous souhaitez ajouter d'​autres voix, elles sont téléchargeables depuis le  [[http://tcts.fpms.ac.be/synthesis/mbrola/​mbrcopybin.html|site officiel]]. [[[[:​archivage#​graphiquement|Extraire]] le fichier zip dans **/​usr/​share/​mbrola/​**. +Si vous souhaitez ajouter d'​autres voix, elles sont téléchargeables depuis le  [[https://github.com/numediart/MBROLA-Voices|site github]]. [[[[:​archivage#​graphiquement|Extraire]] le fichier zip dans **/​usr/​share/​mbrola/​**. 
-Les voix françaises de [[http://tcts.fpms.ac.be/synthesis/mbrola/​mbrcopybin.html|mbrola]] (non libre): +Les voix françaises de [[https://github.com/numediart/MBROLA|mbrola]] (non libres à ce jour, mais en cours d'​ouverture): 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr1/fr1-990204.zip|Voix Mbrola FR1]] : homme, Faculte Polytech. De Mons. +  * [[https://github.com/numediart/MBROLA-voices/​blob/​master/data/fr1/fr1?raw=true|Voix Mbrola FR1]] : homme, Faculte Polytech. De Mons. 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr2/fr2-980806.zip|Voix Mbrola FR2]] : Femme, Celine Egea +  * [[https://github.com/numediart/MBROLA-voices/blob/​master/​data/fr2/fr2?raw=true|Voix Mbrola FR2]] : Femme, Celine Egea 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr3/fr3-990324.zip|Voix Mbrola FR3]] : homme, Babel Technology +  * [[https://github.com/numediart/MBROLA-voices/blob/​master/​data/fr3/fr3?raw=true|Voix Mbrola FR3]] : homme, Babel Technology 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr4/fr4-990521.zip|Voix Mbrola FR4]] : femme, Babel Technology +  * [[https://github.com/numediart/MBROLA-voices/​blob/​master/data/fr4/fr4?raw=true|Voix Mbrola FR4]] : femme, Babel Technology 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr5/fr5-991020.zip|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons +  * [[https://github.com/numediart/MBROLA-voices/​blob/​master/data/fr5/fr5?raw=true|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr6/fr6-010330.zip|Voix Mbrola FR6]] : homme, ​ Faculte Polytech. De Mons +  * [[https://github.com/numediart/MBROLA-voices/blob/​master/​data/fr6/fr6?raw=true|Voix Mbrola FR6]] : homme, ​ Faculte Polytech. De Mons 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr7/fr7-010330.zip|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons, +  * [[https://github.com/numediart/MBROLA-voices/blob/​master/​data/fr7/fr7?raw=true|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons, 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca1/ca1.zip|Voix québecois 1]] : homme,​Vincent Arnaud, +  * [[https://github.com/numediart/MBROLA-voices/​blob/master/data/ca1/ca1?raw=true|Voix québecois 1]] : homme,​Vincent Arnaud, 
-  * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca2/ca2.zip|Voix québecois 2]] : homme, Silex Creations Inc.+  * [[https://github.com/numediart/MBROLA-voices/blob/​master/​data/ca2/ca2?raw=true|Voix québecois 2]] : homme, Silex Creations Inc.
  
  
Ligne 77: Ligne 91:
  
  
-====Autres==== ​+====Autres====
   * [[:Orca]] : outil par défaut d'​Ubuntu,​ fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.)   * [[:Orca]] : outil par défaut d'​Ubuntu,​ fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.)
-  * [[:​abuledu-volubil|Volubil]] : outil destiné aux enfants. 
   * [[https://​github.com/​BullShark/​JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!!   * [[https://​github.com/​BullShark/​JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!!
   * [[http://​www.letime.net/​vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'​étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte.   * [[http://​www.letime.net/​vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'​étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte.
Ligne 85: Ligne 98:
 ==== Logiciels en console ==== ==== Logiciels en console ====
   * **[[apt>​yasr]]** : Yasr est un lecteur d'​écran polyvalent en console pour GNU/Linux et d'​autres systèmes d'​exploitation de style Unix,   * **[[apt>​yasr]]** : Yasr est un lecteur d'​écran polyvalent en console pour GNU/Linux et d'​autres systèmes d'​exploitation de style Unix,
-  * **[[apt>​screader]]** : Le programme de fond screader lit l'​écran et transmet l'​information à un paquet de synthèse vocale logicielle (Comme « festival ») ou à un synthétiseur vocal matériel. 
   * **[[apt>​eflite]]** (emacspeak) s'​utilise avec Festival, donc seulement en anglais pour l'​instant.   * **[[apt>​eflite]]** (emacspeak) s'​utilise avec Festival, donc seulement en anglais pour l'​instant.
  
Ligne 155: Ligne 167:
 2 anglais ` 2 anglais `
  
-##### Sélection automatique de la langue choisie dans le menu Zenity ##### +##### Sélection automatique de la langue choisie dans le menu Zenity #####
  
 case $choix in case $choix in
Ligne 236: Ligne 248:
 Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale :
  
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=413946|Script de diction de l'​heure]] +  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=413946|Script de diction de l'​heure]] 
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=413943|Script de diction du pourcentage de batterie restant]] +  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=413943|Script de diction du pourcentage de batterie restant]] 
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=413944|Réglage du volume avec assistance vocale]] +  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=413944|Réglage du volume avec assistance vocale]] 
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=413945|Consultation de la boite Gmail]] +  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=413945|Consultation de la boite Gmail]] 
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=413950|Aide à la navigation Nautilus]]+  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=413950|Aide à la navigation Nautilus]]
  
 ==== Sous KDE ==== ==== Sous KDE ====
Ligne 252: Ligne 264:
  
 Pour configurer la synthèse vocale: Pour configurer la synthèse vocale:
-  * Faites un clic droit sur l'​icône dans le tableau de bord sur l'​icône Jovie, //​Configurer Jovie//, dans l'​onglet //​Locuteurs//​ entrez un nom, choisissez le locuteur français cliquez sur Ajouter, ​+  * Faites un clic droit sur l'​icône dans le tableau de bord sur l'​icône Jovie, //​Configurer Jovie//, dans l'​onglet //​Locuteurs//​ entrez un nom, choisissez le locuteur français cliquez sur Ajouter,
   * Pour lire du texte sélectionner du texte et cliquer sur l'​icône Jovie ou clic droit, //Lire le contenue du presse-papier//​.\\   * Pour lire du texte sélectionner du texte et cliquer sur l'​icône Jovie ou clic droit, //Lire le contenue du presse-papier//​.\\
   * Lorsque vous utilisez le navigateur [[:​Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé.  ​   * Lorsque vous utilisez le navigateur [[:​Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé.  ​
Ligne 266: Ligne 278:
   * **[[http://​espeak.sourceforge.net/​|Site officiel d'​Espeak]]**.   * **[[http://​espeak.sourceforge.net/​|Site officiel d'​Espeak]]**.
   * [[http://​tcts.fpms.ac.be/​synthesis/​mbrola.html|mbrola]] (en)   * [[http://​tcts.fpms.ac.be/​synthesis/​mbrola.html|mbrola]] (en)
-  * [[http://​www.cstr.ed.ac.uk/​projects/​festival/​|festival]] (en) / [[http://​www.speech.cs.cmu.edu/​flite/​|flite]] (en) / [[http://​festvox.org|Festvox]] (en)+  * [[https://​www.cstr.ed.ac.uk/​projects/​festival/​|festival]] (en) / [[http://​www.speech.cs.cmu.edu/​flite/​|flite]] (en) / [[http://​festvox.org|Festvox]] (en)
   * [[https://​gna.org/​projects/​lliaphon/​|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français.   * [[https://​gna.org/​projects/​lliaphon/​|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français.
   * [[http://​pages.videotron.com/​fluxnic/​cicero/​|Cicero TTS]]   * [[http://​pages.videotron.com/​fluxnic/​cicero/​|Cicero TTS]]
   * [[http://​epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque)   * [[http://​epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque)
   * [[http://​freetts.sourceforge.net/​docs/​index.php|FreeTTS]] (en-us) (en java)   * [[http://​freetts.sourceforge.net/​docs/​index.php|FreeTTS]] (en-us) (en java)
-  * [[http://​forum.ubuntu-fr.org/​viewtopic.php?​id=128037|xclip-speech,​ synthèse vocale]]+  * [[https://​forum.ubuntu-fr.org/​viewtopic.php?​id=128037|xclip-speech,​ synthèse vocale]]
   * [[http://​bothari.free.fr/​weblog/​post/​Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]]   * [[http://​bothari.free.fr/​weblog/​post/​Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]]
  
Ligne 281: Ligne 293:
   * [[http://​wiki.eagle-usb.org/​wakka.php?​wiki=SyntheseParole|Wiki eagle usb]]   * [[http://​wiki.eagle-usb.org/​wakka.php?​wiki=SyntheseParole|Wiki eagle usb]]
  
-==== Tutoriaux ​====+==== Tutoriels ​====
  
   * [[http://​blinuxman.net/​edu/​fr/​EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]]   * [[http://​blinuxman.net/​edu/​fr/​EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]]
   * [[http://​kubuntu.free.fr/​blog/​index.php/​2006/​09/​24/​121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde )   * [[http://​kubuntu.free.fr/​blog/​index.php/​2006/​09/​24/​121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde )
   * [[http://​bothari.free.fr/​weblog/​post/​Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]]   * [[http://​bothari.free.fr/​weblog/​post/​Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]]
-  *  [[http://​ftp.traduc.org/​doc-vf/​gazette-linux/​html/​2005/​114/​lg114-D.html|Faites parler votre shell avec Festival]]+  *  [[https://​ftp.traduc.org/​doc-vf/​gazette-linux/​html/​2005/​114/​lg114-D.html|Faites parler votre shell avec Festival]]
  
 ====Ressources : des voix ==== ====Ressources : des voix ====
  • synthese_vocale.1515507187.txt.gz
  • Dernière modification: Le 09/01/2018, 15:13
  • par 80.14.250.176