Contenu | Rechercher | Menus
Cette page est en cours de rédaction.
Apportez votre aide…

CMU Sphinx

CMU Sphinx est un logiciel de reconnaissance vocale sous licence BSD. Cette page explique comment démarrer une application utilisant la reconnaissance vocale avec sphinx. Nous utilisons sphinx4 (en java), mais il existe aussi pocketsphinx, qui a l'air plus simple. Pour l'instant, cette page décrit l'utilisation de sphinx en langage Java. Il existe aussi une version en C.

Sphinx est aussi (entre autres) le nom d'un générateur de documentation écrit en python, ainsi les recherches à son sujet sur le web renvoient parfois des résultats qui ne sont pas appropriés.

Pré-requis

Installation

Téléchargez ici les sources de sphinx. La dernière version stable en juillet 2014 est la 4.1.0beta6. Décompressez l'archive, vous obtiendrez un dossier sphinx4-1.0beta6.

Une partie de sphinx (la "jsapi") n'est pas sous licence libre, contrairement au reste. Pour installer cette partie, qui nous sera utile par la suite, il faut lancer un script qui va nous demander d'accepter cette licence puis décompresser la "jsapi". Pour cela depuis le dossier sphinx4-1.0beta6 obtenu en décompressant les sources de sphinx :

  • Rendez les script éxécutable
  • Déplacez vous dans le dossier adéquat avec la commande :
    cd sphinx4-1.0beta6-src/sphinx4-1.0beta6/lib/
  • Lancez le script d'installation de la jsapi avec la commande dans un terminal:
    sh jsapi.sh

appuyer sur <espace> pour faire défiler le texte de la licence, puis répondre 'y' à la question 'Accept (y/n)?:' - Si l'on obtient l'erreur suivante, c'est qu'il faut installer le paquet sharutils (cf ci-dessus):

jsapi.sh: 257: jsapi.sh: uudecode: not found

Configuration

FIXME

Utilisation

Première étape: tester un code d'exemple présent dans le paquet. La reconnaissance vocale sera en anglais. Nous allons compiler un des programmes d'exemple ("hello world") depuis eclipse.

  • Démarrer eclipse, soit depuis le bureau, soit en tapant la commande 'eclipse' dans un terminal. Si c'est le premier démarrage d'eclipse, celui-ci demande de choisir un répertoire "workspace" où il stockera les projets. Accepter la réponse par défaut (/home/VOTRELOGIN/workspace), et cocher la case "Use this as default".
  • Dans l'écran d'accueil d'eclipse, cliquer sur "workbench" (flèche en haut à droite).
  • Créer un nouveau projet: sélectionner "Fichier → Nouveau → Projet", puis dans la boîte de dialogue choisir "projet java", puis cliquer sur "suivant"
  • Comme nom de projet, choisir "helloworld" et cliquer sur suivant
  • Passer la dernière boîte de dialogue en cliquant sur "terminer", et si eclipse le demande, accepter d'activer la "perspective java".
  • Importer le répertoire contenant l'exemple "helloworld": dans le menu "Fichier → Importer", "General → File System". Cliquer sur "parcourir", et sélectionner le répertoire "sphinx-4.1.0/src/apps/edu/cmu/sphinx/demo/helloworld". Une fois le répertoire sélectionné cocher tous les fichiers qui s'affichent, puis cliquer sur "Terminer".
  • Charger les .jar: clic droit sur le projet "helloworld" dans l'arborescence qui apparaît à gauche.

Dans le menu, choisir "configurer le buildpath", puis dans la boîte de dialogue qui s'ouvre "Java build path", onglet "libraries" puis "external jar". Sélectionner le répertoire sphinx-4.1.0/lib Une liste des jar apparaît, il faut tous les sélectionner et valider. Ensuite, recliquer sur "external jar" et aller chercher "sphinx4-1.0beta6/src/jsapi2/org.jvoicexml.jsapi2.jse.sphinx4/3rdparty/sphinx4/lib/sphinx4.jar", ainsi que "./sphinx4-1.0beta6/src/jsapi2/org.jvoicexml.jsapi2.jse.sphinx4/3rdparty/sphinx4/lib/WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz.jar"

  • Changer la déclaration du package "helloworld": eclipse indique une erreur à la ligne 3 du fichier (une ampoule avec une croix sur fond rouge). Pour voir ce dont il s'agit, laisser la souris au-dessus de la ligne 3 du fichier, une ligne de diagnostic, à propos de la position du package. Parmi les solutions ("quickfixes") proposées en dessous, choisir "déplacer helloworld.java dans edu.cmu.sphinx.demo.helloworld".
  • Charger les ressources. À ce stade-là, il ne doit plus y avoir d'erreurs dans la marge de "helloworld.java". On peut donc lancer l'application avec le bouton "run" (dans la barre d'outils). Choisir "as java application". On obtient l'erreur suivante:
Exception in thread "main" java.lang.NullPointerException

at edu.cmu.sphinx.util.props.SaxLoader.load(SaxLoader.java:74) at edu.cmu.sphinx.util.props.ConfigurationManager.<init>(ConfigurationManager.java:58) at edu.cmu.sphinx.demo.helloworld.HelloWorld.main(HelloWorld.java:33) C'est parce qu'il faut importer les "ressources" dans le projet. Dans le "project explorer", dérouler l'arborescence jusqu'à voir la classe HelloWorld ("HelloWorld" avec un 'c' blanc sur fond vert à gauche). Cliquer avec le bouton droit sur la classe, et choisir "Import…". Choisir "General → FileSystem", ce qui ouvre une boîte de dialogue dans laquelle on clique sur "browser". On navigue dans l'arborescence, on sélectionne le répertoire "sphinx-4.1.0/src/apps/edu/cmu/sphinx/demo/helloworld". Une fois le répertoire sélectionné cocher tous les fichiers qui s'affichent, puis cliquer sur "Terminer".

  • Adapter le fichier de configuration à la position des ressources. Dans le "project explorer", ouvrir le fichier "helloworld.config.xml" qui est dans la classe helloWorld. Le contenu de ce fichier apparaît dans le panneau de droite. Trouver la ligne suivante:
<property name="fillerPath" value="resource:/WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz/noisedict"/>

et remplacer "noisedict" par "fillerdict". On obtient:

<property name="fillerPath" value="resource:/WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz/dict/fillerdict"/>
  • Toujours dans le fichier de configuration, après la ligne 131, ajouter les deux lignes suivantes:
<property name="modelDefinition" value="etc/WSJ_clean_13dCep_16k_40mel_130Hz_6800Hz.4000.mdef"/>
       <property name="dataLocation" value="cd_continuous_8gau/"/>

à partir d'ici, pas vérifié

Dans le fichier de configuration, trouver la section concernant le dictionnaire. L'un des items de cette section indique le chemin du dictionnaire (commence par /ressource…) Il faut remplacer ce chemin par la position où nous avons importé le dictionnaire de notre projet, par exemple ressource:/edu/sphinx/…/helloworld/dict Faire de même avec la grammaire et le dictionnaire de filler.

On peut maintenant tester le helloworld en cliquant sur Debug (flèche verte). Si la qualité de la reconnaissance est mauvaise, c'est normal.

Pour le français

Modifier le "helloworld" anglais pour l'adapter au français. Pour cela, il faut récupérer les ressources (grammaire, dictionnaire et modèle acoustique), et modifier le fichier de configuration pour que ces nouvelles ressources soient prises en compte.

Dictionnaire: récupérer le fichier french62K.dic à l'url https://code.google.com/p/voicecmdr/source/browse/branches/workflow/src/sphinx4/french/etc/frenchWords62K.dic, l'importer dans le projet eclipse, puis modifier le chemin du dictionnaire dans la section "dictionnary" du fichier configuration.xml, Grammaire: il faut créer une grammaire, sur le modèle de celle qui existe en anglais, l'importer dans le projet eclipse, puis modifier le chemin pour qu'elle soit prise en compte, Modèle acoustique: il faut l'importer dans le projet eclipse, puis le pointer depuis le fichier de configuration. On le récupère à l'url https://voicecmdr.googlecode.com/svn/branches/workflow/src/sphinx4/french/model_architecture/french_f0.5725.mdef le fichier dmp: https://voicecmdr.googlecode.com/svn/branches/workflow/src/sphinx4/french/etc/french3g62K.DMP

Voir aussi


Contributeurs : FIXME.



Le contenu de ce wiki est sous licence : CC BY-SA v3.0