Debian Wheezy / KDE4
Reconnaissance et contrôle vocal avec Simon
simon.kde.org/
Matériel nécessaire : un micro de qualité correcte (micro-casque recommandé)
Pour compiler tout cela
apt-get install build-essential bison libclalsadrv-dev libxtst-dev libqwt-dev kde-workspace-dev cmake
Téléchargement & compilation de PocketSphinx 0.8 (moteur de reconnaissance vocale)
cmusphinx.sourceforge.net/wiki/download/
paquets Debian pas présents dans Wheezy, mais dans Jessie. Donc si vous êtes sous Jessie, passez directement à l’installation de Simon
cd; mkdir temp && cd temp
wget http://downloads.sourceforge.net/project/cmusphinx/{sphinxbase/0.8/sphinxbase-0.8.tar.gz,pocketsphinx/0.8/pocketsphinx-0.8.tar.gz,sphinxtrain/1.0.8/sphinxtrain-1.0.8.tar.gz}
Compilation
tar xzf sphinxbase-0.8.tar.gz && pushd sphinxbase-0.8 && ./configure && make && su -c 'make install' && popd
tar xzf pocketsphinx-0.8.tar.gz && pushd pocketsphinx-0.8 && ./configure && make && su -c 'make install' && popd
tar xzf sphinxtrain-1.0.8.tar.gz && pushd sphinxtrain-1.0.8 && ./configure && make && su -c 'make install' && popd
(les fichiers seront installés, par défaut, dans /usr/local/… )
Téléchargement & compilation de Julius, un autre moteur de reconnaissance vocale.
wget http://jaist.dl.sourceforge.jp/julius/60273/julius-4.3.1.tar.gz
tar xzf julius*.tar.gz && pushd julius-4.3.1 && ./configure && make && su -c 'make install' && popd
Simon 0.4.1
wget http://fr2.rpmfind.net/linux/KDE/stable/simon/0.4.1/src/simon-0.4.1.tar.bz2
tar xjf simon*.tar.bz2 && cd simon-0.4.1 && ./build.sh
(lancera la compilation ET l’installation -le mot de passe root sera demandé- si tout s’est bien déroulé)
(Si l’opération échoue, il vous manque sans doute des dépendances, me le signaler)
A l’issue, lancer le logiciel
simon
Branchez votre micro-casque, suivez l’assistant de configuration.
Réglez le volume d’entrée du micro (attention à avoir le moins de souffle possible)
Télécharger un modèle acoustique
Configurer le modèle acoustique > Ouvrir un modèle > Télécharger
Installer le modèle “[EN/VF/JHTK] Voxforge”
(EN = Anglais, VF = VoxForge et non pas Version Française!, JHTK = Julius HTK)
Sélectionnez ce modèle dans la liste et appliquez les changements.
Télécharger un scénario
Gérer les scénario > Ouvrir > Télécharger
Pour commencer, ajouter le scénario “[EN/VF] Window management”
Essayez de prononcer quelques mots de ce scénario (par exemple : "previous window, “next window”)
Pour améliorer la reconnaissance, vous pouvez “démarrer l’entrainement” pour le scénario.
Puis testez d’autres scénarii (j’en suis à ce stade)
Pour faire la même chose en Français, il faudrait trouver les scénarii et les modèles acoustiques adaptés.
N’hésitez pas à tester et partagez vos résultats!