| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
| synthese_vocale [Le 08/09/2021, 20:16] – ajout de tags 88.166.188.193 | synthese_vocale [Le 06/05/2026, 12:27] (Version actuelle) – attention à fermer l'italique en fin de page krodelabestiole |
|---|
| {{tag>portail accessibilité audio multimédia synthèse vocale tts}} | {{tag>portail accessibilité audio multimédia}} |
| | |
| ---- | |
| |
| ====== Synthèse vocale ====== | ====== Synthèse vocale ====== |
| La synthèse vocale procède en trois temps : | La synthèse vocale procède en trois temps : |
| - transformation du texte en [[wpfr>Phonème|phonèmes]] ; | - transformation du texte en [[wpfr>Phonème|phonèmes]] ; |
| - [[wpfr>Prosodie]] (ajout d'informations de prononciation : accents toniques, indication de durée, etc.) ; | - [[wpfr>Prosodie]] (ajout d'informations de prononciation : accents toniques, indication de durée, etc.) ; |
| - assembler des sons pré-enregistrés en suivant les règles établies par les deux premières étapes. | - assembler des sons pré-enregistrés en suivant les règles établies par les deux premières étapes. |
| |
| Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr), [[http://download.gna.org/lliaphon/devguide.pdf|Llia-Phon]] (fr). | Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr). |
| |
| Ce document a pour but de présenter la mise en œuvre de quelques solutions. | Ce document a pour but de présenter la mise en œuvre de quelques solutions. |
| |
| Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. | Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. |
| |
| <note tip>Certains logiciels libres sont compatibles avec les voix Windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]]). | <note tip>Certains logiciels libres sont compatibles avec les voix Windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]]).</note> |
| </note> | |
| |
| ===== Logiciels de synthèse vocale ===== | =====Speech Dispatcher : l'approche unifiée===== |
| ====Svoxpico==== | |
| [[:Svoxpico]]: le lecteur vocal d'Android, de loin celui qui donne les meilleurs résultats, permet de lire n'importe quelle sélection, | |
| ====eSpeak==== | |
| * [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. | |
| *[[:Gespeaker]] : Interface graphique à eSpeak, pour faire lire le texte que vous tapez dans une case texte. | |
| |
| | **Speech Dispatcher** est une interface standardisée pour la synthèse vocale sous Linux. De nombreuses applications (comme Orca, Firefox) l'utilisent pour parler sans avoir à connaître le moteur TTS sous-jacent. |
| |
| ====Festival==== | ==== Installation ==== |
| * **[[http://www.cstr.ed.ac.uk/projects/festival/|Festival]]** est un synthétiseur vocal, pour lequel il n'existe apparemment pas de voix française directement pour l'instant ([[http://phantomsdad.blogspot.com/2005/06/ktts-and-french-connection.html|avis aux amateurs]]...). | [[:tutoriel:comment_installer_un_paquet|Installez le paquet]] **[[apt>speech-dispatcher]]**. |
| |
| Mais il existe un [[wpfr>Fork (développement logiciel)|fork]] pour festival afin d'avoir les voix françaises : Où ? | ==== Choisir son moteur TTS par défaut ==== |
| De même festival peut utiliser les voix françaises de Mbrola - (et Sapi).\\ | |
| Il peut fonctionner en mode interactif, même si ça n'a pas l'air très intuitif de prime abord...\\ | |
| Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>festival]]**, et [[apt>festvox-rablpc16k|d'autres voix anglaises]]. (voir également [[wpfr>Festival Speech Synthesis System|plus d'information relative sur wikipedia]]) | |
| |
| Pour l'utiliser entrez la commande suivante dans un [[terminal]] : | Speech Dispatcher peut utiliser différents moteurs : espeak, festival, piper, etc. |
| <code>echo "That's really a pity I'm not able to speak French" | festival --tts</code> | |
| |
| Pour connaître les options : <code>festival --help</code> | **1. Voir les modules disponibles :** |
| <note important>Si vous obtenez une erreur du type ''can't open /dev/dsp'', réessayez après avoir fermé toutes les applications (y compris les pages internet nécessitant certains plugins) utilisant le son. | |
| On peut éviter le ''can't open /dev/dsp'' en redirigeant le son vers ALSA. Pour cela, on demande à festival de sortir le son avec aplay. On [[:tutoriel:comment_modifier_un_fichier|Créez le fichier]] [[:fichier_cache|caché]] **.festivalrc** dans votre **Dossier personnel** avec le contenu suivant : | |
| <file> | |
| (Parameter.set 'Audio_Command "aplay -t wav -r $SR $FILE") | |
| (Parameter.set 'Audio_Method 'Audio_Command) | |
| (Parameter.set 'Audio_Required_Format 'wav) | |
| </file> | |
| </note> | |
| |
| ==== MBROLA ==== | <code bash> |
| | spd-say -O |
| | </code> |
| |
| Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** a été développé à l'Université de Mons ([[https://web.umons.ac.be/numediart/fr/|Institut NUMEDIART]]), et comporte un grand nombre de langages/voix. | **2. Changer le moteur par défaut :** |
| |
| En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous license GNU GPL3 Afero.** | Éditez le fichier de configuration système avec les droits d'administration : |
| Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>mbrola]]**. | ''/etc/speech-dispatcher/speechd.conf'' |
| |
| Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:depots|dépôts officiels]], pour les installer faites une recherche dans votre [[:gestionnaire de paquets]] avec le mot clé **Mbrola**.\\ | Décommentez ou ajoutez : |
| Mbrola ne fait pas directement la transformation de texte en voix. Il traite des fichiers de phonèmes. Une autre application, capable de décomposer du texte en phonèmes est donc nécessaire, comme [[:eSpeak]]. | |
| Les voix de Mbrola donnent un rendu plus naturel que celles de eSpeak (lesquelles sont très "robotiques"), d'où l'intérêt de combiner les deux. | |
| Par défaut les voix de Mbrola s'installent dans **/usr/share/mbrola/**. Pour le français il existe fr1, une voix masculine, et fr4 une voix féminine.\\ | |
| Si vous les mettez ailleurs, [[:eSpeak]] ne les trouvera pas. | |
| |
| Si vous souhaitez ajouter d'autres voix, elles sont téléchargeables depuis le [[https://github.com/numediart/MBROLA-Voices|site github]]. [[[[:archivage#graphiquement|Extraire]] le fichier zip dans **/usr/share/mbrola/**. | <file> |
| Les voix françaises de [[https://github.com/numediart/MBROLA|mbrola]] (non libres à ce jour, mais en cours d'ouverture): | DefaultModule <nom_du_module> |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr1/fr1?raw=true|Voix Mbrola FR1]] : homme, Faculte Polytech. De Mons. | </file> |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr2/fr2?raw=true|Voix Mbrola FR2]] : Femme, Celine Egea | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr3/fr3?raw=true|Voix Mbrola FR3]] : homme, Babel Technology | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr4/fr4?raw=true|Voix Mbrola FR4]] : femme, Babel Technology | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr5/fr5?raw=true|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr6/fr6?raw=true|Voix Mbrola FR6]] : homme, Faculte Polytech. De Mons | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr7/fr7?raw=true|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons, | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/ca1/ca1?raw=true|Voix québecois 1]] : homme,Vincent Arnaud, | |
| * [[https://github.com/numediart/MBROLA-voices/blob/master/data/ca2/ca2?raw=true|Voix québecois 2]] : homme, Silex Creations Inc. | |
| |
| | Exemples : |
| | <file> |
| | DefaultModule espeak-ng # voix robotique mais rapide |
| | DefaultModule festival # voix festival (si installé) |
| | DefaultModule piper # voix neuronale (voir ci-dessous, recommandé) |
| | </file> |
| |
| MBROLA est également disponible sous forme de fichiers binaires téléchargeables [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|première partie de la page]]. ((Il y a aussi des « .deb » [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|ici]] (troisième ligne linux)...)) On extrait le fichier qui correspond à son [[:architecture matérielle|architecture]] dans un répertoire au choix, de préférence /usr/share/mbrola (là où se fait l'installation par les dépôts). | **3. Redémarrer Speech Dispatcher après modification :** |
| |
| | <code bash> |
| | pkill -f speech-dispatcher; speech-dispatcher |
| | </code> |
| |
| ====Autres==== | **4. Tester la voix :** |
| * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | |
| * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! | |
| * [[http://www.letime.net/vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte. | |
| |
| ==== Logiciels en console ==== | <code bash> |
| * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix, | spd-say "Bonjour, ceci est un test de synthèse vocale" |
| * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. | </code> |
| |
| =====Synthèse vocale intégrée à certaines applications===== | ==== Intégration avec Piper (voix neuronales) ==== |
| ==== Synthèse vocale dans Pidgin==== | |
| |
| La synthèse vocale dans Pidgin avec : | Pour utiliser [[:piper_tts|Piper]] comme moteur par défaut de Speech Dispatcher, consultez la [[:piper_tts|page dédiée à Piper TTS]]. La configuration correcte pour Ubuntu 24.04 utilise le module générique ''sd_generic'' avec ''paplay'' (PulseAudio) pour éviter les conflits audio avec les navigateurs web. |
| * [[apt://pidgin-festival|pidgin-festival]] : s'installe en 1 clic (installe Festival et Pidgin s'ils ne sont pas déjà installés). Vous pouvez déjà activer le plugin dans Pidgin, mais vous n'aurez qu'une voix anglaise. Il vous reste donc à installer une voix française et la sélectionner. | |
| |
| ==== Dans le dictionnaire Stardict==== | ===== Logiciels de synthèse vocale ===== |
| |
| Vous pouvez installer : | ==== Piper TTS (voix neuronales de haute qualité) ==== |
| * [[apt>stardict-plugin-festival|le plugin Festival]] | |
| * [[apt>stardict-plugin-espeak|le plugin Espeak]] | |
| ==== Dans le dictionnaire Goldendict==== | |
| [[:Goldendict]] est un peu le remplaçant de [[:Stardict]] il permet aussi, dans sa dernière version, d'intégrer un synthétiseur vocale, Pour cela : | |
| * Installez [[:eSpeak]] et éventuellement [[#Mbrola]] | |
| * Appuyer sur F3 pour ouvrir la fenêtre des dictionnaires | |
| * Dans l'onglet //Sources// selectionnez //Programmes// | |
| * Cliquez sur //Ajouter//, dans //Type// mettez //Audio// et dans //Ligne de commande// ''espeak -v f %GDWORD%'' ou ''espeak -v mb/mb-fr1 -f %GDWORD%'' si vous souhaitez utiliser Mbrola. | |
| * Fermez et rouvrez Goldendict, vous trouverez maintenant une catégorie dans vos dictionnaires avec un icône d'haut-parleur devant le mot recherché. | |
| |
| Si vous souhaitez ajouter la lecture en d'autres langues, modifiez la commande **f** par celle de la langue souhaitée. | **[[:piper_tts|Piper]]** est un moteur TTS moderne utilisant des réseaux de neurones pour produire des voix très naturelles, proches de l'humain. Il est **totalement hors-ligne** et rapide. Voir la [[:piper_tts|page dédiée]]. |
| |
| | ==== Svoxpico ==== |
| | [[:Svoxpico]] : était le premier lecteur vocal d'Android, de loin celui qui donnait les meilleurs résultats pour un usage courant. Il permet de lire n'importe quelle sélection. |
| |
| ====Synthèse vocale dans LibreOffice ou Apache Openoffice ==== | ==== gSpeech ==== |
| | {{ :applications:gspeech.png?50}} |
| |
| Il suffit d'installer l'extension [[http://extensions.libreoffice.org/extension-center/read-text|readtext]] ou [[https://extensions.openoffice.org/fr/node/17608|PicoSvoxOOo]] pour Apache Openoffice. Il fonctionne avec [[:Svoxpico]] mais est compatible avec Festival et Espeak. | **gSpeech** est une GUI par dessus **Svoxpico** tout en améliorant sa prononciation sur les mots/expressions les plus courantes. |
| Une fois [[:libreoffice#installer_une_extension|l'extension installée dans LibreOffice]], vous trouverez une icône dans votre barre d'outils en haut à gauche: | |
| |
| {{:accessibilite:readtext.png}} | Une description de **gSpeech** est disponible ici : [[https://wiki.primtux.fr/doku.php/gspeech|présentation de gSpeech]]. |
| | Un descriptif plus technique de l'avancement est également disponible sur [[https://linuxfr.org/news/gspeech-passe-en-0-10|linuxfr]] |
| |
| Pour l'utiliser, sélectionner le texte à lire, cliquez sur l'icône (la bulle noire), une fenêtre s'ouvre, cliquez sur **OK**. | **Installation via un PPA :** |
| | * [[:PPA|Ajouter le PPA]] **ppa:jerem-ferry/tts**((https://launchpad.net/~jerem-ferry/+archive/ubuntu/tts)) dans vos sources de logiciels; |
| | * [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gspeech]]**. |
| |
| ====Synthèse vocale dans Firefox ==== | Vous pouvez trouver les sources sur [[https://github.com/mothsart/gSpeech.git|Github]]. |
| Avec [[:Svoxpico]] l'ajout d'une extension est inutile, **Pico** faisant déjà le travail de lecture.\\ | |
| Cependant sachez qu'il existe différents modules qui permettent la synthèse vocale des pages consultées : | |
| * [[https://addons.cdn.mozilla.net/user-media/addons/9759/foxvox-1.7.9.1-fx-linux.xpi?filehash=sha256%3Acd1ca1aeefa654065390af9b680d00d375d43a4bdc871b9ea719565af20dc8bd|foxvox]] | |
| * [[https://addons.cdn.mozilla.net/user-media/addons/91405/text_to_voice-1.15-fx.xpi?filehash=sha256%3A26dd98884c6cc97dff5c665ac5dc77914530b5ce2dff0aef3b0fef310a9e9f5d|Text to voice]] | |
| |
| Depuis la version 49, le mode Lecture s'agrémente de la parole intégrée dans le navigateur et s'appuyant sur la distribution, etc : Détails sur [[https://blog.mozfr.org/post/2016/09/Mozilla-Firefox-49|le Blog de MozFr]] ; | ==== eSpeak ==== |
| | [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. |
| |
| Vous pouvez également utiliser Mathspeak pour la lecture de formule mathématique.\\ | [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>espeak-ng,espeak-ng-data]]**. |
| Faites une recherche dans les modules complémentaires pour voir les différents choix possibles. | |
| |
| ====Synthèse vocale dans Chromium ==== | ==== Festival ==== |
| Avec [[:Svoxpico]] l'ajout d'une extension est inutile, **Pico** faisant déjà le travail de lecture.\\ | [[https://www.cstr.ed.ac.uk/projects/festival/|Festival]] est un synthétiseur vocal historique, pour lequel il n'existe apparemment pas de voix française. |
| Cependant sachez qu'il existe différentes extensions qui permettent la synthèse vocale des pages consultées : | |
| Installez l'extension [[https://chrome.google.com/webstore/detail/speak-text/dchmahpmnpogmfofejmdndonfljkjhdm?hl=fr|SpeakIt]] ou claroRead Chrome. | |
| |
| Faites une recherche dans les extensions Chrome pour voir les différents choix possibles. | [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>festival,festvox-rablpc16k]]**. |
| ===== Intégration dans l'environnement de bureau ===== | |
| |
| Il est possible d'intégrer ces solutions dans votre environnement de bureau, afin de faire lire le contenu des répertoires ou des pages internet par exemple. | <note>Festival est moins utilisé aujourd'hui au profit de Piper.</note> |
| ==== Sous Unity et Gnome==== | |
| Par défaut sous [[:Unity]] et [[:Gnome]] en général, [[:Orca]] permet de lire le contenu affiché à l'écran. | |
| Ce qui suit sont des alternatives, à travers des scripts à intégrer à l'environnement Gnome. Pensez à adapter la configuration du script à votre convenance. Les scripts qui suivent doivent être intégrés à [[:nautilus_scripts|nautilus-scripts]] pour leur utilisation. | |
| FIXME Comment les arrêter? Refaire cette opération pendant la lecture en cours interrompra la lecture. | |
| * Lire le texte sélectionné à l'écran : | |
| FIXME Semble ne pas fonctionner ? | |
| Pour utiliser ce script, il faut [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>xclip]]**, puis l'enregistrez selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''LecteurdeSelection.sh'': | |
| |
| <file bash ~/.local/share/nautilus/scripts/LecteurdeSelection.sh>#!/bin/bash | ==== MBROLA ==== |
| |
| ##### Affiche le menu Zenity ##### | Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** a été développé à l'Université de Mons ([[https://web.umons.ac.be/numediart/fr/|Institut NUMEDIART]]), et comporte un grand nombre de langages/voix. |
| |
| choix=`zenity --list --title="Choisissez la langue" --column="N°" --column="Langue" --height="200" \ | En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous licence GNU GPL3 Afero.** |
| 1 français \ | |
| 2 anglais ` | |
| |
| ##### Sélection automatique de la langue choisie dans le menu Zenity ##### | [[:tutoriel:comment_installer_un_paquet|Installez le paquet]] **[[apt>mbrola]]**. |
| |
| case $choix in | Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:depots|dépôts officiels]], pour les installer faites une recherche dans votre [[:gestionnaire de paquets]] avec le mot clé **Mbrola**. |
| 1 ) VOIX=/usr/share/mbrola/fr4/fr4 && TYPE=mb/mb-fr4 ;; # pour une voix de femme en français | |
| 2 ) VOIX=/usr/share/mbrola/us1/us1 && TYPE=mb/mb-us1 ;; # pour une voix de femme en anglais | |
| esac | |
| | |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) && sleep 2 | |
| fi | |
| |
| # On traduit la sélection en phonèmes grâce à Espeak, et on l'envoie à Mbrola | **Voix françaises MBROLA :** |
| xclip -o | espeak -v $TYPE -s 150 -p 40 "$@" | mbrola $VOIX - -.au | aplay | * fr1 (homme), fr2 (femme), fr3 (homme), fr4 (femme), fr5 (homme belge), fr6 (homme), fr7 (homme belge) |
| |
| </file> | **Combinaison avec eSpeak :** |
| | <code bash> |
| | espeak -v mb/mb-fr4 "Bonjour" | mbrola /usr/share/mbrola/fr4/fr4 - -.au | aplay |
| | </code> |
| |
| * Lire le contenu d'un fichier texte : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''Readfile.sh'': | ==== Autres ==== |
| | * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) |
| | * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! |
| |
| <file bash ~/.local/share/nautilus/scripts/Readfile.sh>#!/bin/bash | ==== Logiciels en console ==== |
| | * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix. |
| | * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. |
| |
| ######### Début de la section de configuration ######### | =====Synthèse vocale intégrée à certaines applications===== |
| |
| # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin : | ==== Synthèse vocale dans Pidgin==== |
| VOIX=/usr/share/mbrola/fr4/fr4 | |
| #VOIX=/usr/share/mbrola/fr1/fr1 # à décommenter si vous vous voulez une voix d'homme | |
| TYPE=mb/mb-fr4 | |
| # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme | |
| |
| ######### Fin de la section de configuration ######### | La synthèse vocale dans Pidgin avec : |
| | * [[apt://pidgin-festival|pidgin-festival]] : s'installe en 1 clic (installe Festival et Pidgin s'ils ne sont pas déjà installés). Vous pouvez déjà activer le plugin dans Pidgin, mais vous n'aurez qu'une voix anglaise. Il vous reste donc à installer une voix française et la sélectionner. |
| |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | ==== Dans le dictionnaire Stardict==== |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) | |
| |
| else | Vous pouvez installer : |
| # On traduit le fichier en phonèmes grâce à espeak, et on l'envoie à Mbrola | * [[apt>stardict-plugin-festival|le plugin Festival]] |
| espeak -v $TYPE -s 150 -f "$@" | mbrola $VOIX - -.au | aplay | * [[apt>stardict-plugin-espeak|le plugin Espeak]] |
| fi</file> | |
| |
| * Lire la liste des éléments contenus dans un dossier : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''ReadFolder.sh'': | ==== Dans le dictionnaire Goldendict==== |
| | [[:Goldendict]] est un peu le remplaçant de [[:Stardict]] il permet aussi, dans sa dernière version, d'intégrer un synthétiseur vocal. Pour cela : |
| | * Installez [[:eSpeak]] et éventuellement [[#Mbrola]] |
| | * Appuyer sur F3 pour ouvrir la fenêtre des dictionnaires |
| | * Dans l'onglet //Sources// selectionnez //Programmes// |
| | * Cliquez sur //Ajouter//, dans //Type// mettez //Audio// et dans //Ligne de commande// ''espeak -v f %GDWORD%'' ou ''espeak -v mb/mb-fr1 -f %GDWORD%'' si vous souhaitez utiliser Mbrola. |
| | * Fermez et rouvrez Goldendict, vous trouverez maintenant une catégorie dans vos dictionnaires avec un icône d'haut-parleur devant le mot recherché. |
| |
| <file bash ~/.local/share/nautilus/scripts/ReadFolder.sh>#!/bin/bash | Si vous souhaitez ajouter la lecture en d'autres langues, modifiez la commande **f** par celle de la langue souhaitée. |
| |
| ######### Début de la section de configuration ######### | ====Synthèse vocale dans LibreOffice ==== |
| |
| # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin | Il suffit d'installer l'extension [[http://extensions.libreoffice.org/extension-center/read-text|readtext]] ou [[https://extensions.openoffice.org/fr/node/17608|PicoSvoxOOo]] pour Apache Openoffice. Il fonctionne avec [[:Svoxpico]] mais est compatible avec Festival et Espeak. |
| VOIX=/usr/share/mbrola/fr4/fr4 | Une fois [[:libreoffice#installer_une_extension|l'extension installée dans LibreOffice]], vous trouverez une icône dans votre barre d'outils en haut à gauche: |
| TYPE=mb/mb-fr4 # si vous avez téléchargé une voix de femme | |
| # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme | |
| |
| ######### Fin de la section de configuration ######### | {{:accessibilite:readtext.png}} |
| |
| # on teste si la lecture est en cours, pour l'arrêter le cas échéant | Pour l'utiliser, sélectionner le texte à lire, cliquez sur l'icône (la bulle noire), une fenêtre s'ouvre, cliquez sur **OK**. |
| if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | |
| kill $(ps -A | grep mbrola | awk '{ print $1 }' ) | |
| |
| else | ==== Activer la lecture à voix haute dans Firefox ==== |
| |
| #On liste les fichiers contenus dans le répertoire ou bien ceux sélectionnés par la souris | Firefox dispose d'une fonction de lecture à voix haute intégrée, accessible via le **Mode Lecture**. Elle utilise Speech Dispatcher et donc le moteur TTS configuré par défaut (par exemple Piper). Voilà comment l'utiliser : |
| FICHIERS=`ls -1 --quoting-style=c "$@"` | * Ouvrir une page compatible : le mode lecture n'est disponible que sur les pages contenant du texte (articles, blogs, documentations). Il n'apparaît pas sur les pages d'accueil ou les sites complexes. |
| | * Activer le Mode Lecture : repérez l'icône en forme de **page ou de document** dans la barre d'adresse, à droite. Cliquez sur cette icône. La page se transforme en vue simplifiée, sans publicités ni menus. |
| for TEXTE in $FICHIERS | * Lancer la lecture à voix haute : une fois en mode lecture, une barre d'outils apparaît sur le **côté gauche** de la page. Cliquez sur le bouton **"Lecture à voix haute"** (icône de haut-parleur). |
| do | |
| |
| # On traduit le fichier texte temporaire en phonèmes grâce à Espeak, et on l'envoie à Mbrola | <note important>Firefox garde parfois le périphérique audio ALSA en exclusivité. Si la lecture à voix haute ne fonctionne pas ou plante, assurez-vous que votre configuration Speech Dispatcher utilise **paplay** (PulseAudio) plutôt que **aplay** pour la sortie audio. Voir la [[:piper_tts|page Piper TTS]] pour la configuration correcte.</note> |
| espeak -v $TYPE -s 140 -p 40 $TEXTE | mbrola $VOIX - -.au | aplay | |
| done | |
| |
| fi</file> | Vérifiez également dans ''about:config'' que ''media.webspeech.synth.enabled'' est à ''true''. |
| |
| * Lire le contenu du presse papier ou de la sélection à l'aide d'un raccourci clavier : FIXME ne semble pas fonctionner? | ====Synthèse vocale dans Brave/Chromium ==== |
| * [[:tutoriel:comment_installer_un_paquet|installez les paquets]] **[[apt>xclip,recode,xbindkeys|xclip recode xbindkeys]]**. | Il existe différentes extensions qui permettent la synthèse vocale des pages consultées : |
| * Enregistrez le script [[http://forum.ubuntu-fr.org/viewtopic.php?pid=3686193#p3686193|suivant]], toujours avec [[:Nautilus_scripts|Nautilus-scripts]] | Installez l'extension [[https://chrome.google.com/webstore/detail/speak-text/dchmahpmnpogmfofejmdndonfljkjhdm?hl=fr|SpeakIt]] ou claroRead Chrome. |
| |
| À partir de là vous pouvez faire lire votre sélection de texte ou le contenu du presse-papier (texte copié par [Ctrl+C] par exemple) en cliquant avec le bouton droit sur le bureau ou une fenêtre nautilus et en choisissant "scripts / lit le contenu..." | ===Outil par défaut proposé par Brave=== |
| |
| Pour définir un raccourci clavier reportez-vous à la page [[:xbindkeys]]. | Le **Speedreader** est un lecteur proposé par défaut sur Brave. Pour l'activer : |
| | * Dans Brave, allez dans **Menu → Paramètres → Apparence** et activez l'option Speedreader. |
| | * Le navigateur détecte automatiquement si une page peut être simplifiée. Si c'est le cas, l'icône du mode lecture apparaît dans la barre d'adresse. |
| | * Cliquez dessus pour afficher la page en format simplifié avec les commandes Speedreader. |
| |
| Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : | ===== Intégration dans l'environnement de bureau ===== |
| |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413946|Script de diction de l'heure]] | ==== Sous Unity et Gnome==== |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413943|Script de diction du pourcentage de batterie restant]] | Par défaut sous [[:Unity]] et [[:Gnome]] en général, [[:Orca]] permet de lire le contenu affiché à l'écran. |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413944|Réglage du volume avec assistance vocale]] | |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413945|Consultation de la boite Gmail]] | |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413950|Aide à la navigation Nautilus]] | |
| |
| ==== Sous KDE ==== | ==== Sous KDE ==== |
| |
| Grâce à **kttsd** KDE offre une manière élégante et simple de lire du texte affiché à l'écran mais par défaut il utilise [[#Festival]], il n'y a donc pas de français, c'est pourquoi il faudra aussi installer **[[:eSpeak]]**. | Grâce à **kttsd** KDE offre une manière élégante et simple de lire du texte affiché à l'écran. |
| |
| Pour le mettre en place il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>espeak]]** et **[[apt>kttsd]]** qui contient: | Pour le mettre en place il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>espeak]]** et **[[apt>kttsd]]** qui contient: |
| * le démon kttsd, | * le démon kttsd, |
| * Jovie, une application permettant de lire un document copié ou que l'on tape. | * Jovie, une application permettant de lire un document copié ou que l'on tape. |
| * La synthèse vocale sera également intégrée dans [[:Konqueror]] et dans [[:Kate]]. | * La synthèse vocale sera également intégrée dans [[:Konqueror]] et dans [[:Kate]]. |
| |
| Pour configurer la synthèse vocale: | |
| * Faites un clic droit sur l'icône dans le tableau de bord sur l'icône Jovie, //Configurer Jovie//, dans l'onglet //Locuteurs// entrez un nom, choisissez le locuteur français cliquez sur Ajouter, | |
| * Pour lire du texte sélectionner du texte et cliquer sur l'icône Jovie ou clic droit, //Lire le contenue du presse-papier//.\\ | |
| * Lorsque vous utilisez le navigateur [[:Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé. | |
| * Pour prononcer du texte depuis l'éditeur de texte [[:Kate]], assurez-vous que Jovie est lancé et activez l'extension **Synthèse vocale Jovie** de KTextEditor dans la fenêtre de configuration de Kate. Sélectionnez le texte que vous voulez entendre puis choisissez //Outils → Énoncer le texte//. Après un moment, le texte sélectionné devrait être prononcé.\\ | |
| Il n'est pas indispensable de sélectionner du texte. Si vous ne le faites pas, tout le fichier sera prononcé. | |
| |
| |
| ===== Voir aussi ===== | ===== Voir aussi ===== |
| ==== Liens ==== | ==== Liens ==== |
| |
| Pages officielles de ces projets, et d'autres : | |
| * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. | * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. |
| * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) |
| * [[http://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) | * [[https://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) |
| * [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français. | * [[https://github.com/rhasspy/piper|Piper TTS]] - Voix neuronales hors-ligne |
| * [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | * [[https://huggingface.co/rhasspy/piper-voices|Toutes les voix Piper sur HuggingFace]] |
| * [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | |
| * [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] | |
| * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | |
| |
| Sur [[https://help.ubuntu.com/community/TextToSpeech|la documentation ubuntu anglaise]]. | Sur [[https://help.ubuntu.com/community/TextToSpeech|la documentation ubuntu anglaise]]. |
| |
| * [[http://emofilt.sourceforge.net/|emofilt]] un logiciel open-source qui permet d'ajouter de l'émotion à la parole | |
| |
| Wiki rassemblant des liens de synthese vocale : | |
| * [[http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole|Wiki eagle usb]] | |
| |
| ==== Tutoriels ==== | |
| |
| * [[http://blinuxman.net/edu/fr/EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]] | |
| * [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde ) | |
| * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | |
| * [[http://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] | |
| |
| ====Ressources : des voix ==== | |
| |
| * Il existe la voix française [[http://rs211.rapidshare.com/files/108331417/Virginie.exe|virginie de microsoft(sapi) : gratuit mais non libre]]. ([[http://sharebee.com/789d0c18|lien miroir]] ) | |
| * Lernout & Hauspie TruVoice TTS engine (voix gratuite française) : http://activex.microsoft.com/activex/controls/agent2/lhttsfrf.exe | |
| * Trouver d'autres voix sapi sur ce site : http://www.cross-plus-a.com/fr/balabolka.htm (Anciennement: http://www.cross-plus-a.com/balabolka_fr.htm) | |
| * Des voix sur sayz me : http://www.datafurnace.net.au/sayzme/html/voices.html | |
| |
| |
| ===== Pages en rapport ===== | ===== Pages en rapport ===== |
| | [[:piper_tts|Piper TTS]] (voix neuronales)\\ |
| [[:reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) | [[:reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) |
| |
| |
| ---- | ---- |
| | //[[:Contributeurs]] : [[https://forum.ubuntu-fr.org/profile.php?id=7326|Skippy le Grand Gourou]], [[:utilisateurs:herberts]], [[https://forum.ubuntu-fr.org/profile.php?id=7540|Balkoth]], [[http://forum.ubuntu-fr.org/profile.php?id=41914|Dud]], [[:utilisateurs:Mysteroïd]], [[:utilisateurs:Psychederic]], [[:utilisateurs:mohican]].// |
| | |
| //Contributeurs : Page initiale par [[http://forum.ubuntu-fr.org/profile.php?id=7326|Skippy le Grand Gourou]], [[utilisateurs/herberts]], [[http://forum.ubuntu-fr.org/profile.php?id=7540|Balkoth]] et [[http://forum.ubuntu-fr.org/profile.php?id=41914|Dud]], à partir du sujet http://forum.ubuntu-fr.org/viewtopic.php?pid=1469124. Corrections et compléments par [[utilisateurs/Mysteroïd]], [[:utilisateurs:psychederic|Psychederic]] [[:utilisateurs:mohican|mohican]] : refonte pour la simplicité d'abord, et ajout de compléments.// | |