Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
reconnaissance_vocale [Le 27/04/2014, 01:22] – [Logiciels de reconnaissance vocale] moths-artreconnaissance_vocale [Le 29/10/2025, 10:18] (Version actuelle) – [Pour la dictée vocale via une application] 5.49.53.182
Ligne 2: Ligne 2:
  
 ---- ----
- 
- 
  
 ====== Reconnaissance vocale ====== ====== Reconnaissance vocale ======
Ligne 10: Ligne 8:
 Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux. Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.
  
-Canonical prévoit d'intégrer prochainement le logiciel libre [[speechcontrol]] pour ubuntu linux, développé par canonical, et pourrait faire à l'avenir de la [[synthèse vocale]] également. +[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[https://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]].
- +
-Pour bénéficier de la même fonctionnalité avec [[:Gnome]] il faut [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gnome-voice-control]]**. +
- +
-[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[http://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]].+
  
 Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]]. Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]].
Ligne 22: Ligne 16:
  
 ===== Logiciels de reconnaissance vocale ===== ===== Logiciels de reconnaissance vocale =====
 +==== Pour la commande vocale ====
  
-  * [[:CMU Sphinx]] : sphinx est une bibliothèque écrite en java et a une variante en  C +  * [[:NoComprendo]] : commande vocale pour Linux
-  * [[:gnome-voice-control]] : permet de contrôler l'environnement [[GNOME]] par la voix. +
-  * [[Google2Ubuntu]]: utilise la reconnaissance vocale de Google+
   * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx.   * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx.
-  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[http://sourceforge.net/projects/speech2text/]] +  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://sourceforge.net/projects/speech2text/]] 
-  * [[:X voice]] : utilise une librairie ViaVoice d'IBM qui est payante.  +  * **VoiceExecute** : permet de lancer des logiciels par la voix 
-  * [[VoiceExecute]] : permet de lancer des logiciels par la voix ([[http://forum.ubuntu-fr.org/viewtopic.php?pid=2359228#p2359228|Discussion sur le forum]]+  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome
-  * [[http://en.wikipedia.org/wiki/Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. +  * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted. 
-  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocal sous Chrome+  * [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aideLe projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence
-  * [[http://jasperproject.github.io/|Jasper]] : http://jasperproject.github.io+  * [[http://jasperproject.github.io/|Jasper]], pour raspberry
  
 +==== Pour la dictée vocale via une application ====
 +  * **[[https://flathub.org/apps/net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]], vous pouvez l'installer via [[gnome-software|logiciel]].
 +  * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante.
 +  * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]].
 +   * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]].
 +   * **[[https://alphacephei.com/vosk/|VOSK]]** : [[https://forge.chapril.org/tykayn/transcription|mode d'emploi pour transcrire un fichier audio]] par Tykayn
 +   * **[[https://doc.linto.ai/#/services/linstt|LinSTT]]** : service Speech-To-Text de l'assistant vocal LinTO
 +   * **[[https://handy.computer/|Handy]]** est une application disponible en [[appimage]] multiplateforme qui utilise les bibliothèque Parakeet où Whisper .
  
-Logiciels dont le développement est arrêté : +==== Dictée vocale en ligne ====
-  * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002+
  
 +   * [[https://speechnotes.co/fr/|SpeechNotes]] ou [[https://voicenotebook.com/|VoiceNotebook]] marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
 +   * [[https://docs.google.com/document/?usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale//
 +   * [[https://voicenotebook.com/|Voice notebook]] : reconnaissance vocale via une application (multi plateforme), ou extension Chrome
  
  
 +==== Autres ====
 +   * [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C
 +   * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech)
 + 
 +Logiciels dont le développement est arrêté :
 +   * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002
  
 =====Voir aussi===== =====Voir aussi=====
  
-  *[[http://forum.ubuntu-fr.org/viewtopic.php?pid=3532304|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr+  *[[https://forum.ubuntu-fr.org/viewtopic.php?id=60231&p=4|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr
   *[[synthese_vocale|Synthèse vocale]] (Opération inverse)   *[[synthese_vocale|Synthèse vocale]] (Opération inverse)
-  * (en) Tutoriel [[http://www.gear21.com/speech/html/|Automatic Speech Recognition on Linux]] date de 2002 
-  * [[http://www.bostonherald.com/business/technology/general/view.bg?articleid=1303065&srvc=rss|Google launches next phase of voice-recognition project]] ( dec 2010 ) 
  
 ===== Pages en rapport ===== ===== Pages en rapport =====
 {{topic>reconnaissance_vocale&header}} {{topic>reconnaissance_vocale&header}}