Aujourd’hui, les grandes entreprises et administrations publiques hésitent entre continuer à utiliser des logiciels propriétaires ou basculer vers les Logiciels Libres. Pourtant, la plupart des logiciels libres sont capables de bien traiter les données issues des logiciels propriétaire, et parfois avec une meilleur compatibilité.
C’est alors la barrière de la prise en main qui fait peur, et pourtant...
Les logiciels libres
L’aspect « Logiciel Libre » permet une évolution rapide et une plus grande participation des utilisateurs. Les aides et tutoriels foisonnent sur Internet ou sont directement inclus dans le logiciel lui-même.
Enfin, les concepteurs sont plus proches des utilisateurs, ce qui rend les logiciels libres plus agréable à utiliser et conviviaux.
Grâce à la disponibilité des logiciels libres, vous trouverez facilement des services de support techniques et la licence n’est plus un frein à l’utilisation de ces logiciels par votre personnel.
Notre support technique concerne essentiellement les logiciels libres, que ce soit sous forme de services ponctuels ou de tutoriels.
- 6 janvier -
Sommaire
Rappel des faits
Il y a déjà 5 ans, quelques semaines avant le début du grand enfermement, je vous présentais NoComprendo, un programme de commande vocale pour Linux.
Il permet d'associer des énoncés (mot ou groupe de mots précédés et suivis d'un silence) à des actions pré-programmée.
Les actions disponibles sont : séquences de touches (raccourcis claviers), saisie de texte, déplacement de souris, lancement de programme plus quelques métas commandes de pilotage de l'application.
Première présentation
Dépêche de l'époque
Les premières versions utilisaient les bibliothèques PocketSphinx pour la reconnaissance vocale, et libxdo pour la simulation du clavier et de la souris.
PocketSphinx n'avait plus le développement actif, et le nombre de langues disponibles était assez limité.
La libxdo s'appuyant sur X11, le destin de NoComprendo était déjà scellé.
Depuis la reconnaissance vocale a beaucoup progressé, et de nouveaux outils sont apparus pour piloter le clavier et la souris.
En me promenant sur les forums Mageia (ma distibution habituelle) j'ai découvert elograf, développé par Papoteur, qui réalise la dictée vocale.
Un petit tour dans le code pour découvrir les bibliothèques utilisées, et voilà de quoi faire renaître le moribond.
Quoi de neuf ?
De simple outil de commande vocale, NoComprendo est devenu une application complète d'accessibilité en intégrant la dictée et la synthèse vocale.
Nouveaux composants
Une bibliothèque de reconnaissance et de dictée vocale : Vosk avec une vingtaine de langues disponibles.
Un outil de simulation de clavier et de souris compatible X11/Wayland : dotool. N'ayant pas de wayland opérationnel sur une machine, je n'ai pas encore pu vérifier si la compatibilité est réelle. Je m'en tiens donc aux promesses du site.
Un programme de synthèse vocale : svox-pico.
Reconnaissance et synthèse vocales sont effectuées hors-ligne, comme dans la version précédente. Les Gafam ne vous enregistreront pas.
Interface remaniée
La principale différence avec les versions 1.x, c'est qu'il n'y a plus besoin de définir de vocabulaire spécifique. PocketSphinx cherchait à reconnaître des groupes de mots dans un ensemble de mots qu'il fallait déclarer au préalable.
La nouvelle bibliothèque connaît l'ensemble de la langue française, rien à déclarer. On clique sur l'icône du micro et on articule bien devant le micro. Par contre on ne peut pas dire n'importe quoi, on en reparlera plus loin.
Les groupes de commande sont affichés dans les onglets de la fenêtre principale.
Le premier onglet contient la liste des groupes de commandes. Les onglets suivants sont les groupes actifs.
Il y a moins de fenêtres à ouvrir pour ajouter/modifier des groupes ou des commandes. Si une commande ne convient pas, on double clique dessus et on ré-enregistre.
Tout le monde n'a pas besoin de commandes vocales, on peut n'être intéressé que par la dictée. Si c'est votre cas, il suffit de désactiver les groupes de commandes et commencer la dictée en cliquant sur le bouton prévu pour cet usage. Mais c'est plus marrant de commencer en disant "Je commence à dicter".
Les commandes vocales permettent de gérer facilement les "point", "point à la ligne" ou "virgule".
Le principe de la synthèse vocale (TTS : Text to speech) consiste comme d'habitude, à copier du texte dans le presse-papier, et de faire vocaliser le contenu du presse-papier.
Il n'y a que six langues disponibles pour la synthèse vocale.
Premier démarrage
Modèle de langage
Pour fonctionner, NoComprendo a besoin d'un modèle de langage. Celui-ci n'est pas intégré à l'application, il faut en télécharger un avant de commencer.
NoComprendo se connecte sur le site alphacephei.com et vous propose la liste des modèles de langues disponibles.
Pour le français, il y a un modèle 'fr' (1.4G) et un 'small-fr' (41M). Le choix du modèle n'est pas anodin, la reconnaissance vocale donnera des résultats différents d'un modèle à l'autre. Les groupes de commandes sont associées au modèle choisi.
Je conseille l'utilisation du modèle 'fr'.
Peut nécessiter un redémarrage
Si dotool a été installé avec NoComprendo, il a besoin d'un redémarrage système pour prendre en compte de nouveaux droits d'écriture (simulation du clavier et de la souris).
NoComprendo devrait détecter cette situation et suggérer un redémarrage, sinon seulement le lancement de programme et les métas commandes fonctionneront.
Formulation des énoncés
L'ancienne bibliothèque PocketSphinx reconnaissait des mots individuellement. Les énoncés étaient faits de deux ou trois mots : fermer fenêtre
pour émettre Ctrl+W
, par exemple.
Vosk est un modèle entrainé sur des exemples de langage, imprégné de statistiques et de probabilités que certains mots se retrouvent ensembles. Il va chercher à faire une phrase syntaxiquement correcte. Il vaudra mieux dire Fermer la fenêtre
, la reconnaissance sera plus facile.
Mais suivant le modèle utilisé ('fr' ou 'small-fr'), il peut écrire plutôt Fermez la fenêtre
ou Fermé la fenêtre
. La solution que j'ai retenu pour la plupart des exemples est Ferme la fenêtre
.
Il y a parfois des singuliers avec un modèle qui sont reconnus comme des pluriels avec l'autre.
Tout ça pour justifier que le choix du modèle est important, et que les commandes vocales ne sont pas toujours interchangeables.
La langue française est accompagnée d'un jeu d'exemples de commandes.
Il n'y a presque rien en anglais, car mon terrible accent n'est pas reconnu. Je suis prêt à intégrer des exemples de commandes qui me seraient fournies par d'authentiques anglophones.
Empaquetage
Pour les versions 1.X, j'avais fourni des paquets pour différentes distributions Linux via Open Build Service.
La mise à jour des paquets demande un suivi annuel fastidieux, à chaque sortie de nouvelle version d'une distribution.
Je n'ai plus le temps ni l'envie de m'en occuper.
Dorénavant, seuls les sources en .tar.gz et un paquet Mageia seront disponibles sur mon site.
Ça se compile avec Qt.
Je ne sais pas si Vosk et dotool sont bien intégrés dans les autres distributions Linux. En cas de difficulté, les empaqueteurs peuvent me contacter.
Où trouver ça ?
NoComprendo
L'aide intégrée est aussi disponible sur le site.
Commentaires :
voir le flux Atom
ouvrir dans le navigateur
LinuxFr.org : Journaux
La pluie et Freebox
- 6 janvier -
Il pleut, depuis des jours, toute la journée..Du coup j'ai installé un serveur multimédia sur ma freebox Delta.Ça m'a occupé un moment quand même, (...)
Résurrection d'un vieux PC portable
- 5 janvier -
Salut les gens,Mon laptop principal étant encore chez Asus pour réparation (depuis début novembre…), mes doigts commençaient sérieusement à manquer (...)
port des for_comprehension de scala en ruby
- 4 janvier -
Sommaire contexte: map et flatMap exemples de map exemples de flatMap contexte: programmes fonctionnels for comprehensions port en ruby (...)
Croissance d'un projet open source - WiVRn
- 1er janvier -
Bonjour nul, depuis quelques temps je développe un logiciel pour utiliser les casques de réalité virtuelle autonomes depuis un PC Linux : WiVRn. La (...)
Retour vers le Futur - ménage numérique - le web a bien changé.
- Décembre 2024 -
Aujourd'hui, j'ai passé quelques heures à faire du nettoyage numérique en vue de la suppression de deux vieux compte google que je n'utilise plus (...)