Pourquoi la reconnaissance vocale n'est plus un gadget
Nouvelles"Je considère comme de bon augure que le sans fil aurait atteint sa perfection actuelle à une époque où l'empire était uni par une union plus étroite, car il nous offre d'immenses possibilités pour rendre cette union plus proche encore." Le monde a parcouru un long chemin depuis que le roi George V a prononcé ces mots dans un microphone lors du premier discours de Noël diffusé par la BBC en 1932.
Aujourd’hui, 82 ans plus tard, le roi George aurait sans doute été incrédule alors que je demandais à mon smartphone de me trouver un enregistrement de ses mots célèbres via YouTube sur Internet. Pourtant, de l'avis d'un humble «roturier», je pense que les systèmes de reconnaissance vocale et de dictée sont enfin parvenus à maturité..
En termes relatifs - du moins depuis la naissance de l'ère numérique - les applications de dictée vocale n'ont rien de particulièrement nouveau. Les sociétés malheureuses belges, Lernout et Hauspie, développaient des systèmes de reconnaissance vocale en 1987 et ont acheté Dictaphone et Dragon Systems au début du millénaire pour donner plus de poids à leurs produits..
Bien que la société n’existe plus, Microsoft a continué à utiliser certaines des technologies d’interface vocale de L & H..
Une technologie qui mûrit
Cependant, la plupart des premières applications étaient floues et peu fiables, exigeant que les bases de données vocales soient liées à des algorithmes et à une "formation" basée sur quelques centaines d'utilisateurs inscrits dans le cadre de programmes de recherche et développement..
Aujourd'hui, avec l'avènement du cloud et du big data, une quantité presque infinie de données vocales est disponible pour les «vrais» utilisateurs connectés à des serveurs qui définissent et traitent les langages et les mots compliqués sans aucune formation de la part d'un algorithme ou d'un utilisateur. Ce changement radical est illustré par la sophistication de l'application mobile Siri et DragonDictate d'Apple, qui tire même les leçons de votre propre vocabulaire au fur et à mesure de son évolution..
Désormais, tout le monde (sans fort accent) peut accéder aux outils de dictée vocale et de reconnaissance vocale gratuits et basés sur le consommateur, de manière fiable et sans formation. De plus, le jeu de données sur l'utilisation de la traduction vocale a connu une croissance exponentielle.
Sans aucun doute, ce changement de paradigme dans la technologie a transformé les systèmes basés sur la voix de techno-gadgets insolites en de véritables outils professionnels..
Pourquoi? Parce que le rythme du développement a tellement rapidement progressé, aidé non seulement par le big data, mais également par la demande d'outils «hyper-tâches», capables de répondre à la demande des consommateurs en matière d'immédiateté et de travail en déplacement. C'est certainement plus rapide que de taper sur un écran de mobile et, pour ceux qui ne peuvent pas taper au clavier, souvent plus rapide que d'utiliser un clavier de bureau.
Avancement de la synthèse vocale
Les applications de synthèse vocale ont également atteint leur majorité. Autrefois confinée à un outil de niche pour les marchés de la déficience visuelle et de l'accessibilité, la révolution des appareils mobiles, et en particulier des systèmes embarqués dans une voiture, a généré une demande plus large de logiciels pour lire des textes sans ressembler à une langue étrangère..
En fait, la synthèse vocale présente un avantage inattendu en matière de correction d'épreuves. Un ami journaliste m'a dit que, qu'il écrive pour la télévision ou pour la presse écrite, il lisait toujours tout ce qu'il avait tapé à haute voix..
Non seulement cela lui donne-t-il une idée de l'écriture en général, mais c'est aussi le meilleur moyen de détecter les fautes d'orthographe qui seraient autrement omises avec une lecture silencieuse qui utilise une partie différente du cerveau. La même chose s'applique à la technologie de synthèse vocale. Après tout, où serions-nous sans des classiques littéraires tels que "Le DaVinci Cod" ou "Les cent épis de la solitude" de Gabriel Garcia Marquez?
Il y a dix ans, les logiciels de dictée vocale relevaient uniquement de secrétaires, d'avocats, de médecins et, parfois, de cadres avisés. De nos jours, c'est presque acquis et le résultat pourrait être une augmentation spectaculaire de la productivité et une vie plus sûre en déplacement.
Enfin, si vous êtes un de ces sceptiques, peut-être gravement traumatisé par l’effort d’utiliser les incarnations précédentes de la dictée vocale, pourquoi ne pas essayer certains de ces nouveaux systèmes? Pourquoi ne pas essayer Google Now, Apple Siri ou l'application Nuance Dragon Dictate?
- Peter Chadha est directeur général de Dr Pete Inc et Steegle.com. Il est un consultant en informatique fournissant des analyses et une implémentation stratégiques en informatique à une entreprise mondiale. Il adopte une approche pragmatique des solutions métier, mais est un évangéliste des technologies..