Pour certains, le film de Spike Jonze, Her était atroce, pour d'autres, c'était un aperçu de l'avenir, mais imaginez si l'assistante personnelle du film, Samantha, avait soudainement dit à Théodore: "Désolé, je n'ai pas compris cela?" Il aurait tué les morts romance.

Les styles de conversation de Siri et de Google Now sont loin de ceux de Samantha, mais leur développement fait partie d'un mouvement qui menace d'éclipser le mot écrit. Notre écriture n'a jamais été aussi mauvaise, taper sur un clavier commence à être archaïque et même taper constamment sur les SMS et les termes de recherche Web risque de provoquer des crampes aux doigts et des mains douloureuses..

Avec les appareils iOS permettant désormais l'envoi de messages vocaux et de prévisions pour les voitures autonomes, les portes, les lumières et les ascenseurs à activation vocale (signalez l'internet des objets), il est clair que l'avenir sera parlé, pas écrit.

La technologie derrière ce changement dans la manière dont nous interagissons avec notre environnement est le traitement du langage naturel, une technologie qui permet aux ordinateurs de comprendre le sens de nos mots et de reconnaître les habitudes de notre langage..

Rovi rend la grille de télévision recherchant une parole parlable

Où verrons-nous d'abord le traitement du langage naturel?

En plus de Siri et de Google Now, vous l'avez peut-être déjà utilisé sur la Xbox One et le Samsung UE65HU8500

mais jusqu'à présent, la reconnaissance vocale a tourné autour d'une très petite liste de phrases et de mots. Une conversation appropriée ce n'est pas. "Les mots magiques ont fait que ces technologies reposent sur des systèmes de menus structurés dans lesquels la commande vocale remplace simplement les entrées traditionnelles", a déclaré Charles Dawes, directeur des comptes stratégiques mondiaux chez Rovi. "Celles-ci ne fournissent pas une expérience satisfaisante, obligeant les utilisateurs à apprendre à parler avec l'appareil et rendant la parole figée et non naturelle."

Les systèmes de reconnaissance automatique de la parole sur les téléviseurs s’appuient jusqu’à présent sur des microphones intégrés qui pourraient être très éloignés du téléspectateur, bien que la plupart des logiciels migrent vers les applications. "La prédominance des smartphones et des tablettes offre aux opérateurs la possibilité d’éviter ce problème en permettant la recherche et les recommandations pour la télévision via le deuxième écran", déclare Dawes. "Le développement de ces appareils a explosé et la puissance de traitement offerte par la plupart des acteurs du marché fournit une base suffisante pour la création de capacités de conversation."

Mais il existe de nombreux autres endroits où nous voyons déjà utiliser des moteurs en langage naturel. Barclays Wealth l'utilise pour vérifier l'identité du titulaire de son compte, la compagnie aérienne JetBlue utilise une publicité vocale intelligente et Ford utilise le langage naturel pour les conducteurs afin de contrôler les systèmes embarqués tels que le téléphone, la musique, la température, la navigation et les infos trafic..

Comment fonctionne le traitement du langage naturel?

Une fois que ce que quelqu'un a dit est reconnu, tout est une question de contexte et de désambiguïsation de termes similaires. "Un téléspectateur pourrait dire" quelle heure est le match de City ce soir? ", Et la technologie vocale devrait prendre une décision concernant le contexte - le football - et la préférence de l'utilisateur en fonction de son historique. Soutiennent-ils Norwich City ou Manchester? Ville?" dit Dawes. "La technologie doit également être capable de gérer les changements soudains. Par exemple, elle doit reconnaître que si le même spectateur demande alors" y a-t-il des thrillers ce soir? " ils cherchent en dehors du contexte sportif. "

Siri, Google Now et Cortana utilisent tous le traitement du langage naturel