Alexa et Google Assistant pourraient devenir de meilleurs auditeurs
NouvellesLa technologie de reconnaissance vocale joue un rôle de plus en plus important dans nos vies, que nous demandions à notre Amazon Echo de lire notre liste de lecture Spotify préférée ou que nous ayons un aperçu des nouvelles de l'Assistant Google intégré à nos smartphones..
Bien que la technologie de reconnaissance vocale existe sous une certaine forme depuis les années 50, ce n’est que depuis quelques années qu’elle trouve une application pratique sous la forme d’assistants vocaux intégrés dans les smartphones, les haut-parleurs, etc..
La dernière vague d’innovations en matière de reconnaissance vocale a vu le jour grâce aux avancées en intelligence artificielle de ces dernières années, des géants de la technologie comme Google, Amazon et Apple vantant leur utilisation des réseaux de neurones dans le développement de leurs assistants vocaux..
Apprentissage machine
Ce qui différencie les assistants vocaux tels qu'Amazon Alexa, Siri d'Apple et Google Assistant des premières versions de la technologie de reconnaissance vocale, réside dans le fait qu'ils apprennent en permanence, captent vos schémas vocaux, votre vocabulaire et votre syntaxe à chaque interaction..
De nos jours, la plupart des assistants vocaux disposent également de la reconnaissance vocale, ce qui leur permet de faire la distinction entre différents utilisateurs. Avec la puissance de ces énormes entreprises de technologie et des moteurs de recherche, les assistants vocaux s'améliorent constamment..
Cependant, bien que la technologie se soit améliorée de façon irréfutable depuis son introduction sur les appareils grand public, l’intelligence artificielle et l’apprentissage automatique ont toutefois rendu les assistants vocaux encore relativement rudimentaires quant aux sons qu’ils peuvent interpréter et auxquels ils répondent..
Semble plausible
Cela pourrait être dû en partie à l’importance accordée à la reconnaissance de la parole par rapport à la reconnaissance du son; après tout, une grande partie des informations soniques que notre cerveau reçoit quotidiennement provient de sons non verbaux, comme le klaxon des klaxons des voitures ou des aboiements d'un chien..
Bien que l’on pense que l’origine du langage soit antérieure à l’être humain moderne, elle pourrait même aller jusqu’à Homo Ergaster (Il y a 1,5 à 1,9 millions d'années), nos ancêtres ont pu identifier et traiter le son longtemps avant cette date..
Alors que la communication verbale joue un rôle important dans notre compréhension rationnelle du monde qui nous entoure, son son non verbal suscite souvent une réaction émotionnelle enracinée dans l'évolution - nous savons avec très peu de contexte qu'un animal qui grogne nous avertit de reculer, tandis que des pleurs bébé a besoin d'attention. Une forte détonation nous fait peur, et nous nous recroquevillons, levant les mains pour protéger nos têtes.
De plus, le son non verbal joue un rôle important dans la façon dont nous communiquons les uns avec les autres. par exemple, en réponse au bébé qui pleure, un parent peut faire un bruit de couinement apaisant, tout comme nous pourrions crier sur un animal qui grogne pour essayer de l'effrayer.
Donc, si le son non verbal est si important pour notre compréhension du monde et de notre façon de communiquer, pourquoi les assistants à commande vocale sont-ils si accrochés au langage?
La mission de Audio Analytic
Une entreprise britannique pense que le moment est venu pour nos appareils connectés de se familiariser avec l'art d'écouter du son pur - Audio Analytic est une société de reconnaissance sonore basée à Cambridge qui se consacre à l'amélioration des technologies intelligentes à la maison..
Sous la direction de Chris Mitchell, PDG et fondateur, les recherches d'Audio Analytic sur la reconnaissance sonore et l'intelligence artificielle signifient que les assistants vocaux tels qu'Amazon Alexa pourraient bientôt disposer d'une couche supplémentaire d'informations auditives: le contexte.
Après avoir terminé son doctorat, axé sur l'enseignement de l'informatique à la reconnaissance des genres musicaux, Mitchell s'est rendu compte qu'il n'existait aucune entreprise travaillant principalement dans le domaine de la reconnaissance sonore. Il a donc commencé avec une liste de tous les sons auxquels il pouvait penser et de leurs caractéristiques, et avec cela, configurer Audio Analytic..
Bien que Audio Analytic soit né dans le domaine de la sécurité d'entreprise, Mitchell nous a dit que “la société a trouvé un marché dans le secteur de l'électronique grand public” les appareils connectés sont devenus plus communs dans le ménage moyen.
Avec autant de microphones connectés entrant dans nos foyers via des haut-parleurs intelligents tels que Amazon Echo, Google Home et Apple HomePod, un “monde de possibilités” soudainement ouvert pour l'entreprise - avec un accent particulier sur la sécurité de la maison intelligente.
Comment cela rend-il ma maison plus sûre??
Alors, comment la technologie de reconnaissance sonore peut-elle améliorer les dispositifs de sécurité intelligents? Un exemple: si un cambrioleur tente d’introduire votre maison par effraction, brisant une fenêtre au passage. Si votre enceinte intelligente est capable d'interpréter le son et d'identifier correctement l'amplification, la longueur d'onde et la fréquence sonique du verre brisé, elle peut alors vous envoyer une notification, ainsi qu'un signal à d'autres appareils connectés à la maison..
Cela fonctionne particulièrement bien lorsque vous utilisez des dispositifs de sécurité intelligents, tels que le Hive Hub 360, doté de la technologie de reconnaissance du son d'Audio Analytic. Cela signifie qu'il peut reconnaître des sons aussi variés que votre chien qui aboie au son de vos fenêtres qui se brisent. , peut activer d'autres périphériques Hive.
Ainsi, si une fenêtre se brise dans votre maison, vous pouvez configurer automatiquement vos Hive Lights pour qu’elles s’allument et effraient un intrus potentiel. Ce qui est vraiment intelligent avec cette technologie, c'est qu'elle ne vous informe pas sur tous les sons de votre maison, mais seulement sur ceux qu'elle considère importants, grâce au tri de différents sons ou "idéophones" dans d'énormes bibliothèques sonores par Audio Analytic.
- Meilleures serrures intelligentes: sécurisez votre maison avec une serrure intelligente moderne
Qu'en est-il des assistants d'IA?
Outre la sécurité à la maison, l’amélioration de la technologie de reconnaissance du son a également pour résultat des assistants vocaux plus intelligents et plus empathiques, comme l'explique Mitchell: “Si je pouvais donner à un assistant vocal un sens de conscience, de bien-être et toutes les autres choses que je sais proviennent du son, alors leur personnalité pourrait être étendue, de même que leur réactivité et leur utilité..”
Repensez au bébé qui pleure et imaginez que vous avez la bibliothèque sonique de Audio Analytic intégrée à Amazon Echo Dot dans la chambre de votre enfant. Il est 1 heure du matin et vous êtes au lit lorsque vous recevez une notification sur votre smartphone vous informant que Echo Dot a détecté le son d'un bébé qui pleure..
Alexa allume ensuite les lumières de votre couloir pour vous permettre de vous repérer dans l'obscurité, pendant que l'Echo Dot diffuse une musique apaisante dans la chambre du bébé. Peut-être même Alexa va-t-elle parler au bébé, la rassurant que vous êtes sur votre chemin, ou peut-être lui lit-elle une histoire au coucher, calmant votre enfant jusqu'à ce que vous arriviez là et la bercant.
Que vous trouviez cela doux, ou dystopique à l'extrême, dépend en grande partie de vos sentiments vis-à-vis de la technologie d'intelligence artificielle, mais une bonne reconnaissance sonore peut potentiellement rendre les assistants vocaux comme Alexa plus compréhensifs, plus humains et infiniment plus intelligents.
Regarder vers l'avenir
Vous pouvez pousser plus loin l'analogie de l'enfant qui pleure en considérant le lien entre différents sons. Bien que Audio Analytic se soit concentré jusqu'à présent sur les sons individuels, Mitchell pense que l'avenir de la société réside dans l'identification et la contextualisation de plusieurs sons ensemble..
“Imaginez que le bébé pleure, qu'il tousse beaucoup et qu'il éternue beaucoup… vous commencez soudainement à créer une image beaucoup plus riche… alors, la combinaison de tous ces effets sonores et du contexte [qu'ils] peignent pourrait permettre à certains d'être vraiment utiles. fonctionnalités,” il dit.
Si un assistant vocal parvient à identifier les sons des pleurs, de la toux et des éternuements, il n’est pas difficile de suggérer qu’il pourrait un jour être en mesure de relier ces sons et en déduire une cause possible - dans ce cas, l’assistant vocal pourrait supposer le bébé ne va pas bien avec un rhume et peut suggérer des remèdes, donner le numéro au médecin ou vous prescrire un médicament contre la toux.
Ce type de pensée rationnelle vient naturellement aux êtres humains, mais il est encore tôt pour les entités artificiellement intelligentes; cependant, fournissez aux assistants d’IA les outils appropriés (c’est-à-dire des bibliothèques soniques expansives), et il n’ya aucune raison pour que cela ne soit plus possible à l’avenir..
Le problème avec l'IA
Bien entendu, l'idée d'un assistant vocal effectuant des diagnostics déclenchera des sonnettes d'alarme pour de nombreuses personnes - après tout, l'intelligence artificielle est loin de correspondre au cerveau humain en termes de raisonnement et d'intelligence émotionnelle..
L’intelligence artificielle ne peut rivaliser avec des millions d’années d’évolution et de conditionnement social, et les biais implicites au niveau des données et des modèles algorithmiques signifient que les assistants vocaux prennent en compte les préjugés de race, de genre et idéologiques, ce qui nous empêche de faire confiance. complètement.
Pourtant, les assistants vocaux basés sur l’apprentissage automatique s’améliorent de jour en jour et Alexa deviendra peut-être un peu plus humaine, en particulier si ses algorithmes sont mieux formés pour interpréter les données sonores et linguistiques..
Et si cela signifie ne plus trébucher sur les jouets dans le noir, alors comptez nous.
- Meilleures enceintes intelligentes 2018: lequel acheter??