Alfred Spector de Google sur la recherche vocale, l'intelligence hybride et au-delà
NouvellesGoogle a toujours été discret sur les produits qui n'ont pas encore été lancés. Ce n’est un secret pour personne, cependant, grâce à la culture ascendante de la société, ses ingénieurs travaillent simultanément sur des tonnes de nouveaux projets..
Suivant le mantra de «publication anticipée, publication fréquente», la vitesse à laquelle le géant des moteurs de recherche produit des outils est stupéfiante. Alfred Spector, vice-président de la recherche et des initiatives spéciales de Google, est au cœur de tout cela..
L’un des domaines dans lesquels Google fait des progrès importants dans le domaine de la recherche vocale. Spector est stupéfait par la rapidité avec laquelle il avance.
Les fonctionnalités de «recherche vocale» de Google Mobile App sont disponibles pour les iPhone, BlackBerry, Windows Mobile et Android. Toutes les versions comprennent l'anglais (y compris les accents américain, britannique, australien et indien-anglais), mais le dernier ajout, pour les téléphones Nokia S60, introduit même la reconnaissance vocale en mandarin qui, en raison de ses nombreux accents et caractéristiques tonales différentes, posait un énorme défi technique..
C'est la langue la plus parlée au monde, mais comme elle n'est pas vraiment conviviale au clavier, la recherche vocale pourrait devenir immensément populaire en Chine.
Défi technologique
"La voix est l'un de ces grands défis technologiques en informatique", explique Spector. "Un ordinateur peut-il comprendre la voix humaine? Cela fait déjà plusieurs décennies que nous travaillons à cela et nous nous rendons compte au cours des dernières années que cette recherche, en particulier sur les appareils de poche, peut être vocalisée en tant que mécanisme d'importation.
"Il est très utile de pouvoir utiliser la voix. Nous savons tous que, quelle que soit la qualité du clavier, il est difficile de taper exactement le bon texte dans une barre de recherche, tout en maintenant votre sac à dos et tout le reste."
Demander à un ordinateur de prendre en compte votre voix n'est pas une mince affaire, bien sûr. "Une des idées est de prendre toutes les voix entendues par le système au fil du temps dans un seul et même modèle de voix pan-humaine. Ainsi, d'une part, nous avons une voix plus haute et avec un accent anglais, et d'autre part ma voix , qui est plus profond et avec un accent américain. Ils s'inscrivent tous deux dans un même modèle, ou il se personnalise simplement en fonction de l’individu; les scientifiques de la voix n’ont pas vraiment conscience de la meilleure approche. "
Traduction automatique
Le service de recherche progresse également dans la traduction automatique. Google Traduction propose déjà 51 langues, dont le swahili et le yiddish. La dernière version introduit la traduction instantanée en temps réel, la saisie phonétique et la prise en charge de la synthèse vocale (en anglais).
"Nous pouvons passer de n'importe quelle langue à n'importe laquelle des autres, et il y a 51 fois plus de 50 fois, donc 2.550 possibilités", explique Spector.
"Nous nous concentrons sur l'augmentation du nombre de langues parce que nous aimerions gérer même les langues où le volume d'utilisation n'est pas énorme. Le Web deviendra beaucoup plus précieux pour davantage de personnes si elles peuvent accéder à l'anglais ou au chinois." langue web, par exemple.
"Mais nous continuons également à nous concentrer sur la qualité, car les traductions sont presque toujours précieuses mais imparfaites. Cela vient parfois de la formation de notre système de traduction sur davantage de données brutes. Nous avons donc des documents de l'UE en anglais et en français que nous pouvons comparer et apprendre. règles de traduction, l’autre approche est d’apporter plus de connaissances en traduction.
"Par exemple, nous utilisons aujourd'hui davantage de connaissances syntaxiques et procédons à des analyses automatisées avec le langage. C'est un défi de taille pour le secteur depuis la fin des années 50. Nous en sommes enfin arrivés à une utilisation en masse."
L'équipe, dirigée par le scientifique Franz Josef Och, a collecté des données pour plus de 100 langues. Le kit Google Translator Toolkit, qui utilise la "sagesse de la foule", prend désormais en charge 345 langues, dont beaucoup sont des langues minoritaires..
L'éditeur permet aux utilisateurs de traduire du texte, de corriger la traduction automatique et de le publier. Spector pense que cette approche est l'avenir. Alors que les ordinateurs deviennent encore plus rapides et traitent de plus en plus de données - en grande partie dans le cloud -, les machines apprennent des utilisateurs et deviennent ainsi plus intelligentes. Il appelle ce concept "intelligence hybride".
"Il est très difficile de résoudre ces problèmes technologiques sans intervention humaine", dit-il. "Il est difficile de créer un robot aussi intelligent, intelligent et connaissant le monde que nous le sommes en tant qu'humains. Mais ce n'est pas aussi difficile de construire un système de calcul comme Google, qui étend ce que nous faisons et apprend progressivement quelque chose sur le monde de notre part. , mais cela nécessite notre interprétation pour le rendre vraiment réussi.
"Nous devons faire en sorte que les ordinateurs et les personnes communiquent dans les deux sens, pour que l'ordinateur apprenne de l'homme et le rende plus efficace."