Google nous envisage d'ouvrir notre plate-forme Goggles
NouvellesLa réalité augmentée est saluée comme la prochaine grande chose sur les appareils mobiles, pour tout, des jeux à la vérification des prix de l'immobilier; pointer un smartphone sous Yelp dans une rue et la fonction Monocle vous donne des avis et des évaluations pour les entreprises présentes.
Google Goggles peut faire à peu près la même chose, mais Shailesh Nalawadi, chef de produit chez Goggles, ne s'intéresse pas tant à AR: nous ne nous considérons pas vraiment comme travaillant sur la réalité augmentée; nous travaillons sur la recherche visuelle. "
C'est la façon dont les humains travaillent, souligne-t-il, il est donc logique que la recherche fonctionne visuellement. "80% des informations sont utilisées de manière visuelle, et non par aucun autre sens. Pourquoi devez-vous traduire et transcrire ce que vous voyez en mots?"
Bien que Nalawadi soit réaliste quant à ce que vous pouvez faire avec un appareil photo de téléphone aujourd’hui ("La reconnaissance d’image est vraiment difficile bien que les films hollywoodiens qui montrent cela déjà accompli!"). les lentilles de contact numériques devraient être en vente d'ici 2020; comme son nom l'indique, le téléphone est le spectateur.
"Vous avez tous ces ordinateurs très rapides que nous avons tous dans nos poches, avec des capacités que vous n'auriez pas eues sur les ordinateurs de bureau il y a à peine cinq ou dix ans", a-t-il déclaré..
"Bien sûr, quelle que soit la puissance de ces appareils, la vision par ordinateur permet de prendre en charge tous les cycles de traitement de votre ordinateur. Par conséquent, Goggles prend en charge les tâches les plus lourdes dans le cloud."
Cela ne fonctionne que grâce aux connexions à large bande mobile et alors que Nalawadi appelle le délai de reconnaissance de trois à huit secondes que Goggles prend habituellement "assez phénoménal", il admet "nous réalisons également que cela ne suffit pas, car l'attention des personnes est vraiment courte".
Loin d'être fini
Goggles est le fruit de trois à cinq ans de recherche et il est loin d’être terminé, dit-il.
"Nous nous sommes battus et nous avons construit cette chose où vous pouvez déplacer votre appareil photo, le pointer sur un objet et le faire revenir et vous dire de quoi il regarde. La réalité est que nous sommes vraiment loin de cet état."
Ce que Nalawadi veut faire est beaucoup plus ambitieux que de simplement superposer des informations sur votre position à l’écran; il veut une recherche visuelle qui peut traiter avec le monde entier.
"En premier lieu, explique-t-il," il s'agit d'étendre les capacités de reconnaissance de nos ordinateurs. À l'heure actuelle, nous reconnaissons un ensemble très étroit de dizaines de millions d'objets, mais le monde est bien plus vaste que des dizaines de millions d'objets. C'est un effort phénoménal d'essayer de récupérer ces informations dans notre base de données et de les reconnaître. "
VOIR ET RECHERCHER: Goggles traite les points de repère comme des logos et des codes à barres; il vous dit ce que vous regardez et fait apparaître les résultats de recherche
Au fil du temps, Goggles reconnaîtra les plantes et les jeux d’échecs et traduira bientôt le texte sur ce que vous voyez..
Création de la base de données d'images Les lunettes de soleil peuvent être plus grandes, ce n'est qu'un début. Il y a le problème de base de la recherche: "Nous passons beaucoup de temps sur la qualité de la recherche; quand une correspondance est réussie, quels sont les résultats pertinents qui doivent être vérifiés?"
Un problème plus vaste
Mais Nalawadi veut également s'attaquer au problème beaucoup plus vaste. "Actuellement, il y a cette notion que la réalité augmentée concerne uniquement l'affichage de géodonnées classées. Je pense qu'il y a beaucoup plus d'informations dans cette scène et que vous avez vraiment besoin d'une reconnaissance d'image superposée afin de donner plus d'informations sur ce qui se passe autour de vous. "
Il pense également que la reconnaissance d'image rendra l'expérience de réalité augmentée meilleure que la position approximative que les smartphones peuvent calculer..