La révolution silencieuse qui rend votre téléphone plus intelligent que vous en photographie
NouvellesL'intelligence artificielle (IA) fait son chemin dans presque tous les aspects de nos vies. Ce sont nos téléphones, alors que beaucoup d’entre nous l’avons laissé entrer chez nous sous la forme d’assistants vocaux dans des haut-parleurs intelligents..
Ce ne sont là que les implémentations les plus visibles de l'IA. Au cours des prochaines années, elle sera de plus en plus utilisée en coulisse, dans les rouages qui permettront à nos villes de plus en plus intelligentes de fonctionner..
Cependant, c’est en imagerie et en photographie que l’intelligence artificielle est le plus clairement mise en évidence par l’intelligence artificielle. Regardons quelques-uns des meilleurs exemples de cette nouvelle technologie qui améliore activement la photographie.
Mince caméra AI
La version la plus fréquemment commercialisée de l'IA photographique est aujourd'hui celle des smartphones. De nombreux modèles récents et récents disposent de fonctionnalités assistées par l'IA qui utilisent divers types de reconnaissance de scènes et d'objets pour améliorer vos photos..
Différents fabricants de téléphones ont des approches différentes et des caractéristiques distinctes, avec toutefois quelques écarts intéressants dans les approches..
Huawei AI
Huawei est un peu moins criant que l'IA dans les téléphones: c'est un atout majeur si vous souhaitez acheter un appareil comme le Huawei P20 Pro..
L'application de caméra comporte un mode de prise de vue AI distinct qui, dans le Mate 20 Pro, peut reconnaître 1 500 scènes et situations différentes. Le traitement applique ensuite un profil de couleur et de contraste qui convient pour rendre vos images vraiment éclatantes..
Un aspect ultra-naturel n'est pas l'objectif ici. La photographie Huawei AI maximise la saturation des couleurs pour un impact accru et non une fidélité maximale. Les résultats vont bien sur les médias sociaux, bien que.
Éclairage de portrait Apple
Portrait Lighting est l'une des fonctions de photographie assistée par l'IA d'Apple et émule l'effet de divers types d'éclairage de studio. Quelques autres téléphones, comme le Huawei P20 Pro, ont également eu une faille à ce concept, mais Apple a livré la meilleure implémentation à ce jour.
Alors pourquoi est-ce l'IA? L'éclairage portrait consiste à créer une carte de profondeur 3D du visage du sujet, puis à appliquer un filtre 3D pour ajouter des effets d'éclairage qui suivent les contours de leurs fonctions, comme s'ils étaient éclairés par une installation d'éclairage de studio..
Apple appelle ça “studio dans votre poche”. Cela ne remplacera pas un studio, bien sûr, mais les résultats peuvent être étonnamment efficaces.
Google Lens
Google est le développeur le plus prolifique des technologies d'intelligence artificielle et plusieurs des modes de prise de vue de ses téléphones flirtent avec un traitement similaire à celui de l'IA..
Top Shot du Pixel 3, par exemple, est un mode rafale qui capture une série d’images puis choisit celles qui lui paraissent les meilleures. Photobooth fait la même chose, mais pour les photos de vous et de vos amis en train de tirer des visages. Ou souriant.
Google Lens est une démo plus dynamique de l'IA, cependant. C'est un mode caméra qui exploite la reconnaissance d'images et de texte de Google, les plaçant dans un contexte réel. Vous pouvez diriger votre téléphone vers des produits, des points de repère et même des motifs de papier peint. Lens essaiera de les trouver en ligne et fournira des informations pertinentes..
Google Photos
Il existe une utilisation plus pratique et presque cachée du réseau de neurones dans la reconnaissance d'images de Google - Google Photos, et en particulier sa fonction de recherche..
En haut de l'application Google Photos, vous verrez maintenant une barre de recherche. Vous pouvez y taper des objets ou des thèmes et les algorithmes d'intelligence artificielle de Google entrent en jeu pour vous permettre de trouver des images pertinentes. Essaye le. "Chiens", "Noël" et même "fromage" renverront des photos pertinentes, si elles se trouvent dans votre photothèque..
Photos joue également le rôle de conservateur, choisissant des images à transformer en GIF animés, à améliorer avec des filtres et à assembler en panoramas. Tout ceci est basé sur un type avancé de reconnaissance d’image qui est, dans certains cercles, considéré comme une IA..
Restauration d'images Nvidia
Certaines implémentations de l'IA peuvent sembler banales presque instantanément, mais il y a quelques applications dans les travaux qui donnent l'impression d'être réellement futuristes..
Les techniques d'amélioration de l'image de Nvidia font partie des démonstrations visuelles les plus impressionnantes du monde réel de l'IA contextualisée. Il existe trois manières de mettre en œuvre la technologie qui promet de grandes choses..
Le premier est le «débruitage» des images. Il utilise une méthode d'apprentissage en profondeur pour restaurer des données d'image masquées par du bruit, voire du texte. Il s'agit en fait d'une version pure et très avancée de ce que les appareils photo du téléphone font lors de la suppression du bruit d'image d'une photo..
Cependant, il est informé par un réseau de neurones formé par exposition à une masse d'images, ce qui l'aide à reconnaître les motifs et à interpoler les données manquantes dans l'image source..
Il existe également une démonstration plus spectaculaire de la puissance du réseau de neurones de Nvidia, sous la forme d'une peinture dans l'IA. Dans la démo, des parties d'une image source sont supprimées et redessinées, les informations manquantes étant interpolées via le réseau de neurones formé par l'image..
Enfin, Nvidia peut convertir une vidéo à 30 ips ou 60 ips en séquences au ralenti de 480 ips, 16 fois plus lente que la norme. Comme dans la technique de peinture, AI est utilisé pour créer des données d'image qui ne sont tout simplement pas présentes dans le métrage source..
Les téléviseurs ont en réalité des modes trames interpolées comparables. Cependant, l'IA de Nvidia peut gérer, par exemple, le flux de tissu beaucoup mieux, pour des résultats plus naturels.
Iconem
L'intelligence artificielle actuelle consiste en grande partie en de petits calculs peu «intelligents» qui, appliqués à grande échelle, produisent des résultats étonnants.
Cette description s’applique certainement aussi à Iconem, une start-up appartenant au patrimoine qui utilise une IA développée par Microsoft.
L'objectif d'Iconem est d'enregistrer des images de sites historiques importants menacés par la guerre, l'érosion ou d'autres types de dommages, créant ainsi un enregistrement réaliste de leur état actuel..
L'intelligence artificielle consiste ici à cartographier des dizaines de milliers de photos sur un modèle 3D numérisé d'un site du patrimoine, à l'aide de drones permettant de capturer les images requises. Iconem visite des sites difficiles d'accès ou dangereux, tels que la Grande Mosquée des Omeyyades à Alep, en Syrie déchirée par la guerre..
Vous pouvez voir certaines des analyses d'Iconem en action sur YouTube, et ses analyses d'Alep ont été transformées en une application disponible sur Google Play..
Google BigGAN
Vous connaissez peut-être Google pour son moteur de recherche et son système d'exploitation mobile Android, mais il développe également des montagnes de nouvelles technologies innovantes par le biais de ses programmes et de ses dérivés Labs.
DeepMind est la division d’intelligence artificielle de la société mère de Google, Alphabet, et BigGAN est l’un de ses derniers projets, conçu par un stagiaire. C'est un logiciel d'IA qui génère des images en utilisant des algorithmes.
Tout d'abord, une image est générée de manière algorithmique à partir d'un nombre aléatoire. L'image est ensuite comparée à une image "réelle" pour analyser sa proximité. Une nouvelle version de l'image est ensuite créée pour tenter de rapprocher ses caractéristiques de cette référence réelle..
Vous pouvez consulter certains résultats de BigGAN en ligne. Il peut créer des textures naturelles incroyablement réalistes, telles que des lignes d'herbe et d'arbres. Cependant, les visages humains générés par BigGAN ressemblent encore aux cauchemars de Francis Bacon.
- Présenté en association avec Nokia et Android One, vous permettant de tirer davantage parti de votre smartphone. Vous pouvez en apprendre plus sur le nouveau Nokia 7.1 ici, et vous trouverez d'autres conseils judicieux pour tirer le meilleur parti de votre téléphone ici.