Google s’intéresse beaucoup à l’intelligence artificielle ces dernières années, et plus particulièrement à ses applications destinées aux gens ordinaires. Par exemple, il est en cours d'exécution impliquant l'apprentissage automatique.

Aujourd'hui, cependant, des chercheurs du Texas Advanced Computing Center ont montré comment les techniques d'intelligence artificielle peuvent également fournir de meilleurs résultats sur les moteurs de recherche. Ils ont combiné l'IA, le crowdsourcing et les superordinateurs pour développer un meilleur système d'extraction et de classification de l'information..

Lors de la réunion annuelle 2017 de l'association de linguistique informatique à Vancouver cette semaine, le professeur agrégé Matthew Lease a dirigé une équipe présentant deux communications décrivant un nouveau type de système de récupération d'informations..

Systèmes intelligents

"Un défi important dans le traitement du langage naturel consiste à trouver avec précision des informations importantes contenues dans du texte libre, ce qui nous permet de les extraire dans des bases de données et de les combiner avec d'autres données afin de prendre des décisions plus intelligentes et de nouvelles découvertes", a déclaré Lease..

"Nous utilisons le crowdsourcing pour annoter des articles médicaux et d'actualités à grande échelle afin que nos systèmes intelligents soient en mesure de trouver plus précisément les informations clés contenues dans chaque article."

Ils ont pu utiliser ces données en collaboration pour former un réseau de neurones afin de prédire les noms d'éléments et d'extraire des informations utiles de textes qui ne sont pas du tout annotés..

Dans le deuxième article, ils ont montré comment pondérer différentes ressources linguistiques afin d'améliorer la classification automatique des textes. "Les modèles de réseau neuronal ont des tonnes de paramètres et ont besoin de beaucoup de données pour les ajuster", a déclaré Lease.

Des résultats toujours meilleurs

En testant à la fois les recherches biomédicales et les critiques de films, le système a toujours fourni de meilleurs résultats que les méthodes qui n’impliquaient pas de pondération des données..

"Nous avions l’idée que si vous pouviez en quelque sorte raisonner le fait que certains mots étaient associés à d’autres mots a priori, alors, au lieu d’avoir un paramètre pour chacun de ces mots séparément, vous pouvez associer les paramètres entre plusieurs mots et besoin de moins de données pour apprendre le modèle ", a déclaré Lease.

Il a ajouté: "L’industrie est efficace pour regarder les choses à court terme, mais elle n’a pas la même liberté que les chercheurs universitaires de poursuivre des idées de recherche plus risquées, mais qui pourraient être plus transformatrices à long terme".

  • Une équipe chinoise construit le plus grand univers virtuel du monde