cedric sileo : ingénieur, intelligence artificielle, docteur en sciences

lundi | 20 novembre 2017

Photos Videos Google

"Un motard roule sur un chemin boueux". C'est un robot qui l'écrit

Des chercheurs de Google ont inventé un logiciel qui décrit les images avec des phrases complexes. Une future révolution pour les moteurs de recherche ?

Une photo utilisée par les chercheurs de Google et Stanford pour tester leur logiciel de reconnaissance d'images. (Google/Stanford University)

Jusqu'à présent, on savait qu'un ordinateur pouvait identifier un objet individuellement sur une image : écrire le mot "cheval" devant la photo d'un équidé, "pomme" devant le cliché d'un fruit rouge et rond. C'était déjà ça, mais les chercheurs voulaient mieux. Et le "mieux" est arrivé ! Des scientifiques de Google et de l'université américaine de Stanford ont annoncé cette semainele développement d'un logiciel capable non seulement d'analyser les photos, mais aussi de les décrire avec des phrases complexes.

Techniquement, ces phrases se construisent grâce à la combinaison de la reconnaissance visuelle et d'un système de transcription inspiré des progrès récents en matière de traduction automatique – sauf qu'il ne s'agit plus de traduire du français vers l'anglais, mais des "éléments de l'image" vers l'anglais.

Voici, en guise d'exemples, des images traitées par cette étonnante intelligence artificielle, avec les descriptions qu'elles a rédigées pour chacune d'entre elles, traduites par nos soins :

Description du logiciel :  "Un groupe de jeunes personnes font une partie de frisbee."

Description du logiciel : "Un troupeau d'éléphants marche dans un champ d'herbes sèches."

Description du logiciel : "Un homme conduit une moto sur un chemin boueux."

Description du logiciel : "Deux joueurs de hockey se disputent le palet." Une phrase classée par Google parmi celles qui contiennent des "erreurs mineures" ; en l'occurrence, on suppose que les chercheurs condamnent l'absence effective de palet dans le cadrage. L'évocation de l'objet n'en demeure pas moins étonnamment pertinente.

Description du logiciel : "Un homme vole dans les airs en faisant du snowboard". Là, c'est raté. Preuve que les robots faisant de la reconnaissance visuelle ont encore un peu de travail avant de concurrencer sérieusement les humains.

Faciliter la navigation... et la surveillance ?

Pour Fei-Fei Li, le directeur du laboratoire de Stanford consacré à l'intelligence artificielle, les pixels constituent "la matière noire d'Internet. Maintenant, nous allons commencer à l'illuminer."

Manière de dire que les images postées sur la Toile, dont les métadonnées sont le plus souvent mal renseignées ou inexistantes, demeurent généralement invisibles aux yeux des moteurs de recherche. Cette situation évoluera si Google lâche ses robots-identifieurs sur le web, puisque la firme de Mountain View s'offrira la possibilité de décrire et classer toutes les photos qui passeront dans son viseur.

Outre le bouleversement de la recherche sur Google Images, ce scannage global doit améliorer, selon l'entreprise américaine, les conditions de navigation des internautes malvoyants, ou encore offrir des alternatives aux connexions à très faible débit (en remplaçant les photos trop lourdes par du texte). Mais il laisse également imaginer des "possibilités glaçantes en termes de surveillance", note le "New York Times".

(Sources Nouvel Obs)
 

chef de projet web technologies intelligence information formation chef projet artificielle doctorat informatique maîtrise développement thèse université systèmes recherche société temps base machines machine problèmes connaissances problème techniques exemple système règles internet définition