
La révolution ? Pas loin. Des chercheurs du géant de l’Internet américain, Google, et du laboratoire consacré à l’intelligence artificielle de l’université de Stanford aux États-Unis, ont réussi à créer un logiciel capable de décrire des photos, avec des phrases sophistiquées. Jusqu’à présent, les programmes permettaient de reconnaître grosso modo, un objet sur une image, et par image. Ce qui donnait par exemple, une légende succincte comme « voiture », « bébé » ou « chien » devant la photo d'un chien, d'un bébé ou d'une voiture.
Aujourd’hui, un grand pas a été franchi. Les scientifiques de Google et de Stanford, ont réussi à concevoir un programme qui analyse les images d’une part, et les décrit de façon précise, d’autre part. C’est à dire, avec une phrase complexe. Devant la photo d’un motard à moto cross, le logiciel écrira : « Un homme conduit une moto sur un chemin boueux. »
Pour simplifier, ils ont créé un logiciel de reconnaissance d’images. Mais cette fois-ci, ce dernier est capable de « lire » et de décrypter les pixels. En traitant les images, des phrases se créent alors. Elles s'élaborent sur deux principes : la reconnaissance visuelle et un dispositif de transcription. Ce dernier a intégré les derniers progrès en terme de traduction automatique. En revanche, il n’est plus question ici, de traduire une langue vers une autre. Il s'agit de transformer les données d’une image, en une phrase élaborée et compréhensible.
De quoi révolutionner la recherche d'images, notamment sur Google Images. Avec des légendes précises, les photos postées sur Internet remonteront dans les moteurs de recherche beaucoup plus facilement. Cela deviendra encore plus efficace quand ces robots-identifieurs de Google, pourront analyser, décrire, et légender toutes les images auxquelles ils auront accès.
Aujourd’hui, un grand pas a été franchi. Les scientifiques de Google et de Stanford, ont réussi à concevoir un programme qui analyse les images d’une part, et les décrit de façon précise, d’autre part. C’est à dire, avec une phrase complexe. Devant la photo d’un motard à moto cross, le logiciel écrira : « Un homme conduit une moto sur un chemin boueux. »
Pour simplifier, ils ont créé un logiciel de reconnaissance d’images. Mais cette fois-ci, ce dernier est capable de « lire » et de décrypter les pixels. En traitant les images, des phrases se créent alors. Elles s'élaborent sur deux principes : la reconnaissance visuelle et un dispositif de transcription. Ce dernier a intégré les derniers progrès en terme de traduction automatique. En revanche, il n’est plus question ici, de traduire une langue vers une autre. Il s'agit de transformer les données d’une image, en une phrase élaborée et compréhensible.
De quoi révolutionner la recherche d'images, notamment sur Google Images. Avec des légendes précises, les photos postées sur Internet remonteront dans les moteurs de recherche beaucoup plus facilement. Cela deviendra encore plus efficace quand ces robots-identifieurs de Google, pourront analyser, décrire, et légender toutes les images auxquelles ils auront accès.