Google améliore la recherche d’images

DiversPublié le 23 mai 2008 à 11 h 29 min Commentaires fermés

Les chercheurs Google ont mis au point une nouvelle technique avec laquelle ils prétendent pouvoir grandement améliorer la qualité de recherche d’images.


La société vise à rendre ses résultats de recherche d’images aussi appropriés que les recherches de texte, mais le seul handicap est jusque là la dépendance d’un ordinateur basé sur le texte d’indices pour décrypter le contenu d’une image.

Bien que la recherche d’images soit devenue une caractéristique commune aux nombreux moteurs de recherche, entre autres Yahoo, MSN, Google, etc… la majorité de recherches d’images ne font usage que de peu d’information pour classer les images.

En général, seul le texte sur les pages dans lesquelles l’image est intégrée (texte dans le corps de la page, anchor text ou texte cliquable d’un lien, nom de l’image, etc) est utilisé.

Une telle dépendance autour du texte peut lancer des résultats insolites, l’exemple d’un magazine montrant sur sa couverture Monica Lewinsky habillée comme Mona Lisa apparaissant lorsque l’on lance une recherche de peinture artistique.

C’est pourquoi les chercheurs Google ont mis sur pied un nouvel algorithme appelé VisualRank qui cherche des thèmes visuels dans toute une série de photos, avec des images qui sont classées en fonction de leur similarité avec d’autres images que contient ce thème.

Ainsi, par exemple, une recherche sur McDonalds peut aboutir aux fameuses golden arches, avec ces photos où le logo a été en partie taillée ou n’a pas fait de l’objet principal du classement d’image plus bas par rapport à ceux qui le font.

« Le deuxième défi est que, même après que nous ayons trouvé les caractéristiques communes dans les images, nous avons besoin d’un mécanisme pour utiliser cette information à des fins de classement », souligne un chercheur chez Google.

« Compter simplement le nombre de caractéristiques visuelles communes produira des résultats médiocres. Pour remédier à cette tâche, nous interférons en fonction de leur similarité un graphique entre les images, là où les images sont liées les unes aux autres. Une fois que le graphique est créé, nous démontrons comment les procédures redondantes similaires à celles utilisées dans les PageRank peuvent être employées pour créer un classement d’images efficace. « 

« Nous comptons absolument sur l’intelligence des masses: la similarité de l’image du graphique est générée sur base des caractéristiques communes entre les images. Ces images qui saisissent les thèmes communs provenant de plusieurs autres images sont celles qui auront un classement plus élevé. »

Lorsque 2000 employés de Google ont été invités à faire le classement sur la pertinence des résultats de VisualRank par rapport à une recherche d’images ordinaire, le nouvel algorithme a renvoyé 83% en moins d’images n’ayant aucun rapport avec la recherche.

No related posts.

La liste des entrées complémentaires est établie par le module d’extension YARPP.

Les commentaires sont fermés.