Google nous livre ses secrets de recherche

David Bénard
Par David Bénard | Publié le 15/01/2009 à 16:30
Source : Tom's Guide FR | Mots-clés : , , | Thèmes : Google
Syndication : Ajouter à votre page d'accueil Netvibes Ajouter à votre page d'accueil Google Windows Live Alerts

Chez Google

Google a convié la presse ce matin à une conférence menée par Yoelle Maarek, directrice R&D du groupe à Haïfa (Israël) sur le thème des outils de recherches développés par Google ces dix dernières années : "tout ce que vous avez toujours voulu savoir sur la recherche d'information mais n'avez pas vraiment compris".

Yoelle Maarek s'est efforcé de nous expliquer l'évolution des méthodes de recherches employées par le moteur depuis son lancement en 1998, en vulgarisant au maximum son propos. Voici ce que cela donne.

Une question de mathématiques...

Dès le départ, les chercheurs sont partis du principe de l'indexation des données Internet, qui évite de devoir scanner des milliards de documents et de pages en permanence. Ainsi le chemin pour obtenir des résultats se présentait ainsi : requête en langage naturel, identification d'une liste de résultats au sein d'un système d'indexes. Le concept est alors comparable à celui d'un index classique tel qu'on le trouve à la fin d'un livre par exemple.

Avec le temps se sont bien sur ajoutées de nombreuses variables à l'algorithme, ce qui fait aujourd'hui encore la "touche" Google. L'un des tournants a été la prise en considération des liens hypertextes présents sur les pages Web, ce qui a aussi donné naissance au fameux PageRank.

Le PageRank d'une page dépend ainsi essentiellement du nombre de liens qui conduisent à elle. Évidemment l'algorithme qui sert à le calculer est beaucoup plus complexe et prend en considération d'autres paramètres : le texte du lien, la taille des caractères, la mise en page, etc. Au final, le PageRank mesure la probabilité qu'un "surfeur" aléatoire se situe à une page donnée.

Le futur de la recherche

Afin d'améliorer encore la pertinence des résultats de son moteur, les équipes de recherche et de développement tendent à améliorer le respect de sa politique de confidentialité et à rendre la Toile plus interactive, notamment en étant davantage à l'écoute des utilisateurs. Ainsi, si vous souhaitez découvrir quelques innovations et envoyer un feedback à Google, rendez-vous sur le site "experimental" du groupe.

Yoelle Maarek n'a cessé de martelé les obligations de «pertinence et [d']utilité» pendant sa démonstration. Elles seront encore renforcées avec la contribution des internautes...

Commentaires | Imprimer | Envoyer à un ami

Liens commerciaux

Commentaires

Sundevil 15/01/2009 17:24
Masquer
-0+

En gros, on apprends rien :(

Vedlen 15/01/2009 17:26
Masquer
-0+

Triste article que celui-ci... En effet le PageRank n'est :
1) un secret pour personne ;
2) plus utilisé depuis environ 4 ans si ma mémoire est bonne.

Sundevil 15/01/2009 18:01
Masquer
-0+

Le page rank plus utilisé ???????

Anonyme 15/01/2009 18:01
Masquer
-1+

Le PageRank est toujours utilisé, mais il est généralement admis qu'il n'a plus aujourd'hui la même importance que par le passé.

En revanche je rejoins Sundevil: on n'apprend absolument rien. Je sais que ce site fournit généralement des articles courts qui ne peuvent donc pas retranscrire cette conférence dans son intégralité, mais de là à placer un "tout ce que vous avez toujours voulu savoir sur la recherche d'information mais n'avez pas vraiment compris" avant de pondre deux malheureux paragraphes remplis d'évidences, c'est quand même gonflé...

Dr_cube 15/01/2009 18:03
Masquer
-0+

Et pour ceux qui veulent aller plus loin : http://www-fourier.ujf-grenoble.fr [...] google.pdf (niveau Bac+2 en math recommandé ^^)
Il y a quelques année j'ai suivi le cours du monsieur qui a écris ce document (qui est maintenant le premier résultat quand on cherche "comment fonctionne Google" sur Google). J'ai aussi programmé un moteur de recherche d'images. Ce n'est pas facile de classer des documents par pertinence, et c'est vraiment ce qui a fait le succès de Google.

Sundevil 15/01/2009 18:09
Masquer
-2+

Citation :"tout ce que vous avez toujours voulu savoir sur la recherche d'information mais n'avez pas vraiment compris" avant de pondre deux malheureux paragraphes remplis d'évidences, c'est quand même gonflé...


Idn fait son business avec des titres accrocheurs ;)

Exoseth 16/01/2009 09:07
Masquer
-1+

Hop hop hop, ménage. :)

Le HS, ça va bien 5mn. Pareil pour les critiques faciles. Si vous êtes super informé sur le sujet, tant mieux pour vous. Tout le monde n'est pas dans votre cas et il faut bien expliquer les choses simplement au plus grand nombre.

Au lieu de critiquer tout le temps, complétez les articles avec vos propres connaissances. Tout le monde y gagnera.

Sundevil 16/01/2009 09:49
Masquer
-0+

C'est vous les journalistes, vous ne supportez absolument pas la critique sur idn. Votre article est pourris et on apprends rien. Le page rank, tout le monde connait et depuis longtemps.
Votre titre est trompeur comme souvent.

Pour ce qui est du HS, c'est le but d'un forum en même temps.

Ha ces modo qui ont trop de pouvoir :(

Dr_cube 16/01/2009 09:57
Masquer
-0+

Si le HS avait concerné n'importe quel autre sujet il n'aurait pas été modéré ^^.
Et je suis bien d'accord avec Sun : l'article n'apprend aucun secret de la recherche de Google.

Exoseth 16/01/2009 09:58
Masquer
-0+

Primo, je ne suis pas journaliste. Tu peux leur demander, les critiques, ils s'en prennent aussi par les modos.

Secundo, ici, tu es dans les commentaires, pas vraiment sur le forum. Donc tout HS est plus que malvenu.

Tertio, si tu es penses que j'ai trop de pouvoir et que ce n'est pas normal, tu peux MP natcparis pour lui faire part de ton mécontentement.

Je finirai par redire ce que j'ai écris au dessus. Au lieu de critiquer tout et tout le temps, participez aux lacunes de l'article dans vos commentaires. Mais c'est vrai, j'oubliais, il est bien plus facile de critiquer le travail des autres... :(

@Dr_cube : Non mais c'est quoi ces insinuations ?! Ca va pas non ?! Je vire n'importe quel HS qui prend trop d'ampleur. 'fin, ceux que je vois car je ne suis pas H24 devant mon PC.
Je ne supporte pas ce genre de sous-entendu. C'est la première et la dernière fois que tu m'en fais un.

Sundevil 16/01/2009 10:03
Masquer
-0+

TU n'es pas journaliste, mais celui qui l'a écrit si.

De plus, ce n'est pas à nous de compléter un manque de VOTRE travail. Je lis l'article, vois que c'est de la daube, je vais pas perdre 15 min de plus à donner des liens pour le fun. On bosse nous aussi.

Pour ce qui est des pouvoirs des modos, j'ai déjà envoyé un mail pour un modo qui se prenait pour zorro, mais idn va pas taper sur ces modos, faut pas réver.

Exoseth 16/01/2009 10:08
Masquer
-1+

Ce n'est pas à toi de compléter le travail des autres ? Qu'est-ce que tu n'as pas compris dans les termes "site communautaire" ?

Dans ce cas, si l'article ne te conviens pas, n'y répond pas. C'est aussi simple que ça. Tu éviteras de perdre 2mn de ta vie à le faire.

Pour ce qui est des modos, c'est vrai que dans la vraie vie on est des gros frustrés et que donc on se venge sur internet... Quelles vils personnes nous sommes...

Fin du débat.

Dr_cube 16/01/2009 10:10
Masquer
-0+

Citation :@Dr_cube : Non mais c'est quoi ces insinuations ?! Ca va pas non ?!

J'ai insinué que tu as supprimé les commentaires en rapport avec un sujet hautement sensible et sans grand rapport avec la news. Et si le sujet abordé avait été moins sensible tu n'aurais peut-être pas modéré. Je suis un spécialiste des HS dans les commentaires, et je n'avais encore jamais été modéré.
Mais dans le fond je suis d'accord avec toi : ces commentaires n'avaient rien à faire là.

Anonyme 16/01/2009 10:25
Masquer
-0+

Il y a quelques année j'ai suivi le cours du monsieur qui a écris ce document (qui est maintenant le premier résultat quand on cherche "comment fonctionne Google" sur Google).

You French people are funny. Why should someone search the internet for "comment fonctionne Google" and not "how does google actually work"? There has been at least a decade where tremendous advances have been made in the US and UK universities on the area of data/knowledge/web mining and in France people keep noting Lavoisier or Laplace and stay closed in their own world by searching "comment fonctionne Google". I am not American, not British and I tried once to conduct research in France. But the miserable behaviour of the average French, closed to his own world, made me leave for clearer skies. No offend, thank you



Exoseth 16/01/2009 10:30
Masquer
-0+

La politesse aurait voulu que tu écrives en français... ;)

Sundevil 16/01/2009 10:59
Masquer
-0+

Tiens tu n'aimes plus les critiques. Tu censures ^^

Dr_cube 16/01/2009 11:03
Masquer
-0+

corto malt :

Je lis énormément de publications scientifiques en anglais, tous mes cours sont en anglais et j'étudie en France. La personne qui a écris ce document sur Google est allemand, et je pense qu'il parle très bien anglais. Quand on fait des sciences, le langage naturel devient inutile. Tous les chercheurs que je connais ont passé beaucoup de temps dans d'autres pays, et beaucoup d'entre eux ne sont pas pas français. Je pense donc que tu te trompe à propos de la recherche en France.

"D'incroyables avancées ont été faites dans les universités américaines et anglaises"
En France les universités sont quasiment gratuites pour tout le monde, et la culture est de fait accessible pour tout le monde. Je pense que c'est le plus important.

J'ai posté un (très bon) document en français parce qu'on est sur un site français. Je suis sûr que tu trouveras de super papiers en anglais grace à tes super connaissances.


Traduction approximative pour le cas où tu ne comprendrais pas le français :

I read at lot of scientific papers in english, all my courses are in English, and I study in France. The guy who wrote this document about Google is German, and I think he speaks English very well. When we talk about science, the natural language becomes useless. All the researchers I know have spent a lot of time in other countries, and most of them are not French. So I think you're wrong and you don't know anything about the research in France.

"tremendous advances have been made in the US and UK universities"
In France the universities are almost free for everyone, and the culture is then accessible for everyone. I think this is the most important.

I posted a (very good) French paper because we are on a French web site. That's all. I'm sure you'll find great english papers by yourself thanks to your incredible knowledge.

Exoseth 16/01/2009 11:03
Masquer
-0+

Non j'ai dis "Fin du débat". Donc je vire tout ce qui n'a rien à voir avec le sujet.

ChunLi007 16/01/2009 11:18
Masquer
-2+

Sundevil : "Je lis l'article, vois que c'est de la daube, je vais pas perdre 15 min de plus à donner des liens pour le fun. On bosse nous aussi."

Tu viens d'en perdre beaucoup plus...

;)

Sundevil 16/01/2009 11:22
Masquer
-0+

Poster un commentaire ne me prends pas longtemps et je n'aime pas la manière du modo de dire "tu as qu'a faire notre boulot"

Si un membre m'envoie un mp pour avoir des infos, la je prendrais le temps de l'aider.

Exoseth 16/01/2009 11:25
Masquer
-0+

Tu le fais vraiment exprès. Je n'ai pas dit faut leur travail. J'ai dit complète ce que tu estimes manquer dans l'article.

C'est légèrement différent non ?

Sundevil 16/01/2009 11:30
Masquer
-0+

Déjà si tu veux plus d'infos sur le référencement (puisque c'est de ça qu'il s'agit), tu as de bonne infos de base ici: webrankinfo

Content ?

Exoseth 16/01/2009 11:36
Masquer
-0+

Tu vois, ça ne t'as pris longtemps à faire... ;)

Sundevil 16/01/2009 11:38
Masquer
-0+

Oui mais c'est au journaliste de faire ça.

Ce sujet ne peut plus être commenté.

Liens sponsorisés