Qu’est-ce qui fait vrombir Google ?

Pertinent, rapide: en quatre ans d’existence, le moteur de recherche est devenu le plus utilisé du Web – au point de laminer la concurrence. Comment? Voyage de l’autre côté de la page d’accueil

C’est la success story de l’une des pages Web les plus consultées au monde. Plus de 37 millions d’internautes y ont recours chaque mois, qui pour trouver des informations sur la botanique en Papouasie, qui pour consulter les meilleures recettes de cuisine cajun. Sa page de garde n’a pourtant rien de très sexy. Un grand bandeau y accueille l’internaute sur un fond dépouillé. Le nom lui-même – prononcez: « gougueul » – s’inspire d’un terme lancé par le neveu du mathématicien Edward Krasner pour désigner un 1 suivi de 100 zéros. Il n’empêche. Un peu plus de quatre ans à peine après son lancement, le moteur, rentable depuis dix-huit mois, totalise le quart des recherches sur le Web.

Tout s’est passé très vite. En 1997, alors qu’Internet commence à réellement faire parler de lui, deux étudiants, en doctorat à Stanford, mettent au point BackRub, une première technologie de recherche. L’un est new-yorkais, originaire de Russie, Sergey Brin. L’autre, californien pur sucre, Larry Page. A cette époque, AltaVista existe depuis plus de cinq ans. Et, aux yeux de tous, Brin et Page les premiers, ce pionnier semble bien difficile à détrôner. Les deux compères cherchent donc à vendre leur technologie à un industriel. Personne n’est réellement intéressé, mais, en marge d’un rendez-vous, ils croisent Andy Bechtolsheim, cofondateur de Sun, aujourd’hui chez Cisco. Charmé, celui-ci les pousse à monter leur propre société et leur signe un premier chèque de 100 000 dollars. Deux fonds de capital-risque suivront: Sequoia Capital et Kleiner, Perkins, Caufield & Byers, débloquent alors 25 millions de dollars en échange d’une prise de participation. L’acte de naissance de Google. Depuis, les deux compères ont passé la main à Eric Schmidt, un « senior », ex de Sun lui aussi.

Cet argent de départ, le site refuse de le dilapider en dépenses publicitaires. Quand Yahoo!, le portail généraliste de Palo Alto, s’offre de gigantesques affiches dans les aéroports ou des dos de taxi à Londres ou à Kuala Lumpur, Google, encore inconnu, préfère miser sur sa technologie. Et elle est originale: la firme de Mountain View a mis au point un outil unique, PageRank, pour classer ses réponses. Là où la majorité des moteurs s’en tient à la répétition du même terme dans les pages d’un site pour en déterminer la pertinence Google, lui, utilise la « popularité » des mots recherchés. En clair: une adresse sera d’autant mieux référencée qu’elle sera conseillée par des sites eux-mêmes bien établis. Google a donc réussi une jolie prouesse: rendre compte de la pertinence d’un site de façon quasi scientifique. « Notre valeur ajoutée, c’est l’analyse mathématique très complexe dont dispose notre outil », martèle Sergey Brin. Un rien prétentieux, mais probant. Toutefois, il ne suffit pas d’apporter les bonnes réponses; il faut également être rapide. Pour cela aussi Google a sa solution: établir une vaste copie privée du Web. Un logiciel robot (ici, Googlebot) scrute Internet, va de lien en lien et sauvegarde le contenu des pages qu’il trouve sur son chemin, de manière à constituer un « index », sa copie du Web. Depuis décembre 2001, on peut ainsi dénicher sur Google certains messages échangés sur Usenet, l’ancêtre d’Internet, datant de… 1979.

Publicités vendues aux enchères

Comment diable ce super Quid – jusqu’ici gratuit – gagne-t-il de l’argent? Certainement pas en facturant le référencement: Google, pour l’instant, se l’interdit. Non, jusqu’ici, la cash machine a eu recours à d’autres recettes… Les premium sponsorships, d’abord. Ces pubs de couleur pastel placées en tête des résultats sur un fin bandeau disposé sur toute la largeur de la page sont facturées, en gros, de 70 à 75 euros pour 1 000 pages vues. Elles sont donc l’une des vaches à lait de Google. Voilà pour le haut du site. Sur le côté à droite, Google a installé trois minuscules publicités, les adwords. Le thème de ces minipubs est en relation directe avec celui de la recherche. Du coup, la fréquentation est plus élevée que si la publicité était aléatoire: environ 3 internautes sur 100, aux Etats-Unis, et le double en Europe cliquent sur le lien promotionnel. Ces publicités sont vendues aux enchères – mise à prix: 5 eurocents. Reste que la pub est extrêmement volatile. Google, pour diversifier ses revenus, s’est mis à vendre son bien le plus cher, sa technologie. A des portails comme AOL ou Yahoo!, pour lequel Google effectue en sous-main toutes les recherches. En effet, les deux firmes ne sont pas concurrentes: Yahoo! est non un moteur, mais un annuaire. Les sites y sont « rangés », dans un classement non exhaustif, par des surfeurs professionnels.

Le moteur, qui a su se faire si vite une place au soleil, reste pourtant fragile. En juin dernier, selon l’indicateur NetBooster-Weborama, Google a connu son premier véritable fléchissement d’audience. Tombant de 49,2 à 47% en moins d’un mois, alors que la part de marché d’acteurs mineurs demeurait stable. Certes, Google n’a plus grand-chose à craindre de moteurs établis. AltaVista, par exemple, lancé en 1995 par Compaq, s’est un peu endormi sur ses lauriers.

Défis d’avenir

Mais un moteur peut en cacher un autre. La plus grosse menace pourrait bien venir du nord. Avec un nom approprié: Fast Search and Transfer, fast signifiant « rapide », en anglais. Cette firme, fondée en 1997 en Norvège par une poignée d’étudiants de l’Université des sciences et technologies de Norvège, talonne Google. L’élève vient même de piquer à son maître quelques-uns de ses meilleurs clients, comme Lycos, Scandinavian Online et même IBM. « Sans compter Tiscali, depuis toujours affilié à Google! » triomphe Pascal Gaillard, de Fast France. Bref, pour que Google reste en tête, il va devoir relever de nombreux défis. A commencer par sa couverture du Web. Même s’il est leader, le moteur n’a indexé que la moitié des 6 milliards de pages que compte la Toile. Sans compter les quelques dizaines d’autres milliards de pages qui en constituent la partie invisible. Composées d’archives de journaux, de tableaux Excel…, elles sont difficilement accessibles. Autre souci: la fraîcheur des résultats. Le Web est un ensemble vivant: des pages naissent, d’autres. Or, à en croire le site spécialisé Searchengineshowdown.com, 4,3% des pages trouvées par Google étaient périmées à la mi-2001. Contre 2,3% pour Fast et HotBot, et seulement 1,7% pour MSN, le moteur de Microsoft. Une autre remarque – de fond, cette fois-ci – sur la classification même de Google: en ne sélectionnant que les sites déjà recommandés par d’autres, le moteur ne favorise pas l’émergence d’adresses nouvelles. « PageRank est une technologie efficace, mais qui agit un peu comme un miroir déformant, grossissant ce qui est déjà célèbre », se plaint un internaute.

Mais les 250 habitants du Googleplex, siège californien de la firme, ont un plus grand défi à relever. La quête de sens, intellectuellement passionnante, est encore balbutiante. Comment, notamment, saisir avec finesse la nature de la recherche de l’internaute? « Le terme « Saturne », par exemple, peut, selon les cas, désigner une planète ou une voiture. Il est donc important d’anticiper la nature des informations que recherchent les internautes », détaille Jorg Soizik, l’un des cadres de la firme. En conséquence, un nombre croissant de sites de recherche font travailler des linguistes et des psychologues pour que les moteurs se rapprochent du langage naturel. Certains, comme le moteur Ask Jeeves, proposent carrément d’établir une relation entre les personnes qui posent des questions et d’autres qui y répondent. Auracom, de son côté, met en place des assistants de requête à destination des documentalistes quand ALogic vise les professionnels de la veille technologique. Pris de court par tous ces progrès, Google s’est mis, lui aussi, à exposer les dernières avancées de sa cellule recherche et développement en ligne. Pour que le grand public puisse donner son avis. Principal chantier des Google Labs, laboratoires de recherche de la société: les programmes de reconnaissance vocale, à tester au cours d’un simple appel téléphonique. Intéressant, mais pas toujours convaincant. Quand, au bout du fil, on demande « Minneapolis », le moteur patine. Marque un temps d’arrêt. Puis délivre, au milieu de résultats pertinents, une sélection de pages consacrées aux… voitures.

Guillaume Grallet

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire