Comment fonctionnent les algorithmes de recherche ?

Au vu de la quantité d'informations disponibles sur le Web, il vous serait presque impossible de trouver ce dont vous avez besoin si elles n'étaient pas triées. Les systèmes de classement de Google sont conçus pour cela. Ils trient les centaines de milliards de pages Web de l'index de recherche pour vous proposer les résultats les plus utiles et pertinents en une fraction de seconde, et ils présentent ces derniers de sorte que vous trouviez plus vite ce que vous cherchez.

Ces systèmes de classement sont composés non pas d'un, mais de toute une série d'algorithmes. Pour vous donner les informations les plus utiles, les algorithmes de recherche tiennent compte de nombreux facteurs, tels que les mots utilisés dans votre requête, la pertinence et la facilité d'utilisation des pages, le niveau d'expertise des sources, votre position et vos paramètres. La pondération appliquée à chaque facteur varie en fonction de la nature de votre requête. Par exemple, l'actualisation du contenu joue un rôle plus important dans la réponse aux requêtes concernant un sujet d'actualité que dans le cas de définitions du dictionnaire.

Pour que les algorithmes de recherche répondent aux exigences de pertinence et de qualité, nous appliquons un processus rigoureux comprenant des tests en direct conduits avec l'aide de milliers d'évaluateurs externes du monde entier, dont le rôle est d'analyser la qualité des résultats de recherche. Ces évaluateurs suivent des consignes strictes qui définissent nos objectifs en matière d'algorithme de recherche et peuvent être consultées par tous.

Découvrez ci-dessous les principaux facteurs qui déterminent les résultats renvoyés pour votre requête :

  • Analyse des termes de recherche

    Analyse des termes de recherche

    Pour vous proposer des résultats pertinents, bien comprendre votre requête est essentiel. C'est pourquoi nous devons analyser le sens des termes que vous avez saisis afin d'identifier des pages qui leur correspondent. Nos modèles linguistiques nous permettent de déterminer quelles sont les chaînes de mots que nous devons rechercher dans l'index.

    Pour cela, nous mettons en œuvre de nombreuses techniques, telles que l'interprétation des erreurs d'orthographe (plus complexe que cela n'y paraît), ou encore le traitement automatique du langage naturel, une technique sophistiquée visant à cerner le type de requête saisi. Autre exemple : notre système de gestion des synonymes permet d'analyser votre recherche, même si vous utilisez un mot ayant plusieurs significations. Il nous a fallu cinq ans pour développer ce système, qui améliore sensiblement les résultats pour plus de 30 % des recherches, toutes langues confondues.

    Nous analysons également le genre d'informations que vous recherchez. Votre requête est-elle large ou très spécifique ? Avez-vous saisi des mots comme "avis", "photos" ou "horaires d'ouverture", qui pourraient nous aider à mieux cerner votre demande ? Utilisez-vous des mots clés qui font le buzz, auquel cas cela voudrait dire que vous recherchez un contenu publié le jour même ? Êtes-vous à la recherche d'une entreprise de proximité et souhaitez-vous obtenir des informations locales ?

  • Recherche de correspondances

    Recherche de correspondances

    Nous recherchons ensuite les pages Web contenant des informations qui correspondent à votre requête. Lorsque vous lancez une requête, nos algorithmes cherchent les termes que vous avez saisis dans l'index afin d'y trouver des pages pertinentes. Ils analysent le nombre de fois que ces mots clés apparaissent sur une page et leur emplacement au sein de cette dernière (dans les titres, les sous-titres ou le corps du texte).

    Outre les mots clés, les algorithmes recherchent des indices pour mesurer le degré d'adéquation entre les résultats de recherche potentiels et la requête de l'internaute. Par exemple, lorsque vous recherchez le terme "chiens", vous n'avez certainement pas envie que les résultats renvoient une page contenant des centaines d’occurrences du mot "chiens". La page ne doit pas seulement reprendre les termes de votre requête : elle doit vous offrir la réponse souhaitée. C'est la raison pour laquelle les algorithmes de recherche Google déterminent si les pages incluent du contenu pertinent, tel que des photos de chiens, des vidéos, la liste des races de chiens, etc. En dernier lieu, nous vérifions que la page est bien rédigée dans la langue de votre question, afin d'accorder la priorité aux pages rédigées dans votre langue de prédilection.

  • Classement des pages selon leur utilité

    Classement des pages selon leur utilité

    Pour une requête, il existe des milliers, voire des millions de pages Web qui contiennent des informations potentiellement pertinentes. Aussi, afin de proposer les meilleures d'entre elles en premier, nous écrivons des algorithmes pour évaluer leur utilité.

    Pour essayer de déceler les meilleures informations possibles sur le Web, ces algorithmes analysent des centaines de facteurs dont le niveau d'actualisation du contenu, le nombre d'occurrences des termes de recherche ou encore l'ergonomie de la page. Pour évaluer le degré de fiabilité et d'autorité d'une page traitant d'un sujet particulier, nous recherchons les sites auxquels le plus grand nombre d'internautes semble accorder du crédit concernant ce même sujet. Le fait que d'autres sites reconnus sur le sujet dirigent les internautes vers une page en particulier constitue également un bon indicateur de la qualité des informations de cette dernière.

    Le Web compte de nombreux sites spammeurs qui tentent d'accéder aux premières places des résultats de recherche à l'aide de techniques comme la répétition en boucle de mots clés ou l'achat de liens qui améliorent le classement PageRank. Ces sites nuisent à l'expérience de navigation des internautes, et peuvent même leur causer du tort ou les induire en erreur. C'est pour cette raison que nos algorithmes sont conçus pour détecter le spam et pour supprimer de nos résultats les sites qui enfreignent nos Consignes aux webmasters.

  • Affichage des meilleurs résultats

    Affichage des meilleurs résultats

    Avant de vous présenter les résultats, nous évaluons le lien entre toutes les informations pertinentes que nous avons trouvées : les différents résultats traitent-ils d'un sujet en particulier ou de plusieurs ? Un trop grand nombre de pages donnent une interprétation réductrice de la requête ? Nous veillons à proposer un large éventail d'informations, dans les formats qui conviennent le mieux au type de recherche effectuée. Au fur et à mesure des évolutions du Web, nous adaptons nos systèmes de classement afin de renvoyer des résultats de meilleure qualité.

  • Prise en compte du contexte

    Prise en compte du contexte

    De vos paramètres de recherche à votre situation géographique, en passant par l'historique de vos recherches, toutes ces informations nous permettent de vous proposer les résultats les plus pertinents et les plus utiles à l'instant T.

    Nous renvoyons des contenus adaptés à votre zone géographique, en fonction de votre position et de votre pays. Si vous recherchez le terme "football" à Chicago, les résultats Google concerneront sans doute le football américain avec, en tête de liste, des pages sur les Chicago Bears. Par contre, pour la même recherche lancée depuis Paris, les pages sur le football et sur la Ligue 1 seront mieux classées. Les paramètres de recherche peuvent également nous renseigner sur les résultats qui vous conviennent. Par exemple, vous pouvez avoir défini une langue de prédilection ou avoir activé SafeSearch (pour bloquer les résultats explicites).

    Il nous arrive également de personnaliser vos résultats sur la base d'informations liées à votre activité de recherche récente. Supposons que vous lanciez une recherche sur "Barcelone". Le fait que vous ayez récemment saisi la requête "Barcelone contre Arsenal" fournit une indication importante : vous recherchez sans doute des informations concernant le club de football, pas la ville. Vous avez la possibilité de contrôler l'activité de recherche servant à améliorer votre expérience de la recherche Google, y compris en paramétrant les données qui sont enregistrées dans votre compte Google, depuis la page myaccount.google.com.