Hoe Google Zoeken informatie ordent

Voordat u begint met zoeken, verzamelen onze webcrawlers informatie van honderden miljarden webpagina's. Deze informatie wordt vervolgens geordend in de zoekindex.

De basisbeginselen van Google Zoeken

Het crawlproces begint met een lijst van webadressen van eerdere crawls en sitemaps die door website-eigenaren zijn verstrekt. Wanneer onze crawlers deze websites bezoeken, gebruiken ze links op die sites om andere pagina's te ontdekken. De software kijkt specifiek naar nieuwe sites, wijzigingen in bestaande sites en links die niet meer werken. Computerprogramma's bepalen welke sites worden gecrawld, hoe vaak dat gebeurt en hoeveel pagina's van elke site worden opgehaald.

We bieden tools voor webmasters waarmee site-eigenaren gedetailleerd kunnen aangeven hoe Google hun site moet crawlen: ze kunnen gedetailleerde instructies opgeven voor de verwerking van pagina's op hun sites, een recrawl aanvragen of zich afmelden voor crawlen via een bestand met de naam robots.txt. Google accepteert nooit betalingen om een site vaker te crawlen. We bieden alle websites dezelfde tools om onze gebruikers van de best mogelijke resultaten te voorzien.

Informatie zoeken door te crawlen

Het internet is als het ware een continu groeiende bibliotheek met miljarden boeken, die geen centraal registratiesysteem heeft. We gebruiken webcrawlers om openbaar beschikbare webpagina's te ontdekken. Crawlers kijken naar webpagina's en volgen links op die pagina's, net zoals je zou doen als je content bekijkt op internet. Ze gaan van link naar link en sturen informatie over die webpagina's terug naar de Google-servers.

Informatie ordenen via indexering

Wanneer crawlers een webpagina vinden, geven onze systemen de content van de pagina weer, net zoals in een browser. We zoeken naar belangrijke signalen, van zoekwoorden tot hoe recent de website is, en we houden dit allemaal bij in de zoekindex.

De Google Zoeken-index omvat honderden miljarden webpagina's en is meer dan 100.000.000 GB groot. Het is net als de index achterin een boek, met een vermelding voor elk woord op elke webpagina die we indexeren. Wanneer een webpagina wordt geïndexeerd, voegen we deze toe aan de vermeldingen voor alle woorden die op de webpagina staan.

 

 

Met de Kenniskaart gaan we verder dan zoekwoordovereenkomsten om beter inzicht te krijgen in de mensen, plaatsen en dingen die belangrijk voor u zijn. Daartoe ordenen we niet alleen informatie over webpagina's, maar ook andere soorten informatie. Tegenwoordig kunt u via Google Zoeken teksten zoeken in miljoenen boeken uit de belangrijkste bibliotheken, reistijden vinden voor uw plaatselijke aanbieder van openbaar vervoer of gegevens bekijken van openbare bronnen zoals de Wereldbank.