Kako funkcioniraju algoritmi Pretraživanja

Odgovori su ono što tražite, a ne milijarde web-stranica. Zato Googleovi sustavi rangiranja pretražuju stotine milijardi web-stranica u indeksu Pretraživanja kako bi vam prikazali korisne i relevantne rezultate u djeliću sekunde.

Sustavi rangiranja sastoje se od niza algoritama koji analiziraju vaš upit za pretraživanje kako bi odredili koje vam informacije trebaju prikazati kao rezultate. S poboljšanjem Pretraživanja poboljšali smo i svoje algoritme kako bismo mogli što detaljnije procijeniti vaša pretraživanja i pružiti vam korisnije rezultate na svojim uslugama.

Evo nekoliko načina na koje Google koristi algoritme Pretraživanja za prikaz korisnih informacija s weba:

  • Analiziranje vaših riječi

    Analiziranje vaših riječi

    Za dobivanje dobrih odgovora ključno je da razumijemo što tražite. Zato da bismo pronašli stranice s relevantnim informacijama, prvi je korak da analiziramo značenje riječi u vašem upitu za pretraživanje. Izrađujemo jezične modele kako bismo pokušali otkriti koje nizove riječi trebamo tražiti u indeksu.

    Ti modeli koji počivaju na najnovijim istraživanjima o razumijevanju prirodnih jezika obavljaju naizgled jednostavne radnje kao što je tumačenje pravopisnih pogrešaka pa sve do prepoznavanja vrste unesenog upita. Na primjer, pomoću našeg sustava sinonima Pretraživanje može prepoznati što tražite, čak i ako riječ ima više značenja. Za razvoj tog sustava bilo je potrebno više od pet godina i znatno je poboljšao rezultate u više od 30% pretraživanja na različitim jezicima.

    Trudimo se razumjeti i koju kategoriju informacija tražite. Je li u pitanju vrlo specifično pretraživanje ili neki široki pojam? Sadrži li upit riječi kao što su "recenzija", "slike" ili "radno vrijeme" koje ukazuju na potrebu za konkretnim informacijama? Jesu li pojmovi za pretraživanje aktualne ključne riječi koje impliciraju da želite sadržaj koji je objavljen taj dan? Ili tražite neku tvrtku u blizini i želite saznati više o njenoj lokaciji?

  • Traženje podudarnih rezultata

    Traženje podudarnih rezultata

    Zatim tražimo web-stranice s informacijama koje odgovaraju vašem upitu. Dok pretražujete, naši algoritmi na najosnovnijoj razini traže vaše pojmove za pretraživanje u indeksu kako bi pronašli odgovarajuće stranice. Pritom analiziraju učestalost i mjesto pojavljivanja tih ključnih riječi na stranici, i to u naslovima, zaglavljima i samom tekstu stranice.

    Osim podudaranja ključnih riječi, algoritmi traže naznake pomoću kojih mogu mjeriti u kojoj mjeri potencijalni rezultati pretraživanja korisnicima daju informacije koje su tražili. Kada postavite upit "psi", vjerojatno ne želite stranicu na kojoj sto puta piše "psi". Pokušavamo otkriti sadrži li stranica odgovor na vaš upit, a ne samo ponavljanja unesenog upita. Tako algoritmi Pretraživanja analiziraju uključuju li stranice relevantan sadržaj, primjerice slike i videozapise pasa ili čak popise pasmina. Naposljetku provjeravamo je stranica na istom jeziku kao i pitanje kako bismo odredili prioritet stranica prema vašem preferiranom jeziku.

  • Rangiranje korisnih stranica

    Rangiranje korisnih stranica

    Za prosječan upit postoje tisuće ili čak milijuni web-stranica s potencijalno relevantnim informacijama. Da bismo rangirali web-lokacije tako da one najbolje budu među prvima, pišemo i algoritme koji procjenjuju korisnost tih web-stranica.

    Kako bi pronašli najbolje informacije ponuđene na webu, algoritmi analiziraju stotine različitih čimbenika od starosti sadržaja do broja pojavljivanja vaših pojmova za pretraživanje i toga pruža li stranica dobar korisnički doživljaj. U procjeni pouzdanosti i mjerodavnosti za određeni predmet oslanjamo se na web-lokacije za koje se čini da ih mnogi korisnici smatraju korisnima za slične upite. Ako druge istaknute web-lokacije u vezi s tom temom sadrže veze na tu stranicu, to je dobar znak da je kvaliteta informacija visoka.

    Na webu ima mnoštvo neželjenih web-lokacija koje se pokušavaju na prevaru probiti na vrh rezultata pretraživanja koristeći se tehnikama kao što su beskonačno ponavljanje ključnih riječi ili kupnja veza koje prosljeđuju prednosti PageRanka. Te web-lokacije pružaju loš korisnički doživljaj i čak mogu nanijeti štetu Googleovim korisnicima ili ih obmanuti. Zato pišemo algoritme koji otkrivaju neželjeni sadržaj i uklanjaju web-lokacije koje krše Googleove smjernice za webmastere iz rezultata pretraživanja.

  • Prikaz najboljih rezultata

    Prikaz najboljih rezultata

    Prije nego što vam prikažemo rezultate, procjenjujemo međuodnose svih relevantnih informacija: Je li u rezultatima pretraživanja prisutna samo jedna tema ili više njih? Postoji li previše stranica u čijem je fokusu samo jedno usko tumačenje? Nastojimo pružiti raznovrstan skup informacija u oblicima koji su najkorisniji za vašu vrstu pretraživanja. A usporedno s razvojem weba i mi razvijamo svoje sustave rangiranja kako bismo posluživali bolje rezultate za više upita.

  • Razmatranje konteksta

    Razmatranje konteksta

    Informacije kao što su vaša lokacija, povijest prošlih pretraživanja i postavke Pretraživanja pomažu nam da prilagodimo rezultate prema onome što je u tom trenutku najkorisnije i najrelevantnije za vas.

    Vašu zemlju i lokaciju upotrebljavamo kako bismo vam prikazali sadržaj koji je relevantan za vaše područje. Na primjer, ako ste u Chicagu i tražite "nogomet", Google će vam najvjerojatnije prvo prikazati rezultate o američkom nogometu i Chicago Bearsima. No ako "nogomet" potražite u Londonu, Google će više rangirati rezultate o nogometu i Ligi prvaka. Postavke pretraživanja također su važan pokazatelj toga koji će vam rezultati vjerojatno biti korisni, primjerice ako postavite preferirani jezik ili uključite Sigurno pretraživanje (alat za filtriranje eksplicitnih rezultata).

    U nekim slučajevima možemo i prilagoditi rezultate prema vama pomoću podataka o vašoj nedavnoj aktivnosti na Pretraživanju. Na primjer, ako potražite pojam "Barcelona", a nedavno ste tražili "Barcelona – Arsenal", to može biti važna naznaka da ne želite informacije o gradu već nogometnom klubu. Na stranici myaccount.google.com možete odrediti koja će se aktivnost pretraživanja koristiti za poboljšanje vašeg doživljaja na Pretraživanju, a tamo također možete odrediti podatke koji se spremaju na Google račun.