Googlov algoritem
Pred kratkim je bil na spletu objavljen del Googlove kode. Na stotine tržnikov in strokovnjakov za podatkovno rudarjenje se trudi, da bi informacije osmislili in povezali, kako vas Google dejansko uvršča. Številne informacije so precej eksplozivne, npr. da Google daje prednost velikim spletnim mestom pred manjšimi. To smo vsi sumili in to je potrjeno.
Google očitno uporablja Chrome za razvrščanje strani
To je še posebej zanimivo, saj je Google prej zanikal, da bi Chrome uporabljal za razvrščanje spletnih strani.
Iz dokumentov, ki so jih razčlenili strokovnjaki, kot je Fishkin, je razvidno, da Google spremlja, koliko klikov na spletno stran opravijo uporabniki v njegovem spletnem brskalniku Chrome, da bi izbral, katere strani spletnega mesta bo vključil v svoj zemljevid iskalnih poizvedb.
Čeprav se ne zdi, da Google te informacije uporablja za odločanje o tem, kam bo uvrstil celotno spletno mesto, analitiki domnevajo, da podjetje uporablja dejavnost brskalnika Chrome za odločanje o tem, katere notranje strani bo prikazalo v iskanju pod domačo stranjo spletnega mesta.
Google uporablja tag “small personal”.
Strokovnjak za SEO Mike King iz podjetja iPullRank je to označil in sprožil več vprašanj kot odgovorov.
Glede na analizo Googlovega internega dokumenta ima podjetje posebno zastavico, ki jo pripiše “majhnim osebnim spletnim mestom”. Ni jasno, kako Google določi, kaj je “majhna” ali “osebna” spletna stran, prav tako ni nobenih informacij o tem, zakaj Google označuje spletne strani s to oznako. Je to namenjeno njihovi promociji v iskanju? Da bi jih degradiral na lestvici?
Njen namen je za zdaj skrivnosten.
AI ?
Google poskuša ugotoviti, koliko truda je bilo vloženega v ustvarjanje vsebine. Na podlagi opredelitve ne vemo, ali je na ta način ocenjena vsa vsebina s strani LLM ali gre le za vsebino, za katero sumijo, da je ustvarjena z uporabo AI.
Kliki so zelo pomembni
To je še eno vprašanje, o katerem strokovnjaki za SEO že dolgo ugibajo, Google pa ga je v preteklih letih zanikal. In spet se zdi, da so imeli strokovnjaki prav.
Izkazalo se je, da se Google pri uvrstitvah v iskanju veliko bolj zanaša na klike uporabnikov, kot je bilo prej znano.
NavBoost je Googlov dejavnik razvrščanja, ki se osredotoča na izboljšanje rezultatov iskanja. Za izboljšanje teh rezultatov se močno osredotoča na podatke o klikih. Po besedah Kinga zdaj vemo, da ima NavBoost “poseben modul, ki je v celoti osredotočen na signale klikov”. Eden glavnih dejavnikov, ki določa uvrstitev spletnega mesta za iskalno poizvedbo: kratki kliki v primerjavi z dolgimi kliki ali kako dolgo uporabnik ostane na strani po kliku na povezavo iz iskalnika Google.
Natančno ujemajoče se domene (Exact match domains) lahko škodijo uvrstitvi v iskanju
Če ste kdaj naleteli na ime domene z več ključnimi besedami in pomišljaji, kot je na primer used-cars-for-sale.net, je bil vsaj del razloga verjetno SEO. Med vlagatelji v domene in skupnostjo digitalnega trženja je dolgo veljalo prepričanje, da Google nagrajuje natančno ujemajoča se domenska imena.
Izkazalo se je, da to ni vedno res. Pravzaprav lahko natančno ujemajoča se domena poslabša vaše uvrstitve.
Pred približno desetimi leti je Google sporočil, da natančno ujemajoča se domenska imena ne bodo več zelo cenjena kot orodje za doseganje uvrstitev, čeprav je bil algoritem nekoč naklonjen tem imenom. Vendar imamo zdaj zaradi tega uhajanja dokaze, da obstaja mehanizem za aktivno degradiranje teh spletnih mest v iskalniku Google. Izkazalo se je, da Google na številne tovrstne domene gleda enako kot na prakse polnjenja ključnih besed. Algoritem te vrste url-jev obravnava kot spam.
NavBoost : Sistem razvrščanja, ki temelji na dnevnikih klikov uporabnikovega vedenja.
QualityBoost : Sistem razvrščanja, ki temelji na kakovosti vsebine – določa ga več dejavnikov.
RealTimeBoost : Sistem razvrščanja, ki temelji na svežini vsebine – večinoma ga določajo datum objave/posodobitve in drugi datumi, navedeni v vsebini.
WebImageBoost : Sistem razvrščanja, ki temelji na slikah v dokumentu.
Čeprav ni informacij o utežeh parametrov razvrščanja, ki bi določale, koliko določena značilnost vpliva na razvrstitev, lahko sklepamo o nekaterih stvareh :
Google izrecno shranjuje avtorje dokumenta kot besedilo. Prav tako preveri, ali je subjekt, ki je omenjen na strani, avtor strani. Zaradi pomena, ki ga dajejo, je jasno, da imajo informacije o avtorjih pomembno vlogo pri razvrščanju.
Dejansko to pomeni, da višja kot je stopnja, bolj dragocena je povezava.
Strani, ki veljajo za “sveže”, veljajo tudi za visokokakovostne.
Sidra, ustvarjena v času konice, so označena z LINK_SPAM_PHRASE_SPIKE. Zato ne smete v zelo kratkem času dobiti na stotine povratnih povezav, sicer se lahko njihova teža zmanjša ali celo nastavi na 0, s čimer se ustvari majhen ali nikakršen vpliv povezav.
Medtem ko so podatki o prepovedi /disavow / dostopa lahko shranjeni nekje drugje, v vmesniku API ni nobene omembe prepovedi dostopa. Obstaja možnost, da je bil disavow množični inženirski napor za usposabljanje Googlovih klasifikatorjev neželene pošte.
Z vsakim dokumentom je povezana njegova domača stran PageRank. Ta HomePageRank in siteAuthority se verjetno uporabljata kot približek za nove strani, dokler ne pridobijo lastnega PageRanka.
Oblikovanje je pomembno. Vse različice poševnega in krepkega tiska ter velikosti pisave, ki jih izvajamo, imajo splošen vpliv na razvrščanje. Google spremlja povprečno ponderirano velikost pisave izrazov v dokumentih.
V dokumentaciji je navedeno, da je v sistemu Mustang določeno največje število znakov, ki se upoštevajo za dokument, pri čemer je poudarjeno, da morajo avtorji svojo najpomembnejšo vsebino umestiti na začetku.
Čeprav je bilo veliko razprav o tem, ali ima starost domene kakšno vlogo pri razvrščanju, zdaj vemo, da Google shranjuje najnovejše informacije o registraciji na ravni dokumenta.
Uporablja se lahko tudi kot sandbox prej registrirane domene, ki je spremenila lastništvo.
Veliko strategij, ki vključujejo nakup uglednih domen s pretečenim rokom veljavnosti (expired domains) bi moralo postati preteklost, saj pravila o zlorabi domen s pretečenim rokom veljavnosti upoštevajo te podatke.
Beli seznami tem
Glede na analizo dokumentov ima Google za določene teme bele sezname (whiteslist). To pomeni, da je treba spletna mesta, ki se v iskalniku Google pojavljajo za te vrste iskalnih poizvedb, odobriti ročno in se ne prikazujejo na podlagi običajnih algoritemsko razvrščenih iskalnih dejavnikov.
Nekatere teme niso preveč presenetljive. Spletna mesta, ki vsebujejo vsebino, povezano z informacijami COVID, in poizvedbe o politiki, zlasti v zvezi z informacijami o volitvah, so uvrščena na beli seznam.
Obstaja pa tudi bela lista za spletne strani s potovalnimi vsebinami. Ni natančno jasno, čemu je ta bela lista namenjena. Strokovnjaki za SEO so namignili, da bi to lahko bilo povezano s prikazovanjem potovalnih spletnih mest v posebnih zavihkih in gradnikih za potovanja v Googlu.
Google je “lagal”
Fishkin, King in drugi strokovnjaki za SEO so lahko zaradi tega odtujenega dokumenta potrdili in ovrgli kar nekaj teorij SEO. In zdaj jim je jasno, da Google v preteklih letih ni bil povsem resničen glede delovanja svojega iskalnega algoritma.
“‘Lagal’ je sicer kruta beseda, vendar je to edina točna beseda, ki jo lahko tu uporabimo,” je zapisal King v svoji razčlenitvi dokumenta Google Content API Warehouse.
“Čeprav Googlovim javnim predstavnikom ne očitam nujno, da so zaščitili svoje lastniške informacije, pa se ne strinjam z njihovimi prizadevanji, da bi aktivno diskreditirali ljudi iz sveta trženja, tehnologije in novinarstva, ki so predstavili ponovljiva odkritja,” je dejal.
Medtem ko bodo strokovnjaki iz panoge še naprej prebirali ta obsežni dokument, bomo morda kmalu izvedeli še nekaj zanimivih podrobnosti, ki jih skriva Googlov iskalni algoritem.
UPDATE: maj. 30. december 2024, 10:52 EDT Google je potrdil legitimnost razkritega dokumenta.
- Tudi avtoriteta domene obstaja, kljub temu da Google pravi, da je v kodni bazi in je zelo pomemben del Googlovega algoritma.
- Potrjena je tudi teorija o “slabih povratnih povezavah”. Da, v Googlovi kodni bazi obstaja slaba povratna povezava, ki nakazuje, da Google kaznuje spletna mesta, ki imajo slabe povratne povezave.
- Google pri razvrščanju spletnih mest uporablja klike. To pomeni, da če za določeno iskanje vaš rezultat dobi več klikov, se bo sčasoma začel uvrščati višje.
- Google meri tudi čas, porabljen na spletnem mestu. Če ljudje po iskanju obiščejo vaše spletno mesto in se ne vrnejo v Google, je to dober rezultat in se uvrsti. Če se ljudje hitro vrnejo, Google ve, da gre za manj ustrezen rezultat, in to informacijo uporabi za razvrščanje.
- UX je prav tako dejavnik. Če imate pokvarjene povratne povezave, slabo navigacijo, počasno spletno mesto, vas uvrsti nižje.
- Google hrani tudi podatke o avtorjih informacij in glede na avtoriteto izboljša uvrstitev.
- Prav tako se beleži, kako komercialna je stran.
- Naslov strani je še vedno ena najpomembnejših lastnosti in se ujema z iskalno poizvedbo.
- Obstaja atribut, ki posebej označuje majhna osebna spletna mesta/bloge. Ni jasno, čemu je namenjen.
- Google ima oceno siteAuthority
- NavBoost je skoraj v celoti sestavljen iz podatkov o klikih, kot sta najdaljši klik iz SERP-a (rezultat iskanja, ki ga je uporabnik najdlje iskal) in zadnji dober klik (zadnjič, ko je nekdo obiskal vaše spletno mesto in ostal na njem). Spremlja klike v obdobju 13 mesecev.
- Google spremlja obiske brskalnika Chrome na spletu in tako ugotavlja vedenje uporabnikov
- Zdi se, da preveč optimiziran anchor text – zlasti če se stalno uporablja za povezave do vašega spletnega mesta s strani tretjih oseb – sproži znižanje vrednosti teh povezav
- Slaba navigacija in exact match domains znižajo vaše uvrstitve
- Google hrani vsaj zadnjih 20 različic vaših spletnih strani. Ni jasno, kako velika sprememba bi morala biti na strani, da bi se štela za novo različico.
- Velikost pisave za povezave in teža besedila sta atributa, ki ju Google spremlja. Večje povezave se zdijo bolj pozitivne in zdi se, da Google krepko besedilo bere drugače kot običajno besedilo.
- Google ima parameter za keyword stuffing
- Google spremlja, kdaj poteče veljavnost domen
- Če je na spletnem mestu več kot 50 % strani opremljenih z videoposnetki, se spletno mesto uvrsti med videoposnetke. Ni jasno, ali morajo biti ti videoposnetki indeksirani, ali morajo biti na določenem območju objave ali pa morajo biti nativno naloženi na spletno mesto
- Vsebina YMYL ima lastno oceno uvrstitve
- Obstaja atribut “zlati standard”, za katerega se zdi, da razmejuje vsebine, ki jih je ustvaril človek (human generated content), vendar ni jasno, kako se sproži
- AI Overviews v dokumentu niso nikoli omenjeni
- Notranje povezave (internal links) kot atribut niso jasno omenjene ?!
- Tri teme imajo “whitelists” . To so potovanja, Covid in politika. Ni jasno, ali gre pri potovalnih straneh za splošne SERP-e, Googlov razdelek “potovanja” ali celo za widgete. Zanimivo pa je, da je potovanje edina niša, ki ni zajeta v sistemu YMYL.
Aplikacija za Lokalni SEO : https://www.localseoguide.com/local-seo-according-to-the-leaked-google-api-documents/