Cea mai mare parte a indexului Căutării este creată cu ajutorul unor programe software numite crawlere. Acestea accesează automat pagini web accesibile public și urmează linkuri către paginile respective, așa cum ați face și dvs. când căutați conținut pe web. Ele parcurg fiecare pagină și stochează informații despre conținutul găsit în paginile respective și alte tipuri de conținut accesibile public în indexul Căutării Google.
Google informațiile
Când crawlerele găsesc o pagină web, sistemele noastre redau conținutul paginii, exact așa cum face un browser. Ținem cont de principalele semnale, de la cuvintele cheie până la actualitatea site-ului, și ținem evidența acestor aspecte în indexul Căutării.
Indexul Căutării Google conține sute de miliarde de pagini web și are o dimensiune de peste 100.000.000 de gigabyți. Este ca indexul de la finalul unei cărți, cu o intrare pentru fiecare cuvânt găsit în fiecare pagină web pe care o indexăm. Când indexăm o pagină web, o adăugăm intrărilor corespunzătoare tuturor cuvintelor pe care le conține.
Întrucât internetul și conținutul se schimbă în permanență, procesele noastre de accesare cu crawlere rulează încontinuu pentru a ține pasul. Acestea învață frecvența cu care se schimbă conținutul pe care l-au detectat anterior și accesează din nou paginile respective, după cum este necesar. În plus, descoperă conținut nou pe măsură ce apar linkuri noi spre acele pagini sau informații.
Google oferă și un set de instrumente fără costuri, numit Search Console, pe care creatorii îl pot folosi pentru ca noi să le accesăm mai eficient cu crawlere conținutul. Ei pot utiliza și instrumente cum ar fi sitemapurile sau fișierele robots.txt pentru a indica frecvența cu care trebuie accesat conținutul sau dacă acesta nu trebuie inclus în indexul Căutării.
Google nu acceptă niciodată plăți ca să acceseze mai frecvent cu crawlere un site. Oferă aceleași instrumente tuturor site-urilor, din dorința de a asigura utilizatorilor săi cele mai bune rezultate.
Indexul Căutării conține mai mult decât datele de pe web, deoarece informațiile utile se găsesc și în alte surse.
De fapt, avem mai multe indexuri cu diferite tipuri de informații, care sunt colectate prin accesarea cu crawlere, prin parteneriate, prin feeduri de date trimise la Google și prin propria enciclopedie cu informații, Knowledge Graph.
Numărul mare de indexuri înseamnă că puteți să căutați în milioane de cărți din biblioteci renumite, să găsiți duratele de călătorie ale operatorului de transport public local sau să consultați date din surse publice, cum ar fi Banca Mondială.