Do Google za 40 hodin

Robotovi Google trvá velmi krátký čas, než najde novou stránku. Pak ještě chvilku trvá, než se stránka objeví ve hledání, ale stejně je to hodně rychlé. Žádný jiný robot této rychlosti nedosahuje. Uvedu dva příklady z praxe.

V diskusích se velmi často objevuje dotaz, jak rychle vyhledávače (a zejména Google) stránku najde a zařadí. Obvykle se udává, že je to asi měsíc. Je fakt, že nevím, jak je to u málo odkazovaných stránek. Pokud ale na novou stránku vede dostatek zpětných odkazů, počítá se rychlost zařazení do indexu Google v hodinách. Rychlost nalezení příspěvků v blogu pak dokonce v minutách!

Ve středu 16. června jsem asi ve čtyři ráno publikoval novou stránku HTML tahák. Není to nic moc stránka, jenom takové kódy pro začátečníky, o to teď nejde. Odkazy jsem rozprostřel porůznu. Podle logu se v 8.17 ráno Googlebot stavil na hlavní stránce o html, kde asi našel odkaz na novou stránku. A už v 9.26 si vesele stahoval HTML tahák. Takže novou stránku znal Google za pět hodin. Naneštěstí jsem přesně nesledoval, kdy se objevil odkaz ve výsledcích hledání Google, každopádně ve čtvrtek 17. června kolem 18. hodiny už tam byl. To je 40 hodin od publikování stránky.

Je jasné, že kdyby robot na tu hlavní stránku o html, kde našel odkaz, nechodil každý den, asi by to bylo pomalejší. Ještě zběsilejší tempo nasazuje ale googlebot v případě příspěvků v blogu. Například předchozí příspěvek o hledání v knihách jsem publikoval včera (17. 6.) ve 20.40. Načež v logu stojí, že už ve 20.53 přicupital googlebot s označením Mediapartners-Google/2.1. Není mi moc jasné, kde na novou stránku během třinácti minut sehnal odkaz. Napadají mě jenom dva způsoby: přes toolbar Google nějakého návštěvníka (ale během těch třinácti minut u mě byly jenom samé Mozilly a Opery), nebo přes články na Jyxo (jyxo si stáhlo rss ve 20.40, chodí si pro něj každých 10 minut, googlebot jenom dvakrát denně). Nová stránka ovšem ani po devíti hodinách ještě není k nalezení (indexování je zřejmě pomalejší než stahování). (Aktualizace 2013: jyxo už neexistuje.)

O podobné rychlosti si ostatní fulltexty mohou nechat jenom zdát. Zatímco ze stáje Jyxo najde po dvou dnech html tahák pouze Jyxo z Volny (a to pouze stránku obsahující odkaz), ostatní jyxa a morfeo netuší vůbec nic. Yahoo taky nic. Dva dny je pro ně málo.

Abych Google jenom nechválil: má teď jednu nepěknou aktualizační kaňku. Koncem dubna přestal aktualizovat údaje o PageRanku v Google Toolbaru. Novým i neznámým stránkám nyní ukazuje nulu, takže to vypadá, že v indexu vůbec nejsou, ačkoli jsou normálně k nalezení. Pár lidí kvůli tomu už propadá panice. Osobně se domnívám, že tato prodleva nějak souvisí s rozlousknutím šifrování údajů z toolbaru.

Dodatek: Podle přesnějšího sledování se nové stránky do Google mohou dostat už po 33 hodinách. Je ale patrné, že se tak pravděpodobně děje ve vlnách. Například tento příspěvek se objevil (nejpozději) po 33 hodinách, ale předchozí až po 43 hodinách -- oba příspěvky ale (zdá se) ve výsledcích ovšem naskočily najednou.

Publikováno v pátek 18. června 2004

Článek je původně z weblogu

 

Reklama

www.webhosting-c4.cz, webhosting s doménou v ceně. 20GB
o tvorbě, údržbě a zlepšování internetových stránek

Návody HTML CSS JavaScript Články Ostatní

Články Katalog zdrojů SEM SEO

Jak psát web píše Yuhů, Dušan Janovský. Kontakt.