Postřehy z hledání na Yahoo

Aktualizace 2016: Yahoo už svůj vyhledávač, pokud vím, neprovozuje.

Yahoo umí výborně rozpoznat češtinu, částečně si domyslí diakritiku, staví na nějaké staré databázi a přesměrování zohledňuje zcela jinak, než Google.

Hledání v češtině si na Yahoo můžete nastavit na stránce Preferences. Yahoo skutečně český jazyk dobře rozpoznává. To je zrovna teď obrovská slabina Google -- když si poslední dobou dám na Google hledat v češtině nějaké anglicko-mezinárodní slovo, třeba "title", tak mi to vrací z deseti stránek sedm anglických a jenom tři české (je to asi od března a blbne to tak u mnoha slov).

Co se kvality výsledků hledání týká, tak mám pocit, že Google hledá trošku lépe. Jsou dotazy, kdy jsou výsledky zcela srovnatelné (a Yahoo v nich dokonce jakoby vítězí, protože tam nedává ten anglický bordel), ale v některých případech Yahoo zcela selhává (třeba zrovna to title v češtině vrátí sice jedenáct českých stránek, ale zase jsou zcela mimo mísu). Na tomto hledání slova "title" je mimochodem vidět, že fulltext Yahoo si plete rss zdroje s html stránkami a xml zpracovává jako text.

Význam Yahoo pro návštěvnost českých stránek je malý. Navrcholu mu přisuzuje asi 2%. Vzhledem k síle korporace Yahoo ale počítám, že se to trochu zvedne, teda pokud budou chtít.

Primárním hledáním z portálu Yahoo je právě hledání ve fulltextu, tedy nikoliv hledání v katalogu, jak to známe z českých portálů (zejm. ze Seznamu). Yahoo má dokonce na hledání speciální druhou "hlavní stránku", která se trochu podobá Googlu. Na hledání v katalogu se dá dostat přes odkaz "Directory".

Asi nejvíce mě na fulltextu Yahoo zaujalo, jak zachází s přesměrovanými stránkami. Blbě. Narozdíl od Google, který odkaz po krátké době namíří na novou adresu, Yahoo si pamatuje tu starou (pravděpodobně navždy). Dokonce si například u tohoto webu (Jak psát web) pamatuje, že více jak před rokem byl na adrese https://dusan.pc-slany.cz/internet/. Ani nepozná, že jsou obě domény totožné, a tak se mu v databázi objevují duplicity. Fakt, že se v indexu objevuje více jak rok stará adresa, mě vede k pocitu, že index Yahoo se buďto vyvíjel dlouho, nebo byl převzat z Fastu nebo Altavisty, které Yahoo koupilo (a to mi přijde pravděpodobnější).

Narozdíl od Google vypisuje Yahoo na stránce 20 odkazů a vypisuje jenom jeden odkaz z jedné domény (Google vypisuje dva). Zdá se mi, že pro pravidla optimalizace fungují všechna pravidla známá pro Google. Z výsledků některých svých testovacích stránek mám pocit, jako by více záleželo na textu stránky, než například na zpětných odkazech (tedy vyhrávají spíše on-page faktory). Stejně jako u Google by se slova v url neměla oddělovat podtržítkem, protože je pak Yahoo nerozpozná.

Asi nejvíc mě překvapilo, že Yahoo umí u českých slov hledaných bez dirakritiky doplnit čárky. Háčky a kroužky ne. Takže třeba když hledám "kava", najde mi "káva", ale když hledám "sunka", šunku nenajde. Google háčky ani čárky nedoplňuje, oproti tomu všechny české vyhledávače se snaží diakritiku doplnit vždy.

Publikováno 27. května 2004

Článek je původně z weblogu

 

Reklama

www.webhosting-c4.cz, extra rychlý SSD webhosting s doménou v ceně
o tvorbě, údržbě a zlepšování internetových stránek

Návody HTML CSS JavaScript Články Ostatní

Články Katalog zdrojů SEM SEO

Jak psát web píše Yuhů, Dušan Janovský. Kontakt.