Hogyan térképezi fel a Google az internetes tartalmat?

Amikor számítógéphez ülsz, és a Google rendszerben keresést végzel, jóformán azonnal megjelenik a teljes internetet átfogó találati lista. Hogyan találja meg a Google a lekérdezésnek megfelelő weboldalakat, és hogyan határozza meg a találatok sorrendjét?

Egyszerű hasonlattal élve, az internetes keresést úgy képzelhetjük el, mintha egy hatalmas könyvben egy terjedelmes tárgymutató címszavai alapján próbálnánk a keresett oldalakat megtalálni. A Google rendszerben végzett keresésnél programjaink az index alapján keresik ki a legrelevánsabb találatokat, amelyeket megjelenít számunkra a Google.

A keresési eredmények megjelenítésének három fő fázisa a következő:

  • Feltérképezés: Ismeri a Google az Ön webhelyét? Ki tudjuk azt keresni?
  • Indexelés: Tudja indexelni a Google a webhelyet?
  • Megjelenítés: A webhely tartalmaz-e hasznos és értékes, a felhasználó lekérdezése szempontjából releváns információt?

Feltérképezés:

Az a folyamat, amelynek során a Googlebot megkeresi a Google indexébe felvehető új és frissített oldalakat.

Számítógépek egész hadát veti be a Google kereső rendszer az interneten található oldalak milliárdjainak beolvasásához (feltérképezéséhez). A műveletet végző program neve Googlebot (keresőrobotként vagy robotként is ismert). A Googlebot algoritmikus eljárást alkalmaz: számítógépes programok határozzák meg, hogy a keresőrobot mely webhelyeket és milyen gyakran térképezzen fel, illetve az adott webhelyről hány oldalt olvasson be.

A Google a feltérképezési folyamatot a korábbi feltérképezések során talált weboldalak URL-címeivel, valamint a webmesterektől kapott webhelytérképekkel kezdi. A Googlebot végiglátogatja ezeket a webhelyeket, és az oldalakon talált linkeket felveszi a feltérképezésre váró oldalak listájára. Ezután megkeresi az új és a megváltozott webhelyeket, valamint az inaktív linkeket, majd ezek alapján frissíti a Google indexét.

A Google nem teszi lehetővé, hogy díjfizetés ellenében egy webhely gyakoribb feltérképezését kérjék, mert a keresési szolgáltatást az árbevételt hozó AdWords szolgáltatástól elkülönülten kezeli! Ez tehát azt is jelenti: az organikus találati helyezés nem vásárolható meg! Az organikus találati helyet ki kell érdemelni!

Indexelés:

A Googlebot a feltérképezett oldalakat indexelve hatalmas tárgymutatót hoz létre, amelyben nyilvántart minden szót és a szavak előfordulási helyét az egyes oldalakon. Ezenfelül feldolgozza a főbb tartalomcímkékben és -attribútumokban, például a TITLE címkékben és az ALT attribútumokban tárolt információkat is. A Googlebot sokféle tartalomtípust tud kezelni, de nem mindegyiket. Nem tudja például feldolgozni a legtöbb Flash-fájl és a dinamikus oldalak tartalmát. Ezt optimalizálásnál vegük figyelembe: A flash szép, de csak beágyazva, egyébként értéktelen!

Eredmények megjelenítése:

Amikor a felhasználó lekérdezést ír be, A Google számítógépei kikeresik az indexből a megfelelő oldalakat, és a rendszer megjeleníti azokat a találatokat, amelyeket a felhasználó szempontjából a legrelevánsabbnak ítél. Az oldalak relevanciáját több mint 200 tényező határozza meg, többek között a PageRank mutató. A PageRank az oldalak fontosságának mérőszáma, amely a más oldalakról az adott oldalra mutató linkek számán alapul. Vagyis minden link, amely más webhelyről az Ön webhelyének valamely oldalára mutat, növeli a PageRank mutató értékét. Azonban nem minden link egyenértékű: A Google folyamatosan arra törekszik, hogy a felhasználók érdekében kiszűrje a spam jellegű linkeket és az egyéb olyan módszereket, amelyek negatívan befolyásolják a keresések eredményét. Azok a legértékesebb linkek, amelyeket az Ön webhelyén kínált tartalom minőségének köszönhetően hoznak létre.

Ahhoz, hogy webhelye jó rangsorolást kapjon a keresési eredmények oldalán, fontos biztosítani, hogy a Google megfelelően feltérképezhesse és indexelje a webhelyet. Az Útmutató webmestereknek című fejezetben, sok hasznos alkalmazást ismerhetsz meg. Ezek közül is a hétköznapi eseteket elsősorban.