Kuinka hakukoneet toimivat?

Hakukoneet ovat tiedonhakupalveluita, joiden avulla käyttäjä voi hakea tietoa mistä aiheesta tahansa. Hakukoneella tehty haku kohdistuu verkkosivuihin, joiden tiedot on tallennettu hakukoneen tietokantaan. Hakukoneeksi kutsuttu palvelu koostuu kolmesta osasta; indeksoivasta robotista, indeksistä ja itse hakukoneesta.

Hakukoneilla on kaksi tehtävää:

hakukoneen tehtävät

Ensin hakukoneen hakurobotiksi (search crawler) tai hakuhämähäkiksi (search spider) kutsuttu ohjelma vierailee internetissä olevilla verkkosivuilla. Se tallentaa sivujen tietoja hakukoneen tietokantaan myöhempää tiedonhakua varten - tätä kutsutaan indeksoinniksi. Hakurobotit tutkivat internetiä jatkuvasti ja katsovat miljoonia sivuja, tiedostoja, kuvia, uutisia, dokumentteja, kuvia ja mediaa. 

Sitten hakukone tarjoaa listan käyttäjilleen verkkosivuista, jotka se on listannut tärkeysjärjestykseen hakukyselyn perusteella. Hakutuloksen koko ja laatu riippuu hakurobotin tehokkuudesta ja tietokannan koosta. Hakukoneet kehittävät palveluitaan jatkuvasti, jotta pystyvät tarjoamaan käyttäjilleen mahdollisimman tarkkoja vastauksia. Mitä nopeammin hakija saa tarkan vastauksen kyselyynsä, sitä tyytyväisempi hän on.

1. Hakurobotit ja indeksointi

Internetin voi kuvitella monimutkaisena junarataverkostona, jossa jokainen pysäkki on dokumentti - yleensä verkkosivu mutta voi olla myös tiedosto, esim. PDF tai kuva (JPEG, PNG, GIF jne.). Hakurobottien työ on hakea kaikki mahdollinen tieto, mihin ne pääsevät käsiksi ja linkit toimivat niiden junaraiteina.

Linkkejä pitkin hakurobotit pääsevät kaikkiin verkossa oleviin dokumentteihin. Kun robotti saapuu pysäkille se lukee dokumentin koodin ja tallentaa tiedon hakukoneen massiiviseen tietokantaan. Kun hakukoneen käyttäjä kirjoittaa hakukyselyn hakupalkkiin, noutaa hakukone kyselyä lähiten vastaavat dokumentit indeksistään ja näyttää ne hakijalle.

Kun käyttäjät tekevät hakuja, haluavat he välittömiä tuloksia. Jo yhden tai kahden sekunnin viive saattaa aiheuttaa tyytymättömyyttä ja lähettää hakijan muualle. Mitä nopeammin hakukoneet tarjoavat tuloksia ja mitä tarkemmin ne vastaavat hakukyselyä, sitä enemmän ja tyytyväisempiä käyttäjiä hakukoneella on.

Jotta hakukoneet pystyvät tarjoamaan käyttäjilleen tällaista massivista, miljoonista dokmenteista koostuvaa indeksiä haettavaksi, ovat ne rakentaneet datakeskuksia ympäri maailmaa. Nämä valtavat varastotilat pitävät sisällään tuhansia tietokoneita, jotka prosessoivat isoja määriä tietoa erittäin nopeasti.

2. Hakutulosten toimittaminen

Hakukone on yksinkertaisesti sanottuna vastauskone. Kun käyttäjä tekee haun, tekee hakukone kaksi asiaa: ensin se toimittaa vain ne tulokset, jotka ovat merkityksellisiä suhteessa hakykyselyyn; toiseksi se järjestää tulokset suosion mukaan. Hakukoneoptimoinnin tarkoitus on vaikuttaa sisällön merkityksellisyyteen sekä suosioon.

Kuinka hakukoneet määrittelevät hakutulokset?

Merkityksellisyys on hakukoneelle enemmän kuin vain sellaisen sivun löytäminen, jossa on oikeat sanat. Alussa hakukoneet eivät kyenneet tätä enempään ja hakutulosten arvo oli rajallinen. Teknologian kehittyessä insinöörit ovat kehittäneet parempia tapoja vastata hakukyselyihin tarkemmilla hakutuloksilla. Nykyään sadat tekijät vaikuttavat sisällön merkityksellisyyteen.

Hakukoneiden perusolettamus on; mitä suositumpi sivu tai dokumentti, sen arvokkaampi se on (koska monet hakijat ovat sitä käyttäneet usein). Tämä on ollut suhteellisen menestynyt olettamus, kun mitataan hakijoiden tyytyväisyyttä hakutuloksiin.

Suosion ja merkityksellisyyden määräämiseen hakukoneet käyttävät algoritmeja (matemaattisia yhtälöitä). Algoritmit käyttävät satoja tekijöitä, joiden perusteella luokittelevat jokaisen sivun ja dokumentin.

Ensin niiden avulla määräytyy tuloksen merkityksellisyys eli erotellaan korkealaatuiset tulokset huonolaatuisista tuloksista. Seuraavaksi korkealaatuiset tulokset laitetaan tärkeysjärjestykseen sen mukaan, kuinka hyvin ne vastaavat hakukyselyyn.

Alalla näitä kutsutaan hakutulosten tekijöiksi (Search Ranking Factors).

Googlen suositukset

Jotta saat sivusi sijoittumaan hakutuloksissa paremmin, Google suosittelee:

  • Että teet sivut käyttäjiä, et hakukoneita, varten. Älä petkuta käyttäjiäsi tai näytä eri tietoja hakukoneille kuin käyttäjille - tämä käytäntö tunnetaan "verhoamisena".
  • Rakenna sivut, joissa on selvä hierarkia ja tekstilinkkejä. Jokaiselle sivulle tulisi päästä ainakin yhdestä staattisesta tekstilinkistä.
  • Luo hyödyllinen sivusto, joka on tietoa täynnä. Varmista, että sivusi selvästi kuvailevat sisältöäsi ja käytä <title> ja <alt> toimintoja oikein.
  • Käytä avainsanoja ja luo kuvailevia ja ihmisystävällisiä URL-osoitteita. Muista käyttää rel="canonical" tägiä kaksoissisällölle.

Bingin suositukset

Microsoftin insinöörit suosittelevat seuraavaa, jotta sijoitut paremmin Bing hakukoneessa:

  • Varmista, että sinulla on käytössä puhdas, avainsanarikas URL rakenne.
  • Älä hautaa sisältöä sivuillesi (Adobe Flash Player, JavaScript, Ajax) ja varmista, että linkkisi ovat näkyvillä hakuroboteille.
  • Luo sisältöä, jossa on paljon avainsanoja ja yhdistä avainsanat hakijoiden käyttämiin hakukyselyihin.
  • Luo tuoretta sisältöä säännöllisesti.
  • Älä laita tekstiä, jonka haluat indeksoituvan kuvien muodossa. Varmista, että esim. yrityksesi yhteystiedot on kirjoitettu tekstinä eikä kuvamuodossa.

Kuinka haku toimii?

Katso Googlen kertomus siitä, kuinka haku toimii. Visualisoinnissa käydään läpi tutkiminen ja indeksointi (crawling and indexing), algoritmit (algorithms) sekä spämmin eli roskasisällön (fighting spam) estäminen.

kuinka hakukone toimii
Lähde: Google