Edina
2 °C
15 °C

Frissebb találatokat ígér a Google

2010.06.09. 13:38
A Google azt ígéri, hogy az eddiginél is gyorsabb és relevánsabb tartalmat fog adni Caffeine nevű új indexelési módszerével. Ezentúl nem rétegesen vizsgálják a netet, hanem párhuzamosan, szeletekre bontva, azonnal frissítik az élő indexet.

Nyilvánossá vált a Caffeine, vagyis a Google keresőjének új indexelési eljárása. A cég ötven százalékkal frissebb találatokat ígér az eddiginél. Bármilyen tartalomról is van szó, a publikálás után sokkal hamarabb megtalálható a keresőben, mint korábban.

Nem mintha eddig bármi probléma lett volna a gyorsasággal és a relevanciával, a nagyobb forgalmú oldalakon keletkezett újdonságot egy-két percen belül már megtalálhattuk a keresőben, a kisebb és ritkábban frissülő oldalaknál voltak lemaradások. Kereséseknél ugyanis nem közvetlenül a weben keresünk, hanem a keresők által beindexelt oldalakat. Vagyis a keresőknek előtte fel kell térképezniük, indexelniük kell a webet.

caffeine

A Caffeine-t tavaly augusztusban jelentette be a Google. Ki is lehetett próbálni az első verziót, a fejlesztők kifejezetten kérték, hogy a tesztelők hasonlítsák össze a találati listákat a régivel és írják meg tapasztalataikat.

Miért kellett tehát változtatni a jól bevált módszeren? Mert a web elképesztő ütemben növekszik, és itt nem csak azt értjük ez alatt, hogy egyre több a szöveges tartalom, hanem nagy mennyiségű videót, képet töltenek fel. Egy átlagos weboldal most már sokkal komplexebb és gazdagabb tartalmat kínál. Ezzel egy időben megnőttek a felhasználók várakozásai is, a legaktuálisabb releváns találatot akarják. Az oldalak tulajdonosai pedig azt szeretnék, hogy az élesítés pillanatában látható legyen a keresőben az adott tartalom.

A korábbi index rétegekre osztotta a webet, ezek közül a gyakrabban változó, látogatottabb oldalakat gyakrabban indexelték, míg az alapréteget, vagyis a kisebb, ritkán frissülő oldalakat jóval ritkábban indexelték. Ahhoz, hogy frissítsék az adott réteget, az egész webet át kellett nézniük a robotoknak, ezért volt ez nehézkes és lassú folyamat.

A Caffeine ezzel szemben kis szeleteket vizsgál és folyamatosan frissíti az adatokat. Vagyis ha új oldalt találnak a robotok, vagy frissítést valamely oldalon, azt közvetlenül adják hozzá az indexbe. A Caffeine-nel sokkal több oldalt is tudnak indexelni, másodpercenként több száz ezer oldalt. Egy hasonlattal élve, ha papírlap lenne a Google, másodpercenként 4,8 kilométerrel lenne nagyobb a hossza. Az adatbázis 100 millió gigabájt, ehhez naponta több száz ezer gigabájt adódik hozzá.