További Tech cikkek
- Olyat hibát produkál a Windows, hogy garantáltan mindenki kiugrik a székéből
- Könnyen megeshet, hogy a Google kénytelen lesz eladni a Chrome-ot
- A Huawei hivatalosan is bejelentette, előrendelhető a Mate 70
- Lesöpörheti Elon Musk X-ét a Bluesky, már a Google is relevánsabbnak találja
- Ezek a leggyakrabban használt jelszavak – érdemes változtatni, ha ön is használja valamelyiket
Nyilvánossá vált a Caffeine, vagyis a Google keresőjének új indexelési eljárása. A cég ötven százalékkal frissebb találatokat ígér az eddiginél. Bármilyen tartalomról is van szó, a publikálás után sokkal hamarabb megtalálható a keresőben, mint korábban.
Nem mintha eddig bármi probléma lett volna a gyorsasággal és a relevanciával, a nagyobb forgalmú oldalakon keletkezett újdonságot egy-két percen belül már megtalálhattuk a keresőben, a kisebb és ritkábban frissülő oldalaknál voltak lemaradások. Kereséseknél ugyanis nem közvetlenül a weben keresünk, hanem a keresők által beindexelt oldalakat. Vagyis a keresőknek előtte fel kell térképezniük, indexelniük kell a webet.
A Caffeine-t tavaly augusztusban jelentette be a Google. Ki is lehetett próbálni az első verziót, a fejlesztők kifejezetten kérték, hogy a tesztelők hasonlítsák össze a találati listákat a régivel és írják meg tapasztalataikat.
Miért kellett tehát változtatni a jól bevált módszeren? Mert a web elképesztő ütemben növekszik, és itt nem csak azt értjük ez alatt, hogy egyre több a szöveges tartalom, hanem nagy mennyiségű videót, képet töltenek fel. Egy átlagos weboldal most már sokkal komplexebb és gazdagabb tartalmat kínál. Ezzel egy időben megnőttek a felhasználók várakozásai is, a legaktuálisabb releváns találatot akarják. Az oldalak tulajdonosai pedig azt szeretnék, hogy az élesítés pillanatában látható legyen a keresőben az adott tartalom.
A korábbi index rétegekre osztotta a webet, ezek közül a gyakrabban változó, látogatottabb oldalakat gyakrabban indexelték, míg az alapréteget, vagyis a kisebb, ritkán frissülő oldalakat jóval ritkábban indexelték. Ahhoz, hogy frissítsék az adott réteget, az egész webet át kellett nézniük a robotoknak, ezért volt ez nehézkes és lassú folyamat.
A Caffeine ezzel szemben kis szeleteket vizsgál és folyamatosan frissíti az adatokat. Vagyis ha új oldalt találnak a robotok, vagy frissítést valamely oldalon, azt közvetlenül adják hozzá az indexbe. A Caffeine-nel sokkal több oldalt is tudnak indexelni, másodpercenként több száz ezer oldalt. Egy hasonlattal élve, ha papírlap lenne a Google, másodpercenként 4,8 kilométerrel lenne nagyobb a hossza. Az adatbázis 100 millió gigabájt, ehhez naponta több száz ezer gigabájt adódik hozzá.