Egybilliónál is több weboldal

További Net cikkek

Érdekes nyilatkozatháború alakult ki a Google és a Microsoft között: előbbi eredményeiről beszélt, utóbbi új keresőmechanizmusát éltette.

A Google hivatalos blogjában Jesse Alpert és Nissan Hajaj, a vállalat szoftvertervezői bejelentették, hogy szerintük a weben ma már több mint 1 billió egyedi URL, webcím létezik, írta meg az IT.café. A hatalmas számtól megilletődött mérnökök megállapítják, hogy a korábbi adatokat figyelembe véve ez azt jelenti, hogy a web naponta több milliárd weblappal bővül.

A Google indexelési technológiájára büszke szakemberek ezek után dicsekszenek egy kicsit, és elmondják, hogy bár nem indexelik az összes lapot, mivel közülük igen sok a hasonló, illetve haszontalan, valamint az olyan generált lapok, mint a „következő nap”, gyakorlatilag végtelenné teszik a weblapok számát, de ezzel együtt is a Google keresője képes a legtöbb információt nyújtani a felhasználóknak.

A bejelentést a szaksajtóban sokan erős szkepticizmussal fogadták, s megjegyezték, hogy ez nem más, mint a Google indexének dicshimnusza. A PC World például arra hívja fel a figyelmet, hogy mára már világos, hogy nincs értelme a „nekem van több indexelt lapom” háborúját folytatni, mivel a felhasználók döntő többsége a találati listából legtöbbször csak egy vagy két lapot látogat meg, ezért inkább a relevancia számít, vagyis nem szükséges 5000 találatot megadni, elegendő 10–20 valóban használható link, illetve még jobb, ha egy konkrét kérdésre konkrét válasz érkezik.

Az sokkal érdekesebb, hogy a Google keresőjének működéséről is beszámolnak röviden a mérnökök. Mint írják, a keresés olyan oldalakról indul el, melyek sok kapcsolattal rendelkeznek, majd az új oldalakon lévő linkeket követik, és így tovább. A begyűjtött linkek közül azután szelektálnak, eltávolítják a duplikátumokat. Ezek után jön az adatok feldolgozása a Google PageRank algoritmusával, mely a kapcsolatok alapján rangsorolja a weboldalakat. Ezt a munkát 1998-ban, amikor 26 millió egyedi weblapot számoltak, még néhány óra alatt elvégezték, s időnként frissítették. Ma már folyamatosan fut a program, s naponta többször elvégzik a matematikai elemzést. A blog írói a munka nagyságát érzékeltetve elmondják, hogy az egybillió lap által meghatározott „linktérkép” (link graph) ötvenezerszer nagyobb, mint az Egyesült Államok közlekedési hálózatának térképe.

A „számháború” mögött talán az áll, hogy a Google blogbejegyzésének születésével szinte egy időben jelent meg egy Microsoft-közlemény arról, hogy a vállalat kutatói egy szingapúri konferencián bejelentettek egy új fejlesztést, mely a PageRank vetélytársa lehet esetleg. A Microsoft fejlesztői kínai kutatók közreműködésével dolgozták ki a módszert, amely szerintük a kulcsszavas keresések találati hatékonyságát növelné meg.

A közleményben a kutatók kifejtik, hogy a Google algoritmusa az alapján állapítja meg az adott oldal rangját, hogy hány és milyen rangú oldalról érkező link mutat rá. Az új eljárás, a BrowseRank fejlesztői szerint ez nem ad elég jó eredményt, mivel például a kifelé mutató linkek igen gyorsan változnak, újak jönnek, a régebbit törlik. Ők inkább a felhasználói viselkedést figyelnék: az oldalakra látogatók számát, illetve az egyes oldalakon eltöltött időt. Arra is hivatkoznak, hogy a Google módszerét egyrészt könnyű manipulálni, illetve fals eredményekhez is vezethet, mint például az Adobe.com esetében, mely igen magas ranggal rendelkezik, ám nem azért, mert sokan látogatnak el ide, hanem azért, mert rengeteg oldalon linkelik be az Adobe Reader vagy a Flash Player letöltési lehetőségét.

Valójában például a MySpace vagy a Facebook nagyságrendekkel fontosabb, ha a látogatók számát és az ott töltött időt veszik figyelembe. A közleményben megemlítik, hogy ez a módszer ugyanakkor maximálisan tiszteletben tartja a felhasználók személyes adatait.

A Google erre a kutatásra reagálva többek között megemlítette, hogy legfontosabb technológiájuk messze nem olyan egyszerű, mint amilyennek a Microsoft fejlesztői beállítják, és a jogvédett PageRank által kapott adat csak egyike annak a körülbelül 200 jelnek, melyeket feldolgozva végül is meghatározzák egy adott weboldal relevanciáját.

5 könyv
Több mint 600 meghökkentő, érdekes és tanulságos történet!

MEGVESZEM

Az oldalról ajánljuk

Gazdaság

Orbán Viktor bejelentette, rengeteg pénzt akar megmozgatni

A kormányfő szerint fordulóponthoz érkezett az Európai Unió és Magyarország.

március 10., 08:39

Belföld

Nem csak a fiataloké a campus, egy 83 éves felvételiző is van a jelentkezők között

Mintegy 130 ezren vágynak az egyetemi padokba.

március 10., 08:04

Külföld

Donald Trump arra kérte Vlagyimir Putyint, ne mészárolják le az ukrán katonákat Kurszknál, meg is érkezett a válasz

Az orosz elnök feltette a kérdést: elengedjék-e őket a civilek elleni bűncselekmények után?

5 perce

Külföld

Több mint fél napig könyörögtek a palesztinpárti tüntetőnek, mire hajlandó volt lemászni a Big Benről

Aggódtak a férfi biztonsága miatt.

március 10., 09:12

Cinematrix

Óvatosan az üdítővel, pokoli hosszú lesz az Avatar harmadik része

Az Avatar: Fire and Ash a három és negyed órás előző résznél is hosszabb lesz.

március 10., 07:58

Kultúr

Grecsó Krisztián: Hogyan lehet hosszú éveken keresztül nem szólni egymáshoz

Az Apám üzent regény egy nemzedékről szól, amely nem találta a helyét.

március 10., 07:40

Kultúr

Hans Zimmer kiakadt, emiatt nem lehetett ott az Oscaron

Nem indíthatta a Dűne második részéhez készült filmzenéjét.

március 10., 08:20

Külföld

Kim Dzsongun kiadta a parancsot, ballisztikus rakétákkal üzent Washingtonnak és Szöulnak

Phenjan több figyelmeztetést is küldött.

március 10., 08:45

Külföld

22 évesen meghalt a luxemburgi herceg

Frederik súlyos betegséggel küzdött.

március 10., 07:38

Belföld

Tízmilliós prémiumok igen, közterület-felújítás nem – Vitézy Dávid szerint Karácsony Gergely rossz helyre költi a pénzt

Minden másra bezzeg van − állítja a Podmaniczky Mozgalom vezetője.

március 10., 08:55

Külföld

A szélsőjobb esélyeit javítja a román politika nagy visszatérője

Románia mindenekelőtt – Trump mintájára. Ez Victor Ponta jelmondata.

március 10., 05:58

Külföld

Vészjósló kijelentést tett a francia politikus: Oroszország többdimenziós fenyegetést jelent Európára nézve

március 10., 05:55

Vélemény

Mi kell ahhoz, hogy ne egye meg az országot a herbál és a bűnözés?

Ceglédi Zoltán írása.

március 10., 07:25

Belföld

Elnök kegyelem és reflektorfény nélkül

Ilyen volt Sulyok Tamás első éve.

március 10., 07:06

Futball

Szoboszlai meglepte a liverpooliakat, bankot is robbanthatnak csapatáért kedd estig

„Tudtuk, szenvednünk kell!”

március 10., 05:57

Gazdaság

Új időszámítás a késedelmi pótlékoknál: erre minden adózónak figyelnie kell

A NAV már megkezdte az adózók értesítését.

március 10., 09:55

Külföld

Mark Carney lehet Justin Trudeau utódja, aki azonnal kesztyűt dobott Donald Trumpnak

Az új liberális pártvezető nem hagyja, hogy az amerikai elnök sikerrel járjon.

március 10., 07:35

Atlétika

„Hallottam a sikoltást, de nem láttam semmit” – mindenkit megijesztett a holland futó sérülése

Maureen Koster elesett, eszméletét vesztette, majd kórházba szállították.

március 10., 09:40

Kézilabda

A Veszprém vezérigazgatója: Ezzel a gazdasági háttérrel alapvető feladat a BL négyes döntő

„Ez egy alapkövetelmény Veszprémben.”

március 10., 09:27

Kultúr

Megtalált Paradicsom: ilyen volt a 8. Mozart-nap az Indexen

A Concerto Budapest koncertsorozata a Zeneakadémián.

március 10., 05:59

Belföld

Több hullámban érkezik a csapadék, de marad a tavaszias meleg

Viharos széllökések jönnek az Észak-Dunántúlon.

március 10., 06:01

Külföld

Elnyelte a víz a turistaparadicsomot, egy hónapnyi eső zúdult le két óra alatt Ausztráliában

Rombol az Alfred ciklon.

március 10., 06:17

Kultúr

Márkó és Barna Síkideg – Teknősbéka felsőruházat

Két óráig tartó fél órás délutáni pihenések, az elektromos autó nehézségei és habcsók illatú gyertyák. Ezekről is szó volt a Márkó és Barna Síkideg legújabb adásában.

március 10., 07:03