Eufrozina, Kende
8 °C
19 °C

Megdőlt az adatrendezés világrekordja

2010.07.28. 11:15
Az adatbázisok sorbarendezése a programozók egyik legkomolyabb kihívása a számítástechnikában. Bár rengeteg, végletekig optimalizált algoritmus létezik a feladatra, az adatrendezés egyre fontosabb szerepet tölt be az interneten, és minden egyes pici gyorsítás - akár a szoftverben, akár a kiszolgáló hardverben - idő-, energia-, és költségmegtakarítást jelent.

A világ legjobb programozói dolgoznak adatrendezési feladatokon, az eredményeket a felhasználó például keresőmotorok találati listáinak összeállításánál, egy webáruház vagy közösségi oldal személyre szabott vásárlási ajánlatainál, vagy célzott hirdetéseknél tapasztalja meg.

A San Diego-i University of California egyetem programozócsapata az idei Sort benchmark bajnokságon két világrekordot is megdöntött: először sikerült az egy terabájtos (egymillió megabájt) kategóriában egy perc alatt végezni az adatrendezéssel, a száz terabájtos (ez 21 ezer teleírt dvd-nek felel meg) feladattal pedig 172 perc alatt végzett a számítógépük. A számokból is látszik, hogy az adatbázis növekedésével a rendezés számításigénye nem egyenes arányban növekszik, hanem annál jóval meredekebben, ami különösen nagy fejfájást okoz a programozóknak.

Képünk illusztráció
Képünk illusztráció

Az adatrendezés gyorsítása egyszerre programozói és hardveres probléma. A gyors, és az adott feladatra optimalizált rendező algoritmust ki kell szolgálni számítási kapacitással, memóriával, és gyors hálózati kommunikációval, hiszen itt több tucat processzorral dolgozó szuperszámítógépek küzdenek a feladattal. A szűk keresztmetszetet sok esetben a háttértárakra írás-olvasás sebessége, vagy a szoftvert futtató operációs rendszer adja, mondta el a Science Dailynek a rekorder programozócsapat egyik tagja, Alex Rasmussen.

A rekordhoz a kaliforniai kutatók egy 52 szerverből álló farmot építettek, mindegyikben két négymagos processzor dolgozott, 24 gigabájt memóriával, és 16, egyenként 500 gigabájtos merevlemezzel a háttérben. A hálózatot egy 25 ezer dolláros Cisco Nexus 5020 switch vezérelte.