Melinda, Vivien
2 °C
8 °C

800 milliárd bázis a szuper-génadatbázisban

2006.01.19. 15:00
Egymilliárd rekordra nőtt a világ legnagyobb genetikai adatbázisának állománya. A Trace Archive az ötödik legnagyobb UNIX adatbázis a világon.

A Sir Henry Wellcome által 1936-ban alapított Wellcome Trust anyagi támogatását 1992 óta élvező Sanger Intézet a világ egyik vezető genomikai intézménye. Genetikai adatbázisa Trace Archive a világ tudományos közössége által felderített összes génszekvenciát tartalmazza: az egér, a zebrahal, a gyümölcslégy, mintegy kilencven patogén baktérium és természetesen az embert örökítő kódját.

Az archívum jelenleg 22 terabájtot foglal, mérete azonban tízhavonta megduplázódik. Az adatbázis egymilliárd rekordot számlál, egy rekord átlagosan 864 bázis sorrendjét tartalmazza.

Nyomok
A Trace Archive a génszekvenciát leíró eljárásról kapta nevét. A különböző furfangos kémiai hatásoknak kitett DNS-en az egyes bázisokat (adenin, citozin, timin, guanin) különböző színekkel megfestik, majd kinyitják az ajtót és bejön a robot, amely feldolgozza a színekkel jelölt génszekvenciát, amelynek képét trace-nek (nyom, körvonal) nevezik.

Ha az adatokat egy sorba írnánk, az kétszázötvenszer érné körül a Földet. A4-es lapokra nyomtatva a Mont Everestnél két és félszer magasabb oszlopba lehetne rendezni. Aztamindenit.

Van másolat

Az adatbázis az angliai Cambridge közelében, egyetlen HP ES45-ön fut, ami egy 4 processzoros szerver 16 gigabájtos memóriával. A háttértár HSV EVA5000-esekből és EVA8000-esekből áll össze. Az adatokat Oracle Database 10g Enterprise Edition szoftverrel itatták fel.

Az ingyenes és nyílt adatbázist intenzíven használja a biotechnológiai közösség. A letöltések 80 százalékát a dotkom doménekről kérik, utánuk következik a dotedu, majd a brit és amerikai egyetemi kutatók.

A különösen értékes adatbázist kataklizmák ellen is védik: az amerikai nemzeti biotechnológiai információs központ egy másolattal rendelkezik.