A Sir Henry Wellcome által 1936-ban alapított Wellcome Trust anyagi támogatását 1992 óta élvező Sanger Intézet a világ egyik vezető genomikai intézménye. Genetikai adatbázisa Trace Archive a világ tudományos közössége által felderített összes génszekvenciát tartalmazza: az egér, a zebrahal, a gyümölcslégy, mintegy kilencven patogén baktérium és természetesen az embert örökítő kódját.
Az archívum jelenleg 22 terabájtot foglal, mérete azonban tízhavonta megduplázódik. Az adatbázis egymilliárd rekordot számlál, egy rekord átlagosan 864 bázis sorrendjét tartalmazza.
Ha az adatokat egy sorba írnánk, az kétszázötvenszer érné körül a Földet. A4-es lapokra nyomtatva a Mont Everestnél két és félszer magasabb oszlopba lehetne rendezni. Aztamindenit.
Van másolat
Az adatbázis az angliai Cambridge közelében, egyetlen HP ES45-ön fut, ami egy 4 processzoros szerver 16 gigabájtos memóriával. A háttértár HSV EVA5000-esekből és EVA8000-esekből áll össze. Az adatokat Oracle Database 10g Enterprise Edition szoftverrel itatták fel.
Az ingyenes és nyílt adatbázist intenzíven használja a biotechnológiai közösség. A letöltések 80 százalékát a dotkom doménekről kérik, utánuk következik a dotedu, majd a brit és amerikai egyetemi kutatók.
A különösen értékes adatbázist kataklizmák ellen is védik: az amerikai nemzeti biotechnológiai információs központ egy másolattal rendelkezik.