Barbara, Borbála
-6 °C
3 °C

A káosz rendje

2005.11.12. 19:35
Az Amazon.com a fogyasztók demográfiai adatai és vásárlásaik közötti összefüggésre automatizált mintaelemző eljárásokkal derít fényt. Ugyanezen mintákat felhasználva, további ajánlatokkal kedveskedik klienseinek. Hasonló, az agyi folyamatokból kiinduló, számítástudományt, statisztikát, biológiát és fizikát egyesítő mintafelismerő módszereket egyre gyakrabban alkalmaznak más területeken is.
Sokszor támaszkodunk az életünk részévé vált mintaelemzésre (pattern analysis) - genetikai laboratóriumoktól kezdve csillagászati megfigyelőállomásokig, a tudósok már csak a legfejlettebb feldolgozó-eljárásokat használva boldogulnak el valósidőben a rájuk zúduló adatdömpinggel.

Nyelv és DNS

A Kalifornia Egyetem (Davis) statisztika-docense, Nello Cristianini génszekvenciák és a modern nyelvek fejlődését kutatva az élesztőgomba és az indoeurópai nyelvek családfája, a DNS-sorok és a nyelvtan közötti hasonlóságokat igyekszik kimutatni.

Subsumer projektjében - DNS-elemző technikákat alkalmazva - világhálós híroldalak és blog-bejegyzések közös szavai után nyomoz. A rendszer automatikusan összegyűjti a hírekhez kapcsolódó linkeket, honlapokról kivonatolja a tartalmat, felismeri a fontos információt (címet, dátumot, kulcsszavakat, stb.), majd különböző, a felhasználó által kiválasztott módokon csoportosítja a dokumentumokat.

Ha elegendő mennyiségű adat áll rendelkezésünkre, a valójában nem létező mintákat is könnyen megtaláljuk - állapította meg Cristianini. A statisztikai módszerek mindig segítenek megállapítani, mi az igazán lényeges.

Hogyan tanul az ember, és hogyan tanul a gép?

A mintaelemzés megértése betekintést ad az ember és a gép tanulási folyamatába, hogy miként használjuk fel korábbi tapasztalatainkat. Az újszülött agyának a külvilági utasítások nélkül kell elsajátítania a látvány, a hang és az érzetek megértését - jelentette ki a korábban szintén az UC Davis-en tanító, jelenleg a Berkeley Egyetem Elméleti Idegtudományok Központját igazgató Bruno Olshausen. Őt is, Cristianinit is érdekli a csecsemők hasonló célú agyi folyamatait "utánzó" gépi tanulás. Úgy kell rátalálniuk az adatmasszában rejtőző szerkezetekre, mintákra, hogy nem tudják pontosan, miként kezeljék a "nyers matériát." Agyunk - ellentétben a számítógépekkel - a pillanat törtrésze alatt felismeri a képeket, holott ideghálóink nagyságrendekkel lassabban működnek az elektronikus tranzisztoroknál. Azonnal felfogja a vonalak és élek apró részleteiből összeálló nagy egészet. Viszont - és ez a gépi tanulás nagy problémája is - változatlanul nem értjük igazán, miként sajátítja el a mintafelismerést az emberi agy.

Információvesztés nélküli tömörítés

Naoki Saito, az UC Davis matematikusa például agyi aktivitások rögzítésére, vagy nagy terjedelmű fájlok tömörítésére alkalmaz mintafelismerő módszereket. A népszerű JPEG formátummal viszonylag sok adatot veszítünk, márpedig a minél több információ megőrzése a cél. A JPEG képtömörítés javítására, Saito és a japán Shizuoka Egyetemen dolgozó Katsu Yamatani létrehoztak egy úgynevezett "harmonikus elemzés" eljárást. Az adatokat két komponensre, sima, göröngyös, egyenletes területekre, mint a bőr, illetve oszcilláló részekre (csíkok, minták, és más hirtelen változások) osztják. A két összetevő közötti kapcsolatot vizsgálva, a program a tömörítés során kárba veszett információ felbecsülése után rekonstruálja a képet.

Minták a káoszban

A káoszmatematikában és komplexitás-elméletben úttörő munkákat jegyző Jim Crutchfield (CU Davis, Számítástudományi és Mérnöki Központ) a minták és szerveződések eredetét kutatja: miként hozza létre őket a természet, hogyan fedezzük fel az újakat. A tudomány is hasonlóan működik: a szerkezetek különböző szinteken jelennek meg a világmindenségben, mi pedig elméleteket gyártunk az adatokból. Crutchfield computerei különböző mintákat generálnak. A sejtautomatából (Sejtautomaták) indul ki: matematikai módszerrel szűri meg az outputot, és találja meg a mintákat és szerkezeteket. A modelleket - saját kémiával és fizikával rendelkező - "miniatűr univerzumoknak" nevezi. Úgy véli, léteznek az organizációnak minden univerzumra alkalmazható alapelvei. Ha megértjük őket, akkor egyszerű lokális szabálysorokból képesek leszünk előrejelezni, milyen szerkezetek alakulnak ki a jövőben. A kimenetek azonban gyakran kaotikusak, ami megnehezíti a rendszer viselkedésére vonatkozó prognózisainkat_ Crutchfield az időjárást hozza fel példaként: pontos előrejelzést csak néhány napra adhatunk. Nagyobb számítógépes kapacitással esetleg többre mehetünk, ám még annál is fontosabb - és a megoldás záloga lehet -, hogy megtaláljuk a valódi mintákat a káoszban.