A káosz rendje
További Tudomány cikkek
- Az őskorallok minden élőlénynél előbb világítottak az óceánok mélyén
- Meglepő dolgok derültek ki az Alzheimer-kór okairól egy új kutatásból
- A légszennyezés lelassítja a kisgyerekek agyfejlődését
- Egyre több magyar városban lecsapnak a ragadozó madarak
- Ne ijedjen meg, ha lát valami nagyon fényeset az éjjeli égbolton
Nyelv és DNS
A Kalifornia Egyetem (Davis) statisztika-docense, Nello Cristianini génszekvenciák és a modern nyelvek fejlődését kutatva az élesztőgomba és az indoeurópai nyelvek családfája, a DNS-sorok és a nyelvtan közötti hasonlóságokat igyekszik kimutatni.
Subsumer projektjében - DNS-elemző technikákat alkalmazva - világhálós híroldalak és blog-bejegyzések közös szavai után nyomoz. A rendszer automatikusan összegyűjti a hírekhez kapcsolódó linkeket, honlapokról kivonatolja a tartalmat, felismeri a fontos információt (címet, dátumot, kulcsszavakat, stb.), majd különböző, a felhasználó által kiválasztott módokon csoportosítja a dokumentumokat.
Ha elegendő mennyiségű adat áll rendelkezésünkre, a valójában nem létező mintákat is könnyen megtaláljuk - állapította meg Cristianini. A statisztikai módszerek mindig segítenek megállapítani, mi az igazán lényeges.
Hogyan tanul az ember, és hogyan tanul a gép?
A mintaelemzés megértése betekintést ad az ember és a gép tanulási folyamatába, hogy miként használjuk fel korábbi tapasztalatainkat. Az újszülött agyának a külvilági utasítások nélkül kell elsajátítania a látvány, a hang és az érzetek megértését - jelentette ki a korábban szintén az UC Davis-en tanító, jelenleg a Berkeley Egyetem Elméleti Idegtudományok Központját igazgató Bruno Olshausen. Őt is, Cristianinit is érdekli a csecsemők hasonló célú agyi folyamatait "utánzó" gépi tanulás. Úgy kell rátalálniuk az adatmasszában rejtőző szerkezetekre, mintákra, hogy nem tudják pontosan, miként kezeljék a "nyers matériát." Agyunk - ellentétben a számítógépekkel - a pillanat törtrésze alatt felismeri a képeket, holott ideghálóink nagyságrendekkel lassabban működnek az elektronikus tranzisztoroknál. Azonnal felfogja a vonalak és élek apró részleteiből összeálló nagy egészet. Viszont - és ez a gépi tanulás nagy problémája is - változatlanul nem értjük igazán, miként sajátítja el a mintafelismerést az emberi agy.
Információvesztés nélküli tömörítés
Naoki Saito, az UC Davis matematikusa például agyi aktivitások rögzítésére, vagy nagy terjedelmű fájlok tömörítésére alkalmaz mintafelismerő módszereket. A népszerű JPEG formátummal viszonylag sok adatot veszítünk, márpedig a minél több információ megőrzése a cél. A JPEG képtömörítés javítására, Saito és a japán Shizuoka Egyetemen dolgozó Katsu Yamatani létrehoztak egy úgynevezett "harmonikus elemzés" eljárást. Az adatokat két komponensre, sima, göröngyös, egyenletes területekre, mint a bőr, illetve oszcilláló részekre (csíkok, minták, és más hirtelen változások) osztják. A két összetevő közötti kapcsolatot vizsgálva, a program a tömörítés során kárba veszett információ felbecsülése után rekonstruálja a képet.
Minták a káoszban
A káoszmatematikában és komplexitás-elméletben úttörő munkákat jegyző Jim Crutchfield (CU Davis, Számítástudományi és Mérnöki Központ) a minták és szerveződések eredetét kutatja: miként hozza létre őket a természet, hogyan fedezzük fel az újakat. A tudomány is hasonlóan működik: a szerkezetek különböző szinteken jelennek meg a világmindenségben, mi pedig elméleteket gyártunk az adatokból. Crutchfield computerei különböző mintákat generálnak. A sejtautomatából (Sejtautomaták) indul ki: matematikai módszerrel szűri meg az outputot, és találja meg a mintákat és szerkezeteket. A modelleket - saját kémiával és fizikával rendelkező - "miniatűr univerzumoknak" nevezi. Úgy véli, léteznek az organizációnak minden univerzumra alkalmazható alapelvei. Ha megértjük őket, akkor egyszerű lokális szabálysorokból képesek leszünk előrejelezni, milyen szerkezetek alakulnak ki a jövőben. A kimenetek azonban gyakran kaotikusak, ami megnehezíti a rendszer viselkedésére vonatkozó prognózisainkat_ Crutchfield az időjárást hozza fel példaként: pontos előrejelzést csak néhány napra adhatunk. Nagyobb számítógépes kapacitással esetleg többre mehetünk, ám még annál is fontosabb - és a megoldás záloga lehet -, hogy megtaláljuk a valódi mintákat a káoszban.