A Chung-Kwei hatékonyabb filter
Isidore Rigoutsos és Tien Huynh, az IBM bioinformatikusai valamivel több mint egy évvel ezelőtt kezdték el a filter kidolgozását. A Chung-Kwei egy másik algoritmus, a Teiresias elnevezésű program alapján készült, amelyet génkutatások során alkalmaznak mintafelismerőként, mert képes a tanulásra. A Teiresias automatikusan azonosítja a protein tulajdonságait, például rendeltetését és szerkezetét, közvetlenül a DNS-láncból.
A Chung-Kwei is használja a Teiresiast, azonban proteinazonosítás helyett ebben a rendszerben azokat a karakterszekvenciákat tanulja meg, majd ismeri fel, amelyek a spamekben rendszerint előfordulnak, azonban a "rendes" levelekben nem.
Algoritmus-edzés
Az algoritmus okítható, például meg lehet neki tanítani azt is, hogy ne verje át az a spammertrükk, amikor az 'S'-t '$'-re cserélik és ezzel a legtöbb, hagyományos filtert át is vágják.
A Chung-Kwei adatbázist épít, amelyben az összes eddig ismert spammintázatot elraktározza, és az újonnan felismerteket is folyamatosan hozzáveszi. "Rengeteg emaillel kísérlezetünk. Hatvanhatezer spamet és huszonkétezer "fehér" (nem spam) emailt vetettünk be az algoritmus tanítására" - mondta Isidore Rigoutsos.
Egyelőre tesztüzemmódban működik a Chung-Kwei, még nem lehet tudni, hogy mikor debütál a spamfilterekben. Mindenesetre az eddigi szűrőknél hatékonyabbnak bizonyult, mivel 214 emailt vizsgált meg és sorolt be másodpercenként, és 96,56 százalékos arányban helyesen ítélkezett a levelek felett.