Pandora, Gabriella
7 °C
14 °C

A magyar spamszűrők a legjobbak

2008.08.16. 19:29
Amikor Monty Pythonék 1970-ben megírták a klasszikus Spam-jelenetet, aligha gondolták, hogy a címszereplő húskonzerv, amit olyan lelkesen ajánlgat Terry Jones a vendégeknek, pár évtized múlva egy több százmillió dolláros probléma szinonimája lesz. A levélszemét ma az internet egyik legsúlyosabb gondja, vírusokat terjeszt, erőforrásokat foglal le, és felhasználók milliónak az életét teszi kényelmetlenné. Arról nem is beszélve, hogy az internet teljes levélforgalmának 80-90 százalékát teszi ki.

Nem véletlen, hogy ma már egy levelezőszolgáltatásnál nem feltétlenül az a lényeg, hogy mekkora küldeményeket kezel, meg mennyi tárhelyet ad, hanem hogy a beépített szűrője milyen hatékonyan szabadítja meg a felhasználót a spamtől.

Spamszűrőt írni alighanem a leghálátlanabb programozói feladat a világon, hiszen ha ezer esetből csak egyszer hibázik, a felhasználó már anyázik – ha túl elnéző a szűrő, és beengedi a kéretlen reklámlevelet, azért, ha túl szigorú, és fennakad a rostán olyan levél is, aminek nem kellene, akkor meg azért.

Hogyan működik a spamszűrő?

A spamszűrő program a levelezőszerveren fut, és eldönti, hogy egy levél spam vagy igazi email. Egy ilyen szoftver a feladó személyét (illetve az ip-címét) és a levél tartalmát vizsgálja.

A szűrőket fejlesztő cégek folyamatosan frissítik az ismert spammerek címeit tartalmazó adatbázisukat (ez akár percenkénti automatikus frissítést is jelenthet), és a szűrőn fennakad minden, ami feketelistás gépekről származik. Ez persze nem túl hatékony, hiszen a védelem így mindig a spammerek mögött kullog, akik újabb és újabb zombigépekről küldik kéretlen reklámleveleiket.

A másik megoldás a levél szövegének elemzése. Az algoritmus bizonyos szavak előfordulását figyeli, és ha a levél méretéhez képest túl sok gyanús linket, Viagrát, és más termékneveket talál benne, spamnek bélyegzi azt. A legfejlettebb szűrők folyamatosan tanulnak és a felhasználó által spamnek ítélt levelek tartalmát elemezve finomítják a saját, személyre szabott spamkereső algoritmusukat. A spam elleni harcra ma már egész iparág épült, a levelezőrendszerek üzemeltetőinek, nagy céges levelezőszerverek rendszergazdáinak ugyanúgy kell a szűrőjükre figyelni, mint egy vírusirtóra.

Kétszer három versenyző

Tesztünkben három nagy nemzetközi (Gmail, Yahoo Mail és a Hotmail a Microsofttól) és három magyar (Freemail , Citromail és Indamail) szolgáltatónál nyitottunk ingyenes postafiókot, majd jól megkínoztuk mindet igazi és álspamekkel.

Gmail: minden szemét átjutott a szűrőn

A postafiók regisztrálása mindegyik helyen nagyjából ugyanúgy zajlott, ez ugye elvileg pár perces művelet. Azt azért meg kell jegyeznünk, hogy a Hotmail (illetve most már Windows Live Hotmail) captcha-feladványát negyedik próbálkozásra sikerült csak megfejteni, aztán a rendszer kiröhögte az Operát, így kénytelenek voltunk böngészőt váltani hozzá. Az is feltűnt, hogy csak a magyar szolgáltatók ragaszkodnak ahhoz, hogy a regisztráció közben kérdőíveket töltsünk ki a lakhelyünkről meg az érdeklődési körünkről, és a Freemail képességeit meghaladta a 14 betűs jelszavunk, és a gipszjakab.spamszuroteszt felhasználónév is, így kénytelenek voltunk mindkettőt megcsonkítani.

Spamhadjárat

A tesztet azzal kezdtük, hogy szimuláltuk a kezdő felhasználót és óvatlanul elhagytuk a frissen létrehozott címeinket itt-ott az interneten, ahol a spammerek címgyűjtő robotjai könnyen rátalálhatnak. Regisztráltuk magunkat egy ingyenes termékmintákat ígérő oldalon, valamint néhány, jó sok spammel megtűzdelt fórumon és blogon. Aztán jött a célzott támadás, összesen hat levelet küldtünk saját magunknak.

Az első egy valódi spam volt, jó ügyetlenül megfogalmazva, valami pénisznövelő csodaszert hirdetett, a céges postafiók szűrőjén fennakadva találtuk és továbbítottuk. Ugyaninnen származott egy sokkal profibb, szintén igazi spam, ami "BBC news" tárggyal, és egy New Yorkban lezuhant ufó sztorijával próbált rávenni arra, hogy kattintsunk egy linkre. A harmadik spamet saját magunk fabrikáltuk, annyi állt benne, hogy "buy v1arga", és a www.blabla.bla címre invitálta a kedves vásárlót.

A Yahoo szinte mindent spamnek néz

A "spamnek néz ki, de mégsem az" kategóriában indítottunk egy tárgy nélküli, egy szem linkből álló levelet, egy olyat, amiben volt rendes szöveg, linkek, minden ami kell, de ismeretlen okok miatt a céges spamszűrőnk megfogta; és végül egy teljesen ártatlan, spamre távolról sem emlékeztető, egy indexes cikkből véletlenszerűen kiollózott bekezdést tartalmazó levelet.

A spamszűrők elé állított kihívás annyi volt, hogy az első három levelet kifogják, a második hármat átengedjék, és ha még jön valami a neten közszemlére tett címek miatt, azokat se engedjék be a postafiókunkba.

Nagy pénz, nagy bukta

Az első meglepetés akkor ért, amikor a csali címek bedobása után pár nappal benéztünk a postafiókokba, és a sajátjainkon kívül alig-alig találtunk levélszemetet. Úgy tűnik, a profi spammerek lassabban dolgoznak, mint gondoltuk. A saját tesztleveleinkre viszont mindegyik szolgáltató másként reagált (és itt jegyezzük meg, hogy mindenhol az alapbeállításokat használtuk, nem állítgattunk semmit a szűrőkön).

A Gmail például csont nélkül beengedett mindent - még ha a Google-féle spamszűrő alapvetően tanítgatós alapon is működik, és hosszú távon mutatja meg, mit tud, egy kezdő felhasználó szemszögéből nézve a világ legjobb ingyenes levelezőjének tartott rendszer itt csúnyán leszerepelt. Kíváncsiságból továbbküldtük a leveleket egy már régóta használt Gmail-postafiókra is, ahol az évek tapasztalatával felvértezett spamszűrő már sokkal jobb eredménnyel vette fel a harcot a levélszemét ellen, csupán egyet hibázott, a viagrás levelet engedte be.

A Freemail fiókjában találtuk a legtöbb spamet

A Hotmail éppen az ellenkező pólus: egy szem levelet engedett át a szűrője (igaz, annál az is volt a helyes döntés, hogy beengedje), viszont spamnek bélyegezte két olyan levelünket is, amik nem voltak azok. Az ilyen balesetek még idegesítőbbek, mint amikor kézzel kell törölgetni a szűrőt kicselezett kéretlen leveleket; a Microsoft sem lehet különösebben büszke az eredményére.

A Yahoo még rosszabbul vizsgázott: az összes saját levelünket kíméletlenül elmeszelte, az Inbox mappában a saját üdvözlő levele, és egy véletlenszerűen ránk akadt spammer ajánlata várt, aki ingyen ajándékokkal kecsegtetett, de nem hittünk neki. Az eddigi legrosszabb eredmény, hibák mindkét irányban.

Magyar virtus

A három nagy cég lehangoló eredményei után kicsit félve fordultunk a magyar tesztalanyok felé, elvégre a közhiedelem szerint a magyar internet leginkább abból áll, hogy pár éves késéssel másoljuk az Amerikában sikeres szolgáltatásokat. Ehhez képest óriásit csalódtunk, kellemesen.

A Freemailnél még nem látszik, hogy a magyar spamszűrők leiskolázzák a világot: a Gmail mintáját követve szinte mindent átengedett, egyetlen alkalommal (a legegyértelműbbnél) dobott csak vissza levelet. Aztán az Indamailnél fordult a kocka: a három kiszűrnivalóból kettőt megfogott, a három átengednivalóból pedig kettőt átengedett, vagyis még mindig nem tökéletes, de az eddigieknél messze jobb eredményt produkált. Már-már kezdtük magunkat kényelmetlenül érezni, hogy ezt hogyan tálaljuk úgy, hogy ne érhessen az önfényezés vádja (az Indamail az Index ingyenes levelezőszolgáltatása), de aztán megoldódott a dilemma. Egy magyar nyelvű reklámlevél esett be a fiókba, aminek az apróbetűs része azt is közölte velünk, hogy a fiók nyitásánál a felhasználási feltételek elfogadásával beleegyeztünk abba, hogy ilyen reklámokat kapjunk. Technikailag tehát nem spam, de a hatása ugyanaz.

A Citromail messze nem tökéletes, de még így is az egyik legjobb

Végül a Citromail szinte egy az egyben lemásolta az Indamail produkcióját: ugyanazokat szűrte ki és engedte be, csak egy budapesti lakópark reklámja helyett egy véletlenszerű, angol nyelvű spamnek sikerült bejutnia a fiókunkba. A hasonló eredmény persze nem véletlen: ugyanannak a fejlesztőnek a rendszerére épít a két szolgáltató.

Félidő, előny a hazaiaknál

Azon nem lepődtünk meg, hogy nem sikerült az ingyenes szolgáltatóknál tökéletes spamszűrőre bukkannunk, azon viszont igen, hogy a magyarok rövid távon mennyivel jobban szerepeltek a Google, a Microsoft és a Yahoo – nyilván óriási összegekből fejlesztett – megoldásainál. Hosszú távon persze valószínűleg megváltozna az eredmény a tanítható és öntanuló szűrők miatt. Pár hónap múlva majd visszanézünk gipszjakab.spamszuroteszt postafiókjaiba, és meglátjuk, mennyire.