
További Szoftver cikkek
Körmendi György autót akart vásárolni. Volt egy Skoda Octaviája, ahelyett akart valami mást. Mit tesz ilyenkor egy átlagember? Elmegy a boltba, és vesz egy autót. Nem így Körmendi György!
Alapos ember, nem dönt csak úgy hasraütésre. Fogta a Totalcar Népítéletének bejegyzéseit, mind a 37 ezret, és rájuk eresztett egy szövegbányászszoftvert. Az autót vásárlók jelentős részéhez hasonlóan leginkább a szerviztapasztalatokra volt kíváncsi, amit a Népítéleten saját járműveikről véleményt nyilvánító autótulajdonosok 1-10-es skálán fejeznek ki, illetve érdekelte, mik az autók típushibái.
"Nézegettem az ítéleteket, de nincs egységes nézet, végig kell olvasni az összeset, és keresni sem lehet" – mondja Körmendi, aki végül egy Mazda 6 mellett döntött. De hogyan érlelődött meg benne az elhatározás?
A csillagos ötös pozitív
Körmendinek viszonylag könnyű dolga volt, ő az SPSS Hungary ügyvezető igazgatója, az SPSS meg gyakorlatilag az ipari norma a statisztikai analízisre használt szoftverek között, és a cég direkt szövegbányászatra kifejlesztett alkalmazást is árul. Ami persze nem azt jelenti, hogy a gép magától kimondja az igazságot. A népítéletek elemzése durván leegyszerűsítve úgy zajlik, hogy az ember szoftveres segítséggel kivonatolja a szövegeket, a leggyakrabban előforduló jelzőket és egyéb terminusokat összegyűjti, ellátja őket pozitív, illetve negatív címkékkel (a "csillagos ötös" például pozitív, a "b@szik" negatív), aztán megnézi, melyik autóhoz, szervizhez melyik társul gyakrabban. Ezt elméletileg kézi, strigulázós módszerrel is meg lehetne csinálni, és az eredmény valószínűleg pontosabb is lenne, de ki az, aki nekiül 37 ezer népítéletnek?
A szerviztapasztalatok értékeléséhez is kell kézimunka: mivel a műhelyek nevét a felhasználók szabadon gépelhetik be – az Aut-Fort Kft. Szentendrei úti telepének neve például legalább tucatnyi változatban fordul elő, az épület alakja után a legtöbben csak piramisnak hívják – a névváltozatokat emberi erővel egységesíteni kell, mielőtt rájuk lehet engedni a szoftvert.
Lőjük le a poént: Körmendiék elemzése alapján a Mazdák tulajdonosai a legelégedettebbek a szervizekkel, aztán jönnek a hondások és a toyotások. Az Alfa szervizei megcsípték a negyedik helyet, ami valószínűleg annak köszönhető, hogy a Népítéletben véleményt nyilvánító autótulajdonosok az Alfa Szamosit tartják a legjobb szerviznek. Második a Toyota Mayer, harmadik a Bosch.
Dögös aszfaltszaggató
Mit is ír egy 1991-es évjáratú Lancia Dedra 2.0ie ("Dögös aszfaltszaggató") tulajdonosa a Népítéleten a szervizről, ahová a kocsit hordja? "Komolytalan társaság. Csak lehúztak, szerintem nem csináltak semmit! Sajnos ezekhez az autókhoz nem nagyon értenek! (nem csak ők)."
Ebből a szövegből az ember első látásra tudja, hogy negatív ítéletet fogalmaz meg, de mihez kezd vele egy gép? Alaphelyzetben semmit. Aztán ha megtanítják neki, hogy a komolytalan, a lehúztak és az autókhoz nem nagyon értenek mind negatív, illetve ellátják egy jó szótövező algoritmussal, hogy ne csak a komolytalant, hanem a komolytalanságot és a komolytalanabbakat is fel tudja dolgozni, már képes értékelni a szöveget. Úgy-ahogy. Mert akkor még mindig megvan annak az esélye, hogy a hozzászóló csak viccelt, esetleg a konkurencia fizetett ügynöke.
"A statisztikai alapú elemzésnél nem az a cél, hogy minden egyes véleményt eltaláljunk, hanem hogy minél nagyobb arányban találjuk el őket" – mondja Körmendi. "A Népítélet nem feltétlenül ilyen, de vannak hatalmas adatbázisok, mint a Medline, amelyek elemzése meghaladja az emberi teljesítőképesség határait."
A Népítélet-elemzés persze csak egy példa arra, mi mindenre használhatók a szövegbányászati technikák. Körmendi szerint például arra, hogy statisztikai módszerekkel kiszűrjék a netes fórumok bértollnokait, vagyis azokat az egyoldalú véleményformálókat, akik egy-egy cég megbízásából, annak érdekeit képviselve írogatnak pozitív hozzászólásokat, kifejezetten véleménybefolyásolási céllal. Az ilyen ügynököket ránézésre nehéz leleplezni (miért ne írhatna valaki pozitív véleményt egy cégről), de a hozzászólások statisztikai elemzésével kiszűrhetők.
Egy másik lehetséges alkalmazás a trendelemzés: a telekommunikációs cégek valószínűleg kevesebb pénzt öltek volna a wap vagy az mms bevezetésébe, ha egy a fórumokban turkáló szövegelemző program időben kimutatja nekik, hogy ezek a technológiák a kutyát sem érdeklik.
Viszonylag új és még korántsem teljesen megbízható terület a hanganyagok szövegelemzése: egy mobilszolgáltató elméletileg megvizsgálhatja az összes telefonon intézett előfizetés-lemondást, kiderítheti az okokat, és a cég ennek megfelelően korrigálhat, csökkentheti az árait vagy személyre szabott akciókkal bombázhatja meg a hűtlen ügyfeleket.
Tízmillióért inkább vegyen autót
Viszont ha autót akar venni, és a döntés-előkészítéshez az SPSS-t használná, gondolja újra: a szoftver 429 ezer forintba kerül, az egyes modulok hozzá még 190-240 ezerbe, úgyhogy egy jól összeválogatott csomagért már adnak egy Suzukit. A kifejezetten adatbányászatra használt Clementine ára öt-tízmillió forint, abból meg szinte bármilyen autót vehet, mondjuk egy ötéves, megkímélt Porsche Carrera 911 (996)-t. Alternatív megoldásnak ott a fő versenytárs, a SAS, illetve a nyílt forráskódú, ingyenes szoftverek, a SAS-t kiváltani hivatott DAP és az SPSS koppintása, a PSPP.
Aztán van, aki nem is hisz az egészben: a statisztikai alapokon végzett, kvantitatív szövegelemzés ellenzői, a diskurzusanalízis egyes hívei állítják, hogy a számokon alapuló elemzés "óhatatlanul dekontextualizálja a per definitionem egyszeri, alkalmi diskurzív jelentést". Akkor vegyék csak meg azt az autót, amelyik tetszik. Vagy amelyik piros.

Az oldalról ajánljuk
- Külföld
Razziákat tartanak Brazíliában az Amazonas-vidéken az illegális erdőirtás csökkentésére
Veszélyeztetett fafajtát is találtak.
február 18., 07:22
- Boksz
Azon múlhat az olimpiai létéért küzdő boksz sorsa, ki lesz a NOB új elnöke
Március 18–21. között, a NOB 144. ülésén minden eldől.
február 18., 07:53
- Vélemény
Kaphat-e Donald Trump Nobel-békedíjat?
Trump sem nevezhető amerikai konzervatív, vallásos politikusnak, inkább a politikai mainstreamen kívüli „parvenü fekete hattyúnak”.
február 18., 08:03
- Belföld
Tombol az influenzajárvány, a farsang elhalasztását kérik a Tolna vármegyei orvosok
Két hete a norovírus és a bárányhimlő-fertőzés is megjelent a gyermekpopulációban.
február 18., 08:03
- Belföld
Újabb jogszabály-módosítással gyorsítaná a kormány a betegellátást a szakrendelőkben
Megszűnhet a lehetőség, hogy csak a területükhöz tartozó betegekre korlátozzák az ellátást.
február 18., 07:35
- Belföld
Orbán Viktor közvetlen munkatársa üzent a Magyar Péter mellé állóknak
Nagy János egy Tisza István-portré előtt elmélkedett.
február 18., 08:33
- FOMO
Dombóvári István Schobert Norbi sztrókján viccelődött, nem váratott magára sokáig a válasz
Új dumaháború kezdődik a szemünk láttára.
február 18., 07:03
- Gazdaság
Jobbegyenessel ütnék ki az amerikai–magyar kapcsolatok méregfogát
Már a republikánusok asztalán van a kettős adóztatás elkerülésének kérdése.
február 18., 09:04
- Belföld
Nem tud több beteget fogadni a győri kórház gyermekintenzív osztálya
A zalaszentgróti kórházban is orvoshiánnyal küzdenek.
február 18., 07:01
- Belföld
Bicske polgármestere: Veszélyben van a város közbiztonsága
A lakosságot arra szólította fel, hogy ne kezdjenek önbíráskodásba.
február 18., 07:17
- Kultúr
Hatalmas felháborodást keltett a házassága, még az anyja is kitagadta
Ásvai Jókay Móric élete és halála.
február 18., 05:44
- Külföld
Meghalt Francesco Rivella, a Nutella feltalálója
A 97 éves férfi a Kinder és a Ferrero Rocher feltalálásában is részt vett.
február 18., 09:06
- Kultúr
A minisztérium nem akar újabb balhét, de küzdelem azért lehet
Az Index információi szerint két jelölt között dőlhet el a verseny a Zeneakadémián.
február 18., 09:03
- FOMO
Patakokban folyik a tiktokosok könnye a kishaltól, amely halála előtt látni akarta a napot
Hiába fikciók a Disney-mesékbe illő magyarázatok, ez kell a népnek.
február 18., 05:48
- Tech-Tudomány
Világhódításra indul a Meta, a Föld leghosszabb kábelét készülnek éppen megépíteni
Az egész bolygót körbeéri majd az új kábel.
február 18., 06:37
- Kultúr
Még el sem kezdődött, de máris a legbotrányosabb Oscar-gáláról beszél a világ
Több film és színész is érintett.
február 18., 05:49
- Belföld
Mínusz 15 fokig csökkenhet a hőmérséklet kedden
Dermesztő hideg lesz az országban.
február 18., 06:03
- Cellanapló
Már szerdán megjelenhet egy új iPhone, mutatjuk, mit lehet tudni róla
De más újdonságokkal is sokkolhat minket az Apple.
február 18., 06:01
- Külföld
Trump és Putyin is igazi nehézfiúkat vet be a mai sorsdöntő tárgyalásra Ukrajnáról
Óriási a várakozás, hogy mire jut a kedden először tárgyaló orosz és amerikai küldöttség.
február 18., 05:58
- Külföld
A rijádi tárgyalásokon máris kiderült, hogy mi Moszkva legkeményebb feltétele a békéhez
február 18., 06:02
- Futball
Élen a Barcelona, de bírói csalást kiált a madridi sajtó
Két be nem fújt büntető, egy érvénytelenített Rayo-gól.
február 18., 06:45
- Külföld
Szakadékba zuhant egy busz Bolíviában, sokan meghaltak
Négy kiskorút az intenzív osztályon ápolnak, két felnőttet pedig azonnal meg kellett műteni.
február 18., 07:46
- Belföld
Tavaly május óta eltűntként kerestek egy budapesti nőt, most kiderült, a barátja ölhette meg
Egyre több jel utalt bűncselekményre, a nyomozók pedig két férfit őrizetbe is vettek.
február 18., 08:04
- Futball
Az Újpest emberelőnyben sem tudta legyűrni a Nyíregyházát
A fővárosi csapat immár öt kör óta nyeretlen az élvonalban.
tegnap, 21:43
- Belföld
Minden előzmény nélkül fejbe lőtte ismerősét a miskolci férfi, vádat emeltek ellene
A fegyver eredetileg kóbor kutyák miatt került elő.
február 18., 06:15