A Portsmouth Egyetem szoftvere először olyan zajokat észlelne, mint például a betörő ablakok csörömpölése, később pedig egyre több szituációhoz alkalmazkodna, tömegek hangjelzéseire reagálna, és így tovább. Gyorsabb lesz a rendszer reakcióideje, részletesebben, pontosabban rögzíti a bűneseteket.
A jelenlegi szoftverek elsősorban vizuális elemek felismerésében jeleskednek: azonosítanak bizonyos képi fogódzókat, járművek és személyek szokatlan mozgását, erőszakos emberi viselkedésformákat, stb.
„A vizuális felismerő program hamarosan nagyon jól tudja kezelni a képi mintákat, viszont a következő lépésben azt akarjuk elérni, hogy a kamera valóban meghalljon egyes hangtípusokat” – vázolta fel a jelent és a közeljövőt David Brown, a Portsmouth Egyetem kutatója.
Példával illusztrál: ha egy parkolóban valaki, vagy valakik betörik az egyik autó ablakát, a speciális zajt azonnal meghalló kamera „figyelme” rögtön az illető(k)re irányul, miközben a rendszer működtetője figyelmeztető jelzést kap.
„Minél fejlettebb a rendszer mesterséges intelligenciája, annál többet tanul, annál több hangtípust lesz képes azonosítani” – folytatja Brown.
A hangazonosításnál hangformák után kutakodik. Ez nagyjából ahhoz a jelenséghez hasonlítható, amikor becsukjuk a szemünket, majd kezünkkel „megrajzoljuk” egy tárgy kontúrját, formáját.
A Portsmouth Egyetem programja ugyanígy jár el: a kutatók „hangalakzatokat” hoznak létre, melyeket a szoftver – tanulást követően – felismer.
Brown és munkatársai arra törekednek, hogy munkájuk végeredményeként jelenleg használatban lévő CCTV kamerák szoftverébe integrálható algoritmusokat hozzanak létre. Az evolúció szelekciós elvén alapuló algoritmusok sikeres generációi egyre „intelligensebbek” lesznek, kifinomultabb munkát végeznek, mind többet tanulnak arról, hogy mit kell látniuk és – még inkább – mit kell hallaniuk.