Nándor
8 °C
19 °C

Néha úgy érzed, mintha két valóság létezne?

Több infó

Támogasd a független újságírást, támogasd az Indexet!

Nincs másik olyan, nagy elérésű online közéleti médiatermék, mint az Index, amely független, kiegyensúlyozott hírszolgáltatásra és a valóság minél sokoldalúbb bemutatására törekszik. Ha azt szeretnéd, hogy még sokáig veled legyünk, akkor támogass minket!

Milyen rendszerességgel szeretnél támogatni minket?

Mekkora összeget tudsz erre szánni?

Mekkora összeget tudsz erre szánni?

Szájról olvasni tanul a Google

2018.04.13. 11:11

Nehéz még pontosan felmérni, hogy mi mindenre lesz használható a Google egy új, fejlesztés alatt lévő algoritmusa, de mindenképp izgalmas fejlesztésnek tűnik a tömeges zajból egy bizonyos beszélő szavait kiszűrni képes mesterséges intelligencia. A kutatásról a Google Research Blogon számolt be Inbar Mosseri és Oran Lang, a Google két szoftvermérnöke.

A kiindulási pont az volt, hogy miközben az emberek egész jó hatásfokkal képesek kiszűrni, elkülöníteni és megérteni egy bizonyos beszélő által mondottakat akkor is, ha egyszerre többen beszélnek, a számítógépek egyelőre nem képesek erre. Ez pedig egyre növekvő problémát jelent napjainkban, amikor terjedőben vannak a különféle gépi asszisztensek.

A Google kutatói által kifejlesztett mélytanulásra képes algoritmus képes ennek a problémának a megoldására, mégpedig úgy, hogy a beszélő arcát figyeli, azaz vizuális jeleket társít a hangokhoz. A szoftvermérnökök azzal kezdték a fejlesztést, hogy először egyes emberek önálló beszédének felismerésére tanították meg a rendszert, majd virtuális partit hoztak össze, amiben több beszélő is volt egyszerre, háttérzajokkal kiegészülve. Ebben a környezetben folytatták az AI képzését, ami az arcokra fókuszálva képessé vált az egyedi beszélőket elkülöníteni, és csak az ő hangsávjukat kiszűrni. Ez még akkor is egész jó hatásfokkal sikerült, ha a beszélő részben eltakarta arcát a kezével vagy mikrofonnal.

A rendszer jó eséllyel beépülhet majd valamikor a Google videós csevegőappjaiba (Hangouts, Duo), de filmforgatásokon is hasznos lehet, valamint hallókészülékeket is lehet vele tuningolni. És természetesen széles lehet az illegális vagy titkosszolgálati alkalmazások tárháza is, lehallgató-készülékek új generációja jelenhet meg ilyen algoritmusokkal.