1. Mély modell beépített keresztfigyelő igazítással az akusztikus visszhang kioltásához (arXiv)

Szerző: Evgenii Indenbom, Nicolae-Cătălin Ristea, Ando Saabas, Tanel Pärnamaa, Jegor Gužvin

Absztrakt: A legújabb kutatási eredményeknek köszönhetően a mély tanulási modellek vonzó választássá váltak az akusztikus visszhang kioltására (AEC) a valós idejű telekonferencia alkalmazásokban. Mivel az akusztikus visszhang a rossz hangminőség egyik fő forrása, sokféle mély modellt javasoltak. A jó visszhang-kioltás minőségének fontos, de gyakran figyelmen kívül hagyott követelménye a mikrofon és a távoli jelek szinkronizálása. Jellemzően klasszikus, keresztkorreláción alapuló algoritmusokkal megvalósított igazítási modul egy külön funkcionális blokk, ismert tervezési korlátokkal. Munkánkban egy mély tanulási architektúrát javasolunk beépített önfigyelem alapú igazítással, amely képes kezelni a nem igazított bemeneteket, javítva a visszhang kioltási teljesítményét, miközben leegyszerűsíti a kommunikációs folyamatot. Ezen túlmenően megmutatjuk, hogy megközelítésünk jelentős javulást ér el az AEC Challenge adatkészletből származó valós felvételeken a nehéz késleltetés becslési esetekben.

2.LCSM: Könnyű, komplex spektrális leképezési keretrendszer a sztereofonikus akusztikus visszhang kioltásához (arXiv)

Szerző: Chenggang Zhang, Jinjiang Liu, Xueliang Zhang

Absztrakt: A hagyományos adaptív algoritmusok szembesülnek a nem egyediség problémájával, amikor a sztereofonikus akusztikus visszhang kioltással (SAEC) foglalkoznak. Ebben a cikkben először egy hatékony multi-input and multi-output (MIMO) sémát javasolunk, amely mély tanuláson alapul, hogy kiszűrje a visszhangokat az összes mikrofonjelből egyszerre. Ezután egy könnyű komplex spektrális leképezési keretrendszert (LCSM) alkalmazunk a végpontok közötti SAEC-hez a hangszóró jeleinek dekorrelációs előfeldolgozása nélkül. Helyi konvolúciót és csatorna szerinti térbeli modellezést alkalmaznak a közeli jel információinak megőrzésére. Végül egy tartományok közötti veszteségfüggvényt a jobb általánosítási képesség érdekében terveztek. A kísérleteket különféle nem gyakorlott körülmények között értékelték, és az eredmények azt mutatják, hogy az LCSM jelentősen felülmúlja a korábbi módszereket. Ráadásul a javasolt oksági keretrendszer mindössze 0,55 millió paramétert tartalmaz, sokkal kevesebbet, mint a hasonló mély tanuláson alapuló módszerek, ami fontos az erőforrás-korlátozott eszközök számára.