1. Kábítószer-kölcsönhatások előrejelzése mélygeneratív modellek segítségével (arXiv) grafikonokon

Szerző: Nhat Khang Ngo, Truong Son Hy, Risi Kondor

Absztrakt: A kábítószerek és célpontjaik látens ábrázolásai, amelyeket kortárs grafikon-autoencoder-alapú modellek hoztak létre, hasznosnak bizonyultak a csomópont-pár kölcsönhatások számos típusának előrejelzésében nagy hálózatokon, beleértve a gyógyszer-gyógyszer, a gyógyszer-célpont és cél-cél interakciók. A legtöbb létező megközelítés azonban modellezi a csomópont látens tereit, amelyekben a csomóponti eloszlások merevek és diszjunktak; ezek a korlátozások akadályozzák a metódusokat abban, hogy új kapcsolatokat hozzanak létre a csomópontpárok között. Ebben a cikkben bemutatjuk a variációs gráf autoencoderek (VGAE) hatékonyságát a látens csomópont-reprezentációk modellezésében multimodális hálózatokon. Megközelítésünk rugalmas látens tereket tud előállítani a multimodális gráf minden csomóponttípusához; a beágyazásokat később a különböző éltípusok alatti csomópontpárok közötti kapcsolatok előrejelzésére használjuk. A modellek teljesítményének további javítása érdekében egy új módszert javasolunk, amely összefűzi a Morgan ujjlenyomatokat, amelyek rögzítik az egyes gyógyszerek molekuláris szerkezetét, azok látens beágyazódásaival, mielőtt megelőznék azokat a dekódolási szakaszban a kapcsolat előrejelzéséhez. Javasolt modellünk két multimodális hálózaton mutat kompetitív eredményeket: (1) egy gyógyszer és fehérje csomópontokból álló multigráfon és (2) egy gyógyszer- és sejtvonal csomópontokból álló multigráfon. Forráskódunk nyilvánosan elérhető a https://github.com/HySonLab/drug-interactions címen.

2.Mély generatív modellezés korlátozott adatokon, nem átruházható, előre képzett modellek által végzett rendszeresítéssel(arXiv)

Szerző:Yong Zhong, Hongtao Liu, Xiaodong Liu, Fan Bao, Weiran Shen, Chongxuan Li

Absztrakt: A mélygeneratív modellek (DGM-ek) adatvágyóak, mert egy összetett modell korlátozott adatokon való tanulása nagy eltéréseket mutat, és könnyen túlilleszkedik. A torzítás-variancia kompromisszum klasszikus perspektívájából ihletett rendszeresített mélygeneratív modellt (Reg-DGM) javasolunk, amely egy nem transzferálható, előre betanított modellt használ fel a korlátozott adatokkal rendelkező generatív modellezés varianciájának csökkentésére. Formálisan a Reg-DGM egy bizonyos divergencia és egy energiafüggvény elvárásának súlyozott összegét optimalizálja, ahol a divergencia az adatok és a modelleloszlások között van, az energiafüggvényt pedig az előre betanított w.r.t. modell határozza meg. a modelleloszlás. Egy egyszerű, de reprezentatív Gauss-illesztési esetet elemezünk annak bemutatására, hogy a súlyozási hiperparaméter hogyan egyezik meg a torzítással és a szórással. Elméletileg a Reg-DGM globális minimumának létezését és egyediségét nem paraméteres környezetben jellemezzük, és bizonyítjuk a konvergenciáját a gradiens alapú módszerekkel betanított neurális hálózatokkal. Empirikusan, különféle előre betanított funkciókivonókkal és adatfüggő energiafunkcióval a Reg-DGM következetesen javítja a korlátozott adatokkal rendelkező erős DGM-ek generálási teljesítményét, és versenyképes eredményeket ér el a legmodernebb módszerekkel.

3. Wildfire előrejelzés műholdképekkel és mélygeneratív modellel (arXiv)

Szerző:"Thai-Nam Hoang", "Sang Truong", "Chris Schmidt"

Absztrakt:A vadtűz-előrejelzés az egyik legkritikusabb feladat, amelyet a bölcsészettudományok boldogulni szeretnének. Létfontosságú szerepet játszik az emberi élet védelmében. A futótűz előrejelzése viszont sztochasztikus és kaotikus tulajdonságai miatt nehéz. Úgy oldottuk meg a problémát, hogy egy sorozat futótűzről készült képet videóként értelmeztünk, és ennek alapján előre jeleztük, hogyan fog viselkedni a tűz a jövőben. Kihívást jelent azonban olyan videó-előrejelzési modellek létrehozása, amelyek figyelembe veszik a jövő eredendő bizonytalanságát. A publikált próbálkozások nagy része sztochasztikus kép-autoregresszív visszatérő hálózatokon alapul, ami különféle teljesítmény- és alkalmazási nehézségeket vet fel, például számítási költségeket és korlátozott hatékonyságot hatalmas adatkészleteken. Egy másik lehetőség a teljesen látens időbeli modellek használata, amelyek kombinálják a keretszintézist és az időbeli dinamikát. Tervezési és képzési problémák miatt azonban a szakirodalomban még nem javasoltak ilyen modellt a sztochasztikus video-előrejelzésre. Ez a cikk ezekkel a problémákkal foglalkozik egy új sztochasztikus időbeli modell bevezetésével, amelynek dinamikáját látens térben hajtják végre. Természetesen előrejelzi a videó dinamikáját azáltal, hogy lehetővé teszi a könnyebb, jobban értelmezhető látens modellünk számára, hogy legyőzze a GOES-16 adatkészlet korábbi, legmodernebb megközelítéseit. Az eredményeket különböző benchmarking modellekkel hasonlítják össze.