A Nash-egyensúly használata a gépi tanulási forgatókönyvekben, 2. rész

Elosztott nehézgolyós Nash-egyensúlyi algoritmus geometriai konvergenciája időben változó digráfokon korlátlan műveletekkel (arXiv)

Szerző: Duong Thuy Anh Nguyen, Duong Tung Nguyen, Angelia Nedich

Absztrakt: Javasolunk egy új elosztott algoritmust, amely egyesíti a nehéz labda lendületét és a konszenzuson alapuló gradiens módszert, hogy megtalálja a Nash-egyensúlyt (NE) a nem kooperatív konvex játékok egy osztályában, korlátlan akciókészletekkel. Ebben a megközelítésben a játék minden ügynöke hozzáfér a saját sima helyi költségfüggvényéhez, és kommunikációs hálózaton keresztül információt cserélhet szomszédaival. A javasolt módszert úgy tervezték, hogy időben változó irányított gráfok általános sorozatán dolgozzon, és lehetővé teszi nem azonos lépésméretek és impulzusparaméterek használatát. Munkánk az első, amely a nehézlabda lendületet beépíti a nem kooperatív játékok kontextusába, és szigorú bizonyítékot adunk annak geometriai konvergenciájára az ÉK-hez, az ügynökök költségfüggvényeinek erős konvexitása és Lipschitz-folytonossága közös feltételezései mellett. Ezen túlmenően a költségfüggvények, a keverési mátrixok és a gráf összekapcsolhatósági struktúrák jellemzői alapján explicit korlátokat állítunk fel a lépésméret-értékekre és az impulzusparaméterekre. A javasolt módszerünk hatékonyságának bemutatása érdekében numerikus szimulációkat végzünk egy Nash-Cournot játékon, hogy bemutassuk annak felgyorsult konvergenciáját a meglévő módszerekhez képest.

2. Bizonyítható részecske-alapú primál-kettős algoritmus kevert Nash-egyensúlyhoz (arXiv)

Szerző: Shihong Ding, Hanze Dong, Cong Fang, Zhouchen Lin, Tong Zhang

Absztrakt: Az általános nemkonvex nemkonkáv minimax problémát folytonos változók felett vizsgáljuk. Ennek a problémának a fő kihívása, hogy nem létezik nyeregpont. Ennek a nehézségnek a megoldása érdekében megvizsgáljuk a kevert Nash-egyensúly megtalálásának kapcsolódó problémáját, amely egy randomizált stratégia, amelyet a folytonos változók közötti valószínűségi eloszlások képviselnek. Javasolunk egy részecske-alapú primál-kettős algoritmust (PPDA) egy gyengén entrópia-szabályozott min-max optimalizálási eljáráshoz a valószínűségi eloszlások felett, amely a részecskék sztochasztikus mozgását alkalmazza a kevert Nash-egyensúly véletlenszerű stratégiáinak frissítésére. A javasolt algoritmus szigorú konvergenciaanalízise megtalálható. Összehasonlítva azokkal a korábbi munkákkal, amelyek a részecskesúlyt mozgások nélkül próbálják frissíteni, a PPDA az első megvalósítható részecske alapú algoritmus, amely nem aszimptotikus kvantitatív konvergencia eredményeket, futási időt és minta összetettségi garanciákat tartalmaz. Keretrendszerünk új betekintést nyújt a részecske alapú algoritmusok tervezésébe a folyamatos min-max optimalizáláshoz az általános nemkonvex nemkonkáv beállításban.

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Java Science Golang Code Data Structures Open Source Software DevOps Programming Languages