CodeFormer / Robusztus vak arc helyreállítása Codebook Lookup Transformerrel

Lickety Split felülvizsgálata

Probléma: A jelenlegi GAN korábbi alapú BFR-modellek alacsony hűségű eredményeket biztosítanak erősen leromlott képeken.

Megoldás:
• Ismerje meg az előzményeket egy kis, diszkrét kódkönyvterületen
• Alkalmazza a Transformert a kódolt arcvonások kódkönyvbe való leképezéséhez

Ezután a munka fő gondolata az, hogy jobb robusztusságot biztosítson a súlyosan leromlott arcoknak, mint a jelenlegi GAN-alapú modellek (mint például GFPGAN vagy <) em>GPEN). A szerzők ezt úgy teszik meg, hogy a folytonos prior tér bizonytalanságát diszkrétté teszik. Ehhez először előtanítjuk a VQ-VAE-t, hogy megtanulja az atomi arcpriorokat tartalmazó diszkrét Kódkönyvet, majd ezt követően lefagyasztva tartjuk a VQ-VAE kódkönyvét és dekóderét a következő lépéshez. Ezt követően a nagyonCodeFormer modellt betanítjuk, és bizonyos értelemben a BFR-feladatot kód-előrejelzési feladatra cseréljük. Tehát a CodeFormer egy kódoló-dekódoló modell, amely rendelkezik LQ kódolóval, fagyasztott HQ dekóderrel és a „Transformer” leképezési kódolt jellemzőkkel a lefagyasztott kódkönyv arckódjaihoz. A Transformer használatának egyetlen célja van: a hosszú távú arcvonások visszaállítása a Kódkönyvből. És ha a VQ-VAE-t kép- és kódszintű veszteségekkel is előtanítjuk, a CodeFormer csak kódszintű veszteségekkel van betanítva. Ezt követően betanítunk egy úgynevezett Controllable Feature Transformation (CFT) modult, amely lehetővé teszi az archűség és a részletek közötti csúszást, akárcsak a GCFSR.

IMHO: az ötlet nagyszerű; az a tény, hogy hozzáadják a CFT-t, szintén nagyszerű; Szeretnék több elemzést látni a Codebook látens térről.

Szia mindenkinek! A „Lickety Split Review” célja, hogy néhány perc alatt képet adjon arról, miről szól egy tanulmány: kiemeljük a szerzők problémáit, megmutatjuk, hogyan oldják meg őket, beszélünk az újdonságokról, és szerény véleményünket is elmondjuk róla. .

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Golang Code Java Science Open Source Software DevOps Programming Languages Data Structures