Az elfogultság/variance kompromisszum

Egy modell általánosítási hibája három nagyon különböző hiba összegeként fejezhető ki: torzítás, variancia és irreducible error. Ez a blog bemutatja a torzítás/szórás kompromisszumot és a túlillesztést/alulillesztést.

Elfogultság és eltérés

Az általánosítási hiba torzítása téves feltevésekből adódik. A nagy torzítású modell valószínűleg alul illeszti a képzési adatokat. A szórás abból adódik, hogy a modell túlzottan érzékeny a képzési adatok kis változásaira. A sok szabadságfokkal rendelkező modell valószínűleg nagy szórással rendelkezik, és így túlilleszti a képzési adatokat. A visszafordíthatatlan hiba magának az adatnak a zajosságából adódik. A hiba ezen részének csökkentésének egyetlen módja az adatok törlése.

A modell összetettségének növelése általában növeli a varianciáját és csökkenti a torzítását. Ezzel szemben a modell összetettségének csökkentése növeli a torzítását és csökkenti a varianciáját. Ezért ezt kompromisszumnak nevezik.

Túl- és alulfitting

Általában nem tudjuk, hogy melyik függvény generálta az adatokat, ezért nehéz probléma, hogyan lehet megállapítani, hogy a modell túl- vagy alulillesztette-e az adatokat.

Ha egy modell jól teljesít a betanítási adatokon, de rosszul általánosít a keresztellenőrzési metrikák szerint, akkor a modell túlillesztése. Ha mindkettőn rosszul teljesít, akkor nem megfelelő. Egy másik módja annak, hogy megnézzük a tanulási görbéket: ezek a modell teljesítményét ábrázolják a betanítási halmazon és az érvényesítési halmazon a képzési halmaz méretének vagy a képzési iterációnak a függvényében. A diagramok generálásához tanítsa többször a modellt a tanítókészlet különböző méretű részhalmazain.

Ha a modell nem felel meg a képzési adatoknak, nem segít további képzési példák hozzáadása. Bonyolultabb modellt kell használnunk, vagy jobb funkciókkal kell előállnunk. A túlillesztési modell javítása érdekében több betanítási adatot táplálhatunk be, amíg az érvényesítési hiba el nem éri a betanítási hibát.

Data Science Machine Learning

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Golang Code Java Science Open Source Software DevOps Programming Languages Data Structures