A gépi tanulás alapjai: A lineáris regresszió megértése

A legfontosabb kiindulópont minden adatelemző számára

Az előnyök

A gépi tanulás megkímélheti Önt attól a fáradságtól, hogy összetett szabályrendszert állítson össze egy adott problémára, amely esetleg nem ideális, és sokkal nehezebb fenntartani.
Megfelelő útmutatásokkal a gépi tanulás jobb és gyorsabb megoldási módszereket találhat. a problémáidat.

Hol kezdjem?

Először is kezdjük az alapkoncepcióval. Később néhány grafikont és kódolást végzünk, hogy könnyebben megértsük az ügyet és annak következményeit. Később a tényleges megvalósítás még egyszerűbb lesz, mint a cikk koncepciója (ez a rész a végén lesz).

Gépi tanulási típusok

Számos gépi tanulási algoritmus létezik, és sok típusra oszthatja őket. Van felügyelt tanulás, felügyelet nélküli tanulás és megerősítéses tanulás.

A gépi tanulás kenyere a felügyelt tanulás. A lineáris regresszió ott is határozottan magas.

Felügyelt tanulás

A felügyelt tanulás során osztályozott (ismert) adatokat használ, hogy megértse a mögötte álló algoritmust, az egyes jellemzők (paraméterek) közötti kapcsolatot és a végeredményt. Például egy ház mérete és ára közötti kapcsolat.

A felügyelt tanulást is gyakran használják osztályozásra. Ha ez felkeltette érdeklődését, kérjük, írjon megjegyzést egy további cikkhez.

A tökéletes példa: Lakáspiac

Foglaljuk össze egy pillanatra. Említettük, hogy a felügyelt tanuláshoz milyen adatokra van szükség a tanuláshoz, és hogy a lineáris regresszió hogyan határozza meg, hogy az egyes paraméterek (jellemzők) mennyire befolyásolják az eredményeket.

A lakáspiac hatalmas mennyiségű adatot tartalmaz az eladások terén, minden felügyelt adatot megad, amire szüksége van, és nyilvánvalóan viszonylag állandó súlya van minden funkciónak. A méretét, a szobák számát stb. mind figyelembe kell venni a ház áránál.

A folyamat 2D-ben

A folyamatot 2D-ben kezdem, mivel sokkal könnyebben érthető.
Tegyük fel, hogy a négyzetméter az egyetlen jellemző (paraméter), amely meghatározza egy ház árát. Ezt grafikonon ábrázolhatjuk, és ezt a futballnak tűnő eredményt kapjuk:

Most az az ötlet, hogy készíthetünk egy lineáris függvényt, amely pontosan átmegy a golyón, és valahogy így fog kinézni:

y = x1*SqFt + x0

X0 mennyibe kerül egy ház kiindulási pontként anélkül, hogy bármi mást tudnánk.

Most kezdjük azzal, hogy teljesen véletlenszerű értékeket adunk x1 és x0, és ebből az egyenletből kiszámítjuk a várható Y értéket.

Most azt kell tennünk, hogy kitaláljuk, milyen rosszat tettünk, és ennek kijavításához egy gradiens süllyedésnek nevezett algoritmust használunk.

Gradiens süllyedés

Anélkül, hogy túl sok matematikába mennénk bele, az ötlet az, hogy vegyük a költségfüggvény deriváltját (a mi hibánk), és tegyünk egy lépést a legközelebbi lokális minimum felé.

Ez a fő matematikai folyamat az ML-ben, amelynek vizsgálatát ajánlom, de az első két sor egyszerű megértése is elegendő az ML használatának megkezdéséhez.

Egyszerűbben fogalmazva, ha a költségfüggvény egyfajta parabola, akkor a grafikonon lefelé sétálunk a legközelebbi völgybe.

Minél meredekebb a költségfüggvény, annál nagyobbak a lépések.

Ez a mi körünkben van, és a veszteséget és a tanulást jelenti. Ez a grafikon a folyamatot mutatja az idő múlásával:

Bostoni lakáspiac

A bostoni lakáspiac a Python "scikit-learn" moduljával érkezik, amely mindent tartalmaz, ami a szabványos gépi tanulási algoritmusokhoz és megvalósításhoz szükséges. Ez lesz a tanulási tapasztalatunk adatkészlete.

A Scikit-learn már rendelkezik egy előre beépített funkcióval a teljes folyamathoz, és így néz ki:

Megjegyzés: A teszt- és vonatadatokra való felosztás fontos! Ha betanított adatokra jósol, az eredmények túlillesztést okozhatnak, ami azt jelenti, hogy a folyamat csak az Ön adatain működik, az új adatokon nem.

Következtetés

Ez a cikk nem azért készült, hogy matematikát tanítson, vagy hogy egy nap alatt ML-szakértő legyen. Egyszerűen megpróbálok egy viszonylag jó kiindulópontot adni az ügyben, hogy megértsd a fő fogalmakat. Ha szereti ezt a témát, tudni fogja, hogy mely tárgyakat kell keresnie (tanulás, hibák, jellemzők, gradiens süllyedés stb.).

Remélem élvezted. Kérjük, kommentálja, ha igen, és szeretne egy mélyebb merülést látni!

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Java Science Golang Code Data Structures Open Source Software DevOps Programming Languages