A lineáris regresszió egy alapvető statisztikai módszer, amelyet két vagy több változó közötti kapcsolat modellezésére használnak. Ez olyan, mintha egy egyenes vonalat húznánk adatpontok felhőjén, hogy megtaláljuk a leginkább illeszkedő vonalat, amely az alapul szolgáló mintát reprezentálja. Ez a módszer különösen hasznos az előrejelzések készítéséhez, az összefüggések megértéséhez és a különböző területeken, a közgazdaságtól és a pénzügyektől a tudományig és mérnöki tudományokig. A változók közötti kapcsolat számszerűsítésével a lineáris regresszió segít megalapozott döntéseket hozni, és értékes betekintést nyerhetünk az adatokból.

Mi az a lineáris regresszió?

A regresszióanalízis egy prediktív modellezési technika, amely egy függő változó és egy független változó közötti kapcsolatot tárja fel. Megmutatja, hogy az x tengelyen lévő magyarázó változó változásai hogyan befolyásolják az y tengelyen lévő függő változót.

Célja

A regressziós elemzés három fő célra használható. Először is meg tudja határozni a előrejelzők erősségét azáltal, hogy azonosítja a független változóknak a függő változóra gyakorolt ​​hatását. Például segíthet megérteni az értékesítés és a marketingkiadások közötti kapcsolatot vagy az életkor és a jövedelem közötti összefüggést. Másodszor, a regressziós elemzés használható változások hatásának előrejelzésére és azonosítására. Segíthet megérteni, hogy a függő változó mennyit változik egy vagy több független változó változásával. Segíthet például olyan kérdések megválaszolásában, mint hogy mennyi további értékesítési bevétel keletkezik minden marketingre költött ezer dollár után. Harmadszor, a regressziós elemzés trend-előrejelzésre használható a jövőbeli értékek előrejelzésére. Ezen túlmenően olyan pontbecslésekkel is szolgálhat, amelyek választ adhatnak olyan kérdésekre, mint például, hogy mi lesz a Bitcoin ára a következő hat hónapban.

Lineáris vs logisztikai regresszió:

Ha a lineáris regresszióval kezdjük, az az érdekünk, hogy megtaláljuk a korrelációt az X és az Y változók között, amelyek Y= mX+ c. Ez azt jelenti, hogy X minden értékének megvan a megfelelő Y értéke, ha az folytonos. A logisztikus regresszióban azonban nem illesztjük adatainkat egy egyeneshez, mint a lineáris regresszió. Ehelyett leképezzük Y versus X-et egy szigmoid függvényre. A logisztikus regresszióban lényegében eldöntjük, hogy Y 1 vagy 0 adott X értékhez, igaz vagy hamis értéket határozunk meg. A fő különbség a lineáris és a logisztikus regresszió között a leképezett függvény típusa. A lineáris regresszió egy folytonos X-et egy folytonos Y-ra, míg a logisztikus regresszió egy folytonos X-et egy bináris Y-re képez le. Így a logisztikus regresszió hasznos kategória vagy igaz/hamis döntések meghozatalához adatokból.

Kiválasztási feltételek:

Osztályozási és regressziós képességek: Ha osztályozási képességről van szó, a polinomra, például egy egyenesre való támaszkodás az adatkészlethez való illesztéshez igazi kihívást jelent. A regressziós modellek egy folytonos változót jeleznek előre, mint például az egy napon történt eladások vagy egy város hőmérsékletét. Azonban egy vonal illesztése a vonatpontokkal, majd új adatpontok hozzáadása megkövetelné a meglévő modell megváltoztatását, ami nem ideális. A lineáris regresszió nem alkalmas osztályozási modellekhez.

Adatminőség: A következő lépés az adatminőség minden hiányzó érték eltávolít egy adatpontot, amely optimalizálhatja a regressziót egyszerű lineáris regresszióval. A kiugró értékek egyelőre jelentősen megzavarhatják az eredményt, tudhatod, hogy ha eltávolítod a kiugró értékeket, a modelled nagyon jó lesz.

Számítási komplexitás: Az alineáris regresszió számítási szempontból gyakran nem költséges a döntési fához vagy a klaszterező algoritmushoz képest. A bonyolultsági sorrend n tanítási példa és X jellemző esetén általában O(X²) vagy O(Xn)-be esik.

Érthető és átlátható: A lineáris regresszió könnyen érthető és átlátható jellegű. Egyszerű matematikai jelöléssel bárki számára ábrázolhatók, és nagyon könnyen megérthetők.

Lineáris regresszió használata:

Az üzleti trendek hatékony elemzése és a megalapozott döntések meghozatala érdekében fontos a jól szervezett és pontos feljegyzések vezetése. Ennek egyik hasznos eszköze a lineáris regresszió, amellyel trendvonalakat hozhatunk létre, és az értékesítési adatok alapján előrejelezhetjük a jövőbeli eladásokat. Ezenkívül a lineáris regresszió betekintést nyújthat a fogyasztói magatartásba és kockázatértékelésbe olyan iparágakban, mint a pénzügyi szolgáltatások és a biztosítás. Ezen technikák alkalmazásával a vállalatok magabiztosan és pontosan hozhatnak fontos döntéseket.

Matematika és a lineáris regresszió vizualizálása néhány ponttal:

Alább található a lineáris regresszió kódja

Összefoglalva, a lineáris regresszió értékes technika a változók közötti kapcsolatok elemzésére és az előrejelzések készítésére. Bár egyszerűséget és értelmezhetőséget kínál, fontos, hogy érvényesítsük a feltételezéseket, és vegyük figyelembe a korlátait az összetett forgatókönyvekben. Ha más módszerekkel együtt alkalmazzuk, a lineáris regresszió továbbra is alapvető eszköz a betekintés megszerzéséhez és a megalapozott döntések meghozatalához az adattudományban és -elemzésben.

Oktatóanyag linkje: https://www.youtube.com/watch?v=E5RjzSK0fvY

Adatkészlet link: https://www.kaggle.com/datasets/saarthaksangam/headbrain

#Quantum30 #Day_6 QuantumComputingIndia