Neurális hálózatok —Alapvető bevezető

Warren S. McCulloch és Walter Pitts (1943) lefektették a neurális hálózatok alapjait. Bevezettek egy matematikai modellt, amely elméletileg úgy működik, mint egy neuron. Ez a perceptron egy vagy több bemenetből, egy processzorból és egy kimenetből áll.

Később, 1957-ben Rosenblatt előállt az első általunk ismert tanítható neurális hálózattal. Az alábbiakban egy háromrétegű neurális hálózat példája látható.

Szerkezet

A mesterséges neurális hálózat összetett gépi tanulási módszer. Neuronokból áll, és az összes neuronnak van bejövő és kimenő kapcsolata, ami ezt az egészet hálózattá teszi. Különféle kapcsolatok léteznek, pl. előrecsatolt, ismétlődő stb. Vannak különböző típusú hálózatok is, mint például a konvolúciós neurális hálózatok (CNN), a hosszú távú memória (LSTM) stb.

A neuron olyan függvény, amely egy vagy több értéket vesz fel, és csak egy értéket ad ki kimenetként. Súlyokból és egy aktiváló funkcióból áll. Minden egyes neuronban a bemeneteket megszorozzuk súlyokkal (ahogy a lineáris regressziónál is), majd az aktiválási függvényt alkalmazzuk.

A neurális hálózatokat a neuronok közötti kapcsolatok súlyának és torzításának beállításával képezik ki egy adott feladat elvégzésére. A neurális hálózat betanításának célja, hogy megtalálja a súlyok és torzítások halmazát, amelyek a bemeneti adatokat a kívánt kimenetté alakíthatják.

A neurális hálózatok különösen jól illeszkednek olyan feladatokhoz, amelyek mintafelismeréssel járnak, mint például a kép- és beszédfelismerés, a természetes nyelvi feldolgozás, vagy akár a játékok. A legkorszerűbb eredmények elérésére használták őket számos területen, beleértve a számítógépes látást, a természetes nyelvi feldolgozást és a beszédfelismerést.

Egy mély neurális hálózatban a folyamat annyiszor ismétlődik, ahány réteg van. A probléma összetettségétől függően azonban egy neurális hálózat betanítása hosszú időt vehet igénybe az érintett számítási szakaszok okozati láncai miatt.

A több neuron szükségessége abból adódik, hogy a neuronoknak csak egy értéke lehet, de szeretnénk több információval rendelkezni, vagyis sok tényező befolyásolja a kimenetünket (nagy komplexitás). Az ugyanabban a rétegben lévő különböző neuronokban lévő értékek változása eltérően befolyásolja az y kimenetet.

A bemeneti és kimeneti réteg között több réteg is lehet. Ezeket a rétegeket rejtett rétegeknek nevezzük. Tegyük fel, hogy egy mesterséges neurális hálózat egy rétegében lévő összes neuronnak van szinapszisa (nyílnak jelölve), amely a következő réteg összes neuronjához kapcsolódik. Ebben az esetben sűrű rétegnek nevezzük. Ha egy mesterséges neurális hálózat sok neuronból és rejtett rétegből áll, akkor többrétegű mesterséges neurális hálózatnak nevezzük. A Mély tanulás egy többrétegű mesterséges neurális hálózat, amely legalább három rétegből áll.

Aktiválási funkciók

Az aktiválási függvény egy nemlineáris függvény, mint például a Sigmoid függvény, a ReLU, a Softmax vagy a TanH. Meghatározza a neuron állapotát (be/ki). A különböző rétegeknek eltérő aktiválási funkciója lehet. E függvény nélkül a perceptron csak egy egyszerű lineáris regresszió.

Az aktiválási függvény egy matematikai függvény, amely meghatározza egy neuron kimenetét egy bemenet vagy bemeneti készlet esetén. Az aktiválási funkciók a mesterséges neurális hálózatok kulcsfontosságú összetevői, mivel meghatározzák, hogy egy neuron „tüzel-e” vagy sem, és meghatározzák a kimeneti jel erősségét.

Számos különböző típusú aktiválási funkció létezik, amelyeket általánosan használnak a neurális hálózatokban, és mindegyiknek megvan a maga sajátossága. Néhány általános aktiválási funkció:

Szigmoid függvény: A szigmoid függvény a bemeneti értékeket 0 és 1 közötti tartományra képezi le, és gyakran használják olyan osztályozási feladatokban, ahol a kimenet valószínűségként értelmezhető.
Egyenirányított lineáris egység (ReLU): A ReLU függvény a bemeneti értéket adja ki, ha az pozitív, és 0-t, ha negatív. Ez az aktiválási funkció egyszerű és hatékony, és gyakran használják a mély tanulási hálózatokban.
Hiperbolikus tangens (tanh): A tanh függvény hasonló a szigmoid függvényhez, de a bemeneti értékeket -1 és 1 közötti tartományba rendeli. Gyakran használják a szigmoid függvénnyel együtt több osztályban. osztályozási feladatok.
Softmax függvény: A softmax függvény a többosztályos osztályozási feladatokhoz használt szigmoid függvény általánosítása. Bemeneti értékek halmazát képezi le az osztályok halmazán belüli valószínűségi eloszláshoz.

Az aktiválási funkciók a neurális hálózat tervezésének fontos szempontjai, mivel meghatározzák, hogy a hálózat hogyan dolgozza fel és alakítja át a bemeneti adatokat. A megfelelő aktiválási funkció kiválasztása jelentősen befolyásolhatja a neurális hálózat teljesítményét.

Alkalmazások

A neurális hálózatok hatékony eszközt jelentenek számos probléma megoldására, és különösen alkalmasak mintafelismeréssel járó feladatokra. A neurális hálózatok néhány gyakori alkalmazása a következők:

Képosztályozás: A neurális hálózatok betaníthatók a képek tartalmuk alapján történő osztályozására, például objektumok vagy jelenetek azonosítására a fényképen.
Beszédfelismerés: A neurális hálózatokat meg lehet tanítani a beszélt nyelv szöveggé történő átírására, illetve meghatározott szavak vagy kifejezések felismerésére.
Természetes nyelvi feldolgozás: A neurális hálózatok felhasználhatók az írott vagy beszélt nyelv feldolgozására és elemzésére, például nyelvi fordításra vagy szövegösszegzésre.
Csalások felderítése: A neurális hálózatok megtaníthatók a csaló tevékenységek észlelésére, ha megtanulják azonosítani azokat a viselkedési mintákat, amelyek csalárd tevékenységre utalnak.
Prediktív modellezés: A neurális hálózatok segítségével előrejelzéseket lehet készíteni a jövőbeli eseményekről a múltbeli adatok alapján, például a részvényárfolyamok vagy az ügyfelek lemorzsolódása alapján.

Összességében a neurális hálózatok rugalmas és hatékony eszközt jelentenek számos különböző típusú probléma megoldására, és számos területen alkalmazhatók. Ha olyan problémája van, amely magában foglalja a mintafelismerést vagy az adatokon alapuló előrejelzések készítését, a neurális hálózatok jó választás lehet.

Ha tetszett ez a bejegyzés, nézd meg az alábbi bejegyzésemet.

Osztályozási és regressziós fák
Ez a második bejegyzésem a gépi tanulási algoritmusokról. Az első bejegyzésem a mesterséges neurális hálózatokról szól, akkor…medium.com

Ha hasznosnak találta ezt a cikket, kérjük, tapsolja és ossza meg másokkal.

Köszönöm!

hasonló anyagok:

Új anyagok

A rádiógomb ellenőrzött eseményének használata a jQueryben

Ebben a cikkben látni fogjuk, hogyan kell dolgozni a jquery választógombbal ellenőrzött eseményeivel. A választógombok HTML gombok, amelyek segítenek kiválasztani egyetlen értéket egy csoportból...

Körkörös függőségek megoldása terraformban adatforrásokkal – lépésről lépésre

Mi az a körkörös függőségek Dolgozzunk egy egyszerű eseten, amikor az SQS-sor és az S3-vödör közötti körkörös függőség problémája van egy egymástól függő címkeérték miatt. provider..

Miért érdemes elkezdeni a kódolást 2023-ban?

01100011 01101111 01100100 01100101 — beep boop beep boop Világunk folyamatosan fejlődik a technológia körül, és naponta fejlesztenek új technológiákat a valós problémák megoldására. Amint..

🎙 Random Noise #2 – Örökbefogadás és hit

az analitika íratlan világának gondozása Szeretné, hogy ezek a frissítések a postaládájába kerüljenek? Iratkozzon fel itt . "Ha önvezető autókat gyártanak, akkor mi miért ne..

A legrosszabb politika és prediktív modellek májátültetésre jelöltek számára az Egyesült Államokban

A máj (vagy óangolul lifer) az emberi test legnehezebb belső szervére utal, amely csendesen működik a nap 24 órájában. Mit csinál a máj? 500 feladatot hajt végre a szervezet egészségének..

5 webhely, amely 2022-ben fejleszti front-end fejlesztői készségeit

Frontendmentor.io A tényleges projektek létrehozásával a Frontendmentor.io segítséget nyújt a front-end kódolási képességeinek fejlesztésében. A kódolást azután kezdheti meg, hogy..

Mikor kell használni a Type-t az interfészhez képest a TypeScriptben?

A TypeScript a JavaScript gépelt szuperkészlete, amely statikus gépelést ad a nyelvhez. Ez megkönnyíti a robusztus és karbantartható kód írását azáltal, hogy a hibákat a fordítási időben..

Címkék

Machine Learning JavaScript Artificial Intelligence Data Science Python Software Development Web Development Coding Deep Learning AI React Nodejs Front End Development Software Engineering Javascript Tips NLP Computer Science HTML Neural Networks Algorithms Tech Development Typescript Python Programming CSS ChatGPT Javascript Development Statistics Data Java Science Golang Code Data Structures Open Source Software DevOps Programming Languages