Néhány hónappal ezelőtt elkezdtem érdeklődni a mély tanulás és a számítógépes látás iránt, ezért létrehoztam az első mély tanulási „Hello World”-emet, és ahogy mindannyian tudjuk, hogy jó pontszámot kaptam a kézírási Minst adatbázison, először az ANN-t futtattam a probléma megoldására. és körülbelül 0,97%-ot kapott, majd létrehoztam egy alkalmazást, amellyel a felhasználó húzhat egy számot, és az algoritmus megjósolja a kihúzott számot.

Az alkalmazásban rajzolhat egy számot, és az algoritmus megjósolja a számot, amelyet az algoritmus tesztelése után rajzol, az esetek 70%-ában több okból is működött. Az első ok az, hogy a Minst adatbázis 28x28 méretű kézzel írt számokat tartalmaz

és a festő mérete 200X200, szóval nagyot kell méretezni, bár az OpenCV nagyszerű, nem tudja tökéletessé tenni az átméretezést.

a második ok pedig az, hogy az ANN használata a mély tanulás problémájára nem a legjobb módszer.

ezért megpróbáltam megoldani egy CNN-architektúra létrehozásával egy Keras-tuner segítségével, hogy jobb architektúrát hozzak létre. Tudom, hogy túlzás, de szerettem volna a lehető legegyszerűbb módon felfedezni a CNN különböző architektúráit.

és sikerült 0,99%-os pontosságú architektúrát létrehoznom a tesztkészleten.

és sokkal jobban működött, mint az ANN architektúra.
Végül létrehoztam egy játékot olyan felhasználókkal, akiket az SQL Database-ba mentettek el, és a kihívás gomb megnyomása után pontokat kapsz a szám helyes beírásáért.