A történet, amelyről írok, a Hackerearth Loveislove Machine Learning Hackathonon szerzett tapasztalataim. A problémafelvetés arra kéri, hogy bontsa ki a képek szövegét, és elemezze azt pozitív, negatív és véletlenszerű érzésekre. Ezt a Hackathont 5 nappal a beküldési határidő előtt találtam. Mivel új volt a természetes nyelvi feldolgozás és az ocr-konverzió, nagyon lenyűgözőnek találtam ezt a problémát, és elhatároztam, hogy feltöröm ezt a hackathont.

Ezért elkezdtem kutatni a weben és a YouTube-on az oCR-konverziós eszközöket illetően, mivel ez jelenti az első lépést a problémafelvetésben. Az első eszköz, amit kipróbáltam, a pytesseract volt, ahol a pontosság nem érte el a jelet, így a következő próbálkozásom az easyocr volt, ez majdnem ugyanazt az eredményt adta. A következő próba a yolov3 volt, egy egész napig próbáltam ezt megvalósítani, de valahogy nem sikerült. Aztán elkezdtem próbálni az East Detektort, hogy felismerjem a szöveget néhány opencv előfeldolgozási technikával (küszöbölés, elmosódás stb.), ami jobb eredményeket adott néhány képnél, amelyek csak pytesseract-ot tettek. Nem tudtam felismerni .Mivel az óra ketyegett, és közeledett a határidő, elkezdtem elemezni a szöveg hangulatát a vadersentiment és textblob segítségével, a pytesseract és az east detector mindkét módszerét kombinálva. Ezzel 48%-os pontszámot kaptam, és 7 órám maradt. Ezúttal elkezdtem javítani a hangulatbesorolásomat. Elkezdtem kísérletezni néhány gépi tanulási technikával, mint például az svm, a logisztikai regresszió, a naiv bayes és az xgboost. Az itt használt adatkészlet a twitter tweetek adatkészlete volt, amelyet az előfeldolgozás után használtam. A naiv bayes használatával 56%-ot kaptam. Néhány apró változtatás után az előfeldolgozás és a keleti detektor résznél 58%-os pontszámot tudtam elérni .maradt 3 óra ,majd kipróbáltam a Google vision API-t, ami számlázási hibát okozott, pedig engedélyeztem a számlázási információkat .Végül a hackathon véget ért, és 58%-os pontszámmal a 15. helyet hoztam el a ranglistán. A hackathon után megtanultam a Google vision api és lstms használatát, ami elég nagy pontosságot adott nekem.

Ez volt a 2. Hackathonom, és csak annyit tanultam meg, hogy soha ne adjam fel a kísérletezést és a különböző módszerek alkalmazását. -Sairam