Ben Kandel alkalmazott gépi tanulási kutató, aki az elmúlt néhány évben a PointClickCare-nél dolgozott. Csodálatos ember volt, akivel beszélgetni lehetett, és valóban betekintést engedett abba, hogy mit csinál egy gépi tanulási kutató.

A PointClickCare egy felhőalapú egészségügyi vállalat, amely egészségügyi intézmények szoftvereit készíti és karbantartja. Olyan termékeket hoznak létre, amelyek segítik az egészségügyi intézményeket klinikai gyakorlatukban és pénzügyi helyzetükben. További információ a PointClickCare-ről itt található.

A PointClickCare-nél Ben orvosi adatokkal dolgozik, hogy modelleket készítsen ügyfeleik számára. Egyes projektek, amelyeken dolgozott, az újbóli kórházi kezeléssel foglalkoznak, mivel a kórházba került emberek jelentős része 30 napon belül visszatér a kórházba. Ügyfeleivel dolgozott abban a reményben, hogy ezt a számot kezelhetőbb összegre tudja csökkenteni.

Hogyan lehetsz gépi tanulás kutatója?

Mit kellene tanulnod?

Mielőtt gépi tanuláskutató lett volna, Ben Kandel fizikát tanult az egyetemen, egy másik matematika és kémia mellett. Posztgraduális tanulmányaihoz biomérnöki doktori fokozatot szerzett, amelynek középpontjában az orvosi alkalmazásokhoz való gépi tanulás áll. Ez nem feltétlenül jelenti azt, hogy követnie kell a lépéseit. Bennel beszélgetve kifejtette, hogy tudományos tanulmányainak tükrözniük kell a kívánt karrierjét.

A Harvard Business Review szerint jelenleg az új, forró és legszexisebb állás a Data Scientist. Ben Kandel kifejti véleményét erről a munkakörről, mivel sok átfedés van más munkákkal, például az övével. Azt állítja, hogy a Data Scientist munkái vegyesek, és valóban meg kell vizsgálnia és meg kell értenie a felelősségét, mielőtt elfogad egy ajánlatot. Egyes állások, amelyek korábban adatelemzőként, üzleti elemzőként, statisztikusként és adatmérnökként szerepeltek, most adatkutatóként szerepelnek. Ben azt mondja, hogy ezeknek a problémáknak/munkáknak valószínűleg saját megoldásaik kellenek, de „2022-től ez nem így van”, és valószínűleg egy Data Scientist felvételével oldják meg. A szakterületek és készségek széles skálája miatt nem feltétlenül van szükség PhD-re, hogy adatkutatóvá váljon. Végül Ben kijelentette, hogy a PHD-k nem szükségesek, de általában felkészítenek különböző típusú munkákra, amelyeket ilyenek nélkül általában nem tudna megszerezni.

Ez szakterülettől és intézménytől is függ. Ha a területről/intézményről köztudott, hogy szigorú és szabványosított útja van a kutatás elfogadásához, akkor ezekhez a munkákhoz általában hiteles és publikációs igényű jelentkezők szükségesek. Ez attól is függ, hogy mennyire fontos a modell pontossága. Nyilvánvaló, hogy minél pontosabb a modell, annál jobb, de eltérő mezők eltérő következményekkel járnak a pontatlan modellekre. Például különbség van a bevétel-előrejelzési modell és egy olyan modell között, amely előrejelzi egy életveszélyes betegség korai tüneteit.

Tehát milyen típusú hitelesítő adatokra van szükségünk valójában? Ben szerint soha nem tévedhetsz el bizonyos gépi tanulási vagy adattudós órákon. A matematikai háttér megléte is nagyon hasznos lehet. Ha pontosan tudja, hogy melyik területre/iparágra szeretne bekerülni, akkor nagyon hasznos lesz néhány tartományspecifikus kurzus elvégzése. Ha az intenzívebb mérnöki szerepkörökbe szeretne belemenni, akkor a szoftvermérnöki és számítástechnikai órák nagyon hasznosak lesznek.

Hogyan készülj fel az akadémiai léten kívül?

Az egyik kérdés, amelyet Bennek feltettek, ez volt: „Milyen képesítéseken/készségeken kell dolgoznod, amelyeken nem tanítanak akadémikusokon?”. A válasz az volt, hogy az interperszonális készségek nagyon szépek. Különösen, ha az iparágban dolgozik, nemcsak modellek készítése fontos, hanem az is, hogy tudja, hogyan magyarázza el, hogyan működik és miért működik a vezetőknek és az ügyfeleknek. Egy eszköz, bármilyen erős is, haszontalan olyan ember kezében, aki nem tudja, hogyan kell használni. Emellett sok kutatást végeznek csapatok és csoportos erőfeszítések révén. Fontos tudni, hogyan kell emberekkel dolgozni.

Ezután Ben arról beszélt, hogy az embereknek milyen tapasztalatokkal kell rendelkezniük. Ha frissen végzett az iskolából, vagy ha ez az első gépi tanulási/adattudományi munkája, akkor személyes projektjei fontosak. Itt Ben kijelentette, hogy a személyes projektekkel rendelkező jelölteknél azt keresi, hogy van-e valamiféle újdonság a projektben, és ami még fontosabb, hogy az illető tudja, miért teszi meg azokat a lépéseket, amelyeket megtett. Például bárki követhet egy oktatóprogramot és egy szabványos folyamatot. Ami biztosítja, hogy tudja, mit csinál, az az, hogy képes megmagyarázni a meghozott döntéseit. Például, hogy miért választott bizonyos modelleket másokkal szemben, és miért döntött úgy, hogy konkrét funkciókat tervez.

Ha magasabb beosztásra jelentkezik, akkor fontos a korábbi munkatapasztalata. Ben kijelentette, hogy ezekkel a jelöltekkel azokat az eredményeket nézi, amelyeket ott dolgozva elértek. Például, milyen projekteken dolgozott, és hogyan használta fel ezeket a projekteket a vállalat. Lenyűgözőbbé válik, ha fel tud sorolni olyan kézzelfogható és számszerűsíthető előnyöket, amelyeket előző cége tapasztalt, például „az én modellem 10%-kal növelte haszonkulcsunkat”.

Kifejezetten a gépi tanuláshoz Ben kijelentette, hogy bizonyos statisztikák ismerete nagyon hasznos.

Akadémia kontra ipar

A PhD diplomával és a PointClickCare-nél dolgozó Bennek mind a tudományos, mind az iparban szerzett tapasztalata van. Kijelenti, hogy az akadémia és az ipar a megfelelő választás a különböző típusú emberek számára.

Ben szerint az akadémia számára akkor kell belevágnia, ha egyáltalán nem bírja a gondolatot, hogy valakinek dolgozzon. Több szabadságot élvezhet, hogy azt kutassa, amit akar. Ez nem teljes szabadság, hiszen ahelyett, hogy bármilyen kutatást végezhetne, szabadon kitalálhatja, hogy a finanszírozó ügynökségek hajlandóak-e finanszírozni. Ennek ellenére ez nagyobb szabadságot jelent, mint az iparban. Hatékonyan a saját főnökévé is válhat, hiszen kiválaszthatja, kivel szeretne együtt dolgozni. Ez akkor is jó választás, ha szeret felelősséget vállalni és elismerést kapni felfedezéseiért. A tudományos körökben talált kutatások során általában az Ön neve szerepel az újságban, és az emberek szakértőként tekintenek rád.

Az ipar nagyobb stabilitást biztosít, mivel nem kell folyamatosan pályáznia a támogatásokra, és általában többet fizet. Ennek ellenére elakadsz a rábízott feladatok elvégzésében, de intuitív módon csak azért kaptad ezt a munkát, mert élvezed, amit ott fogsz csinálni. Mindig kereshetsz másik állást, ha valami mást akarsz kutatni, de ehhez meg kell szoknod egy teljesen új környezetet. Ez akkor is jó választás, ha nem bánja, ha megosztja a dicsőséget, vagy ha nem szereti a teljes felelősséget vállalni, ha bármilyen probléma merül fel. Az iparban a dokumentumokat általában az azokat kiadó szervezetnek tulajdonítják, nem pedig a kutatást végző konkrét személyeknek. Ez nem jelenti azt, hogy nem kapsz semmilyen elismerést. Csak arról van szó, hogy az elismerés megoszlik Ön és a szervezet között.

Hogyan tovább a karriered?

Még azután sem, hogy adattudósként/gépi tanuláskutatóként elhelyezkedne, az utazása nem fejeződött be. Ez a terület folyamatosan növekszik és folyamatosan fejlődik, így a tudásra való törekvés soha nem ér véget. Mindig új modelleket és paradigmákat kell keresnie. Ben kijelentette, hogy kedvenc modellje a Random Forest modell, mivel ez egy jó alapmodell, és nagyon könnyen használható, mivel nem paraméteres.

Amikor Bentől kért néhány forrást, amivel lépést tarthat mindennel, jó ajánlásokat adott. Azt mondja, hogy lépést tart azzal, hogy nyomon követi egyes Reddit-közösségeket, blogokat, hackerhíreket és kiadványokat. Néhányan a „gépi tanulási subreddit” és a „The-Gradient” blogot kiáltotta. Azt mondta, hogy lehetetlen mindennel lépést tartani, ezért ne érezze magát nyomásnak, hogy a hét minden napján, 24 órában naprakész legyen, de az erőforrások listája, amelyeket szabadidejében görgethet, nagyon előnyös lehet.

Következtetés

Összefoglalva, Ben Kandel nagyszerű ember volt az interjú készítésére, és az általa az adattudomány/gépi tanulás/statisztika területére adott betekintések nagyon hasznosak voltak. Tekintettel arra, hogy még csak most kezdem a pályafutásomat, határozottan megfogadom a tanácsát.