Python kao alat za analizu podataka, stvaranje vizuelizacija i korišćenje algoritama mašinskog učenja
Miloš Bijanić održao dvodnevnu radionicu u okviru projekta FONup
Podržali smo projekat FONup, u organizaciji FON-ovog centar za razvoj karijere, koji je namenjen svim studentima informacionih tehnologija, onima koji su radoznali i uvek voljni da čuju aktuelne teme iz IT oblasti. Naš kolega Miloš Bijanić održao radionice 7. i 8. decembra na Fakultetu organizacionih nauka, na temu “Python for Data Science”.
Naš kolega je imao cilj da polaznike upozna sa programskim jezikom Python kao alatom za analizu podataka, stvaranje vizuelizacija i korišćenjem algoritma mašinskog učenja. Takođe polaznici su imali priliku da se upoznaju sa:
- Pandas i Numpy bibliotekama za analizu podataka
- Seaborn i Matplotlib bibliotekama za vizualizaciju podataka
- SciKit-Learn kao bibliotekom za izgradnju modela mašinskog učenja
- Načinom kako da se evaluiraju rezultati modela.
Kroz ovu radionicu pokušali smo da polaznike provedemo kroz ceo proces digitalizacije, šta to znači i koju to vrednost ima za privredu, zatim koliko je privreda počela da bude svesna šta su podaci, koji su načini i pristupi da se ti podaci primene u svakom vidu poslovanja, da bi na kraju zajedno pokušali da razumemo to iskustvo koje je kreirano u podacima.
Početak 21. veka bio je zasnovan na izgradnji tehnološki informacionih sistema koji će da zamene ljudsku snagu, odnosno da automatizuju neke procese. Sada kad su se prikupile jako velike količine podataka, došlo je do toga da ti podaci sadrže neku vrednost i da daju neko dodatno skriveno ponašanje, i kompanije su to prepoznale. Mi smo pokušali da kroz ovu radionicu prođemo kroz podatke, da razumemo ponašanje i istoriju klijenata, i da napravimo prediktivne modele. Radili smo razne vizualizacije, gde su polaznici opisivali da li dva atributa mogu da imaju korelaciju i kakva je korelacija ako je imaju. Kroz same vizualizacije možemo da donesemo zaključak kao čovek, i kroz dva parametra da kažemo da li će naš klijent da uzme neke proizvode ili će da napusti naše poslovanje. U ovoj radionicu su se koristili podaci iz telekomunikacione industrije.
Suština radionice je bila polaznici shvate kako se prepoznaje problem, kako taj problem može da se vidi kroz podatke i kako da ga predstavimo da nama bude jasno kroz razne vizualizacije i manipulaciju podacima. Nako toga, kako to ponašanje koje smo mi videli kao čovek da pokušamo da damo modelu, da model to isto vidi i da kasnije to model može automatski da radi za nas. Odnosno, da integrišemo neko ponašanje koje smo mi uočili, i da za neki novi primer korisnika koji nam dođe da možemo da procenimo da li će da napusti telekomunikacionu kompaniju ili ne.
Našoj radionici, koja je trajala 8h u toku dva dana, prisustvovalo je preko 25 studenata koji su se zaista zainteresovali za temu i bili aktivni do samog kraja. Kolega Miloš je imao težak zadatak da odabere dvoje najboljih i najaktivnijih polaznika, jer su svi bili uključeni sve vreme.