DATA SCIENCE – POSAO BUDUĆNOSTI

Plata od 120.000 USD

Data science je tražena karijera za one sklone koji vole analizu podataka, primenjenu statistiku kao i programiranje. Prema istraživanju Glassdoor, prosečna godišnja plata data scientist-a je 120.000 USD a data scientist je treće najtraženije zanimanje! Očekuje se da će zanimanje data scientist porasti za čak 22% između 2020. i 2030. godine! Šta podrazumeva ovaj posao budućnosti? Data science je interdisciplinarna oblast koja koristi algoritme, procedure i procese za ispitivanje velikih količina podataka u cilju otkrivanja skrivenih obrazaca, generisanja uvida (insights) i direktnog donošenja odluka. Da bi kreirali modele predviđanja, data scientist-i koriste napredne algoritme mašinskog učenja da sortiraju, organizuju i uče iz strukturiranih i nestrukturiranih podataka. Kao oblast koja se brzo razvija, sa primenom u brojnim industrijama, data science nudi razne mogućnosti za posao – od analize podataka do programiranja.  

Kako računar „pravi“ veštačku inteligenciju (AI)?

Izrazi poput veštačka inteligencija (artificial intelligence, AI), mašinsko učenje (machine learning, ML), duboko učenje (deep learning, DL), ogromne količine podataka (Big data) čujemo svuda okolo. Međutim, većina nas nije sigurna šta oni znače i kako se razlikuju. Šta je zapravo veštačka inteligencija? Veštačka inteligencija podrazumeva svako ponašanje računara koje oponaša ljudsko ponašanje. Mi želimo da računar razmišlja kao čovek, tj. da mu isprogramiramo ljudsku inteligenciju. Kako da ovo postignemo? Programiranje na „stari način“ funkcioniše na sledeći način: računaru zadajemo jasan set instrukcija (pravila) koje on treba da izvrši nad novim podacima. Svaka instrukcija se izvršava u strogom redosledu. Uzmimo primer da želimo da nam računar odgovori na pitanje „Da li je devojka visoka?“ Programer piše programski kod u okviru kog definiše pravilo. Pravilo može biti: „Ako je visina veća od 165 cm, devojka je visoka. U suprotnom, devojka je niska.“ Zatim, svaki sledeći put kada pokrenemo program, unosom visine određene devojke, dobijamo odgovor da li je ona visoka ili ne. Ako unesemo 160 cm, odgovor će biti „niska“. Međutim, šta se dešava ako ne znamo gde treba da postavimo granicu o visini? Ko je taj koji određuje da li je 165 cm prag za visinu? Upravo ovde nastupa mašinsko učenje. Mašinsko učenje podrazumeva da računar sam razume i gradi metode koje koriste prethodne podatke za rešavanje problema. U našem primeru, računaru bismo dali niz devojaka (npr. 20 devojaka) i označili ih sa „visoka“ ili „niska“, kako bi on preko matematičkih modela došao do zakonitosti – kako visina utiče na našu percepciju „visoka“ ili „niska“. Ako mu damo mali set (npr. 2 devojke) rezultat je neprecizan i inteligencija nije visoka. Ako mu damo puno podataka (Big Data) rezultat i inteligencija je preciznija. Na primer, ako bi računaru označili sa 10.000 devojaka sa „visoka“ ili „niska“, rezultat bi bio mnogo tačniji. Data Science‚1

Data Science je svuda

Primer koji smo pomenuli je jednostavan i odličan je za ilustraciju onoga šta podrazumeva mašinsko učenje. Šta se dešava kada umesto jedne karatkteristike (kao što je ovde bila visina), koristimo mnogo veći broj karakteristika (desetine, stotine, hiljade) i veću količinu podataka (1 GB, 1 TB, 1 PB…)? Šta ako imamo 3.904.727.342 devojaka (procenjen broj devojaka na Zemlji) koje smo označili sa „visoka“ ili „niska“? U tom slučaju, neophodni su nam moćni alati kako bi računar kreirao zakonitosti, a jedan od njih je duboko učenje (DL). Duboko učenje je deo metoda mašinskog učenja čije reprezentacije podsećaju na interpretaciju obrade informacija i na šablone komunikacije u biološkom nervnom sistemu, kao što je nervno kodiranje koje definiše vezu između različitih draži i odgovarajućeg nervnog odgovora u mozgu. Dakle, duboko učenje simulira rad neurona u ljudskom mozgu. Data science (DS) ima veliko preklapanje sa veštačkom inteligencijom (AI), samim tim što koristi metode mašinskog učenja (ML) i klasično programiranje kako bi se doneli zaključci i predikcije iz postojećih podataka. Međutim, pored ovih oblasti, data science podrazumeva dobro poznavanje biznisa tj. oblasti iz koje se radi analiza ili pravi model, kao i procese prikupljanja podataka, vizuelizacije, komunikacije.   Data Science2    

„You may also like…“

Od prikaznih reklama na brojnim veb sajtovima do digitalnih postera na aerodromima, data science modeli su neophodni u modernom oglašavanju. Jedan od najčešćih načina na koji se data science koristi u marketingu je kada Google pojam i algoritmi kreiraju relevantne rezultate pretrage, uključujući ciljane oglase u vezi sa vašim upitom. Ova primena je razlog zašto možete videti onlajn npr. reklamu za programe obuke o data science, dok neko drugi u istom regionu može videti reklamu za odeću. Preduzeća mogu da ih prilagode na osnovu prethodnog ponašanja korisnika. Zbog toga digitalni oglasi imaju daleko veći CTR (click-through rate) od tradicionalnog oglašavanja. Mnoge marketinške firme su iskoristile data science da promovišu svoje ponude zasnovane na interesima korisnika i relevantnosti podataka kako bi poboljšale angažovanje kupaca. Kompanije kao što su Amazon, Twitter, Google Play, Netflix i druge takođe usvajaju ovu strategiju.  

E-commerce ne može bez Data Science-a

Data science je snažno uticala na e-commerce, pomažući kompanijama da identifikuju svoje ciljno tržište, predvide tražnju za robom i uslugama i optimizuju formiranje cena. Obrada prirodnog jezika (natural language processing, NLP) i mehanizam za preporuke, pokazali su se izuzetno korisnim kompanijama koje prodaju onlajn, jer koriste ove metode da analiziraju ponašanje kupaca i steknu uvid u potencijalne strategije rasta. Štaviše, NLP se koristi za analizu tekstova i onlajn anketa, što pomaže preduzećima da pruže kvalitetne usluge svojim klijentima.  

Data Science dramatično menja biznis model

Data science je u centru nekih od najuticajnijih inovacija u transportu u poslednje dve decenije. Dok su autopilot vozila verovatno najupečatljiviji razvoj u svetu transporta, data science je takođe temelj za proizvodnju statistike o upotrebi goriva, analizu ponašanja vozača i praćenje performansi vozila. Kombinovanjem mašinskog učenja sa automatizacijom, proizvođači automobila mogu da kreiraju pametnija, bezbednija vozila sa boljim logističkim rutama. Istaknute taksi kompanije kao što je Uber koriste data science da optimizuju troškove i rute kombinovanjem različitih elemenata kao što su ponašanje kupaca, lokacija, ekonomski podaci i logistički provajderi. Takođe, avio-kompanije koriste data science za predviđanje kašnjenja letova, odluku koje će avione kupiti, planiranje ruta, upravljanje kašnjenjima letova i kreiranje programa lojalnosti.  

Data science je 3.najtraženiji posao na Glassdoor

Postoji veliki broj različitih posloslova koje Data Scientist može da radi. U nastavku je pregled ključnih pozicija.  
Pozicija Veštine
Machine learning engingeer mašinsko učenje, matematika, algoritmi, programiranje
Deep learning engineer inženjer mašinskog učenja sa akcentom na neuronske mreže
Data engineer mašinsko učenje, baze podataka, data mining, ETL
Database administrator SQL, bezbednost podatka, rezervne kopije, data warehouse
Data analyst interpretacija, vizuelizacija i komunikacija podataka
Business analyst data analyst sa poznavanjem biznisa
Product analyst data analyst sa poznavanjem proizvoda
Financial analyst data analyst sa poznavanjem finansija i računovodstva