POSTAVI PRAVO PITANJE! Veljko Stanojković, Compensation and Benefits Manager, Imlek.

 

Uporedo sa tehnološkim razvojem raste količina podataka koja se generiše upotrebom novih tehnologija, čineći da putovanje od sirovih do upotrebljivih podataka postane prava avantura sa mnogo izazova. Vizualizovati podatke u obliku tabela i grafikona više nije dovoljno, već je kroz podatke potrebno naći sve uzroke prikazanih rezultata, objasniti njihov uticaj i predvideti sve moguće posledice.

  [caption id="attachment_27003" align="aligncenter" width="550"]Veljko Stanojković Veljko Stanojković, Compensation and Benefits Manager, Imlek.[/caption]  

Postavljanje pravih pitanja predstavlja početnu stanicu svakog analitičkog putovanja. Ovde treba napraviti distinkciju između izveštavanja i analitike s obzirom na to da ove dve usko povezane, ali ipak različite, aktivnosti daju odgovore na različita pitanja. Izveštavanjem se dolazi do odgovora šta se desilo u nekom prethodnom periodu dajući podacima deskriptivnu dimenziju. Analitika koja se naslanja na rezultate iz izveštaja mora odgovoriti na seriju pitanja koja proističu iz prikazanih rezultata sa namerom da ih objasni i predvidi njihov dalji uticaj na poslovanje. Doći do krajnje destinacije i dati odgovore na pitanja, ne predstavlja ucrtanu stazu na mapi sa preciznim GPS koordinatama. Vrlo često je to put u nepoznato, gde je potrebno raskrčiti nepristupačan teren raznom mehanizacijom i, uz pomoć nekoliko različitih prevoznih sredstava, naći najkraći put do cilja.

 

Čišćenje terena kojim analitički karavan treba da prođe predstavlja deo puta gde svako od hodočasnika provede najveći deo svog vremena fizikališući. Čišćenje podataka, sagledavanje šta je ono što nam je potrebno, način na koji će se podaci prikupljati, sistematizovati, čuvati i upotrebljavati, svakako nije uzbudljivo i udobno ali, ako se ne uradi na ispravan način, ostatak putovanja će izgledati kao u narodnoj izreci „proveo se kao bos po trnju“ u pravom smislu tih reči. Kako bi ovaj posao obavili što lakše, analitičari moraju razviti nove veštine, jer u protivnom će fizikalisati mnogo duže golih ruku. Excel je svakako najzastupljeniji od alata koji analitičari imaju u svojim rukama. Iako moćan alat, on sam po sebi često nije dovoljan za rešavanje problema. Kako su strukturirani podaci i dalje najzastupljeniji kada je analitika u pitanju, osnovno poznavanje funkcionisanja relacionih baza podataka je obavezno kod svakog ozbiljnog analitičara. Na koji način se podaci čuvaju u tabelama, šta je primarni ključ i na koji način se stvaraju relacije između tabela, spada u osnovno znanje analitičara. Kao i na svakom putovanju, mnogo je lakše putovati uz poznavanje stranih jezika. Najvažniji na našem analitičkom putovanju jeste univerzalni jezik kojim se komunicira sa podacima odnosno SQL (Structured Query Language). Baveći se analitikom bez osnovnog poznavanja SQL-a, umnogome podseća na putovanje svetom bez bazičnog znanja engleskog jezika. Ne morate ga znati perfektno, dovoljno je nekoliko jednostavnih fraza sa malim vokabularom (Select, From, Where; Inner Join, Left Join, Right Join itd). Učenje SQL-a, koje je slično učenju engleskog jezika, jer ima jasna pravila, dosta je zastupljeno, a edukacija je i više nego dostupna. Pored tradicionalnih kurseva, postoje mnogobrojni besplatni ili vrlo pristupačni on-line kursevi na internetu. Ukoliko uz sve prethodno navedeno imate i znanja iz funkcionisanja ETL (Extract, Transform, Load) procesa i alata, onda već krčite svoj put teškom mehanizacijom.

  SQL  

Nakon što su sve staze do cilja prohodne i utabane, može krenuti pravo putovanje puno avantura. Na koji način će se vršiti modelovanje podataka, umnogome zavisi od kompleksnosti problema koje želimo rešiti, količine podataka koje obrađujemo, kao i alata i tehnika kojima raspolažemo. Svakako je ovo najzabavniji deo analitičkog putovanja, gde je izbor avantura beskrajno raznolik – od kreiranja modela u Excelu uz pomoć power pivota i power querya, preko statističkih i regresionih modela, do pravljenja kompleksnih algoritama i machine learninga uz pomoć programskih jezika R, Phyton ili Spark, a sve u skladu sa potrebama, ličnim afinitetima i mogućnostima. Ovde dolazi do izražaja kvaliteta obavljenog posla u prethodnoj fazi, jer ukoliko su podaci kompletni, bez anomalija i sistematizovani na pravi način, postoji velika verovatnoća da će rezultat modelovanja biti zadovoljavajuć i da ćemo dobiti odgovore na sva pitanja. Ukoliko se pokaže da je bilo propusta u prethodnoj fazi, potrebno je sagledati u kojoj meri nedostajući podaci mogu ugroziti krajnji rezultat. Ako je zaključak negativan, bolje da se vratimo nekoliko koraka unazad nego da sletimo sa puta.

 

Na kraju putovanja, kada su nam svi odgovori sa početka već poznati, treba da izaberemo najbolje slike iz našeg aparata i da u fazi vizualizacije na jednostavan i razumljiv način predstavimo rezultate analiza. Na koji način će rezultati biti predstavljeni, svakako zavisi od publike. Sasvim je drugačiji prikaz namenjen top menadžmentu, kolegama iz sektora ili funkcionalnim menadžerima specijalizovanim za neki segment poslovanja. Samim tim je i izbor alata za vizualizaciju prilagođen onome ko donosi poslovne odluke, a sve sa ciljem što boljeg razumevanja naše analize.

 

Način interpretacije ovde ima ključnu ulogu, jer uzaludno je putovanje samo po sebi ako nakon njega ne ostane dobra priča na osnovu koje će se doneti kvalitetna poslovna odluka.

 

Tekst je preuzet iz Controlling magazina #14. Ceo magazin možete pročitati na ovom linku.

Još zanimljivih tekstova možete pročitati na ovom linku.