Badacz danych poszukiwany

Marta Piątkowska
13.07.2015 , aktualizacja: 13.07.2015 12:56
A A A

Kacper Pempel/Reuters

Hal Varian, główny ekonomista Google, uważa, że badacz danych jest jednym z najbardziej pożądanych zawodów tej dekady. Szacuje się, że do 2020 r. na amerykańskim rynku pracy może zabraknąć nawet 4 mln tych specjalistów.
Jeszcze w 2008 r. żaden z użytkowników międzynarodowego biznesowego serwisu społecznościowego LinkedIn nie pracował na stanowisku Big Data Scientist. Pięć lat później było ich blisko 3,5 tysiąca. Kiedy w 2013 r. Uniwersytet w Iowa uruchomił kierunek Analityka Biznesowa i Systemy Informacyjne, zapisało się na niego niewiele ponad 170 studentów.

Dziś już wiadomo, że za kolejne pięć lat potentaci z Doliny Krzemowej będą mieć poważny problem z obsadzeniem wakatów w tym sektorze. O światowym zagłębiu IT można powiedzieć wiele, ale na pewno nie to, że czeka na przyszłość z założonymi rękoma. Niedawno Josh Sullivan, lider niemal półtysięcznej grupy "badaczy danych" w firmie konsultingowej Booz Allen Hamilton podkreślał, że jeżeli ktoś w swoim profilu zawodowym na wspomnianym LinkedIn ma wpisane "data science", to pewnie otrzymuje do stu maili dziennie. Wszystkie zawierają propozycję zatrudnienia.

Dostrzec trendy

- Pracownicy sektora Big Data są specjalistami do spraw pozyskiwania, analizowania, segmentowania i interpretowania informacji, jakie internauci pozostawiają po sobie na witrynach. Ich wiedza jest połączeniem wiadomości z zakresu ekonomii, matematyki, statystyki oraz nowych technologii. Właśnie do tych nauk nawiązuje termin "scientist" czyli naukowiec/badacz, używany w nazwie tego zawodu - tłumaczy Piotr Prajsnar, CEO Cloud Technologies, największej platformy Big Data w Polsce. - Profesja badacza danych nawiązuje do wcześniejszej koncepcji "data miningu", czyli "górnictwa danych". Ktoś, kto pracuje jako Big Data Scientist, odpowiedzialny jest za analizowanie i poszukiwanie pewnych prawidłowości w dużych i złożonych zbiorach danych. To swego rodzaju "górnik danych", który przesiewa grunt, szukając drobin złota, czyli wartościowych elementów, które są w tych dużych zbiorach danych niejako ukryte - dodaje Prajsnar.

Kiedy już badacz danych urobi się po łokcie, efekty jego pracy mogą nas mocno zaskoczyć. Obrazowo opowiedział o nich w rozmowie z "Wyborczą" Rick Smolan, amerykański fotograf, autor albumu fotograficznego "The human face od Big Data" ("Ludzka twarz Big Data").

- Analitycy sieci supermarketów Traget napisali program, który na podstawie zakupów dokonywanych przez stałe klientki odgadywał, która z nich zaszła w ciążę - mówił Smolan. Wszystko po to, żeby w odpowiednim czasie - czyli kiedy przyszła mama zacznie myśleć o wyprawce - móc zasypać ją reklamami produktów dla niemowląt.

Ciąża to jedno, ale z na pozór nic nieznaczących, porozbijanych na dziesiątki miejsc danych można stworzyć algorytm, który przypisze nas do grupy osób zagrożonych rozwodem. Smolan tłumaczy. - Bank na podstawie transakcji dokonywanych kartą może przewidzieć, który klient w ciągu dwóch lat się rozwiedzie. Np. regularnie wynajmuje pokój w hotelu, choć w tym samym mieście ma swój dom albo wysyła kwiaty pod obcy adres. Algorytm bierze pod uwagę kilkadziesiąt czynników i jeśli układają się w znany wzór, bank ma prawo podejrzewać, że klienta czekają małżeńskie komplikacje - opowiada. To skomplikowany mechanizm, który po przemieleniu tysięcy informacji zbieranych w czasie jest w stanie stwierdzić, które kwiaty dostała na imieniny ciocia, a które potencjalna kochanka.

Co ciekawe, wcale nie trzeba mieć czegoś na sumieniu, żeby zostać zakwalifikowanym np. do grupy klientów obarczonych ryzykiem. Wystarczy zmienić upodobania zakupowe. - Niepokojącym sygnałem jest to, że klient nagle zaczyna robić zakupy w tańszych sklepach. Mój znajomy ostrzegł córkę, która słucha rapu, a muzykę kupuje w sklepach internetowych, że taka informacja może zaciążyć na jej ocenie kredytowej. Bo słuchanie rapu to dla banku także jeden z czynników ryzyka. Ubezpieczyciele w Stanach Zjednoczonych oferują kierowcom urządzenie, które rejestruje położenie auta, prędkość, przyspieszenie, hamowanie, pokonywany dystans. Ten, kto zgodzi się je zainstalować, dostaje 10-15 proc. zniżki, ale jednocześnie godzi się na permanentną inwigilację - wyjaśniał na początku 2013 r. Amerykanin.

Dywan, który dba o zdrowie

Choć ze świadomością, że fakt, gdzie kupujemy bułki na śniadanie, może mieć wpływ na naszą zdolność kredytową, trudno poczuć się komfortowo, to trzeba dodać, że praca badaczy danych przynosi wiele korzyści dla ludności. I może ratować życie.

Przykładem może być specjalny dywan opracowany we współpracy z firmami Intel i GE. Naszpikowano go czujnikami i zostawiono na podłogach w domach starszych osób. Przez tydzień zbierał informacje o tym, kiedy szły do łóżka i kiedy z niego wstawały. Jaki miały chód? Czy powłóczyły nogami, a może szły dziarsko? Na tej podstawie powstał model, który określał "zdrowe zachowania", które świadczą o tym, że ze staruszkami nie dzieje się nic podejrzanego. Gdyby w pewnym momencie ich chód się zmienił, nie wstaliby z łóżka o swojej porze albo w ogóle do niego nie dotarli, jakkolwiek dziwnie by to nie zabrzmiało - dywan, a raczej urządzenie z nim współpracujące poinformowałoby o tym fakcie rodzinę lub lekarzy.

Kolejny przykład przytoczony przez Smolana dotyczy kontroli wydatków na służbę zdrowia. Amerykanin dr Jeffrey Brenner przeanalizował zbiór danych zawierający opisy 600 tys. szpitalnych wizyt w stanie New Jersey i odkrył, że 30 proc. kosztów leczenia generuje zaledwie 1 proc. pacjentów, którzy jak boomerang wracali na kolejne zabiegi. Ale stan ich zdrowia wcale się nie pogarszał, po prostu nie przyjmowali przepisanych leków i generalnie nie stosowali do zaleceń lekarzy. Wystarczyło wysłać do nich pielęgniarki, które doprowadziły ich do porządku. Efekt? Przestali pojawiać się w szpitalu, a koszty utrzymania placówki spadły.

Ważna praca, a jaka płaca?

I tu pojawia się problem, bo choć wiadomo, że branża IT w każdym możliwym rankingu jest tą najlepiej płacącą, to ile dokładnie wpływa na konto badaczy - nie wiadomo. W Polskich raportach płacowych takie stanowisko nie istnieje. W Stanach Zjednoczonych portal DataJobs oszacował średnie zarobki początkujących badaczy danych na 50-75 tys. dol. rocznie. W przypadku doświadczonych analityków to już pensja rzędu 65-110 tys. dolarów. Z kolei według Burtch Works mediana zarobków badacza ze stażem do 3 lat, dyplomem uniwersyteckim i dobrą znajomością języków programowania oraz metod statystycznych wynosi 80 tys. dolarów. Ci, którzy pracują w branży dłużej, mogą liczyć nawet na 150 tys. dol. To kwoty, które zarabiają prawnicy, lekarze i doświadczeni programiści.

Ameryka Ameryką, ale co z nami? W Polsce rynek Big Data dopiero raczkuje. Na portalach z ogłoszeniami o pracę można znaleźć oferty, ale rekruterzy szukają specjalistów lub osób, które mogą się nimi stać, na własną rękę.

Polskie uczelnie również starają się nie być w tyle. Szkoła Główna Handlowa w październiku zeszłego roku uruchomiła pierwszą edycję studiów podyplomowych: Inżynieria Danych - Big Data. Z kolei Politechnika Warszawska od 2012 organizuje seminaria poświęcone tematyce Big Data.

Praca oparta o analizę danych przyjmuje różne oblicza. Analitycy twierdzą, że nie ma zagadnienia, którego nie dałoby się przedstawić za pomocą liczb. Ten trend dotarł m.in. do świata mediów, które w ostatnim czasie dorobiły się "data journalism", czyli opowiadania historii poprzez analizę i wizualizacje danych.

- Informacje w tej formie są atrakcyjne i szybsze w odbiorze, pozwalają czytelnikowi zajrzeć głębiej, odkryć coś, czego nie zauważył wcześniej. Z kolei mediom pozwalają w pełni wykorzystać możliwości, które daje internet, czyli nie tylko szybko znajdować dane, ale także je aktualizować. Dziennikarstwo danych jest jednak czasochłonne, pracochłonne i wymaga nowych kompetencji w redakcji, a to oznacza inwestycje po stronie wydawców. Z kolei od dziennikarzy wymaga to umiejętności i dużo pasji, żeby w cyferkach dojrzeć historię - mówi Vadim Makarenko, dziennikarz "Gazety Wyborczej" i szef serwisu BIQdata.pl.

Zobacz także
Skomentuj:
Zaloguj się lub komentuj jako gość

Aby ocenić zaloguj się lub zarejestrujX