Większości firm brakuje jasnego przywództwa, skutecznej komunikacji między zespołami i… danych.
Jak inwestować w ML to z głową
Firmy przeżywają en gros ciężkie czasy i nie chodzi tylko o pandemię. Po prostu czasy są niepewne więc wyczuwanie potrzeb klientów jest chyba trudne jak nigdy dotąd. W tym świetle zrozumiałe staje się inwestowanie miliardów dolarów w rozwój modeli uczenia maszynowego, co ma ulepszyć oferowane produkty. Ale, ale - firmy nie mogą po prostu inwestować na ślepo w naukowców zajmujących się danymi i deweloperów od uczenia maszynowego (machine learning, ML) mając nadzieję, że wydarzy się jakaś magia i powstanie z tego wartościowy model.
Dane mówią zresztą same za siebie. Jak donosi VentureBeat, w zeszłym roku około 90% modeli uczenia maszynowego nigdy nie trafiło do produkcji. Innymi słowy, tylko co dziesiąty dzień pracy analityka danych faktycznie kończy się produkcją czegoś przydatnego dla firmy. I mimo, że aż 9 na 10 dyrektorów ds. technologii uważa, że sztuczna inteligencja znajdzie się w centrum kolejnej rewolucji technologicznej, jej masowe przyjęcie i wdrożenie to ciągle pieśń bliżej niedającej się zdefiniować przyszłości. A naukowcy zajmujący się danymi nie są tymi, których można winić za opóźnienia w rozwoju.
Dobre szefostwo to więcej niż pieniądze
Rynek pracy dla analityków danych jest całkiem niezły. Firmy zatrudniają i są również gotowe zapłacić dobrą pensję fachowcom. Oczywiście menedżerowie czy liderzy oczekują od tych analityków, że w zamian dodadzą wartość do firmy ale czy sami ułatwiają im to? Jak to ujmuje Chris Chapo, starszy wiceprezes ds. danych i analityki w GAP:
Czasami ludzie myślą, że wszystko, co muszę zrobić, to zasypać problem pieniędzmi lub wprowadzić odpowiednią technologię a sukces sam wyjdzie z drugiej strony.
Aby pomóc analitykom danych w osiągnięciu maksymalnej wydajności, liderzy nie tylko muszą kierować zasoby we właściwym kierunku, ale także rozumieć, na czym polegają modele uczenia maszynowego. Jednym z możliwych rozwiązań jest to, że liderzy sami przechodzą szkolenie wprowadzające do nauki o danych, aby mogli wykorzystać tę wiedzę w praktyce w swoich firmach.
Brak dostępu do danych
Firma nawet jak potrafi zbierać dane to niekonieczne robi to w sposób przydatny dla machine learningu. Wiele firm jest silnie ukierunkowanych na potrzeby swoich jednostek organizacyjnych co oznacza, że każdy dział ma swoje własne sposoby gromadzenia danych, preferowane formaty, miejsca ich przechowywania oraz preferencje dotyczące bezpieczeństwa i prywatności.
A analitycy danych często potrzebują danych z kilku działów. Tymczasem wzmiankowane wyżej zjawisko, określane polskim terminem „silosowanie”, utrudnia przetwarzanie tych danych. Co więcej, wielu naukowców zajmujących się danymi skarży się, że nie mogą nawet w ogóle uzyskać potrzebnych im danych z konkretnych jednostek biznesowych. A jak w ogóle zacząć trenować model, jeśli nie masz go czym nakarmić? W erze, w której transformacja technologiczna rozpędziła się do zawrotnej prędkości, firmy też muszą przyspieszyć i stworzyć jednolite struktury danych w całym swoim „biznesie”.
Rozdźwięk między informatyką, nauką o danych i rozwojem oprogramowania
Działy muszą się też ze sobą lepiej komunikować i dostosowywać swoje cele do potrzeb. O co chodzi? W wielu firmach istnieje fundamentalny podział między działami IT i data science. Dział IT ma tendencję do priorytetowego traktowania działania i utrzymywania stabilności. Z drugiej strony naukowcy zajmujący się danymi lubią eksperymentować i… niszczyć rzeczy. To nie prowadzi do skutecznej komunikacji, trudno tu też o wspólnotę celów.
Ponadto inżynieria oprogramowania nie zawsze jest uważana za wiedzę niezbędną dla naukowców zajmujących się danymi. Jest to problem, ponieważ deweloperzy mogą nie zawsze rozumieć wszystkie szczegóły rozwiązań wymyślanych przez „data ekspertów” lub też mogą wdrażać je w inny sposób z powodu nieporozumień. Dlatego naukowcy zajmujący się danymi, którzy potrafią samodzielnie wdrażać swoje modele, mają przewagę konkurencyjną nad tymi, którzy tej umiejętności nie posiadają – i według StackOverflow częściej dochodzi wtedy do faktycznego użycia modelu w produkcji a w każdym razie poza ścisłym „labem”.