Nie jestem analitykiem. To znaczy nie chodzi o to, że mnie to nie kręci, raczej po prostu się do tego specjalnie nie nadaję. Ok, długie godziny spędzone nad porównywaniem danych i żonglowaniem nimi chyba rzeczywiście nie są dla mnie fascynujące, choć uwielbiam patrzeć na gotowe wyniki i wnioski. Szczególnie te bardzo zaskakujące i nietypowe. Pamiętam książkę „Freaconomics“ w której to autorzy analizowali mnóstwo zależności i prezentowali wyniki badań – ot choćby dlaczego dealerzy narkotyków w USA mieszkają z matkami. Tak, tak, da się to obliczyć za pomocą liczb. Fascynujące, prawda?
Mnie jednak brakuje cierpliwości i jednak – nie bójmy się tego powiedzieć – umiejętności analitycznych potrzebnych badaczowi. Wymaga to często ogarnięcia sporej ilości danych, odpowiedniego uporządkowania ich w głowie, nawet na wstępnym etapie. A to rzeczywiście bywa trudne.
Moja pierwsza styczność z danymi jako takimi, to studia i przedmiot „Bazy danych“. To właśnie tam nauczyłem się podstaw i gimnastykowałem umysł ubierając rzeczywistość w tabele oraz łączące je relacje. Wbrew pozorom to wcale nie było takie proste.
Lata mijały, a ja jakoś omijałem konieczność korzystania z obróbki danych. Gdy pracowałem w agencji reklamowej, robił to za mnie ktoś inny – ja zlecałem coś działowi badań, a po jakimś czasie dostawałem slajdy z kolorowymi słupkami. Prawda, że piękne?

Czas liczb

Aż… aż zagłębiłem się w e-commerce. Bo to właśnie on spowodował, że mniej lub bardziej trzeba było sięgnąć do danych i wyczytać z nich to i owo. Z danych, a dokładnie z Google Analyticsa, bo to podstawowe narzędzie badawcze. Tu nie trzeba było nic udowadniać klientowi, to ja byłem klientem, a z danych musiałem wyciągać twarde wnioski – to od nich zależy nasz rozwój oraz ocena decyzji, które podejmowaliśmy. I powiem szczerze, że czułem się – i czuję nadal – średnio. Bo jak pisałem, to nie do końca moja bajka.

Kiedy dostałem propozycję przetestowania systemu Watson Analytics od IBM wyobraziłem sobie od razu olbrzymi superkomputer, który przeżuje moje dane i powie co mam robić. Coś jak HAL w Odysei Kosmicznej (swoją drogą zdajesz sobie sprawę, co stanie się gdy w nazwie HAL każdą literę zastąpimy następną w alfabecie? ;) )

Ale czym w ogóle jest Watson Analytics? To system będący częścią większego projektu IBM Watson, który dąży do jak najlepszego odwzorowania systemu myślenia człowieka. Nigdy nie wątpiłem, że to właśnie przyszłość – nasza naturalna mowa jest najlepszym interfejsem jaki znamy! Watson Analytics pozwala zadawać pytania w naturalny sposób, analizuje wyniki, przedstawia je w “ludzki” sposób i podpowiada inne podobne zapytania pozwalając rozwijać tok myślenia.

Tu nie chodzi tylko o moc obliczeniową –  ja wcale nie dysponowałem aż taką ilością danych, która przerastałaby mojego zwykłego macbooka, a już na pewno mojego PC. To nie lata 80, choć pewnie i wtedy ta ilość danych nie stanowiłaby większego problemu. Ale to właśnie sposób obsługi i interfejs stanowią siłę tego programu.

Pierwsze kroki i import danych

Już do początku oczekiwałem prostoty. Nie znam się na specjalistycznych programach do obróbki danych i nie chcę się znać. Mam jednak – co warto podkreślić – podstawowe umiejętności ogarniania danych. Zarówno techniczne – obsługa excela, jak i logiczne. Ale chyba nikt, kto nie ogarnia wierszy i kolumn nie bierze się za tego typu sprawy :)

Postanowiłem więc wrzucić do Watsona moje podstawowe dane sprzedażowe z koszulkowo.com – ilość sprzedanych produktów, obroty, konwersję i inne. Ale to wszystko mało. W moim biznesie pogoda jest dość ważnym czynnikiem. Wiem oczywiście, że im cieplej tym lepsza sprzedaż koszulek, ale postanowiłem wyszukać czegoś więcej. Co ważne, wszystko należy scalić w jeden arkusz, ale to raczej dość prosta sprawa wymagająca jedynie używania CMD-C i CMD-V.

Wrzucanie danych

Dane możemy wrzucić w formie pliku csv, ale także excela, można połączyć się bezpośrednio z bazą danych jeśli mamy taką ochotę.

Co jeszcze można wrzucić Watsonowi? Praktycznie wszystko co możemy opisać w arkuszu. Sprzedaż, data sprzedaży, źródło ruchu, czas od pierwszej wizyty na serwisie, czas od ostatniego zakupu, liczba kupionych produktów, wartość sprzedaży, wykorzystywana forma płatności, region użytkownika, itd.

Watson przemawia

Watson zaczął trawić moje dane i proponować pytania. Tak, bo komunikacja z nim przebiega za pomocą normalnych pytań. Które – co od razu zauważyłem – wychwytują nawet literówki. Pierwszy problem polegał na tym, że moje dane pochodziły z Google’a, który sam proponuje wyświetlanie podstawowych zależności i wykresów. Zdaję sobie jednak sprawę, że dla większości danych nie e-commercowych nawet takie podstawowe wykresy są czymś przydatnym.

Zacząłem więc zadawanie kolejnych pytań i klikanie po systemie. Wizualizuje on dość szybko dane, a pasek z boku podpowiada inne ciekawe „discoveries“ czyli zestawienia danych.

Podpowiedzi systemu - można szybko tworzyć nowe porównania i wykresy

Podpowiedzi systemu – można szybko tworzyć nowe porównania i wykresy

Podstawowe dane to oczywiście sprzedaż po dniach tygodnia. Nie będę tu oczywiście pokazywał wszystkich danych, bo konkurencja tylko na to czeka ;)

System niestety nie myśli za nas ;) Sami musimy zdecydować, czy podsuwane rozwiązania mają sens ze względu na to jakiego typu dane mu wrzucamy. I tak pytanie „what drives temperature“ raczej nie będzie miało sensu :)

Zestawianie danych pogodowych ze sprzedażą przyniosło oczekiwane rezultaty – okazało się oczywiście, że ciepłe miesiące to lepsza sprzedaż koszulek, choć grudzień zaburza wszelkie wyliczenia – co zrobić, Boże Narodzenie!

Natomiast niespodzianką było zestawienie pogody i konwersji, czyli stosunku klientów którzy kupili towar do tych którzy weszli do sklepu. Okazało się, że najwyższą konwersję możemy zaobserwować… w trakcie burzy! Może to uderzenia pioruna powodują, że ludzie podejmują szybciej decyzje? ;)

W każdym razie pokazało to dokładnie siłę tego systemu – to nie ja musze wpadać na wszelkie możliwe zestawienia, system sam proponuje ich multum, a “bieganie” po nich jest bardzo łatwe i proste.

Spróbować może każdy – system można testować za darmo przez 30 dni. Jeśli więc masz jakiekolwiek dane, które chcesz zobrazować, czy w których chcesz wychwycić zależności – warto! Wystarczy wejść tu i zarejestrować darmowe konto: http://www.ibm.com/analytics/pl/pl/watson-analytics/

Miłej – i co ważne konstruktywnej – zabawy!

Podziel się!

Udostępnij notkę znajomym: