sobota, 2 sierpnia 2008

Analiza statystyczna serwisu internetowego

Coraz ważniejsza staje się analiza informacji z danych, które mamy w serwisach internetowych. Te dane mają na celu pokazanie w jakim stanie znajduje się serwis.

Cała sztuka polega na tym, żeby przy pomocy odpowiednich narzędzi szukać odpowiedzi. Oczywiście, że mamy coraz lepsze narzędzia do zbierania informacji o ruchu na stronach, ale bez statystyki nie ruszymy się dalej.

Istotne jest zrozumienie, że co możemy osiągnąć dzięki statystyce pozwoli na lepsze prowadzenie biznesu w internecie. Na wstępnie warto przyjrzeć się temu co ma nam do zaoferowania statystyka.

Najpierw trzeba zebrać dane, a o to już jest łatwiej. Wystarczy zainstalować Google Analytics, czy Stat24. Całe szczęście polega na tym, że pobrane dane można już pobierać w formacie Excela.

Idziemy dalej warto patrzeć na dane poprzez pryzmat wykresów. Ale wykresy to narzędzie. Oczywiście że sporo serwisów analitycznych już pozwala na prezentacje danych w postaci wykresów. W tym momencie warto spojrzeć na wykresy jako narzędzie, które pozwala nam wyciągnąć dane odnośnie tendencji centralnych. Wykresy przydadzą nam się przy testach hipotez. Gdy mamy pojedynczy zbiór danych (na przykład ilość odsłoń) to możemy zrobić test chi kwadrat na trafność dopasowania, przy wielu zbiorach danych można porównywać dane za pomocą testów F i testów Studenta.

Ale dane z serwisów internetowych mają bardzo ważny czynnik - czas. W tej sytuacji potrzebne jest narzędzie do analizy danych w kontekście czasu. Aby sprawdzić stabilność procesu (np: ilość użytkowników w serwisie) warto wykorzystać wykresy kontrolne. Gdy bardziej jest się zainteresowanym wpływem czasu na serwis to trzeba będzie dokonać analizy szeregów czasowych w celu podania prognozy przyszłych zmian.

Najciekawsza w statystyce jest analiza relacji pomiędzy wieloma czynnikami, które wpływają na serwis (na przykład wpływ pól formularza na proces zamówień). W pewnym sensie istotne jest dokonanie eksperymentów. Jak wiadomo serwisy internetowe łatwo poddać różnym eksperymentom. W tym kontekście istotne jest zaprojektowanie eksperymentu pod kątem analizy wariancji (ANOVA). Gdyby przyszło pracować na danych, które nie są wynikiem eksperymentu, ale interesuje nas jak pewne czynniki mają wpływ na te dane to wystarczy nam na początek użyć dopasowania krzywych - regresji albo korelacji.

Tak więc zaczniemy przygodę z eksploracji danych. Mnie jako programisty Adobe Flex cieszy to że są narzędzia do prezentacji danych czyli Flex Data Visualization zawierające zestaw kontrolek do wykresów i jak zaawansowane tabele przestawne

Brak komentarzy: