niedziela, 3 sierpnia 2008

Średnia w serwisie internetowym

Dzięki statystyce lepiej się czuję z danymi, które mam z narzędzi raportujących. Zbieramy informacje aby ustalić zjawiska, które rządzą serwisem internetowym. Dane inaczej nazywane zmiennymi maja reprezentować pomiary czyli to co mierzymy. W serwisie internetowym pomiary dotyczą użytkowników, albo odsłon. Statystycy mogą powiedzieć, że ten pomiar jest ciągły. Te dane czyli zmienne podlegają kategoryzacji (segmentacji). Są to cechy danych, które podlegają pomiarowi. W przypadku serwisu może to być podział użytkowników na nowych i jak tych powracających. Statystycy mogą określić to jak atrybuty zmiennych.
Średnia arytmetyczna jest łatwa w obliczeniu, ale w analizie danych z raportów z serwisów internetowych ma sens gdy dane są równomierne i stabilne. Jak wiadomo w serwisach internetowych nic nie ma stabilnego ani równomiernych danych w swoim zakresie. Na przykład w danych z transakcji w Google Analytic wynika, że większość zamówień mieszczą się w zakresie 500 - 1200 zł, ale były też 2 zamówienia za 150 zł, w tym momencie te 2 zamówienia mają zbyt duży wpływ na średnią. W tej sytuacji lepiej pokazać w raporcie medianę.
Obserwując dane z ruchu w serwisie można zauważyć wzrosty lub spadki, w tej sytuacji może zainteresować nas jak ta zmienność wpływa na ruch, tak aby wskazać jaka jest tendencja odsłon (spadkowa czy wzrostowa). W tym momencie lepiej jest użyć średniej geometrycznej. Pozwoli to na zminimalizowanie wpływu jednorazowych czynników takich jak nagły wzrost odsłon spowodowany na przykład zamieszczeniem bannera w portalu.
Otóż większość danych jakich otrzymuje się z narzędzi raportujących zawiera informacje atrybutów, czyli pozwala na obliczenie istności ( czy wag danej cechy) na serwis internetowy. Obecnie taką cechą mogą być słowa kluczowe które miały wpływ na to, że użytkownik dokonał zakupu, czy jakiegoś działania w serwisie (na przykład wypełnił formularz). W tym bardzo przydaje się średnia ważona.
Pozwolę sobie na dygresję: w szkołach w jakich się uczyłem stosowano średnią arytmetyczną do oceniania wyników w nauce. Według mnie to jest pewien niesprawiedliwy sposób oceniania uczniów i studentów. Dlaczego? Bo nie uwzględnia tego, że nauka polskiego czy matematyki jest ważniejsza od nauki religii. Za kryterium istności jest ilość godzin w tygodniu na dany przedmiot. Mogę pokazać przykład, który zmienia całkowicie sens analizy. W pewnej klasie było 5 godzin tygodniowo na lekcje języka polskiego, 4 godziny na matematykę oraz 1 godzina na naukę religii.
Mamy 3 zdolnych uczniów: uczeń A ma 4 z polskiego i z matematyki oraz 6 z religii (jego średnia arytmetyczna to 4,67), uczeń B ma 5 z polskiego oraz 4 z matematyki i z religii (jego średnia arytmetyczna to 4,33) a uczeń C ma 4 z polskiego 5 z matematyki oraz 3 z religii (jego średnia arytmetyczna to 4). Gdyby w szkołach stosowano średnią ważoną to tacy spryciarze jak uczeń A nie otrzymywali świadectwa z biało czerwonym paskiem. Średnia ważona ucznia A to 4,2 dla ucznia B to 4,5 , a uczeń C otrzymuje 4,3 (co za ironia uczeń C jest lepszy od ucznia A). Zresztą uważam, że średnia ważona za "sprawiedliwszą" miarę oceny w szkołach i na uczelni.

To samo możemy zastosować w analizie serwisu internetowego. Otóż najbardziej cenna strona na blogu to taka dzięki, której użytkownik spędza sporo czasu aby to przeczytać. W tej sytuacji robimy średnią ważoną ze średniej ilości czasu w jakim spędzają użytkownicy na tej stronie z ilością odsłoń. W ten sposób może okazać się że będziemy mieli podgląd, które artykuły na blogu są cenne.

Brak komentarzy: