niedziela, 31 sierpnia 2008

Porównanie odwiedzin w serwisie internetowym.

Często lubimy porównywać ze sobą rożne serwisy internetowe. Ale tym razem sprawdzimy hipotezę zerową że pomiędzy odwiedzinami w dwóch tygodniach nie ma większej różnicy.
A hipoteza alternatywna poinformuje nam że że istnieje jakaś różnica pomiędzy odwiedzinami w serwisie internetowym (a jeżeli będzie istniała to trzeba będzie dokonywać dalszych badań w celu wskazania i odkrycia jakiejś relacji).

Analityk dostał informacje że w tygodniu 10-16 sierpnia w pewnym serwisie internetowym były codzienne takie odwiedziny: 43, 69, 84, 85, 82, 21, 34. Razem odwiedzin było 418, co daje średnią 59,51 odwiedzin na dzień. Następnie dostał dane z 17-23 sierpnia następującymi danymi 35, 89, 77, 68, 76, 75, 29, razem daje to 449 z średnią 64,14 odwiedzin na dzień.
Analityk ma 2 próby. I chce dokonać porównania wariancji 2 prób, aby stwierdzić czy są istotne różnice w tych odwiedzinach a potem z testu t chce wywnioskować podobieństwa z średnich odwiedzin.
Wariancja z pierwszego tygodnia wynosi 708,57, a wariancja z drugiego tygodnia wynosi 523,48 a w obu przypadkach stopnie swobody wynoszą 6. Do mierzenia rozkładu z różnicy wariancji używa się rozkładu F. Rozkład F to stosunek wariancji z dwóch prób.
W naszym przypadku dla 5% stopnia ufności, przy 6 stopniach swobody statystyka F wynosi 4,284. Stosunek wariancji odwiedziń serwisu wynosi 1,35 co jest mniejszą wartością niż wartośc teoretyczna. Analityk więc wnioskuje że nie ma istotnych róznic w wariancjach odwiedziń. W tej sytuacji pozostaje jemu jeszcze sprawdzić jak bardzo do siebie są dopasowane te próby inaczęj pisząc sprawdzić stopień podobieństwa. Hipoteza zerowa mówi, że średnie odwiedziń swerwisu internetowego nie różnią się czyli są podobne do siebie.
W tym przypadku najpierw trzeba obliczyć stopnie swobody dla testu t: jest nią suma wszystkich danych minus 2 czyli 12 Teoretyczna wartość testu t dla 12 stopni swobody przy 5% poziomie ufności wynosi: 2,1788 W tym przypadku wzór na test t z 2 prób przy braku istotnych róznić w wariancjach wyglada tak jak podano w Wikipedii

|59,51 - 64,14| / Sqrt([(708,57 * 6)+(523,48*6) /7+7-2] * [(7+7)/(7*7)]) = 0.33

Znowu wartość obliczona wartośc t nie przekracza wartości z tablicowej wartości co oznacza że spełniamy hipotezę zerową. Czyli średnie odwiedziń serwisu nie róznią się od siebie przy załozeniu 5% poizomi ufności.

Podsumując statystycznie jesteśmy w stanie obliczyć to że nic się nie zmieniło w sposób istotny w odwiedzinach serwisu internetowego.

Brak komentarzy: