poniedziałek, 8 września 2008

Współczynniki korelacji i regresja liniowa odwiedzin serwisu internetowego

Zawsze mnie intrygowało co ma większy wpływ na ruch w serwisie internetowym. Zazwyczaj miarą jest ilość odwiedzin. Zazwyczaj wyróżnia się ruch z wyszukiwarek,wejścia bezpośrednie i jak wejścia ze stron internetowych, a także wskutek działań marketingowych. Jak wiadomo możemy mierzyć jak zachodzą relację pomiędzy odwiedzinami w całości a poszczególnymi odwiedzinami.
Otóż statystycy wymyślili narzędzie do mierzenia zależności czyli to jest korelacji. Do określania wartości zależności pomiędzy tymi danymi nazywamy współczynnikiem korelacji.Mamy zbiór danych z wszystkich odwiedzin:
88,73,47,42,69,84,85,82,21,34,35,89,77,68,76,75,29,37,81,86,96,75,52,40,34,70,83,88,83,92,44
Mamy też zbiór danych o odwiedzinach ze stron internetowych.
30,26,15,16,18,23,23,25,15,14,13,28,25,16,25,21,9,17,25,25,21,18,13,15,20,26,18,28,22,21,14
Mamy też informacje jaki udział odwiedzin był też z wyszukiwarek internetowych
13,13,14,6,11,19,13,13,1,8,10,16,18,9,14,10,1,5,16,18,24,23,15,5,6,13,19,21,26,25,8
A także jakie udział w tych wszystkich odwiedzinach mieli nowi użytkownicy:
63,58,39,34,43,61,51,59,18,25,26,52,57,39,50,45,15,31,48,61,59,46,35,28,28,51,51,54,42,46,24

Korelacja oznacza możliwość oszacowania tendencji wpływu pomiędzy 2 cechami Wartość współczynnika korelacji może być od -1 do 1
W naszym przypadku interesują następujące korelacje:
wszystkich odwiedzin do odwiedzin ze stron internetowych - współczynnik wynosi 0,78
wszystkich odwiedzin do odwiedzin z wyszukiwarek internetowych - współczynnik wynosi 0,82
wszystkich odwiedzin do odwiedzin osób których system raportujący potraktował jako nowych użytkowników 0,91

Wskaźniki korelacji są bardzo silne. Można by powiedzieć że odwiedziny z wyszukiwarki mają większy wpływ na wynik niż z linki serwisów zewnętrznych w przypadku tego serwisu.

Analityk nie poprzestanie na tym i spróbuje dokonać model który pozwoli mu na dość bezpieczne określanie jak te zależności wpływają na siebie. Do tego wystarczy mu równanie regresji liniowej: takie proste narzędzie dzięki któremu można by prognozować odwiedziny przy założeniu nie nie robimy większych zmian. Czyli nic się nie dzieje szczególnego w serwisie, ani w internecie.

Najlepszy sposób poznawania problemów i rozwiązywania ich przypomina "przepisy kuchenne". Mamy wysmażyć wzór dzięki któremu będziemy mogli dowiedzieć się ile trzeba odwiedzin ze stron internetowycxh żeby można było osiagnąć ponasd 200 odwiedzin.

Składniki do wzoru "kuchennego" regresji liniowej:
Dane z wszystkich odwiedzin.
Dane o odwiedzinach ze stron internetowych.
Współczynnik korelacji wszystkich odwiedzin do odwiedzin ze stron internetowych - 0,78.
Odchylenie standardowe wszystkich odwiedzin - 22,52.
Odchylenie standardowe odwiedzin ze stron - 5,38.
Średnia ze wszystkich odwiedzin - 65,65.
Średnia z odwiedzin ze stron - 20,16.

Obliczamy wagę = Współczynnik korelacji*(Odchylenie standardowe odwiedzin ze stron/Odchylenie standardowe wszystkich odwiedzin)
Waga wynosi 0,19
Pozostaje jeszcze obliczenie stałej:
Stała = Średnia z odwiedzin ze stron - (Waga * Średnia ze wszystkich odwiedzin)
Stała w tym przypadku wynosi 7,94

Na koniec pozostaje nam zrobienie przyprawy na patelni wg przepisu na ilość odwiedzin ze stron:
Waga * 200 wszystkich odwiedzin + stała
Na talerzu otrzymamy 45,16 odwiedzin ze stron.

Gdy się najemy - trzeba zrozumieć, że to jest spekulacja, ale lepiej zajmować się spekulacją opartą na modelu tego co było czyli na równaniu regresji liniowej.

Brak komentarzy: