Główny » handel algorytmiczny » Podstawy regresji dla analizy biznesowej

Podstawy regresji dla analizy biznesowej

handel algorytmiczny : Podstawy regresji dla analizy biznesowej

Jeśli kiedykolwiek zastanawiałeś się, w jaki sposób dwa lub więcej danych odnosi się do siebie (np. Jak wpływ na PKB mają zmiany w bezrobociu i inflacji), lub jeśli kiedykolwiek miałeś szefa, poprosił cię o utworzenie prognozy lub analizę prognoz na podstawie na temat zależności między zmiennymi, warto nauczyć się analizy regresji.

W tym artykule poznasz podstawy prostej regresji liniowej, czasami nazywanej „zwykłą metodą najmniejszych kwadratów” lub regresją OLS - narzędziem powszechnie stosowanym w prognozowaniu i analizie finansowej. Zaczniemy od poznania podstawowych zasad regresji, najpierw poznając kowariancję i korelację, a następnie przechodząc do budowania i interpretowania wyników regresji. Popularne oprogramowanie biznesowe, takie jak Microsoft Excel, może wykonać wszystkie obliczenia i wyniki regresji dla Ciebie, ale nadal ważne jest poznanie podstawowych mechanizmów.

Zmienne

Sercem modelu regresji jest związek między dwiema różnymi zmiennymi, zwanymi zmiennymi zależnymi i niezależnymi. Załóżmy na przykład, że chcesz prognozować sprzedaż dla swojej firmy i doszedłeś do wniosku, że sprzedaż firmy rośnie i maleje w zależności od zmian PKB.

Prognozowana sprzedaż byłaby zmienną zależną, ponieważ ich wartość „zależy” od wartości PKB, a PKB byłby zmienną niezależną. Następnie należy określić siłę związku między tymi dwiema zmiennymi w celu prognozowania sprzedaży. Jeśli PKB wzrośnie / spadnie o 1%, o ile zwiększy się lub zmniejszy sprzedaż?

Kowariancja

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {aligned} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {wyrównany} Cov (x, y) = ∑N (xn-xu) (yn -yu)

Wzór do obliczania zależności między dwiema zmiennymi nazywa się kowariancją. To obliczenie pokazuje kierunek relacji. Jeśli jedna zmienna rośnie, a druga również ma tendencję do wzrostu, kowariancja będzie dodatnia. Jeśli jedna zmienna wzrośnie, a druga obniży się, wówczas kowariancja będzie ujemna.

Rzeczywista liczba uzyskana z obliczenia tego może być trudna do interpretacji, ponieważ nie jest znormalizowana. Na przykład kowariancję pięciu można interpretować jako związek pozytywny, ale siłę związku można powiedzieć tylko, że jest silniejsza niż wtedy, gdy liczba jest cztery lub słabsza niż gdyby liczba była sześć.

Współczynnik korelacji

Korelacja = ρxy = Covxysxsy \ begin {wyrównany} i Korelacja = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {wyrównany} Korelacja = ρxy = sx sy Covxy W pobliżu

Musimy ujednolicić kowariancję, aby umożliwić nam lepszą interpretację i wykorzystanie jej w prognozowaniu, a wynikiem jest obliczenie korelacji. Obliczenie korelacji po prostu bierze kowariancję i dzieli ją przez iloczyn odchylenia standardowego dwóch zmiennych. Wiąże to korelację między wartością -1 a +1.

Korelację +1 można interpretować, aby zasugerować, że obie zmienne poruszają się ze sobą idealnie dodatnio, a -1 oznacza, że ​​są one całkowicie skorelowane ujemnie. W naszym poprzednim przykładzie, jeśli korelacja wynosi +1, a PKB wzrośnie o 1%, sprzedaż wzrośnie o 1%. Jeśli korelacja wynosi -1, wzrost PKB o 1% spowodowałby 1% spadek sprzedaży - dokładnie odwrotnie.

Równanie regresji

Teraz, gdy wiemy, w jaki sposób obliczana jest relacja względna między dwiema zmiennymi, możemy opracować równanie regresji do prognozowania lub przewidywania pożądanej zmiennej. Poniżej znajduje się wzór na prostą regresję liniową. „Y” to wartość, którą próbujemy przewidzieć, „b” to nachylenie linii regresji, „x” to wartość naszej niezależnej wartości, a „a” oznacza przecięcie y. Równanie regresji opisuje po prostu związek między zmienną zależną (y) a zmienną niezależną (x).

y = bx + a \ begin {wyrównany} i y = bx + a \\ \ end {wyrównany} y = bx + a

Punkt przecięcia lub „a” to wartość y (zmienna zależna), jeśli wartość x (zmienna niezależna) wynosi zero, a więc czasami jest po prostu nazywana „stałą”. Więc jeśli nie nastąpiłaby zmiana PKB, Twoja firma nadal osiągałaby pewną sprzedaż - ta wartość, gdy zmiana PKB wynosi zero, stanowi punkt przecięcia. Spójrz na poniższy wykres, aby zobaczyć graficzne przedstawienie równania regresji. Na tym wykresie jest tylko pięć punktów danych reprezentowanych przez pięć kropek na wykresie. Regresja liniowa próbuje oszacować linię, która najlepiej pasuje do danych (linia najlepszego dopasowania), a równanie tej linii skutkuje równaniem regresji.

Ryc. 1: Linia najlepszego dopasowania

Źródło: Investopedia

Regresje w programie Excel

Teraz, gdy rozumiesz niektóre podstawy analizy regresji, zróbmy prosty przykład, korzystając z narzędzi regresji programu Excel. Wykorzystamy poprzedni przykład próby prognozowania sprzedaży w przyszłym roku na podstawie zmian PKB. W następnej tabeli wymieniono niektóre sztuczne punkty danych, ale liczby te mogą być łatwo dostępne w prawdziwym życiu.

RokObrotyPKB
20141001, 00%
2015 r2501, 90%
2016 r2752, 40%
2017 r2002, 60%
2018 r3002, 90%

Wystarczy spojrzeć na stół, by zobaczyć, że istnieje pozytywna korelacja między sprzedażą a PKB. Oba zwykle idą w górę razem. Korzystając z programu Excel, wystarczy kliknąć menu rozwijane Narzędzia, wybrać opcję Analiza danych, a następnie wybrać opcję Regresja . Stąd wyskakujące okienko jest łatwe do wypełnienia; twój zakres wejściowy Y to kolumna „Sprzedaż”, a twój zakres wejściowy X to kolumna zmiany PKB; wybierz zakres wyjściowy, dla którego chcesz wyświetlać dane w arkuszu kalkulacyjnym, i naciśnij OK. Powinieneś zobaczyć coś podobnego do tego, co podano w poniższej tabeli:

Współczynniki statystyki regresji

Wiele R0, 8292243Przechwycić34, 58409

plac R


0, 687613PKB88, 15522
Skorygowana
plac R


0, 583484

-


-


Standardowy błąd51, 021807-

-


Spostrzeżenia5

-


-


Interpretacja

Główne wyniki, o których należy się martwić w przypadku prostej regresji liniowej, to kwadrat R, intercept (stały) i współczynnik beta (b) PKB. Liczba R-kwadrat w tym przykładzie wynosi 68, 7% - pokazuje to, jak dobrze nasz model przewiduje lub prognozuje przyszłą sprzedaż, co sugeruje, że zmienne objaśniające w modelu przewidywały 68, 7% zmienności zmiennej zależnej. Następnie mamy przecięcie 34, 58, które mówi nam, że gdyby prognozowano zmianę PKB na zero, nasza sprzedaż wyniósłaby około 35 jednostek. I wreszcie współczynnik beta PKB lub współczynnik korelacji 88, 15 mówi nam, że jeśli PKB wzrośnie o 1%, sprzedaż prawdopodobnie wzrośnie o około 88 jednostek.

Dolna linia

Jak więc używałbyś tego prostego modelu w swojej firmie ">

Oczywiście jest to tylko prosta regresja i istnieją modele, które można zbudować przy użyciu kilku niezależnych zmiennych zwanych wieloma regresjami liniowymi. Ale wiele regresji liniowych jest bardziej skomplikowanych i wiąże się z kilkoma problemami, które wymagałyby omówienia w kolejnym artykule.

Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.
Zalecane
Zostaw Swój Komentarz