Główny » handel algorytmiczny » Suma kwadratów

Suma kwadratów

handel algorytmiczny : Suma kwadratów
Co to jest suma kwadratów?

Suma kwadratów to technika statystyczna stosowana w analizie regresji w celu określenia dyspersji punktów danych. W analizie regresji celem jest określenie, jak dobrze seria danych może być dopasowana do funkcji, która może pomóc wyjaśnić, w jaki sposób seria danych została wygenerowana. Suma kwadratów jest używana jako matematyczny sposób znalezienia funkcji, która najlepiej pasuje (różni się najmniej) do danych.

Wzór na sumę kwadratów to

Dla zbioru X z n elementów: Suma kwadratów = ∑i = 0n (Xi − X‾) 2 gdzie: Xi = i-ty element w zbiorze X‾ = Średnia wszystkich elementów w zbiorze (Xi-X‾) = Odchylenie każdego elementu od średniej \ początek {wyrównany} i \ tekst {Dla zestawu} X \ text {z} n \ text {items:} \\ & \ text {Suma kwadratów} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {gdzie:} \\ & X_i = \ text {The} i ^ {th} \ text {element w set} \\ & \ overline {X} = \ text {Średnia wszystkich elementów w zestawie} \\ & \ left (X_i- \ overline {X} \ right) = \ text {Odchylenie każdego elementu od mean} \\ \ end {wyrównany} Dla zbioru X z n elementów: Suma kwadratów = i = 0∑n (Xi-X) 2 gdzie: Xi = i-ty element w zbiorze X = średnia wszystkich pozycje w zbiorze (Xi-X) = Odchylenie każdej pozycji od średniej

Suma kwadratów jest również znana jako wariacja.

Co mówi ci suma kwadratów?

Suma kwadratów jest miarą odchylenia od średniej. W statystyce średnia jest średnią zbioru liczb i jest najczęściej stosowaną miarą tendencji centralnej. Średnia arytmetyczna jest po prostu obliczana poprzez zsumowanie wartości w zbiorze danych i podzielenie przez liczbę wartości.

Załóżmy, że ceny zamknięcia Microsoft (MSFT) w ciągu ostatnich pięciu dni wynosiły 74, 01, 74, 77, 73, 94, 73, 61 i 73, 40 w dolarach amerykańskich. Suma całkowitych cen wynosi 369, 73 USD, a średnia lub średnia cena podręcznika wynosiłaby 369, 73 USD / 5 = 73, 95 USD.

Ale znajomość średniej zestawu pomiarowego nie zawsze wystarcza. Czasami dobrze jest wiedzieć, jak duża jest zmienność w zestawie pomiarów. To, jak bardzo poszczególne wartości są oddzielone od średniej, może dać pewien wgląd w dopasowanie obserwacji lub wartości do tworzonego modelu regresji.

Na przykład, jeśli analityk chciałby się dowiedzieć, czy cena akcji MSFT zmienia się równolegle z ceną Apple (AAPL), może wymienić zestaw obserwacji dla procesu obu akcji na pewien okres, powiedzmy 1, 2 lub 10 lat i utwórz model liniowy z każdą zarejestrowaną obserwacją lub pomiarem. Jeśli związek między obiema zmiennymi (tj. Cena AAPL i cena MSFT) nie jest linią prostą, wówczas istnieją różnice w zbiorze danych, które należy zbadać.

Ze statystyk wynika, że ​​jeśli linia w stworzonym modelu liniowym nie przechodzi przez wszystkie pomiary wartości, to część zmienności zaobserwowanej w cenach akcji jest niewyjaśniona. Suma kwadratów służy do obliczenia, czy istnieje zależność liniowa między dwiema zmiennymi, a każdą niewyjaśnioną zmienność określa się jako resztkową sumę kwadratów.

Suma kwadratów jest sumą kwadratu zmienności, przy czym zmienność jest definiowana jako rozrzut między każdą indywidualną wartością a średnią. Aby określić sumę kwadratów, odległość między każdym punktem danych a linią najlepszego dopasowania jest podniesiona do kwadratu, a następnie zsumowana. Linia najlepszego dopasowania zminimalizuje tę wartość.

Jak obliczyć sumę kwadratów

Teraz możesz zobaczyć, dlaczego pomiar nazywa się sumą kwadratowych odchyleń lub sumą kwadratów w skrócie. Korzystając z naszego przykładu MSFT powyżej, sumę kwadratów można obliczyć jako:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

Dodanie samej sumy odchyleń bez podniesienia do kwadratu spowoduje, że liczba będzie równa lub bliska zeru, ponieważ odchylenia ujemne prawie idealnie zrównoważą odchylenia dodatnie. Aby uzyskać bardziej realistyczną liczbę, suma odchyleń musi być podniesiona do kwadratu. Suma kwadratów zawsze będzie liczbą dodatnią, ponieważ kwadrat dowolnej liczby, dodatniej lub ujemnej, jest zawsze dodatni.

Przykład użycia sumy kwadratów

Na podstawie wyników obliczeń MSFT duża suma kwadratów wskazuje, że większość wartości znajduje się dalej od średniej, a zatem istnieje duża zmienność danych. Niska suma kwadratów odnosi się do małej zmienności w zestawie obserwacji.

W powyższym przykładzie 1.0942 pokazuje, że zmienność ceny akcji MSFT w ciągu ostatnich pięciu dni jest bardzo niska, a inwestorzy chcący inwestować w akcje charakteryzujące się stabilnością cen i niską zmiennością mogą zdecydować się na MSFT.

Kluczowe dania na wynos

  • Suma kwadratów mierzy odchylenie punktów danych od średniej wartości.
  • Wyższy wynik sumy kwadratów wskazuje na duży stopień zmienności w zbiorze danych, podczas gdy niższy wynik wskazuje, że dane znacznie różnią się od wartości średniej.

Ograniczenia użycia sumy kwadratów

Podjęcie decyzji inwestycyjnej dotyczącej tego, jaki towar kupić, wymaga znacznie więcej obserwacji niż te tutaj wymienione. Analityk może być zmuszony do pracy z wieloletnimi danymi, aby mieć większą pewność, jak wysoka lub niska jest zmienność składnika aktywów. W miarę dodawania kolejnych punktów danych do zestawu, suma kwadratów staje się większa, ponieważ wartości będą bardziej rozłożone.

Najczęściej stosowanymi pomiarami zmienności są odchylenie standardowe i wariancja. Jednak aby obliczyć którąkolwiek z tych dwóch miar, najpierw należy obliczyć sumę kwadratów. Wariancja to średnia sumy kwadratów (tj. Suma kwadratów podzielona przez liczbę obserwacji). Odchylenie standardowe jest pierwiastkiem kwadratowym wariancji.

Istnieją dwie metody analizy regresji, które wykorzystują sumę kwadratów: liniowa metoda najmniejszych kwadratów i nieliniowa metoda najmniejszych kwadratów. Metoda najmniejszych kwadratów odnosi się do faktu, że funkcja regresji minimalizuje sumę kwadratów wariancji z rzeczywistych punktów danych. W ten sposób można narysować funkcję, która statystycznie zapewnia najlepsze dopasowanie do danych. Zauważ, że funkcja regresji może być liniowa (linia prosta) lub nieliniowa (linia zakrzywienia).

Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.

Terminy pokrewne

Jak działa metoda najmniejszych kwadratów Metoda najmniejszych kwadratów to technika statystyczna mająca na celu określenie linii najlepszego dopasowania do modelu, określonej równaniem z pewnymi parametrami obserwowanych danych. więcej Jak działa metoda kryterium najmniejszych kwadratów Kryterium najmniejszych kwadratów to metoda pomiaru dokładności linii w obrazie danych użytych do jej wygenerowania. Oznacza to, że formuła określa linię najlepszego dopasowania. więcej Definicja odchylenia standardowego Odchylenie standardowe jest statystyką mierzącą dyspersję zestawu danych w stosunku do jego średniej i jest obliczana jako pierwiastek kwadratowy wariancji. Oblicza się go jako pierwiastek kwadratowy wariancji, określając różnicę między każdym punktem danych w stosunku do średniej. więcej Korzystanie z równania wariancji Wariancja jest miarą rozpiętości między liczbami w zbiorze danych. Inwestorzy używają równania wariancji do oceny alokacji aktywów portfela. więcej Jak działa rezydualne odchylenie standardowe Resztkowe odchylenie standardowe jest terminem statystycznym stosowanym do opisania różnicy w odchyleniach standardowych obserwowanych wartości w stosunku do wartości przewidywanych, jak pokazują punkty w analizie regresji. więcej Jak działa współczynnik determinacji Współczynnik determinacji jest miarą stosowaną w analizie statystycznej do oceny, jak dobrze model wyjaśnia i przewiduje przyszłe wyniki. więcej linków partnerskich
Zalecane
Zostaw Swój Komentarz