Kwartyl

handel algorytmiczny : Kwartyl
Co to jest kwartyl?

Kwartyl to termin statystyczny opisujący podział obserwacji na cztery określone przedziały w oparciu o wartości danych i ich porównanie z całym zestawem obserwacji.

Zrozumienie kwartyli

Aby zrozumieć kwartyl, ważne jest, aby zrozumieć medianę jako miarę tendencji centralnej. Mediana w statystykach jest średnią wartością zestawu liczb. Jest to punkt, w którym dokładnie połowa danych znajduje się poniżej i powyżej wartości centralnej.

Tak więc, biorąc pod uwagę zestaw 13 liczb, mediana byłaby siódmą liczbą. Sześć liczb poprzedzających tę wartość to najniższe liczby w danych, a sześć liczb po medianie to najwyższe liczby w podanym zestawie danych. Ponieważ na medianę nie mają wpływu skrajne wartości lub wartości odstające w rozkładzie, czasami jest ona preferowana w stosunku do średniej.

Mediana jest solidnym estymatorem lokalizacji, ale nie mówi nic o tym, jak dane po obu stronach ich wartości są rozkładane lub rozproszone. Właśnie tam wkracza kwartyl. Kwartyl mierzy rozkład wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy.

Kluczowe dania na wynos

  • Kwartyl mierzy rozkład wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy.
  • Kwartyl dzieli dane na trzy punkty - dolny kwartał, mediana i górny kwartyl - w celu utworzenia czterech grup zbioru danych.
  • Kwartyle służą do obliczania zakresu międzykwartylowego, który jest miarą zmienności wokół mediany.

Jak działają kwartyle

Podobnie jak mediana dzieli dane na pół, tak że 50% pomiaru leży poniżej mediany, a 50% leży powyżej niej, kwartyl dzieli dane na ćwiartki, tak że 25% pomiaru jest mniejsze niż dolny kwartyl, 50 % to mniej niż średnia, a 75% to mniej niż górny kwartyl.

Kwartyl dzieli dane na trzy punkty - dolny kwartał, mediana i górny kwartyl - w celu utworzenia czterech grup zbioru danych. Dolny kwartyl lub pierwszy kwartyl jest oznaczony jako Q1 i jest środkową liczbą, która mieści się między najmniejszą wartością zestawu danych a medianą. Drugi kwartyl, Q2, jest również medianą. Górny lub trzeci kwartyl, oznaczony jako Q3, jest centralnym punktem leżącym między medianą a najwyższą liczbą rozkładu.

Teraz możemy zmapować cztery grupy utworzone z kwartyli. Pierwsza grupa wartości zawiera najmniejszą liczbę do Q1; druga grupa obejmuje Q1 do mediany; trzeci zestaw jest medianą do Q3; czwarta kategoria obejmuje Q3 do najwyższego punktu danych w całym zestawie.

Każdy kwartyl zawiera 25% wszystkich obserwacji. Ogólnie dane są uporządkowane od najmniejszej do największej:

  1. Pierwszy kwartyl: najniższe 25% liczb
  2. Drugi kwartyl: od 25, 1% do 50% (do mediany)
  3. Trzeci kwartyl: 51% do 75% (powyżej mediany)
  4. Czwarty kwartyl: najwyższe 25% liczb

Przykład kwartylu

Pracujmy z przykładem. Załóżmy, że rozkład wyników matematycznych w klasie 19 uczniów w porządku rosnącym jest następujący:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Najpierw zaznacz medianę Q2, która w tym przypadku jest dziesiątą wartością: 75.

Q1 jest centralnym punktem między najmniejszym wynikiem a medianą. W tym przypadku Q1 mieści się między pierwszym a piątym wynikiem: 68. [Uwaga: mediana może być również uwzględniona przy obliczaniu Q1 lub Q3 dla nieparzystego zestawu wartości. Jeśli uwzględnimy medianę po obu stronach punktu środkowego, wówczas Q1 będzie wartością środkową między pierwszym a dziesiątym wynikiem, który jest średnią z piątego i szóstego wyniku - (piąty + szósty) / 2 = (68 + 69) / 2 = 68, 5].

Q3 to średnia wartość pomiędzy Q2 a najwyższym wynikiem: 84. [Lub jeśli uwzględnisz medianę, Q3 = (82 + 84) / 2 = 83].

Teraz, gdy mamy nasze kwartyle, zinterpretujmy ich liczby. Wynik 68 (Q1) reprezentuje pierwszy kwartyl i jest 25. percentylem. 68 to mediana dolnej połowy wyniku uzyskanego w dostępnych danych, tj. Mediana wyników od 59 do 75.

Q1 mówi nam, że 25% wyników to mniej niż 68, a 75% wyników w klasie jest większa. Q2 (mediana) jest 50. percentylem i pokazuje, że 50% wyników jest mniejszych niż 75, a 50% wyników jest powyżej 75. Wreszcie, Q3, 75. percentyl, ujawnia, że ​​25% wyników to większy, a 75% to mniej niż 84.

Uwagi specjalne

Jeśli punkt danych dla Q1 znajduje się dalej od mediany niż Q3 od mediany, możemy powiedzieć, że istnieje większe rozproszenie między mniejszymi wartościami zestawu danych niż między większymi wartościami. Ta sama logika obowiązuje, jeśli Q3 jest dalej od Q2 niż Q1 od mediany.

Alternatywnie, jeśli liczba parzystych punktów danych jest parzysta, mediana będzie średnią z dwóch środkowych liczb. W powyższym przykładzie, gdybyśmy mieli 20 uczniów zamiast 19, mediana ich wyników będzie średnią arytmetyczną dziesiątej i jedenastej liczby.

Kwartyle służą do obliczania zakresu międzykwartylowego, który jest miarą zmienności wokół mediany. Przedział międzykwartylowy oblicza się po prostu jako różnicę między pierwszym i trzecim kwartylem: Q3 - Q1. W efekcie zakres środkowej połowy danych pokazuje rozkład danych.

W przypadku dużych zestawów danych program Microsoft Excel ma funkcję KWARTYLU do obliczania kwartylów.

Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.

Terminy pokrewne

Jak działa decylatyczna metoda ilościowa Decyl to ilościowa metoda dzielenia zestawu danych rankingowych na 10 podsekcji o jednakowej wielkości. Ten rodzaj rankingu danych jest przeprowadzany w ramach wielu badań akademickich i statystycznych w dziedzinie finansów i ekonomii. więcej Statystyka opisowa Statystyka opisowa to zestaw krótkich współczynników opisowych, które podsumowują dany zestaw danych reprezentatywny dla całej populacji lub populacji próby. więcej Kwintyle Definicja Kwintyl to wartość statystyczna zbioru danych, który reprezentuje 20% danej populacji. więcej Jak korzystać ze średniej winsorizowanej Średnia winsorizowana to metoda uśredniania, która początkowo zastępuje najmniejsze i największe wartości obserwacjami najbliższymi. Odbywa się to w celu ograniczenia wpływu nieprawidłowych wartości ekstremalnych lub wartości odstających na obliczenia. więcej Granice Three-Sigma: Co musisz wiedzieć Granice Three-Sigma to obliczenia statystyczne, które odnoszą się do danych w trzech standardowych odchyleniach od średniej. więcej Definicja odchylenia standardowego Odchylenie standardowe jest statystyką mierzącą rozrzut zbioru danych w stosunku do jego średniej i jest obliczana jako pierwiastek kwadratowy wariancji. Oblicza się go jako pierwiastek kwadratowy wariancji, określając różnicę między każdym punktem danych w stosunku do średniej. więcej linków partnerskich
Zalecane
Zostaw Swój Komentarz