Chi Square (χ2) Definicja statystyczna
Co to jest statystyki chi-kwadrat?Kwadrat chi ( χ 2 ) Statystyka to test, który mierzy porównanie oczekiwań z rzeczywistymi zaobserwowanymi danymi (lub wynikami modelu). Dane wykorzystane do obliczenia statystyki chi-kwadrat muszą być losowe, surowe, wykluczające się wzajemnie, sporządzone na podstawie zmiennych niezależnych i na podstawie wystarczająco dużej próbki. Na przykład wyniki rzutu monetą 100 razy spełniają te kryteria.
Testy chi kwadrat są często stosowane w testach hipotez.
Formuła dla Chi Square Is
χc2 = ∑ (Oi − Ei) 2 Gdzie: c = stopnie swobody O = wartości obserwowane E = wartości oczekiwane \ początek {wyrównane} i \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {gdzie:} \\ & c = \ text {stopnie swobody} \\ & O = \ text {zaobserwowane wartości (wartości)} \\ & E = \ text {wartości oczekiwane (s) )} \\ \ end {wyrównany} χc2 = ∑Ei (Oi −Ei) 2 gdzie: c = stopnie swobody O = wartości obserwowane E = wartości oczekiwane
Co mówi ci statystyki chi-kwadrat?
Istnieją dwa główne rodzaje testów chi-kwadrat: test niezależności, który zadaje pytanie o związek, na przykład: „Czy istnieje związek między wynikami płci i SAT?”; oraz test dobroci dopasowania, który brzmi: „Jeśli moneta zostanie rzucona 100 razy, to czy podniesie głowę 50 razy, a reszka 50 razy?”
W tych testach wykorzystuje się stopnie swobody, aby ustalić, czy określoną hipotezę zerową można odrzucić na podstawie całkowitej liczby zmiennych i próbek w ramach eksperymentu.
Na przykład, biorąc pod uwagę studentów i wybór kursu, wielkość próby 30 lub 40 studentów prawdopodobnie nie jest wystarczająco duża, aby wygenerować znaczące dane. Uzyskiwanie takich samych lub podobnych wyników z badania na próbie liczącej 400 lub 500 studentów jest bardziej uzasadnione.
W innym przykładzie zastanów się nad rzuceniem monetą 100 razy. Oczekiwanym rezultatem rzutu rzetelną monetą 100 razy jest to, że głowy podniosą się 50 razy, a reszka wyniesie 50 razy. Rzeczywisty wynik może być taki, że głowy pojawiają się 45 razy, a ogony pojawiają się 55 razy. Statystyka chi-kwadrat pokazuje wszelkie rozbieżności między oczekiwanymi wynikami a rzeczywistymi wynikami.
Kluczowe dania na wynos
- Kwadrat chi (χ 2 ) Statystyka to test, który mierzy porównanie oczekiwań z rzeczywistymi zaobserwowanymi danymi.
- Istnieją dwa główne rodzaje testów chi-kwadrat: test niezależności dla danych i testy zgodności z modelem.
- Testy te można wykorzystać do ustalenia, czy pewną hipotezę zerową można odrzucić w testowaniu hipotez.
Przykład testu chi-kwadrat
Wyobraź sobie, że przeprowadzono losową ankietę wśród 2000 różnych wyborców, zarówno mężczyzn, jak i kobiet. Osoby, które udzieliły odpowiedzi, zostały sklasyfikowane według płci i tego, czy były republikańskie, demokratyczne czy niezależne. Wyobraź sobie siatkę z kolumnami oznaczonymi republikańskimi, demokratycznymi i niezależnymi oraz dwoma rzędami oznaczonymi jako mężczyzna i kobieta. Załóżmy, że dane od 2000 respondentów są następujące:
Republikański | Demokrata | Niezależny | Całkowity | |
Męski | 400 | 300 | 100 | 800 |
Płeć żeńska | 500 | 600 | 100 | 1200 |
Całkowity | 900 | 900 | 200 | 2000 |
Pierwszym krokiem do obliczenia statystyki chi-kwadrat jest znalezienie oczekiwanych częstotliwości. Są one obliczane dla każdej „komórki” w siatce. Ponieważ istnieją dwie kategorie płci i trzy kategorie poglądów politycznych, istnieje sześć całkowitych oczekiwanych częstotliwości. Wzór na oczekiwaną częstotliwość to:
E (r, c) = n (r) × c (r) gdzie indziej: r = wiersz w pytaniu c = kolumna w pytaniu n = odpowiednia suma \ początek {wyrównany} i E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {gdzie:} \\ & r = \ text {wiersz w pytaniu} \\ & c = \ text {kolumna w pytaniu} \\ & n = \ text {odpowiadająca suma } \\ \ end {wyrównany} E (r, c) = nn (r) × c (r) gdzie: r = wiersz w pytaniu c = kolumna w pytaniu n = odpowiadająca suma
W tym przykładzie oczekiwane częstotliwości to:
- E (1, 1) = (900 x 800) / 2000 = 360
- E (1, 2) = (900 x 800) / 2000 = 360
- E (1, 3) = (200 x 800) / 2000 = 80
- E (2, 1) = (900 x 1200) / 2000 = 540
- E (2, 2) = (900 x 1200) / 2000 = 540
- E (2, 3) = (200 x 1200) / 2000 = 120
Następnie są to wartości używane do obliczania statystyki chi do kwadratu przy użyciu następującego wzoru:
Chi-kwadrat = ∑ [O (r, c) −E (r, c)] 2E (r, c) gdzie: O (r, c) = obserwowane dane dla danego wiersza i kolumny \ początek {wyrównany} i \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {gdzie:} \\ & O (r, c) = \ text {obserwowane dane dla danego wiersza i kolumny} \\ \ end {wyrównane} Chi-kwadrat = ∑E (r, c) [O (r, c) -E (r, c)] 2 gdzie: O (r, c) = obserwowane dane dla danego wiersza i kolumny
W tym przykładzie wyrażenie dla każdej zaobserwowanej wartości to:
- O (1, 1) = (400–360) 2/360 = 4, 44
- O (1, 2) = (300–360) 2/360 = 10
- O (1, 3) = (100–80) 2/80 = 5
- O (2, 1) = (500–540) 2/540 = 2, 96
- O (2, 2) = (600–540) 2/540 = 6, 67
- O (2, 3) = (100–120) 2/120 = 3, 33
Statystyka chi do kwadratu równa się sumie tych wartości, czyli 32, 41. Następnie możemy spojrzeć na tabelę statystyk kwadratowych chi, aby zobaczyć, biorąc pod uwagę stopnie swobody w naszym zestawie, czy wynik jest statystycznie istotny, czy nie.
Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.