Test T

Co to jest test T?

Test t jest rodzajem wnioskowania statystycznego stosowanym do ustalenia, czy istnieje znacząca różnica między średnimi dwóch grup, która może być powiązana w niektórych cechach. Najczęściej stosuje się go, gdy zbiory danych, takie jak zbiór danych zarejestrowany jako wynik rzutu monetą 100 razy, będą miały normalny rozkład i mogą mieć nieznane wariancje. Test t jest wykorzystywany jako narzędzie do testowania hipotez, które umożliwia testowanie założenia mającego zastosowanie do populacji.

Test t sprawdza statystykę t, wartości rozkładu t i stopnie swobody w celu ustalenia prawdopodobieństwa różnicy między dwoma zestawami danych. Aby przeprowadzić test z trzema lub więcej zmiennymi, należy zastosować analizę wariancji.

1:38

Test T

Wyjaśnienie testu T

Zasadniczo test t pozwala nam porównać średnie wartości dwóch zestawów danych i ustalić, czy pochodzą one z tej samej populacji. W powyższych przykładach, gdybyśmy mieli pobrać próbkę uczniów z klasy A i kolejną próbkę uczniów z klasy B, nie spodziewalibyśmy się, że będą mieli dokładnie taką samą średnią i odchylenie standardowe. Podobnie próbki pobrane z grupy kontrolnej karmionej placebo i próbki pobrane z grupy przepisanej lekiem powinny mieć nieco inną średnią i odchylenie standardowe.

Matematycznie test t pobiera próbkę z każdego z dwóch zestawów i ustala stwierdzenie problemu, przyjmując hipotezę zerową, że dwa średnie są równe. W oparciu o obowiązujące formuły pewne wartości są obliczane i porównywane z wartościami standardowymi, a przyjęta hipoteza zerowa jest odpowiednio przyjmowana lub odrzucana.

Jeśli hipoteza zerowa kwalifikuje się do odrzucenia, oznacza to, że odczyty danych są silne i nie są przypadkowe. Test t jest tylko jednym z wielu testów zastosowanych w tym celu. Statystycy muszą dodatkowo zastosować testy inne niż test t, aby zbadać więcej zmiennych i testy z większą wielkością próby. W przypadku dużej wielkości próby statystycy stosują test Z. Inne opcje testowania obejmują test chi-kwadrat i test F.

Istnieją trzy rodzaje testów t i są one klasyfikowane jako zależne i niezależne testy t.

Kluczowe dania na wynos

Test t jest rodzajem wnioskowania statystycznego stosowanym do ustalenia, czy istnieje znacząca różnica między średnimi dwóch grup, która może być powiązana w niektórych cechach.
Test t jest jednym z wielu testów wykorzystywanych do testowania hipotez w statystyce.
Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchylenie standardowe każdej grupy oraz liczbę wartości danych każdej grupy.
Istnieje kilka różnych rodzajów testów t, które można wykonać w zależności od wymaganych danych i rodzaju analizy.

Niejednoznaczne wyniki testu

Weź pod uwagę, że producent leków chce przetestować nowo wynaleziony lek. Postępuje zgodnie ze standardową procedurą wypróbowania leku na jednej grupie pacjentów i przekazania placebo innej grupie, zwanej grupą kontrolną. Placebo podane grupie kontrolnej jest substancją bez zamierzonej wartości terapeutycznej i służy jako punkt odniesienia do pomiaru reakcji drugiej grupy, której podano rzeczywisty lek.

Po badaniu lekowym członkowie grupy kontrolnej karmionej placebo odnotowali wzrost średniej długości życia o trzy lata, podczas gdy członkowie grupy, której przepisano nowy lek, zgłosili wzrost średniej długości życia o cztery lata. Natychmiastowa obserwacja może wskazywać, że lek rzeczywiście działa, ponieważ wyniki są lepsze dla grupy stosującej lek. Jednak możliwe jest również, że obserwacja może być spowodowana przypadkowym zdarzeniem, szczególnie zaskakującym szczęściem. Test t jest przydatny do stwierdzenia, czy wyniki są rzeczywiście poprawne i mają zastosowanie do całej populacji.

W szkole 100 uczniów w klasie A uzyskało średnio 85% przy standardowym odchyleniu 3%. Kolejnych 100 uczniów należących do klasy B uzyskało średnią 87% przy standardowym odchyleniu 4%. Chociaż średnia z klasy B jest lepsza niż z klasy A, może nie być poprawne wyciągnięcie wniosku, że ogólna wydajność uczniów w klasie B jest lepsza niż uczniów w klasie A. Jest tak, ponieważ wraz z oznacza to, że odchylenie standardowe dla klasy B jest również wyższe niż dla klasy A. Wskazuje to, że ich ekstremalne wartości procentowe, po stronie dolnej i wyższej, były znacznie bardziej rozłożone w porównaniu do wartości klasy A. Test t może pomóc w ustaleniu która klasa wypadła lepiej.

Założenia testu T

Pierwsze założenie dotyczące testów t dotyczy skali pomiaru. Założeniem testu t jest to, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ.
Drugie przyjęte założenie dotyczy prostej próby losowej, że dane są zbierane z reprezentatywnej, losowo wybranej części całkowitej populacji.
Trzecie założenie to, że dane, po wykreśleniu, dają rozkład normalny, krzywą rozkładu w kształcie dzwonu.
Czwarte założenie dotyczy dość dużej próby. Większy rozmiar próbki oznacza, że rozkład wyników powinien zbliżać się do normalnej krzywej w kształcie dzwonu.
Ostatnim założeniem jest jednorodność wariancji. Homogeniczna lub równa wariancja występuje, gdy standardowe odchylenia próbek są w przybliżeniu równe.

Obliczanie testów T

Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchylenie standardowe każdej grupy oraz liczbę wartości danych każdej grupy.

Wynik testu t daje wartość t. Ta obliczona wartość t jest następnie porównywana z wartością uzyskaną z tabeli wartości krytycznych (zwanej tabelą rozkładu T). To porównanie pomaga ustalić, jak prawdopodobne jest, że różnica między średnimi wystąpiła przypadkowo, lub czy zbiory danych rzeczywiście mają wewnętrzne różnice. Test t pyta, czy różnica między grupami reprezentuje prawdziwą różnicę w badaniu, czy też jest to prawdopodobnie nieistotna różnica statystyczna.

Tabele rozkładu T.

Tabela rozkładów T jest dostępna w formatach jednoogonowych i dwuogonowych. Pierwszy służy do oceny przypadków, które mają stałą wartość lub zakres z wyraźnym kierunkiem (dodatnim lub ujemnym). Na przykład, jakie jest prawdopodobieństwo, że wartość wyjściowa pozostanie poniżej -3 lub uzyska więcej niż siedem, gdy rzucisz parę kości? Ten ostatni jest wykorzystywany do analizy związanej z zakresem, na przykład do pytania, czy współrzędne mieszczą się w zakresie od -2 do +2.

Obliczenia można wykonywać za pomocą standardowych programów obsługujących niezbędne funkcje statystyczne, takie jak te znalezione w MS Excel.

Wartości T i stopnie swobody

Test t daje jako wynik dwie wartości: wartość t i stopnie swobody. Wartość t jest stosunkiem różnicy między średnią dwóch zestawów próbek a różnicą występującą w zestawach próbek. Podczas gdy wartość licznika (różnica między średnią dwóch zestawów próbek) jest łatwa do obliczenia, mianownik (różnica występująca w zestawach próbek) może stać się nieco skomplikowany w zależności od rodzaju wartości danych. Mianownik stosunku jest miarą dyspersji lub zmienności. Wyższe wartości wartości t, zwane również wynikiem t, wskazują, że istnieje duża różnica między dwoma zestawami próbek. Im mniejsza wartość t, tym większe podobieństwo między dwoma zestawami próbek.

Duży wynik t wskazuje, że grupy są różne.
Mały wynik t wskazuje, że grupy są podobne.

Stopnie swobody odnoszą się do wartości w badaniu, które mogą się zmieniać i są niezbędne do oceny ważności i ważności hipotezy zerowej. Obliczenie tych wartości zwykle zależy od liczby rekordów danych dostępnych w zestawie próbek.

Skorelowany (lub sparowany) test T

Skorelowany test t wykonuje się, gdy próbki zazwyczaj składają się z dopasowanych par podobnych jednostek lub gdy występują przypadki powtarzanych pomiarów. Na przykład mogą wystąpić przypadki wielokrotnego testowania tych samych pacjentów - przed i po otrzymaniu określonego leczenia. W takich przypadkach każdego pacjenta używa się jako próbki kontrolnej przeciwko sobie.

Ta metoda ma również zastosowanie w przypadkach, w których próbki są w jakiś sposób powiązane lub mają pasujące cechy, takie jak analiza porównawcza z udziałem dzieci, rodziców lub rodzeństwa. Skorelowane lub sparowane testy t są typu zależnego, ponieważ dotyczą one przypadków, w których dwa zestawy próbek są powiązane.

Wzór na obliczenie wartości t i stopni swobody dla sparowanego testu t to:

Mean1 i mean2 są średnimi wartościami każdego zestawu próbek, podczas gdy var1 i var2 reprezentują wariancję każdego zestawu próbek.

Pozostałe dwa typy należą do niezależnych testów t. Próbki tego typu są wybierane niezależnie od siebie - to znaczy zestawy danych w dwóch grupach nie odnoszą się do tych samych wartości. Obejmują przypadki takie jak grupa 100 pacjentów podzielona na dwa zestawy po 50 pacjentów. Jedna z grup staje się grupą kontrolną i otrzymuje placebo, podczas gdy druga grupa otrzymuje przepisane leczenie. Stanowi to dwie niezależne grupy próbek, które są niesparowane ze sobą.

T-test równej wariancji (lub łącznej)

Test t równej wariancji stosuje się, gdy liczba próbek w każdej grupie jest taka sama lub wariancja dwóch zestawów danych jest podobna. Poniższy wzór stosuje się do obliczenia wartości t i stopni swobody dla testu t równej wariancji:

Wartość T = średnia1 - średnia2 (n1-1) x var12 + (n2-1) x var22n1 + n2-2 x 1n1 + 1n2 gdzie: średnia1 i średnia2 = średnie wartości każdego z zestawów próbek var1 i var2 = wariancja każdego przykładowe zestawyn1 i n2 = liczba rekordów w każdym zestawie próbnym \ początek {wyrównany} i \ text {wartość T} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ razy var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { gdzie:} \\ & mean1 \ text {and} mean2 = \ text {Średnie wartości każdego} \\ & \ text {z przykładowych zestawów} \\ & var1 \ text {and} var2 = \ text {Wariancja każdego z zestawy próbek} \\ & n1 \ text {i} n2 = \ text {Liczba rekordów w każdym zestawie próbek} \\ \ end {wyrównane} Wartość T = n1 + n2−2 (n1-1) × var12 + (n2 −1) × var22 × n11 + n21 średnia 1 − średnia 2 gdzie: średnia 1 i średnia 2 = średnie wartości każdego zestawu próbek var1 i var2 = wariancja każdego zestawu próbek n1 i n2 = liczba zapisów w każdej próbce zestaw

Stopnie wolności = n1 + n2-2 gdzie: n1 i n2 = Liczba rekordów w każdym zestawie próbek \ begin {wyrównany} i \ text {Stopnie wolności} = n1 + n2 - 2 \\ & \ textbf {gdzie:} \\ & n1 \ text {and} n2 = \ text {Liczba rekordów w każdym zestawie próbek} \\ \ end {wyrównane} Stopnie swobody = n1 + n2-2 gdzie: n1 i n2 = Liczba rekordów w każdym zestawie próbek W pobliżu

Nierówny test T wariancji

Nierówny test t wariancji stosuje się, gdy liczba próbek w każdej grupie jest inna, a wariancja dwóch zestawów danych jest również inna. Ten test nazywa się również testem t-Welcha. Poniższy wzór stosuje się do obliczenia wartości t i stopni swobody dla testu t nierówności wariancji:

Wartość T = średnia1 - średnia2var12n1 + var22n2 gdzie: średnia1 i średnia2 = średnie wartości każdego zestawu próbek var1 i var2 = wariancja każdego zestawu próbek n1 i n2 = liczba rekordów w każdym zestawie próbek \ początek {wyrównany} i \ tekst {Wartość T} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {gdzie:} \ \ & mean1 \ text {and} mean2 = \ text {Średnie wartości każdego} \\ & \ text {zestawów próbek} \\ & var1 \ text {i} var2 = \ text {Wariancja każdego zestawu próbek} \ \ & n1 \ text {i} n2 = \ text {Liczba rekordów w każdym zestawie próbek} \\ \ end {wyrównane} Wartość T = n1var12 + n2var22 średnia1 - średnia2 gdzie: średnia1 i średnia2 = wartości średnie każdego zestawu próbek var1 i var2 = wariancja każdego zestawu próbek n1 i n2 = liczba rekordów w każdym zestawie próbek

Stopnie swobody = (var12n1 + var22n2) 2 (var12n1) 2n1-1 + (var22n2) 2n2-1 gdzie: var1 i var2 = Wariancja każdego zestawu próbek n1 i n2 = Liczba rekordów w każdym zestawie próbek \ początek {wyrównany } & \ text {Degrees of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {gdzie:} \\ & var1 \ text {i} var2 = \ text {Odchylenie każdego z przykładowych zestawów} \\ & n1 \ text {i} n2 = \ text {Liczba rekordów w każdym zestawie przykładowym } \\ \ end {wyrównany} Stopnie wolności = n1-1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 gdzie: var1 i var2 = wariancja każdego zestawów próbekn1 i n2 = liczba rekordów w każdym zestawie próbek

Określanie właściwego testu T do użycia

Poniższy schemat blokowy można wykorzystać do ustalenia, który test t należy zastosować w oparciu o cechy charakterystyczne zestawów próbek. Kluczowe elementy, które należy wziąć pod uwagę, obejmują to, czy rekordy próbki są podobne, liczbę rekordów danych w każdym zestawie próbek oraz wariancję każdego zestawu próbek.

Nierówny wariant testu t wariancji

Załóżmy, że wykonujemy pomiar po przekątnej obrazów otrzymanych w galerii sztuki. Jedna grupa próbek zawiera 10 obrazów, a druga zawiera 20 obrazów. Zestawy danych, z odpowiednimi wartościami średnimi i wariancjami, są następujące:

	Zestaw 1	Zestaw 2
	19, 7	28, 3
	20.4	26, 7
	19, 6	20.1
	17, 8	23, 3
	18, 5	25, 2
	18, 9	22.1
	18, 3	17.7
	18, 9	27, 6
	19, 5	20, 6
	21, 95	13, 7
		23, 2
		17.5
		20, 6
		18
		23, 9
		21, 6
		24, 3
		20.4
		23, 9
		13, 3
Oznaczać	19, 4	21, 6
Zmienność	1.4	17.1

Chociaż średnia dla zestawu 2 jest wyższa niż dla zestawu 1, nie możemy stwierdzić, że wszystkie obrazy mają średnią długość około 21, 6 jednostek, ponieważ wariancja zestawu 2 jest znacznie wyższa niż zestawu 1. Czy to przez przypadek, czy naprawdę istnieją różnice w ogólnej populacji wszystkich obrazów otrzymanych w galerii sztuki ">

Ponieważ liczba rekordów danych jest różna (n1 = 10 i n2 = 20), a wariancja jest również inna, wartość t i stopnie swobody są obliczane dla powyższego zestawu danych przy użyciu wzoru wymienionego w teście nierównej wariancji T Sekcja.

Wartość t wynosi -2.24787. Ponieważ znak minus można zignorować podczas porównywania dwóch wartości t, obliczona wartość wynosi 2, 24787.

Wartość stopni swobody wynosi 24, 38 i jest zmniejszona do 24, ze względu na definicję formuły wymagającą zaokrąglenia w dół wartości do najmniejszej możliwej wartości całkowitej.

Ilekroć zakłada się rozkład normalny, jako kryterium akceptacji można określić poziom prawdopodobieństwa (poziom alfa, poziom istotności, p ). W większości przypadków można przyjąć wartość 5%.

Wykorzystując wartość stopnia swobody jako 24 i 5% poziom istotności, spojrzenie na tablicę rozkładu wartości t daje wartość 2, 064. Porównanie tej wartości z wartością obliczoną 2, 247 wskazuje, że obliczona wartość t jest większa niż wartość z tabeli na poziomie istotności 5%. Dlatego można bezpiecznie odrzucić hipotezę zerową, że nie ma różnicy między średnimi. Zestaw populacji ma wewnętrzne różnice i nie są przypadkowe.

Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.

Terminy pokrewne

Jak działa analiza wariancji (ANOVA) Analiza wariancji (ANOVA) to narzędzie analizy statystycznej, które dzieli całkowitą zmienność stwierdzoną w zbiorze danych na dwa składniki: czynniki losowe i systematyczne. więcej Zrozumienie rozkładu T Rozkład AT jest rodzajem funkcji prawdopodobieństwa, która jest odpowiednia do szacowania parametrów populacji dla małych wielkości próby lub nieznanych wariancji. więcej Stopnie swobody Definicja Stopnie swobody odnosi się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się zmieniać w próbce danych. więcej Jak działa rezydualne odchylenie standardowe Resztkowe odchylenie standardowe jest terminem statystycznym stosowanym do opisania różnicy w odchyleniach standardowych obserwowanych wartości w stosunku do wartości przewidywanych, jak pokazują punkty w analizie regresji. więcej Jak działa statystyka chi-kwadrat Statystyka chi-kwadrat (χ2) to test, który mierzy porównanie oczekiwań z rzeczywistymi zaobserwowanymi danymi (lub wynikami modelu). Dane wykorzystane do obliczenia statystyki chi-kwadrat muszą być losowe, surowe, wykluczające się wzajemnie, sporządzone na podstawie zmiennych niezależnych i na podstawie wystarczająco dużej próbki. więcej Jak stosuje się test Wilcoxona Test Wilcoxona, który odnosi się albo do testu sumy rang, albo testu podpisanej rangi, jest nieparametrycznym testem porównującym dwie sparowane grupy. więcej linków partnerskich

← Inwestuj w narzędzia za pomocą tych funduszy ETF (XLU, JXI)

Upadły anioł →

Zalecane

Zostaw Swój Komentarz