Jak udělat T test v Excelu

Obsah:

Jak udělat T test v Excelu
Jak udělat T test v Excelu
Anonim

T-test je způsob, jak rozhodnout, zda existují statisticky významné rozdíly mezi soubory dat, pomocí Studentova t-distribuce. T-test v Excelu je dvouvýběrový T-test, který porovnává průměry dvou vzorků. Tento článek vysvětluje, co znamená statistická významnost, a ukazuje, jak provést T-test v Excelu.

Pokyny v tomto článku platí pro Excel 2019, 2016, 2013, 2010, 2007; Excel pro Microsoft 365 a Excel Online.

Image
Image

Co je statistická významnost?

Představte si, že chcete vědět, která ze dvou kostek dá lepší skóre. Hodíte první kostkou a dostanete 2; hodíte druhou kostkou a dostanete 6. Říká vám to, že druhá kostka obvykle dává vyšší skóre? Pokud jste odpověděli: „Samozřejmě, že ne“, pak už máte určitou představu o statistické významnosti. Chápete, že rozdíl byl způsoben náhodnou změnou skóre při každém hodu kostkou. Protože byl vzorek velmi malý (pouze jedna role), nevykazoval nic významného.

Teď si představte, že každou kostkou hodíte 6krát:

  • První hod kostkou 3, 6, 6, 4, 3, 3; Průměr=4,17
  • Druhá kostka hodí 5, 6, 2, 5, 2, 4; Průměr=4,00

Dokazuje to nyní, že první kostka dává vyšší skóre než druhá? Asi ne. U malého vzorku s relativně malým rozdílem mezi průměry je pravděpodobné, že rozdíl je stále způsoben náhodnými variacemi. S tím, jak zvyšujeme počet hodů kostkou, je obtížné dát selským rozumem odpověď na otázku – je rozdíl mezi skóre výsledkem náhodné variace, nebo je skutečně pravděpodobnější, že jeden dá vyšší skóre než druhý?

Významnost je pravděpodobnost, že pozorovaný rozdíl mezi vzorky je způsoben náhodnými odchylkami. Význam se často nazývá hladina alfa nebo jednoduše „α“. Úroveň spolehlivosti, nebo jednoduše 'c, ' je pravděpodobnost, že rozdíl mezi vzorky není způsoben náhodnou variací; jinými slovy, že existuje rozdíl mezi základními populacemi. Proto: c=1 – α

„α“můžeme nastavit na jakoukoli úroveň, kterou chceme, abychom měli jistotu, že jsme prokázali význam. Velmi často se používá α=5% (95% spolehlivost), ale pokud si chceme být opravdu jisti, že nějaké rozdíly nejsou způsobeny náhodnou variací, můžeme použít vyšší úroveň spolehlivosti pomocí α=1% nebo dokonce α=0,1 %.

K výpočtu významnosti v různých situacích se používají různé statistické testy. T-testy se používají k určení, zda jsou střední hodnoty dvou populací různé, a F-testy se používají k určení, zda jsou rozdíly odlišné.

Proč testovat statistickou významnost?

Při porovnávání různých věcí musíme použít testování významnosti, abychom určili, zda je jedna lepší než druhá. To platí pro mnoho polí, například:

  • V podnikání lidé potřebují porovnávat různé produkty a marketingové metody.
  • Ve sportu lidé potřebují porovnávat různé vybavení, techniky a konkurenty.
  • Ve strojírenství lidé potřebují porovnávat různé návrhy a nastavení parametrů.

Pokud chcete otestovat, zda něco funguje lépe než něco jiného, v jakékoli oblasti, musíte otestovat statistickou významnost.

Co je to studentská T-distribuce?

A Studentovo t-rozdělení je podobné normálnímu (nebo Gaussovu) rozdělení. Obě tyto distribuce jsou ve tvaru zvonu, přičemž většina výsledků se blíží střední hodnotě, ale některé vzácné události jsou poměrně vzdálené od střední hodnoty v obou směrech, označované jako ocasy distribuce.

Přesný tvar studentova t-rozdělení závisí na velikosti vzorku. U vzorků větších než 30 je to velmi podobné normálnímu rozdělení. Jak se velikost vzorku zmenšuje, ocasy se zvětšují, což představuje zvýšenou nejistotu, která pochází z vytváření závěrů na základě malého vzorku.

Jak udělat T-test v Excelu

Než budete moci použít T-test ke zjištění, zda existuje statisticky významný rozdíl mezi průměry dvou vzorků, musíte nejprve provést F-test. Důvodem je, že pro T-test se provádějí různé výpočty v závislosti na tom, zda existuje významný rozdíl mezi odchylkami.

K provedení této analýzy budete potřebovat doplněk Analysis Toolpak.

Kontrola a načítání doplňku analytického nástroje

Chcete-li zkontrolovat a aktivovat analytické nástroje, postupujte takto:

  1. Vyberte kartu FILE >select Options.
  2. V dialogovém okně Možnosti vyberte z karet na levé straně Doplňky.
  3. Ve spodní části okna vyberte rozbalovací nabídku Spravovat a poté vyberte Doplňky Excelu. Select Go.

    Image
    Image
  4. Ujistěte se, že je zaškrtnuto políčko vedle Analysis Toolpack, poté vyberte OK.

  5. Nástroj pro analýzu je nyní aktivní a jste připraveni použít F-testy a T-testy.

Provádění F-testu a T-testu v Excelu

  1. Zadejte dvě datové sady do tabulky. V tomto případě uvažujeme o prodeji dvou produktů během týdne. Vypočítá se také průměrná denní hodnota prodeje pro každý produkt spolu s jeho standardní odchylkou.

    Image
    Image
  2. Vyberte kartu Data > Analýza dat

    Image
    Image
  3. Ze seznamu vyberte F-Test Two-Sample for Variances a poté vyberte OK.

    Image
    Image

    F-Test je vysoce citlivý na nenormálnost. Proto může být bezpečnější použít Welchův test, ale v Excelu je to obtížnější.

  4. Vyberte rozsah proměnné 1 a rozsah proměnné 2; nastavte alfa (0,05 dává 95% spolehlivost); vyberte buňku pro levý horní roh výstupu, protože to vyplní 3 sloupce a 10 řádků. Vyberte OK.

    Image
    Image

    Pro rozsah proměnné 1 musí být vybrán vzorek s největší směrodatnou odchylkou (nebo rozptylem).

  5. Zobrazte výsledky F-testu a zjistěte, zda existuje významný rozdíl mezi odchylkami. Výsledky dávají tři důležité hodnoty:

    • F: Poměr mezi rozptyly.
    • P(F<=f) one-tail: Pravděpodobnost, že proměnná 1 ve skutečnosti nemá větší rozptyl než proměnná 2. Pokud je větší než alfa, což je obecně 0,05, pak mezi rozptyly není žádný významný rozdíl.
    • F Critical one-tail: Hodnota F, která by byla potřebná k získání P(F<=f)=α. Pokud je tato hodnota větší než F, znamená to také, že mezi rozptyly není žádný významný rozdíl.

    P(F<=f) lze také vypočítat pomocí funkce FDIST s F a stupni volnosti pro každý vzorek jako jeho vstupy. Stupně volnosti jsou jednoduše počet pozorování ve vzorku mínus jedna.

  6. Nyní, když víte, zda existuje rozdíl mezi odchylkami, můžete vybrat vhodný T-test. Vyberte kartu Data > Analýza dat a poté vyberte buď t-Test: Dva vzorky za předpokladu stejných rozptylůnebo t-test: Dva vzorky za předpokladu nestejných rozptylů

    Image
    Image
  7. Bez ohledu na to, kterou možnost jste vybrali v předchozím kroku, zobrazí se vám stejné dialogové okno pro zadání podrobností analýzy. Chcete-li začít, vyberte rozsahy obsahující vzorky pro Variable 1 Range a Proměnná 2 Range.

    Image
    Image
  8. Za předpokladu, že chcete otestovat, zda mezi průměry není žádný rozdíl, nastavte Hypothesized Mean Difference na nulu.
  9. Nastavte hladinu významnosti Alfa (0,05 dává 95% spolehlivost) a vyberte buňku pro levý horní roh výstupu, protože tím vyplníte 3 sloupce a 14 řádků. Vyberte OK.
  10. Zkontrolujte výsledky a rozhodněte, zda existuje významný rozdíl mezi průměry.

    Stejně jako u F-testu, pokud je p-hodnota, v tomto případě P(T<=t), větší než alfa, pak není žádný významný rozdíl. V tomto případě jsou však dány dvě p-hodnoty, jedna pro jednostranný test a druhá pro dvoustranný test. V tomto případě použijte dvoustrannou hodnotu, protože každá z proměnných s větším průměrem by byla významným rozdílem.

Doporučuje: