Sådan laver du en T-test i Excel

Indholdsfortegnelse:

Sådan laver du en T-test i Excel
Sådan laver du en T-test i Excel
Anonim

En T-test er en måde at afgøre, om der er statistisk signifikante forskelle mellem datasæt, ved hjælp af en elevs t-fordeling. T-testen i Excel er en T-test med to prøver, der sammenligner middelværdien af to prøver. Denne artikel forklarer, hvad statistisk signifikans betyder, og viser, hvordan man laver en T-test i Excel.

Instruktionerne i denne artikel gælder for Excel 2019, 2016, 2013, 2010, 2007; Excel til Microsoft 365 og Excel Online.

Image
Image

Hvad er statistisk signifikans?

Forestil dig, at du vil vide, hvilken af to terninger der giver en bedre score. Du kaster den første terning og får en 2'er; du kaster den anden terning og får en 6'er. Fortæller dette dig, at den anden terning norm alt giver højere score? Hvis du svarede "Selvfølgelig ikke", så har du allerede en vis forståelse af statistisk signifikans. Du forstår, at forskellen skyldtes den tilfældige ændring i scoren, hver gang en terning kastes. Fordi prøven var meget lille (kun én rulle), viste den ikke noget væsentligt.

Forestil dig nu, at du kaster hver terning 6 gange:

  • Den første terning kaster 3, 6, 6, 4, 3, 3; Gennemsnit=4,17
  • Den anden terning kaster 5, 6, 2, 5, 2, 4; Gennemsnit=4,00

Beviser dette nu, at den første terning giver højere score end den anden? Sikkert ikke. En lille stikprøve med en relativt lille forskel mellem middelværdierne gør det sandsynligt, at forskellen stadig skyldes tilfældige variationer. Efterhånden som vi øger antallet af terningkast, bliver det vanskeligt at give et fornuftigt svar på spørgsmålet - er forskellen mellem scoringerne resultatet af tilfældig variation, eller er der faktisk større sandsynlighed for, at den ene giver højere score end den anden?

Signifikans er sandsynligheden for, at en observeret forskel mellem stikprøver skyldes tilfældige variationer. Betydning kaldes ofte alfa-niveauet eller blot 'α'. Konfidensniveauet eller blot 'c' er sandsynligheden for, at forskellen mellem stikprøverne ikke skyldes tilfældig variation; med andre ord, at der er forskel på de underliggende populationer. Derfor: c=1 – α

Vi kan indstille 'α' på det niveau, vi ønsker, for at føle os sikre på, at vi har bevist betydning. Meget ofte bruges α=5% (95% konfidens), men hvis vi vil være virkelig sikre på, at eventuelle forskelle ikke er forårsaget af tilfældig variation, kan vi anvende et højere konfidensniveau ved at bruge α=1% eller endda α=0,1 %.

Forskellige statistiske test bruges til at beregne signifikans i forskellige situationer. T-test bruges til at bestemme, om middelværdierne for to populationer er forskellige, og F-tests bruges til at bestemme, om varianserne er forskellige.

Hvorfor test for statistisk signifikans?

Når vi sammenligner forskellige ting, skal vi bruge signifikanstest til at afgøre, om den ene er bedre end den anden. Dette gælder for mange felter, f.eks.:

  • I erhvervslivet skal folk sammenligne forskellige produkter og markedsføringsmetoder.
  • I sport skal folk sammenligne forskelligt udstyr, teknikker og konkurrenter.
  • I teknik skal folk sammenligne forskellige designs og parameterindstillinger.

Hvis du vil teste, om noget yder bedre end noget andet, inden for et hvilket som helst felt, skal du teste for statistisk signifikans.

Hvad er en studerendes T-distribution?

En elevs t-fordeling ligner en normal (eller gaussisk) fordeling. Disse er begge klokkeformede fordelinger med de fleste resultater tæt på gennemsnittet, men nogle sjældne hændelser er ret langt fra gennemsnittet i begge retninger, kaldet fordelingens haler.

Den nøjagtige form af elevens t-fordeling afhænger af stikprøvestørrelsen. For prøver på mere end 30 svarer det meget til normalfordelingen. Efterhånden som stikprøvestørrelsen reduceres, bliver halerne større, hvilket repræsenterer den øgede usikkerhed, der kommer af at drage slutninger baseret på en lille stikprøve.

Sådan laver man en T-test i Excel

Før du kan anvende en T-test for at afgøre, om der er en statistisk signifikant forskel mellem gennemsnittet af to prøver, skal du først udføre en F-test. Dette skyldes, at der udføres forskellige beregninger for T-testen afhængigt af, om der er en signifikant forskel mellem varianserne.

Du skal have Analysis Toolpak-tilføjelsen aktiveret for at udføre denne analyse.

Kontrol og indlæsning af analyseværktøjspakken-tilføjelse

For at kontrollere og aktivere analyseværktøjspakken skal du følge disse trin:

  1. Vælg fanen FILE >vælg Options.
  2. I dialogboksen Indstillinger skal du vælge Add-Ins fra fanerne i venstre side.
  3. Vælg rullemenuen Administrer nederst i vinduet, og vælg derefter Excel-tilføjelser. Vælg Go.

    Image
    Image
  4. Sørg for, at afkrydsningsfeltet ud for Analysis Toolpak er markeret, og vælg derefter OK.

  5. Analyseværktøjspakken er nu aktiv, og du er klar til at anvende F-Tests og T-Tests.

Udførelse af en F-Test og en T-Test i Excel

  1. Indtast to datasæt i et regneark. I dette tilfælde overvejer vi salget af to produkter i løbet af en uge. Den gennemsnitlige daglige salgsværdi for hvert produkt beregnes også sammen med dets standardafvigelse.

    Image
    Image
  2. Vælg fanen Data > Data Analysis

    Image
    Image
  3. Vælg F-Test To-Sample for Variances fra listen, og vælg derefter OK.

    Image
    Image

    F-testen er meget følsom over for ikke-normalitet. Det kan derfor være mere sikkert at bruge en Welch-test, men det er sværere i Excel.

  4. Vælg Variable 1 Range og Variable 2 Range; indstil alfa (0,05 giver 95% sikkerhed); vælg en celle i det øverste venstre hjørne af outputtet, i betragtning af at dette vil fylde 3 kolonner og 10 rækker. Vælg OK.

    Image
    Image

    For Variable 1-området skal prøven med den største standardafvigelse (eller varians) vælges.

  5. Se F-testresultaterne for at afgøre, om der er en signifikant forskel mellem varianserne. Resultaterne giver tre vigtige værdier:

    • F: Forholdet mellem varianserne.
    • P(F<=f) one-tail: Sandsynligheden for, at variabel 1 faktisk ikke har en større varians end variabel 2. Hvis denne er større end alfa, hvilket er generelt 0,05, så er der ingen signifikant forskel mellem varianserne.
    • F Kritisk en-hale: Værdien af F, der kræves for at give P(F<=f)=α. Hvis denne værdi er større end F, indikerer dette også, at der ikke er nogen signifikant forskel mellem varianserne.

    P(F<=f) kan også beregnes ved hjælp af FDIST-funktionen med F og frihedsgrader for hver sample som input. Frihedsgrader er simpelthen antallet af observationer i en prøve minus én.

  6. Nu hvor du ved, om der er forskel mellem afvigelserne, kan du vælge den passende T-test. Vælg fanen Data > Data Analysis, og vælg derefter enten t-Test: Two-Sample Assuming Equal Varianceseller t-Test: To-Sample forudsat ulige varianser

    Image
    Image
  7. Uanset hvilken mulighed du valgte i det foregående trin, vil du blive præsenteret for den samme dialogboks for at indtaste detaljerne i analysen. For at starte skal du vælge de områder, der indeholder eksemplerne for Variable 1 Range og Variable 2 Range.

    Image
    Image
  8. Forudsat at du ikke vil teste for nogen forskel mellem middelværdierne, skal du indstille Hypotesized Mean Difference til nul.
  9. Indstil signifikansniveauet Alpha (0,05 giver 95 % konfidens), og vælg en celle i det øverste venstre hjørne af outputtet, i betragtning af at dette vil fylde 3 kolonner og 14 rækker. Vælg OK.
  10. Gennemgå resultaterne for at afgøre, om der er en væsentlig forskel mellem midlerne.

    Ligesom med F-testen, hvis p-værdien, i dette tilfælde P(T<=t), er større end alfa, så er der ingen signifikant forskel. Men i dette tilfælde er der givet to p-værdier, en for en en-hale test og den anden for en to-hale test. I dette tilfælde skal du bruge to-hale værdien, da hver variabel, der har et større middelværdi, ville være en signifikant forskel.

Anbefalede: