'n T-toets is 'n manier om te besluit of daar statisties beduidende verskille tussen datastelle is, deur 'n Student se t-verspreiding te gebruik. Die T-toets in Excel is 'n twee-steekproef T-toets wat die gemiddeldes van twee monsters vergelyk. Hierdie artikel verduidelik wat statistiese betekenisvolheid beteken en wys hoe om 'n T-toets in Excel te doen.
Instruksies in hierdie artikel is van toepassing op Excel 2019, 2016, 2013, 2010, 2007; Excel vir Microsoft 365 en Excel Online.
Wat is statistiese betekenisvolheid?
Stel jou voor jy wil weet watter van twee dobbelstene 'n beter telling sal gee. Jy gooi die eerste dobbelsteen en kry 'n 2; jy gooi die tweede dobbelsteen en kry 'n 6. Sê dit vir jou dat die tweede dobbelsteen gewoonlik hoër tellings gee? As jy geantwoord het, "Natuurlik nie," dan het jy reeds 'n mate van begrip van statistiese betekenisvolheid. Jy verstaan die verskil was te wyte aan die ewekansige verandering in die telling, elke keer as 'n dobbelsteen gerol word. Omdat die monster baie klein was (slegs een rol) het dit niks betekenisvol getoon nie.
Stel jou nou voor jy gooi elke dobbelsteen 6 keer:
- Die eerste dobbelsteen gooi 3, 6, 6, 4, 3, 3; Gemiddeld=4,17
- Die tweede dobbelsteen gooi 5, 6, 2, 5, 2, 4; Gemiddeld=4,00
Bewys dit nou dat die eerste dobbelsteen hoër tellings as die tweede gee? Waarskynlik nie. 'n Klein steekproef met 'n relatief klein verskil tussen die gemiddeldes maak dit waarskynlik dat die verskil steeds aan ewekansige variasies te wyte is. Soos ons die aantal dobbelstene gooi, word dit moeilik om 'n gesonde verstand-antwoord op die vraag te gee - is die verskil tussen die tellings die gevolg van ewekansige variasie of is die een eintlik meer geneig om hoër tellings as die ander te gee?
Betekenis is die waarskynlikheid dat 'n waargenome verskil tussen steekproewe te wyte is aan ewekansige variasies. Betekenis word dikwels die alfa-vlak of bloot 'α' genoem. Die vertrouensvlak, of bloot 'c,' is die waarskynlikheid dat die verskil tussen die steekproewe nie te wyte is aan ewekansige variasie nie; met ander woorde, dat daar 'n verskil tussen die onderliggende bevolkings is. Daarom: c=1 – α
Ons kan 'α' stel op watter vlak ons ook al wil hê, om vol vertroue te voel dat ons belangrikheid bewys het. Baie dikwels word α=5% gebruik (95% vertroue), maar as ons regtig seker wil wees dat enige verskille nie deur ewekansige variasie veroorsaak word nie, kan ons 'n hoër vertrouensvlak toepas deur α=1% of selfs α=0.1 te gebruik. %.
Verskeie statistiese toetse word gebruik om betekenisvolheid in verskillende situasies te bereken. T-toetse word gebruik om te bepaal of die gemiddeldes van twee populasies verskil en F-toetse word gebruik om te bepaal of die afwykings verskil.
Waarom toets vir statistiese betekenisvolheid?
Wanneer ons verskillende dinge vergelyk, moet ons beduidendheidstoetsing gebruik om te bepaal of die een beter as die ander is. Dit geld vir baie velde, byvoorbeeld:
- In besigheid moet mense verskillende produkte en bemarkingsmetodes vergelyk.
- In sport moet mense verskillende toerusting, tegnieke en mededingers vergelyk.
- In ingenieurswese moet mense verskillende ontwerpe en parameterinstellings vergelyk.
As jy wil toets of iets beter presteer as iets anders, in enige veld, moet jy toets vir statistiese betekenisvolheid.
Wat is 'n student se T-verspreiding?
'n Student se t-verspreiding is soortgelyk aan 'n normale (of Gaussiese) verspreiding. Hierdie is albei klokvormige verspreidings met die meeste resultate naby aan die gemiddelde, maar sommige seldsame gebeurtenisse is redelik ver van die gemiddelde in beide rigtings, waarna verwys word as die sterte van die verspreiding.
Die presiese vorm van die Student se t-verspreiding hang af van die steekproefgrootte. Vir monsters van meer as 30 is dit baie soortgelyk aan die normale verspreiding. Soos die steekproefgrootte verminder word, word die sterte groter, wat die verhoogde onsekerheid verteenwoordig wat voortspruit uit die maak van afleidings gebaseer op 'n klein steekproef.
Hoe om 'n T-toets in Excel te doen
Voordat jy 'n T-toets kan toepas om te bepaal of daar 'n statisties beduidende verskil tussen die gemiddeldes van twee steekproewe is, moet jy eers 'n F-toets uitvoer. Dit is omdat verskillende berekeninge vir die T-toets uitgevoer word, afhangende van of daar 'n beduidende verskil tussen die afwykings is.
Jy sal die Analysis Toolpak-byvoeging nodig hê om hierdie ontleding uit te voer.
Nagaan en laai van die Analysis Toolpak-byvoeging
Volg hierdie stappe om die Analise Toolpak na te gaan en te aktiveer:
-
Kies die FILE-oortjie >kies Options.
- In die Opsies-dialoogkassie, kies Add-Ins van die oortjies aan die linkerkant.
-
Selekteer die Bestuur-aftrekkieslys onderaan die venster en kies dan Excel-byvoegings. Kies Gaan.
- Sorg dat die merkblokkie langs Analysis Toolpak gemerk is, en kies dan OK.
- Die Analise Toolpak is nou aktief en jy is gereed om F-toetse en T-toetse toe te pas.
Voer 'n F-toets en 'n T-toets in Excel uit
-
Voer twee datastelle in 'n sigblad in. In hierdie geval oorweeg ons die verkope van twee produkte gedurende 'n week. Die gemiddelde daaglikse verkoopswaarde vir elke produk word ook bereken, tesame met sy standaardafwyking.
-
Kies die Data-oortjie > Data-analise
-
Kies F-Toets twee-steekproef vir afwykings uit die lys, kies dan OK.
Die F-toets is hoogs sensitief vir nie-normaliteit. Dit kan dus veiliger wees om 'n Welch-toets te gebruik, maar dit is moeiliker in Excel.
-
Kies die Veranderlike 1-reeks en Veranderlike 2-reeks; stel die Alpha (0.05 gee 95% vertroue); kies 'n sel vir die boonste linkerhoek van die afvoer, aangesien dit 3 kolomme en 10 rye sal vul. Kies OK.
Vir die vir Veranderlike 1-reeks moet die steekproef met die grootste standaardafwyking (of variansie) gekies word.
-
Bekyk die F-toetsresultate om te bepaal of daar 'n beduidende verskil tussen die afwykings is. Die resultate gee drie belangrike waardes:
- F: Die verhouding tussen die afwykings.
- P(F<=f) eenstert: Die waarskynlikheid dat veranderlike 1 nie eintlik 'n groter variansie as veranderlike 2 het nie. As dit groter as alfa is, wat is oor die algemeen 0.05, dan is daar geen beduidende verskil tussen die afwykings nie.
- F Kritiese eenstert: Die waarde van F wat vereis sal word om P(F<=f)=α te gee. As hierdie waarde groter as F is, dui dit ook aan dat daar geen beduidende verskil tussen die afwykings is nie.
P(F<=f) kan ook bereken word deur die FDIST-funksie te gebruik met F en die vryheidsgrade vir elke monster as sy insette. Grade van vryheid is bloot die aantal waarnemings in 'n steekproef minus een.
-
Nou dat jy weet of daar 'n verskil tussen die afwykings is, kan jy die toepaslike T-toets kies. Kies die Data-oortjie > Data-analise, en kies dan óf t-toets: twee-steekproef met gelyke afwykingsof t-toets: twee-steekproef wat ongelyke afwykings veronderstel
-
Ongeag watter opsie jy in die vorige stap gekies het, sal dieselfde dialoogkassie aan jou gebied word om die besonderhede van die analise in te voer. Om te begin, kies die reekse wat die monsters bevat vir Variable 1 Range en Variable 2 Range.
- Veronderstel jy wil toets vir geen verskil tussen die gemiddeldes nie, stel die Hipotese gemiddelde verskil op nul.
- Stel die betekenisvlak Alpha (0.05 gee 95% vertroue), en kies 'n sel vir die boonste linkerhoek van die afvoer, aangesien dit 3 kolomme en 14 rye sal vul. Kies OK.
-
Gaan die resultate na om te besluit of daar 'n beduidende verskil tussen die middele is.
Net soos met die F-toets, as die p-waarde, in hierdie geval P(T<=t), groter as alfa is, dan is daar geen beduidende verskil nie. In hierdie geval word daar egter twee p-waardes gegee, een vir 'n eensterttoets en die ander vir 'n tweesterttoets. Gebruik in hierdie geval die tweestertwaarde aangesien enige veranderlike met 'n groter gemiddelde 'n beduidende verskil sal wees.