Er det statistisk signifikante forskjeller i dataene dine?
Hvem som helst kan se forskjellen mellom to tall, men det kan være mer arbeid å finne ut om denne forskjellen faktisk er statistisk signifikant.
La oss si at du har gjemmomført en spørreundersøkelse om kundetilfredshet for selskapet ditt, og at du har mange resultater å analysere. Du spør sjefen din hva du først skal analysere, og hun sier at hun vil vite om menn og kvinner gir forskjellige svar. Gir for eksempel menn i gjennomsnitt selskapet ditt en lavere Net Promoter Score℠ (NPS) enn kvinner?
Når du graver i dataene ser du at gjennomsnittlig rangering fra mannlige respondenter var 9, sammenlignet med en gjennomsnittlig poengsum på 12 fra kvinnelige respondenter. Hvordan vet du om 9 er vesentlig forskjellig fra 12? Det er her t-testen kommer inn i bildet.
T-testen er en måte å fastslå om to tall er vesentlig forskjellige fra hverandre. Det er flere typer t-test, og hver beregnes ved å bruke en annen formel.
1. T-test med én prøve: Denne testen ser på om gjennomsnittet (aka gjennomsnittet) av data fra en gruppe (i dette tilfellet den totale NPS) er forskjellig fra en verdi du angir.
Eksempel: Bedriftens mål er å ha en NPS som er betydelig høyere enn bransjestandarden på 5. Din bedrifts nyeste spørreundersøkelse setter NPS til 10. Er en NPS på 10 betydelig høyere enn bransjestandarden på 5?
2. T-test med dobbelt utvalg: Denne testen undersøker om virkemidlene til to uavhengige grupper er vesentlig forskjellige fra hverandre.
Eksempel: Hypotesen din er at menn gir selskapet ditt en lavere NPS enn kvinner. Gjennomsnittlig NPS fra mannlige respondenter er 9, mens gjennomsnittlig poengsum fra kvinner er 12. Er 9 betydelig forskjellig fra 12?
3. Sammenkoblet t-test: Denne testen er for når du gir en gruppe mennesker den samme spørreundersøkelsen to ganger. En sammenkoblet t-test lar deg vite om middelverdien ble endret mellom første og andre spørreundersøkelse.
Eksempel: Du har utført en spørreundersøkelse for den samme gruppen kunder to ganger: én gang i april og én gang i mai, etter at de hadde sett en annonse for bedriften din. Har bedriftens NPS endret seg etter at kundene så annonsen?
Merk at selv om t-tester kan fortelle deg om noe er vesentlig annerledes, er det opp til deg å avgjøre om denne forskjellen er meningsfull. Små forskjeller kan være statistisk signifikante hvis utvalgsstørrelsen er stor nok.
Det er 4 trinn for å utføre en t-test:
1. Beregn t-statistikken:
Hver type t-test har en annen formel for beregning av t-statistikken (du kan bla til bunnen av siden for å finne alle de tre formlene).
2. Beregn frihetsgrader:
Grad av frihet er antall måter gjennomsnittet kan variere på. I dette tilfellet er frihetsgraden antallet NPS-rangeringer du kan ha i en gitt gruppe respondenter. I likhet med t-statistikken vil formelen for frihetsgraden variere avhengig av hvilken type t-test du utfører.
3. Bestem den kritiske verdien:
Den kritiske verdien er terskelen der forskjellen mellom to tall anses å være statistisk signifikant.
4. Sammenlign absolutt verdi av t-statistikken med kritisk verdi:
Hvis t-statistikken din er større enn din kritiske verdien, er forskjellen din betydelig. Hvis t-statistikken din er mindre, er de to tallene dine, statistisk sett, umulig å skille fra hverandre.
La oss gå gjennom eksemplet fra begynnelsen: Hypotesen din er at menn gir en lavere NPS til selskapet ditt enn kvinner. Gjennomsnittlig NPS fra menn er 9, mens gjennomsnittlig poengsum for kvinner er 12. Er 9 betydelig forskjellig fra 12? Dette er et eksempel på hvor du kan bruke t-testen med dobbelt utvalg.
1. Beregn t-statistikk:
Nedenfor er formelen for t-testen med dobbelt utvalg, hvor:
2. Beregn frihetsgrad:
Denne formelen må brukes til å bestemme frihetsgrad i t-tester med dobbelt utvalg. Formlene for andre typer tester er oppført nedenfor.
3. Fastslå kritisk verdi:
Ifølge denne tabellen er den kritiske verdien 2,02 for en tohaletest med et alfanivå på 0,05 ved 41 graders frihet. Legg merke til at de fleste analytikere bruker en to-halet test i stedet for en énhalet test fordi den er mer konservativ. Hvis du vil ha mer informasjon om forskjellene mellom énhalet og tohalete tester, kan du ta en titt på denne videoen fra Khan Academy.
4. Sammenlign den absolutte verdien av t-statistikken med kritisk verdi:
Siden den absolutte verdien av t-statistikken er 0,86, som ikke er større enn den kritiske verdien på 2,02, kan du konkludere med at menn ikke gir en betydelig lavere NPS-rangering enn kvinner.
Du vil sannsynligvis gjennomføre t-testene i et regneark eller statistisk program (som Excel eller SPSS), men hvis du vil gjøre regnestykket for hånd, er formlene for de to andre typene t-tester inkludert nedenfor.
Hvis du bestemmer deg (som folk flest gjør) for å utføre t-tester i et regneark eller statistisk program, vil prosessen være litt annerledes. I stedet for å sammenligne t-statistikken med den kritiske verdien, beregner de fleste programmer en p-verdi, som den sammenligner med alfanivået ditt (det mest brukte nivået er 0,05). I dette tilfellet vil en p-verdi som er lavere enn alfanivået ditt vise at tallene er vesentlig forskjellige.
Net Promoter Score er et varemerke som tilhører Bain & Company, Inc, Satmetrix Systems, Inc. og F. Reichheld.
Innsiktsledere kan bruke disse verktøyene for å oppnå overbevisende, gjennomførbar innsikt som støtter interessenter og for å nå riktig målgruppe.
Bransjen for forbrukerprodukter og -tjenester, deriblant forbruksvarer, reiseliv, hotell og restaurant, benytter SurveyMonkey-innsikt for å forme fremtidige produkter.
Se hvordan SurveyMonkey hjelper detaljhandelen med å finne ut av nye markedstrender, utvikle produkter som begeistrer og bygge populære merkevarer.
Se hvordan organisasjoner innen profesjonelle tjenester bruker SurveyMonkey for å få innsikt om kunder og marked.