Test av hypoteser

En enkel och kort handledning om hypotesundersökning med Python

Bild från: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

I den här bloggen kommer jag att ge en kort tutorial om hypotestestning med hjälp av statistiska metoder i Python. Test av hypoteser är en del av den vetenskapliga metoden som vi alla känner till, något vi antagligen har lärt oss under våra tidiga utbildningsår. I statistik görs dock många experiment på ett urval av en befolkning.

”Att fastställa vad ett urval av observationer berättar om en föreslagen förklaring, i allmänhet, kräver att vi gör en slutsats, eller som vi statistiker kallar det, för att resonera med osäkerhet. Att resonera med osäkerhet är kärnan i statistisk inferens och görs vanligtvis med en metod som kallas Null Hypotese Significance Testing. ” -Ovens.

Som ett exempel för denna blogg kommer jag att använda en europeisk fotbollsuppsättning som finns på Kaggle och kommer att utföra hypotesundersökningar. Datasatsen kan hittas här.

Steg 1

Gör en observation

Det första steget är att observera fenomen. I det här fallet kommer det att vara: Finns det en påverkan av försvarsaggression i genomsnitt tillåtna mål?

Steg 2

Undersök forskningen

Ett bra tankesätt att gå förbi är att arbeta smartare och inte svårare. En bra sak att göra är att se om det redan finns forskning som rör din observation. I så fall kan det hjälpa till att besvara vår fråga. Att vara medveten om redan befintlig forskning eller experiment kommer att hjälpa oss att strukturera vårt experiment bättre, eller kanske till och med besvara vår fråga och inte behöva utföra experimentet i första hand.

Steg 3

Forma en nollhypotes och en alternativ hypotes

En alternativ hypotes är vår utbildade gissning och en nollhypotes är helt enkelt motsatsen. Om den alternativa hypotesen säger att det finns ett signifikant samband mellan två variabler, säger nollhypotesen att det inte finns någon signifikant relation.

Vår nollhypotes kommer att vara: Det finns ingen statistisk skillnad i mål som är tillåtna för lag med en försvarsaggression som är större än eller lika med 65 mot lag under 65.

Alternativ hypotese: Det finns en statistisk skillnad i mål som är tillåtna för lag med ett försvarsaggresionsbetyg större än eller lika med 65 mot lag under 65.

Steg 4

Bestäm om vår hypotesen är ett test med en stjärna eller ett två-svansat test.

En-Tailed Test

"Om du använder en signifikansnivå på 0,05 tillåter ett enstansat test all din alfa att testa den statistiska signifikansen i en riktning av intresse." Ett exempel på ett enstansat test skulle vara "Fotbollslag med en aggresionsbedömning lägre än 65 tillåter statistiskt signifikant fler mål än lag med en rating lägre än 65."

Två-Tailed Test

”Om du använder en signifikansnivå på 0,05 tillåter ett två-svansat test hälften av din alfa att testa den statistiska signifikansen i en riktning och hälften av din alfa för att testa statistisk betydelse i den andra riktningen. Det betyder att 0,025 är i varje svans i fördelningen av din teststatistik. ”

Med ett två-svansat test testar du den statistiska betydelsen i båda riktningarna. I vårt fall testar vi den statistiska betydelsen i båda riktningarna.

Steg 5

Ställ in en tröskelvärdesnivå (alfa)

(alfavärde): Marginaltröskeln där vi är okej med att avvisa nollhypotesen. Ett alfavärde kan vara vilket värde vi sätter mellan 0 och 1. Det vanligaste alfavärdet i vetenskapen är dock 0,05. En alfa inställd på 0,05 betyder att vi är okej med att avvisa nollhypotesen även om det finns en chans på 5% eller mindre att resultaten beror på slumpmässighet.

P-värde: Den beräknade sannolikheten för att komma fram till dessa data slumpmässigt.

Om vi ​​beräknar ett p-värde och det uppgår till 0,03, kan vi tolka detta som att säga ”Det finns en 3% chans att resultaten jag ser faktiskt beror på slumpmässighet eller ren tur”.

Bild från Learn.co

Vårt mål är att beräkna p-värdet och jämföra det med vår alfa. Ju lägre alfa desto strängare test.

Steg 6

Utför provtagning

Här har vi vårt datasätt som heter fotboll. För vårt test behöver vi bara två kolumner i vår datauppsättning: team_def_aggr_rating och goals_allowed. Vi filtrerar ut dem till dessa två kolumner och skapar sedan två delmängder för lag med defensiv aggresionsbedömning större än eller lika med 65 och lag med defensiv aggresionsgradering under 65.

Bara för att sammanfatta för vårt hypotest:

Effekten av försvarsaggression i genomsnitt tillåtna mål. Nollhypotes: Det finns ingen statistisk skillnad i mål som är tillåtna för lag med ett försvarsaggresionsbetyg större än eller lika med 65 mot lag under 65. Alternativ hypotese: Det finns en statistisk skillnad i mål som är tillåtna för lag med ett försvarsaggresionsbetyg större än eller lika med 65 mot lag under 65. Två-tailed Test Alpha: 0,05

Nu har vi två listor med prover som vi kan köra statistiska test på. Innan det steget planerar jag de två distributionerna för att få en visual.

Steg 7

Utför två-prov-T-test

T-provet med två prov används för att bestämma om två populationsmedel är lika. För detta kommer vi att använda Python-modulen som heter statsmodeller. Jag kommer inte gå in på för mycket detaljer om statistikmodeller men du kan se dokumentationen här.

Steg 8

Utvärdera och dra slutsatsen

Kom ihåg att alfa som vi satt var = 0,05. Som vi kan se av våra testresultat att p-värdet är mindre än vår alfa. Vi kan avvisa vår nollhypotes och med 95% förtroende acceptera vår alternativa hypotes.

Tack för att du läste! För mer fördjupad hypotesundersökning kan du kolla in detta gruppprojekt på GitHub som jag var inblandad i på hypotestning här.

Resurser:

Ugnar, Matthew. ”Statistik och” vetenskaplig metod ”Hämtad från YourStatsGuru. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Introduktion till SAS. UCLA: Statistical Consulting Group. från https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (nås maj 16, 2019).

Teknisk statistikhandbok. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm