2 kriterier. Testar hypotesen om log Return Independence

Pearsons chi-kvadrattest är en icke-parametrisk metod som låter dig utvärdera betydelsen av skillnader mellan det faktiska (avslöjade som ett resultat av studien) antalet resultat eller kvalitativa egenskaper hos urvalet som faller inom varje kategori, och det teoretiska antal som kan förväntas i de studerade grupperna om nollhypotesen är sann. I enklare termer låter metoden dig utvärdera den statistiska signifikansen av skillnader mellan två eller flera relativa indikatorer (frekvenser, andelar).

1. Historien om utvecklingen av χ 2-kriteriet

Chi-kvadrattestet för analys av beredskapstabeller utvecklades och föreslogs 1900 av en engelsk matematiker, statistiker, biolog och filosof, grundaren av matematisk statistik och en av grundarna av biometri. Karl Pearson(1857-1936).

2. Vad används Pearsons χ 2-kriterium för?

Chi-kvadrattestet kan användas i analysen beredskapstabeller innehållande information om frekvensen av utfall beroende på förekomsten av en riskfaktor. Till exempel, beredskapstabell med fyra fält som följer:

Exodus är (1) Ingen utgång (0) Total
Det finns en riskfaktor (1) A B A+B
Ingen riskfaktor (0) C D C+D
Total A+C B+D A+B+C+D

Hur fyller man i en sådan beredskapstabell? Låt oss överväga ett litet exempel.

En studie pågår om effekten av rökning på risken att utveckla arteriell hypertoni. För detta valdes två grupper av försökspersoner ut - den första inkluderade 70 personer som röker minst 1 paket cigaretter dagligen, den andra - 80 icke-rökare i samma ålder. I den första gruppen hade 40 personer högt blodtryck. I den andra - arteriell hypertoni observerades hos 32 personer. Följaktligen var normalt blodtryck i gruppen rökare hos 30 personer (70 - 40 = 30) och i gruppen icke-rökare - hos 48 (80 - 32 = 48).

Vi fyller i beredskapstabellen med fyra fält med de initiala uppgifterna:

I den resulterande beredskapstabellen motsvarar varje rad en specifik grupp av ämnen. Kolumner - visar antalet personer med arteriell hypertoni eller med normalt blodtryck.

Utmaningen för forskaren är: finns det statistiskt signifikanta skillnader mellan frekvensen av personer med blodtryck bland rökare och icke-rökare? Du kan svara på denna fråga genom att beräkna Pearsons chi-kvadrattest och jämföra det resulterande värdet med det kritiska.

3. Villkor och begränsningar för användningen av Pearsons chi-kvadrattest

  1. Jämförbara indikatorer bör mätas i nominell skala(till exempel patientens kön - man eller kvinna) eller i ordinarie(till exempel graden av arteriell hypertoni, med värden från 0 till 3).
  2. Denna metod tillåter analysen inte bara av fyrafältstabeller, när både faktorn och utfallet är binära variabler, det vill säga de har bara två möjliga värden (till exempel man eller kvinna, närvaron eller frånvaron av en viss sjukdom i historien ...). Pearsons chi-kvadrattest kan också användas vid analys av flerfältstabeller, när faktorn och (eller) utfallet tar tre eller fler värden.
  3. De matchade grupperna bör vara oberoende, det vill säga chi-kvadrattestet ska inte användas när man jämför före-efter-observationer. McNemar test(när man jämför två relaterade populationer) eller beräknas Q-test Cochran(vid jämförelse av tre eller flera grupper).
  4. Vid analys av fyrafältstabeller förväntade värden i var och en av cellerna måste vara minst 10. I händelse av att det förväntade fenomenet i minst en cell tar ett värde från 5 till 9, måste chi-kvadrattestet beräknas med Yates-korrigering. Om det förväntade fenomenet i minst en cell är mindre än 5, bör analysen använda Fishers exakta test.
  5. Vid analys av flerfältstabeller bör det förväntade antalet observationer inte ta värden mindre än 5 i mer än 20% av cellerna.

4. Hur beräknar man Pearsons chi-kvadrattest?

För att beräkna chi-kvadrattestet måste du:

Denna algoritm är tillämplig för både fyrfälts- och flerfältstabeller.

5. Hur tolkar man värdet av Pearsons chi-kvadrattest?

I händelse av att det erhållna värdet av kriteriet χ 2 är större än det kritiska drar vi slutsatsen att det finns ett statistiskt samband mellan den studerade riskfaktorn och utfallet på lämplig signifikansnivå.

6. Ett exempel på beräkning av Pearson chi-kvadrattest

Låt oss bestämma den statistiska signifikansen av inverkan av rökfaktorn på förekomsten av arteriell hypertoni enligt tabellen ovan:

  1. Vi beräknar de förväntade värdena för varje cell:
  2. Hitta värdet av Pearsons chi-kvadrattest:

    χ 2 \u003d (40-33,6) 2 / 33,6 + (30-36,4) 2 / 36,4 + (32-38,4) 2 / 38,4 + (48-41,6) 2 / 41,6 \u003d 4,396.

  3. Antalet frihetsgrader f = (2-1)*(2-1) = 1. Vi hittar det kritiska värdet för Pearsons chi-kvadrattest från tabellen, som vid signifikansnivån p=0,05 och antalet frihetsgrader 1 är 3,841.
  4. Vi jämför det erhållna värdet av chi-kvadrattestet med det kritiska: 4,396 > 3,841, därför är beroendet av förekomsten av arteriell hypertoni på närvaron av rökning statistiskt signifikant. Signifikansnivån för detta förhållande motsvarar sid<0.05.

ODA. Empiriska frekvenser är faktiskt observerade frekvenser.

VERIFIERING AV HYPOTESEN OM FÖRDELNING AV DEN ALLMÄNNA BEFOLKNINGEN. PEARSONS KRITERIUM

Som tidigare noterats kan antagandet om typen av fördelning läggas fram utifrån teoretiska premisser. Men oavsett hur väl den teoretiska distributionslagen väljs är diskrepanser oundvikliga mellan de empiriska och teoretiska fördelningarna. Frågan uppstår naturligtvis: beror dessa avvikelser endast på slumpmässiga omständigheter förknippade med ett begränsat antal observationer, eller är de signifikanta och är relaterade till det faktum att den teoretiska distributionslagen valdes utan framgång. Överenskommelsekriteriet tjänar till att besvara denna fråga, dvs.

ODA. Överensstämmelsekriterium kallas kriteriet för att testa hypotesen för den föreslagna lagen om den okända fördelningen.

För varje kriterium, dvs. motsvarande fördelning, brukar tabeller sammanställas, efter vilka de hittar k kr (se bilagor). Efter att den kritiska punkten har hittats, beräknas det observerade värdet av kriteriet från provdata Till obs. Om en Till obs > k kr, då förkastas nollhypotesen, om vice versa, så accepteras den.

Låt oss beskriva tillämpningen av Pearson-kriteriet för att testa hypotesen om en normalfördelning av den allmänna befolkningen. Pearsons kriterium svarar på frågan om diskrepansen mellan empiriska och teoretiska frekvenser är tillfällig?

Pearson-kriteriet, liksom vilket kriterium som helst, bevisar inte hypotesens giltighet, utan fastställer endast, på den accepterade signifikansnivån, dess överensstämmelse eller oenighet med observationsdata.

Så låt en empirisk fördelning erhållas från ett urval av storlek n. På en signifikansnivå a krävs att man testar nollhypotesen: populationen är normalfördelad.

Som ett kriterium för att testa nollhypotesen tas en stokastisk variabel c 2 =, där är de empiriska frekvenserna; - teoretiska frekvenser.

Denna SW har c 2 - fördelning med k - frihetsgrader. Antalet frihetsgrader hittas av ekvationen k=m –r -1, m är antalet partiella samplingsintervall; r är antalet fördelningsparametrar. För en normalfördelning r=2 (a och s), då k=m –3.

För att testa nollhypotesen på en given nivå av signifikans: befolkningen är normalfördelad, är det nödvändigt:

1. Beräkna provets medelvärde och provets standardavvikelse.

2. Beräkna de teoretiska frekvenserna,

där n är provstorleken; h - steg (skillnaden mellan två intilliggande alternativ); ; funktionsvärden titta på applikationen.

3. Jämför empiriska och teoretiska frekvenser med hjälp av Pearsons test. För detta:



a) hitta det observerade värdet av kriteriet;

b) enligt tabellen över kritiska fördelningspunkter c 2 , enligt den givna signifikansnivån a och antalet frihetsgrader k, hitta den kritiska punkten .

Om en< - нет оснований отвергнуть нулевую гипотезу. Если >– Nollhypotesen förkastas.

Kommentar. Få frekvenser (<5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы следует в качестве m принять число групп выборки, оставшихся после объединения частот.

I de tidigare anteckningarna beskrevs procedurerna för att testa hypoteser om numeriska och kategoriska data: , flera , och även , vilket gör att du kan studera en eller . I den här anteckningen kommer vi att överväga metoder för att testa hypoteser om skillnader mellan proportionerna av en egenskap i allmänna populationer baserat på flera oberoende urval.

För att illustrera de använda metoderna används ett scenario som bedömer graden av tillfredsställelse hos gästerna på hotell som ägs av T. C. Resort Properties. Föreställ dig att du är chef för ett företag som äger fem hotell som ligger på två resortöar. Om gästerna är nöjda med servicen är chansen stor att de kommer tillbaka nästa år och rekommenderar ditt hotell till sina vänner. För att utvärdera kvaliteten på servicen ombeds gästerna att fylla i ett frågeformulär och ange om de är nöjda med gästfriheten. Du måste analysera undersökningsdata, bestämma den övergripande graden av gästnöjdhet, bedöma sannolikheten för att gäster kommer igen nästa år och även bestämma orsakerna till eventuellt missnöje hos vissa kunder. På en av öarna äger företaget till exempel hotellen Beachcomber och Windsurfer. Är servicen densamma på dessa hotell? Om inte, hur kan denna information användas för att förbättra företagets kvalitet? Dessutom, om några gäster sa att de inte skulle komma till dig igen, vilka skäl ger de oftare än andra? Kan man hävda att dessa skäl endast gäller ett visst hotell och inte gäller hela företaget som helhet?

Följande notation används här: X 1 - antalet framgångar i den första gruppen, X 2 - antalet framgångar i den andra gruppen, n 1 X 1 - antalet misslyckanden i den första gruppen, n 2 X 2 - antalet misslyckanden i den andra gruppen, X=X 1 + X 2 - totalt antal framgångar, nX = (n 1 X 1 ) + (n 2 X 2 ) är det totala antalet misslyckanden, n 1 - volymen av det första provet, n 2 - volymen av det andra provet, n = n 1 + n 2 är den totala provvolymen. Tabellen som visas har två rader och två kolumner, varför den kallas en 2x2 faktortabell. Cellerna som bildas av skärningspunkten mellan varje rad och kolumn innehåller antalet framgångar eller misslyckanden.

Låt oss åskådliggöra tillämpningen av händelsetabellen med hjälp av scenariot som beskrivs ovan som ett exempel. Antag att frågan "Kommer du tillbaka nästa år?" 163 av 227 gäster på Beachcomber hotel svarade ja, och 154 av 262 gäster på Windsurfer hotel. Finns det en statistiskt signifikant skillnad mellan hotellgästnöjdhet (vilket är sannolikheten att gäster kommer tillbaka nästa år) om signifikansnivån är 0,05?

Ris. 2. Faktortabell 2x2 för bedömning av kvaliteten på kundservice

Den första raden anger antalet gäster på varje hotell som deklarerat sin önskan att återvända nästa år (framgång); på andra raden - antalet gäster som uttryckte missnöje (misslyckande). Cellerna i kolumnen Totalt innehåller det totala antalet gäster som planerar att återvända till hotellet nästa år, samt det totala antalet gäster som är missnöjda med tjänsten. Cellerna på raden "Totalt" innehåller det totala antalet intervjuade gäster på varje hotell. Andelen gäster som planerar att återvända beräknas genom att dividera antalet gäster som rapporterat återvändande med det totala antalet gäster som undersökts på det hotellet. Sedan tillämpas χ 2 -kriteriet för att jämföra de beräknade andelarna.

För att testa noll- och alternativhypoteserna H 0: p 1 \u003d p 2; H 1: p 1 ≠ p 2 vi använder test χ 2 -statistik.

Chi-kvadrattest för att jämföra två proportioner. Testet χ 2 -statistik är lika med summan av skillnaderna i kvadrat mellan det observerade och förväntade antalet framgångar, dividerat med det förväntade antalet framgångar i varje cell i tabellen:

var f 0- det observerade antalet framgångar eller misslyckanden i en viss cell i beredskapstabellen, fe

Testet χ 2 -statistik approximeras av en χ 2 -fördelning med en frihetsgrad.

Eller misslyckanden i varje cell i beredskapstabellen med tecken, det är nödvändigt att förstå deras innebörd. Om nollhypotesen är sann, dvs. framgångsfrekvenserna i de två populationerna är lika, urvalsandelarna som beräknas för var och en av de två grupperna kan skilja sig från varandra endast av slumpmässiga skäl, och båda andelarna är en uppskattning av en gemensam parameter för populationen R. I denna situation är statistiken som kombinerar båda andelarna i en övergripande (medelvärde) uppskattning av parametern R , representerar den totala framgångsfrekvensen i poolade grupper (dvs lika med det totala antalet framgångar dividerat med den totala urvalsstorleken). Hennes tillägg, 1 – , representerar den totala felfrekvensen i de poolade grupperna. Med hjälp av notationen, vars betydelse beskrivs i tabellen i fig. 1. du kan härleda formeln (2) för att beräkna parametern :

var - den genomsnittliga andelen av funktionen.

För att beräkna det förväntade antalet framgångar fe(dvs innehållet i den första raden i funktionstabellen), är det nödvändigt att multiplicera provstorleken med parametern . För att beräkna det förväntade antalet fel fe(dvs innehållet i den andra raden i särdragstabellen), är det nödvändigt att multiplicera provstorleken med parametern 1 – .

Teststatistiken beräknad med formel (1) approximeras av en χ 2 -fördelning med en frihetsgrad. För en given signifikansnivå α förkastas nollhypotesen om den beräknade χ 2 -statistiken är större än χ U 2 , det övre kritiska värdet för χ 2 -fördelningen med en frihetsgrad. Så här ser beslutsregeln ut: hypotesen H 0 förkastas om χ 2 > χ U 2 , annars hypotesen H 0 avviker inte (fig. 3).

Ris. 3. Kritiskt område χ 2 -kriterier för att jämföra aktier på en signifikansnivå α

Om nollhypotesen är sann är den beräknade χ 2 -statistiken nära noll eftersom kvadraten på skillnaden mellan de observerade f 0 och förväntat fe värdena i varje cell är mycket små. Å andra sidan, om nollhypotesen H 0är falsk och det finns en signifikant skillnad mellan framgångsfrekvenser i populationer, måste den beräknade χ 2 -statistiken vara stor. Detta beror på skillnaden mellan det observerade och förväntade antalet framgångar eller misslyckanden i varje cell, som ökar vid kvadrering. Bidragen från skillnaderna mellan de förväntade och observerade värdena till den övergripande χ 2 -statistiken kanske inte är desamma. Samma faktiska skillnad mellan f 0 och fe kan ha större effekt på χ 2 -statistiken om cellen innehåller resultaten av ett litet antal observationer än skillnaden som motsvarar ett större antal observationer.

För att illustrera χ 2-testet för att testa hypotesen om likhet mellan två aktier, låt oss återgå till scenariot som beskrivits tidigare, vars resultat visas i fig. 2. Nollhypotesen (H 0: p 1 = p 2) säger att när man jämför servicekvaliteten på två hotell är andelen gäster som planerar att återvända nästa år nästan desamma. För att utvärdera parametern R, som representerar andelen gäster som planerar att återvända till hotellet, om nollhypotesen är sann, används värdet , som beräknas med formeln

Andel gäster som är missnöjda med service = 1 - 0,6483 = 0,3517. Att multiplicera dessa två proportioner med antalet tillfrågade gäster på Beachcomber-hotellet ger det förväntade antalet gäster som planerar att återvända nästa säsong, liksom antalet semesterfirare som inte längre kommer att bo på detta hotell. På samma sätt beräknas den förväntade andelen gäster på Windsurfer-hotellet:

Ja - Beachcomber: = 0,6483, n 1 = 227, därför, fe = 147,16.
Ja - vindsurfare: = 0,6483, n 2 = 262, därför, fe = 169,84.
Nej - Beachcomber: 1 - = 0,3517, n 1 = 227, därför, fe = 79,84.
Nej - Vindsurfare: 1 - = 0,3517, n 2 = 262, därför, fe = 92,16.

Beräkningar presenteras i fig. 4.

Ris. 4. χ 2 -statistik för hotell: a) Inledande uppgifter. (b) 2x2 faktortabell för att jämföra de observerade ( f 0 ) och förväntat ( fe) antalet gäster som är nöjda och missnöjda med tjänsten; (c) Beräkning av χ 2-statistik vid jämförelse av andelen gäster som är nöjda med tjänsten. (d) beräkning av det kritiska värdet för test χ 2-statistiken

För att beräkna det kritiska värdet för testet χ 2 -statistik, används Excel-funktionen =ХИ2.OBR(). Om signifikansnivån α = 0,05 (sannolikheten som ersätts i HI2.OBR-funktionen är 1 – α), och χ 2-fördelningen för 2×2-faktortabellen har en frihetsgrad, är det kritiska värdet för χ 2-statistiken 3,841. Eftersom det beräknade värdet för χ 2-statistiken, lika med 9,053 (fig. 4c), överstiger talet 3,841, förkastas nollhypotesen (fig. 5).

Ris. 5. Bestämning av det kritiska värdet för testet χ 2 -statistik med en frihetsgrad vid en signifikansnivå α = 0,05

Sannolikhet R att nollhypotesen är sann när χ 2 -statistiken är 9,053 (och en frihetsgrad) beräknas i Excel med funktionen =1 - CHI2.DIST(9,053;1;TRUE) = 0,0026. R-värde lika med 0,0026 är sannolikheten att skillnaden mellan urvalsandelen för gäster som är nöjda med servicen på Beachcomber- och Windsurfer-hotellen är lika med eller större än 0,718 - 0,588 = 0,13, om deras andelar i båda populationerna faktiskt är samma . Det finns alltså goda skäl att hävda att det finns en statistiskt säkerställd skillnad i gästservice mellan de två hotellen. Studier visar att antalet gäster som är nöjda med servicen på Beachcomber är större än antalet gäster som planerar att bo på Windsurfer igen.

Kontrollera antagandena om faktortabellen 2×2. För att erhålla korrekta resultat baserat på data som ges i 2x2-tabellen är det nödvändigt att antalet framgångar eller misslyckanden överstiger siffran 5. Om detta villkor inte uppfylls, är det exakta Fishers kriterium.

När man jämför andelen kunder som är nöjda med servicekvaliteten på två hotell leder Z- och χ 2-kriterierna till samma resultat. Detta kan förklaras av att det finns ett nära samband mellan den standardiserade normalfördelningen och χ 2 -fördelningen med en frihetsgrad. I detta fall är χ 2 -statistiken alltid kvadraten på Z-statistiken. Till exempel, när vi bedömde gästnöjdhet, fann vi det Z-statistik är +3,01 och χ 2 -statistik är 9,05. Om man bortser från avrundningsfel är det lätt att verifiera att det andra värdet är kvadraten på det första (dvs. 3,01 2 = 9,05). Dessutom, genom att jämföra de kritiska värdena för båda statistiken vid en signifikansnivå av α = 0,05, kan det konstateras att värdet på χ 1 2 lika med 3,841 är kvadraten på det övre kritiska värdet av Z-statistik lika med till +1,96 (dvs x12 = Z2). Dessutom, R- Värdena för båda kriterierna är desamma.

Således kan det hävdas att när man testar noll- och alternativhypoteserna H 0: p 1 \u003d p 2; H 1: p 1 ≠ p 2 kriterierna Z och χ 2 är ekvivalenta. Men om det inte bara är nödvändigt att upptäcka skillnader utan också att bestämma vilken andel som är större (p 1 > p 2), skall tillämpa ett Z-test med ett kritiskt område avgränsat av svansen av en standardiserad normalfördelning. Följande kommer att beskriva tillämpningen av χ 2-testet för att jämföra proportioner av en egenskap i flera grupper. Det bör noteras att Z-testet inte kan tillämpas i denna situation.

Tillämpning av χ 2 -kriteriet för att testa hypotesen om likheten mellan flera aktier

Chi-kvadrattestet kan utökas till ett mer generellt fall och användas för att testa hypotesen att flera delar av en egenskap är lika. Låt oss beteckna antalet analyserade oberoende populationer med bokstaven med. Nu består funktionstabellen av två rader och med kolumner. För att testa noll- och alternativhypoteserna H 0: p 1 \u003d p 2 = … = p 2, H 1: Inte alla Rj lika med varandra (j = 1, 2, …, c), test χ 2 -statistik används:

var f 0- det observerade antalet framgångar eller misslyckanden i en viss cell i faktortabellen 2* med, fe- Det teoretiska, eller förväntade, antalet framgångar eller misslyckanden i en viss cell i beredskapstabellen, förutsatt att nollhypotesen är sann.

För att beräkna det förväntade antalet framgångar eller misslyckanden i varje cell i beredskapstabellen måste du tänka på följande. Om nollhypotesen är sann och framgångsfrekvenserna i alla populationer är lika, kan motsvarande urvalsandelar skilja sig från varandra endast av slumpmässiga skäl, eftersom alla andelar är uppskattningar av funktionens andel R i den allmänna befolkningen. I denna situation, en statistik som kombinerar alla andelar i en övergripande (eller genomsnittlig) parameteruppskattning R, innehåller mer information än någon av dem individuellt. Denna statistik, betecknad med symbolen , representerar den totala (eller genomsnittliga) andelen framgång i det poolade urvalet.

Beräkning av den genomsnittliga andelen:

För att beräkna det förväntade antalet framgångar fe i den första raden i tabellen för funktionsberedskap är det nödvändigt att multiplicera volymen av varje prov med parametern . För att beräkna det förväntade antalet fel fe i den andra raden i särdragstabellen är det nödvändigt att multiplicera volymen av varje prov med parametern 1 – . Teststatistiken beräknad med formel (1) approximeras av χ 2 -fördelningen. Antalet frihetsgrader för denna fördelning ges av kvantiteten (r - 1)(c – 1) , var r- antalet rader i faktortabellen, med- antalet kolumner i tabellen. För faktortabell 2*s antalet frihetsgrader är (2 - 1)(s - 1) = s - 1. För en given signifikansnivå α förkastas nollhypotesen om den beräknade χ 2 -statistiken är större än det övre kritiska värdet χ U 2 som ingår i χ 2 -fördelningen med s - 1 grader av frihet. Så här ser beslutsregeln ut: hypotesen H 0 förkastas om χ 2 > χ U 2 (Fig. 6), annars förkastas hypotesen.

Ris. 6. Kritiskt område χ 2 -kriterium för jämförelse med andelen på signifikansnivån α

Kontroll av antaganden gällande faktortabellen 2*c. För att erhålla korrekta resultat baserat på data som ges i faktortabellen 2* med, är det nödvändigt att antalet framgångar eller misslyckanden är tillräckligt stort. Vissa statistiker tror att kriteriet ger korrekta resultat om de förväntade frekvenserna är större än 0,5. Mer konservativa forskare kräver att inte mer än 20% av cellerna i beredskapstabellen innehåller förväntade värden som är mindre än 5, och ingen cell ska innehålla det förväntade värdet mindre än ett. Det senare villkoret förefaller oss vara en rimlig kompromiss mellan dessa ytterligheter. För att uppfylla detta villkor bör kategorier som innehåller små förväntade värden kombineras till en. Därefter blir kriteriet mer exakt. Om det av någon anledning inte är möjligt att kombinera flera kategorier bör alternativa förfaranden tillämpas.

För att illustrera χ 2-testet för att testa hypotesen om lika andelar i flera grupper, låt oss återgå till scenariot som beskrivs i början av kapitlet. Överväg en liknande undersökning som involverar gäster på tre T.C. Resort Resources-hotell (Figur 7a).

Ris. 7. Faktortabell 2×3 för att jämföra antalet gäster som är nöjda och missnöjda med tjänsten: (a) det observerade antalet framgångar eller misslyckanden - f 0; (b) det förväntade antalet framgångar eller misslyckanden - fe; (c) beräkning av χ 2 -statistik när man jämför andelen gäster som är nöjda med tjänsten

Nollhypotesen säger att andelen kunder som planerar att återvända nästa år är nästan densamma på alla hotell. För att utvärdera parametern R, som är andelen gäster som planerar att återvända till hotellet, används värdet R = X /n= 513/700 = 0,733. Andelen gäster som är missnöjda med tjänsten är 1 - 0,733 = 0,267. Multiplicerar vi tre andelar med antalet tillfrågade gäster på varje hotell, får vi det förväntade antalet gäster som planerar att återvända nästa säsong, samt antalet kunder som inte längre kommer att bo på detta hotell (fig. 7b).

För att testa noll- och alternativhypoteserna används test χ 2 -statistik, beräknad med de förväntade och observerade värdena enligt formel (1) (Fig. 7c).

Det kritiska värdet för testets χ 2 -statistik bestäms av formeln =XI2.OBR(). Eftersom tre hotell deltar i undersökningen har χ 2 -statistiken (2 – 1)(3 – 1) = 2 frihetsgrader. Vid en signifikansnivå av α = 0,05 är det kritiska värdet för χ 2-statistiken 5,991 (fig. 7d). Eftersom den beräknade χ 2 -statistiken, lika med 40,236, överstiger det kritiska värdet, förkastas nollhypotesen (Fig. 8). Å andra sidan, sannolikheten R att nollhypotesen är sann för χ 2 -statistik lika med 40,236 (och två frihetsgrader) beräknas i Excel med funktionen =1-XI2.DIST() = 0,000 (Fig. 7d). R-värdet är lika med 0,000 och mindre än signifikansnivån α = 0,05. Därför förkastas nollhypotesen.

Ris. Fig. 8. Områden för acceptans och förkastande av hypotesen om jämställdhet av tre aktier vid en signifikansnivå av 0,05 och två frihetsgrader

Att förkasta nollhypotesen när man jämför proportionerna som anges i faktortabellen 2* med, vi kan bara konstatera att andelen gäster som är nöjda med servicen på de tre hotellen inte stämmer överens. För att ta reda på vilka aktier som skiljer sig från andra är det nödvändigt att tillämpa andra metoder, till exempel Marasquilo-proceduren.

Marasquilo-förfarande låter dig jämföra alla grupper i par. I det första steget av proceduren beräknas skillnaderna p s j – p s j ’ (där jj) mellan s(s – 1)/2 aktiepar. Motsvarande kritiska intervall beräknas med formeln:


Vid en övergripande signifikansnivå av α är värdet kvadratroten av det övre kritiska värdet av en chi-kvadratfördelning som har s - 1 grader av frihet. För varje par av provandelar är det nödvändigt att beräkna ett separat kritiskt område. I det sista skedet, var och en s(s – 1)/2 ett par slag jämförs med motsvarande kritiska intervall. De andelar som bildar ett visst par anses vara statistiskt signifikant olika om den absoluta skillnaden mellan stickprovsandelarna |p s j – p s j | överskrider det kritiska intervallet.

Låt oss illustrera Marasquilo-proceduren på exemplet med en undersökning av gäster på tre hotell (Fig. 9a). Genom att tillämpa chi-square-testet fann vi att det finns en statistiskt signifikant skillnad mellan andelen gäster på olika hotell som kommer att återvända nästa år. Eftersom undersökningen involverar tre hotellgäster är det nödvändigt att göra 3(3 - 1)/2 = 3 parvisa jämförelser och beräkna tre kritiska intervall. Låt oss först beräkna tre provandelar (Fig. 9b). Med en generell signifikansnivå på 0,05 bestäms det övre kritiska värdet för testets χ 2 -statistik för "chi-kvadrat"-fördelningen, som har (c - 1) = 2 frihetsgrader, av formeln = XI2.OBR (0,95; 2) = 5,991. Så = 2,448 (fig. 9c). Därefter beräknar vi tre par absoluta skillnader och motsvarande kritiska intervall. Om den absoluta skillnaden är större än dess kritiska område, anses motsvarande andelar vara signifikant olika (fig. 9d).

Ris. Fig. 9. Resultat av Marasquilo-proceduren för att testa hypotesen om lika andelar nöjda gäster på de tre hotellen: (a) undersökningsdata; (b) Provandelar. (c) det övre kritiska värdet för testets χ 2-statistik för chi-kvadratfördelningen; (d) tre par absoluta skillnader och motsvarande kritiska intervall

Som du kan se, vid en signifikansnivå på 0,05, är graden av tillfredsställelse för gästerna på Palm Royal hotell (p s2 = 0,858) högre än för gästerna på Golden Palm (p s1 = 0,593) och Palm Princess hotell (p s3 = 0,738). Dessutom är nöjdhetsgraden för gästerna på Palm Princess Hotel högre än för gästerna på Golden Palm Hotel. Dessa resultat bör få ledningen att analysera orsakerna till dessa skillnader och försöka avgöra varför Golden Palms gästnöjdhet är betydligt lägre än för andra hotell.

Material från boken Levin m.fl. Statistik för chefer används. - M.: Williams, 2004. - sid. 708–730

p2-Pearsons test

Kriterierna enligt vilka distributionslagstiftningen framgångsrikt eller misslyckat väljs kallas vanligtvis för godhetskriterierna. K. Pearsons p2-kriterium är det mest använda kriteriet för att testa en enkel hypotes om distributionslagen. Det är baserat på att använda som ett mått avvikelsen av experimentella data från en hypotetisk fördelning av samma värde som tjänar till att konstruera en konfidensregion för en okänd densitet, med ersättning av okända sanna värden för sannolikheterna att falla i intervall med sannolikheter beräknade från en hypotetisk fördelning. Antag att intervallet av möjliga värden för en slumpvariabel är uppdelad i r-intervall (flerdimensionella, dvs. rektanglar, i fallet med en vektorvariabel). Låt - slumpmässiga frekvenser för att falla in i dessa intervall, erhållna som ett resultat av n experiment, Р1, ..., Рr - sannolikheter för att falla i samma intervall, beräknade enligt den hypotetiska fördelningen.

I det allmänna fallet är dessa sannolikheter funktioner av uppskattningar av okända parametrar erhållna från samma experimentella data och är därför också slumpvariabler. Låt oss anta att uppskattningarna av de okända parametrarna för den hypotetiska fördelningen beräknas från samma grupperade urval som frekvenserna. Då kommer sannolikheterna Р1,...,Рr att vara några funktioner av frekvenser, och för att uppskatta avvikelsen för experimentdata från den hypotetiska fördelningen tar vi värdet

där Р1,…,Рr är vissa frekvensfunktioner.

Neumann och Pearson visade att om en asymptotiskt effektiv och asymptotiskt normal uppskattning av en okänd s-dimensionell parameter av en hypotetisk fördelning över ett grupperat urval används för att beräkna sannolikheterna Р1,...,Рr, då värdet av Z definierat av formeln (1) ) i gränsen som n ->? har en h2 -fördelning med r-s-1 frihetsgrader.

Med hjälp av detta teorem är det möjligt att utvärdera diskrepansen mellan experimentella data och en hypotetisk fördelning med hjälp av tabeller över h2-fördelningar. Vi väljer en tillräckligt liten sannolikhet p så att en händelse med sådan sannolikhet kan anses praktiskt taget omöjlig, och bestämmer utifrån ekvationen

Om realiseringen =2 av Z-värdet som erhållits som ett resultat av experimenten överstiger eller är lika med =2, anses den hypotetiska fördelningen vara inkonsekvent med experimentdata, eftersom det med denna fördelning är praktiskt taget omöjligt att erhålla =2 med ett prov. Sannolikheten för en sådan händelse med ett stort antal experiment n är ungefär lika med p, dvs. försumbart liten. I detta fall sägs det att det finns en betydande avvikelse mellan experimentdata från den hypotetiska fördelningen. Om =2, så tror man att den hypotetiska fördelningen inte motsäger experimentdata, är förenlig med dem.

Värdet kallas 100p-protestsignifikansnivån för provavvikelsen från den hypotetiska fördelningen. Vanligtvis används signifikansnivåer på 5, 1 och 0,1 procent, beroende på problemets natur.

För ytterligare verifiering av överensstämmelsen mellan experimentella data med en hypotetisk fördelning, är det användbart att beräkna sannolikheten att, för en given hypotetisk fördelning, värdet på Z kommer att vara större än det som erhålls som ett resultat av experiment med dess implementering =2, P(Z > 2) Ju större sannolikhet är, desto bättre överensstämmer urvalet med den hypotetiska fördelningen, desto mindre signifikant blir den resulterande diskrepansen mellan urvalet och den hypotetiska fördelningen. Faktum är att om sannolikheten P(Z > 2) är hög, då när man upprepar denna serie experiment, i fallet med giltigheten av den valda hypotesen om fördelningen, kommer värden på Z ofta att erhållas ännu större än värdet = 2 erhållna som resultat av experimenten.

Låt oss vara uppmärksamma på det faktum att efter att ha fått =2< и даже получив высокую вероятность P(Z >2), drar vi inte en bestämd slutsats att den valda fördelningshypotesen är korrekt, utan säger bara att denna hypotes inte motsäger de erhållna experimentella resultaten, att den överensstämmer med dem, varför den kan accepteras. För att få ett tillräckligt starkt bevis för att en slumpvariabel verkligen är föremål för en hypotetisk distributionslag, är det nödvändigt att upprepa denna serie experiment ett tillräckligt stort antal gånger och se till att den resulterande överensstämmelsen mellan hypotesen och resultaten av experimenten är stabil.

Kolmogorovs kriterium

Kolmogorov-kriterium - hjälpkriterium

Som ett hjälpkriterium för att kontrollera enhetligheten i fördelningen av P-värdet för huvudkriteriet använder vi i detta arbete Kolmogorov-kriteriet.

Kolmogorov-kriteriet beaktar det maximala värdet av modulen för skillnaden mellan den statistiska fördelningsfunktionen F^* (x) och motsvarande teoretiska fördelningsfunktion F(x, dvs. D = max|F^* (x)-F(x) |.

Nästa steg är att bestämma värdet l=D. Enligt statistiska tabeller (i matcalc-miljön, med funktionen pvKolm(u)) finner vi sannolikheten att den maximala avvikelsen mellan F^* (x) och F(x) på grund av rent slumpmässiga skäl inte blir mindre än vad som faktiskt observerats. Om sannolikheten P(n) är relativt stor, bör hypotesen accepteras, om den är mycket liten, bör den förkastas som osannolik.

Dela med sig