Vienošanās kritēriju veidi. Skatiet lapas, kurās ir minēts termins piekrišanas kritērijs

Tā kā visi pieņēmumi par konkrēta sadalījuma būtību ir hipotēzes, tie ir jāpakļauj statistiskai pārbaudei, izmantojot vienošanās kritēriji, kas ļauj noteikt, kad neatbilstības starp teorētiskajām un empīriskajām frekvencēm uzskatāmas par nenozīmīgām, t.i. nejauši, un kad - nozīmīgi (nejauši). Tādējādi vienošanās kritēriji ļauj noraidīt vai apstiprināt hipotēzes pareizību par sadalījuma raksturu empīriskajās rindās, kas izvirzīta, saskaņojot rindas.

Ir vairāki piekrišanas kritēriji. Visbiežāk izmantotie kritēriji ir Pīrsons, Romanovskis un Kolmogorovs.

Pīrsona piemērotības tests - viens no galvenajiem:

kur k ir grupu skaits, kurās ir sadalīts empīriskais sadalījums,
- novērotā pazīmes biežums in i-tā grupa,
– teorētiskā frekvence.
Sadalījumam ir apkopotas tabulas, kas norāda atbilstības kritērija kritisko vērtību izvēlētajam nozīmīguma līmenim un brīvības pakāpēm df.(vai )
Nozīmīguma līmenis ir iespējamība kļūdaini noraidīt izvirzīto hipotēzi, t.i. varbūtība, ka pareizā hipotēze tiks noraidīta. Statistikā tiek izmantoti trīs līmeņi:

a= 0,10, tad P=0,90 (10 gadījumos no 100 pareizo hipotēzi var noraidīt);
a= 0,05, tad P=0,95;
a= 0,01, tad P=0,99.

Brīvības pakāpju skaits df tiek definēts kā grupu skaits sadalījuma rindā mīnus savienojumu skaits: df = k –z. Ar savienojumu skaitu saprot teorētisko frekvenču aprēķināšanā izmantoto empīrisko sēriju rādītāju skaitu, t.i. indikatori, kas savieno empīriskās un teorētiskās frekvences.
Piemēram, izlīdzinot ar zvana līkni, pastāv trīs attiecības:
; ; .
Tāpēc, izlīdzinot normālā sadalījuma līkni, brīvības pakāpju skaits tiek noteikts kā df = k –3.
Lai novērtētu nozīmīgumu, aprēķinātā vērtība tiek salīdzināta ar tabulā norādīto vērtību.
Ja teorētiskais un empīriskais sadalījums pilnībā sakrīt, pretējā gadījumā >0. Ja >, tad noteiktam nozīmīguma līmenim un brīvības pakāpju skaitam noraidām hipotēzi par neatbilstību nenozīmīgumu (nejaušību).
Gadījumā , secinām, ka empīriskā rinda labi sakrīt ar hipotēzi par paredzamo sadalījumu un ar varbūtību P = (1-a) var apgalvot, ka neatbilstība starp teorētiskajām un empīriskajām frekvencēm ir nejauša.
Pīrsona piemērotības testu izmanto, ja populācijas lielums ir pietiekami liels un katras grupas biežumam jābūt vismaz 5.

Romanovska kritērijs ar ir balstīta uz Pīrsona kritērija izmantošanu, t.i. jau atrastās vērtības un brīvības pakāpju skaits df:

Tas ir ērti, ja nav galdiņu.
Ja ar<3, то расхождения распределений случайны, если же с>3, tad tie nav nejauši un teorētiskais sadalījums nevar kalpot par modeli pētāmajam empīriskajam sadalījumam.

Kolmogorova kritērijs l ir balstīta uz maksimālās neatbilstības noteikšanu starp uzkrātajām frekvencēm un empīrisko un teorētisko sadalījumu frekvencēm:
vai ,
kur D un d ir attiecīgi maksimālā starpība starp empīriskās un teorētiskās sadalījumu sērijas uzkrātajām frekvencēm un uzkrātajām frekvencēm;
N ir vienību skaits populācijā.
Aprēķinot l vērtību, no tabulas P(l) tiek noteikta varbūtība, ar kuru var apgalvot, ka empīrisko frekvenču novirzes no teorētiskajām ir nejaušas. Varbūtība Р(l) var mainīties no 0 līdz 1. Ja Р(l)=1 ir pilnīga frekvenču sakritība, Р(l)=0 – pilnīga nesakritība. Ja l ņem vērtības līdz 0,3, tad P(l)=1.
Galvenais nosacījums Kolmogorova kritērija izmantošanai ir pietiekami liels novērojumu skaits.

Lai pārbaudītu hipotēzi par empīriskā sadalījuma atbilstību teorētiskajam sadalījuma likumam, tiek izmantoti īpaši statistikas rādītāji - piemērotības kritēriji (jeb atbilstības kritēriji). Tie ietver Pīrsona, Kolmogorova, Romanovska, Jastremska uc kritērijus. Lielākā daļa vienošanās kritēriju ir balstīti uz empīrisko frekvenču noviržu izmantošanu no teorētiskajām.

Acīmredzot, jo mazākas šīs novirzes, jo labāk teorētiskais sadalījums atbilst empīriskajam (vai apraksta to). Piekrišanas kritēriji

Vienošanās kritēriji, pamatojoties uz noteikto sadales likumu, ļauj noteikt, kad neatbilstības starp teorētiskajām un empīriskajām frekvencēm uzskatāmas par nenozīmīgām (nejaušas), bet kad par būtiskām (negadījuma rakstura). No tā izriet, ka saskaņošanas kritēriji ļauj noraidīt vai apstiprināt hipotēzes pareizību, kas izvirzīta, saskaņojot rindas par sadalījuma raksturu empīriskajā rindā, un atbildēt, vai ir iespējams pieņemt konkrētam empīriskam sadalījumam. modelis, kas izteikts ar kādu teorētisku sadalījuma likumu.

Pīrsona piemērotības tests c 2 (hī kvadrāts) ir viens no galvenajiem vienošanās kritērijiem. Angļu matemātiķa Karla Pīrsona (1857-1936) ierosinājums novērtēt empīrisko un teorētisko sadalījumu biežuma neatbilstību nejaušību (nozīmību):

Shēma kritērija c 2 piemērošanai, lai novērtētu teorētisko un empīrisko sadalījumu konsekvenci, ir šāda:

1. Tiek noteikts aprēķinātais neatbilstības mērs.

2. Noteikts brīvības pakāpju skaits.

3. Pamatojoties uz brīvības pakāpju skaitu n, izmantojot īpašu tabulu, nosaka.

4. Ja , tad noteiktam nozīmīguma līmenim α un brīvības pakāpju skaitam n tiek noraidīta hipotēze par neatbilstību nenozīmīgumu (nejaušību). Pretējā gadījumā hipotēzi var atzīt par nepretrunīgu ar iegūtajiem eksperimentālajiem datiem un ar varbūtību (1 – α) var apgalvot, ka neatbilstības starp teorētiskajām un empīriskajām frekvencēm ir nejaušas.

Nozīmes līmenis ir varbūtība kļūdaini noraidīt izvirzīto hipotēzi, t.i. varbūtība, ka pareizā hipotēze tiks noraidīta. Statistikas pētījumos atkarībā no risināmo problēmu nozīmīguma un atbildības tiek izmantoti šādi trīs nozīmīguma līmeņi:

1) a = 0,1, tad R = 0,9;

2) a = 0,05, tad R = 0,95;

3) a = 0,01, tad R = 0,99.

Izmantojot vienošanās kritēriju c 2, ir jāievēro šādi nosacījumi:

1. Pētāmās populācijas apjomam jābūt pietiekami lielam ( N≥ 50), savukārt biežumam vai grupas lielumam jābūt vismaz 5. Ja šis nosacījums tiek pārkāpts, vispirms ir jāapvieno mazas frekvences (mazākas par 5).

2. Empīriskajam sadalījumam jāsastāv no datiem, kas iegūti nejaušās izlases rezultātā, t.i. tiem jābūt neatkarīgiem.

Pīrsona piemērotības kritērija trūkums ir daļa no sākotnējās informācijas, kas saistīta ar nepieciešamību grupēt novērojumu rezultātus intervālos un apvienot atsevišķus intervālus ar nelielu novērojumu skaitu. Šajā sakarā ir ieteicams papildināt sadales atbilstības pārbaudi atbilstoši kritērijam ar 2 citiem kritērijiem. Tas ir īpaši nepieciešams, ja izlases lielums ir salīdzinoši neliels ( n ≈ 100).

Statistikā Kolmogorova piemērotības tests(pazīstams arī kā Kolmogorova-Smirnova atbilstības tests) tiek izmantots, lai noteiktu, vai divi empīriski sadalījumi atbilst vienam un tam pašam likumam, vai arī lai noteiktu, vai iegūtais sadalījums atbilst pieņemtajam modelim. Kolmogorova kritērijs ir balstīts uz maksimālās neatbilstības noteikšanu starp uzkrātajām frekvencēm vai empīrisko vai teorētisko sadalījumu frekvencēm. Kolmogorova kritēriju aprēķina, izmantojot šādas formulas:

Kur D Un d- attiecīgi maksimālā starpība starp uzkrātajām frekvencēm ( f – f¢) un starp uzkrātajām frekvencēm ( lpp – lpp¢) empīriskās un teorētiskās sadalījumu rindas; N- vienību skaits summā.

Aprēķinot λ vērtību, tiek izmantota īpaša tabula, lai noteiktu varbūtību, ar kuru var apgalvot, ka empīrisko frekvenču novirzes no teorētiskajām ir nejaušas. Ja zīmei ir vērtības līdz 0,3, tas nozīmē, ka pastāv pilnīga frekvenču sakritība. Ar lielu skaitu novērojumu Kolmogorova tests spēj noteikt jebkādas novirzes no hipotēzes. Tas nozīmē, ka jebkura izlases sadalījuma atšķirība no teorētiskā tiks konstatēta ar tās palīdzību, ja būs pietiekami liels novērojumu skaits. Praktiskā nozīmeŠī īpašība nav nozīmīga, jo vairumā gadījumu ir grūti paļauties uz liela skaita novērojumu iegūšanu nemainīgos apstākļos, teorētiskā ideja par sadalījuma likumu, kuram paraugam būtu jāievēro, vienmēr ir aptuvena, un statistikas precizitāte. testi nedrīkst pārsniegt izvēlētā modeļa precizitāti.

Romanovska piemērotības pārbaude ir balstīta uz Pīrsona kritērija izmantošanu, t.i. jau atrastās vērtības c 2 un brīvības pakāpju skaits:

kur n ir variācijas brīvības pakāpju skaits.

Romanovska kritērijs ir ērts, ja nav tabulu priekš . Ja< 3, то расхождения распределений случайны, если же >3, tad tie nav nejauši un teorētiskais sadalījums nevar kalpot par modeli pētāmajam empīriskajam sadalījumam.

B. S. Jastremskis vienošanās kritērijā izmantoja nevis brīvības pakāpju skaitu, bet gan grupu skaitu ( k), īpaša q vērtība atkarībā no grupu skaita un hī kvadrāta vērtība. Jastremska piemērotības pārbaude ir tāda pati nozīme kā Romanovska kritērijam, un to izsaka ar formulu

kur c 2 ir Pīrsona atbilstības kritērijs; - grupu skaits; q - koeficients, grupu skaitam, kas mazāks par 20, vienāds ar 0,6.

Ja L fakts > 3, neatbilstības starp teorētiskajiem un empīriskajiem sadalījumiem nav nejaušas, t.i. empīriskais sadalījums neatbilst normālā sadalījuma prasībām. Ja L fakts< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Tika apspriests Čap. 5 šeit mēs pieteiksim šī metode kapitālieguldījumu projektiem. Ierobežojumi un nosacījumi, kādos šī metode tiek izmantota, tiks apspriesti sadaļā. 15, kur aplūkojam riskantu ieguldījumu piemērotības kritēriju. Mūsu mērķis šeit ir tikai parādīt, kā tiek mērīts risks riskantu ieguldījumu kombinācijām, pieņemot, ka šāds kritērijs ir nepieciešams.

Nākamais posms ir saistīts ar augstāku atvasinājumu izmantošanu (Teilora formula), un šis posms beidzas ar metodes apskatu kopumā. Tālāk daži funkciju skaitlisko raksturlielumu jautājumi - skaitliskās metodes (diferenciālrēķina pielietošana tuvināšanai). aprēķini) tiek ņemti vērā. Šajā posmā novirzes kļūda lauztām līnijām no sekantiem, lauztām līnijām no tangentēm, gabalos līknēm no Teilora parabolām tiek noteikta vairāk nekā augstas pakāpes no dotās funkcijas atkarībā no tās diferenciālajām īpašībām, un kļūda tiek salīdzināta. Vienkāršības labad mēs apsveram gadījumu, kad mezgli atrodas vienādi. Tādējādi tiek noteiktas diferenciālrēķina metodes pielietojamības robežas. Kā šī posma tālāku izvērstu varam aplūkot citus tuvināšanas modeļus, tos konstruējot, vadoties, piemēram, pēc sekojošas diagrammas 1. Kādus mezglus izmantosim 2. Kādu aproksimēšanas funkciju klasi izmantosim 3. Kādu saskaņošanas kritēriju pielietosim 4. Kādu precizitāti vēlēsimies

Šajā analīzē, novērtējot empīriskā un teorētiskā sadalījuma konsekvences pakāpi, tika izmantots V. I. Romanovska sakritības kritērijs, pamatojoties uz Pīrsona kritēriju.

Sadalījuma līknes parametru aprēķinu rezultāti doti tabulā. 10. Aprēķinātās frekvences tika aprēķinātas, izmantojot formulas 10, 11, 12. Objektīvs empīrisko un teorētisko frekvenču sakritības pakāpes novērtējums ir sakritības kritērijs (šajā pētījumā tika izmantots V. I. Romanovska sakritības kritērijs). Pārbaude parādīja, ka pētītās empīriskās intervālu rindas darba objektu gulēšanas laika sadalījumam pārnešanas atlikumos ir diezgan precīzi aprakstītas ar atrastajām blīvuma funkcijas p(x) līknēm.

Vienību skaits izlasē, N intervāla lielums, N sērijas asimetrijas rādītājs, ch Kurtozes rādītājs, Ex dispersija, a vidējā vērtība, X atbilstības kritērijs, K

Iegūtais empīriskais sadalījums tiks tuvināts ar nepārtrauktu analītisko funkciju, tas ir, tiks identificēts nejaušā lieluma sadalījuma likums. Aplūkota arī vienošanās kritēriju izmantošana izplatīšanas likuma identificēšanā.

Piemērotības kritēriju izmantošana izplatīšanas likuma noteikšanai nejaušais mainīgais.

Izmantojot Pīrsona piemērotības testu, ir jāaprēķina vērtība

Īpaši jāuzsver, ka, pārbaudot modeli pēc saskaņošanas kritērija, droša ir tikai noraidoša atbilde, tas ir, modeļa noraidīšana.

Pozitīva atbilde nozīmē tikai to, ka modelis nav pretrunā ar empīriskiem datiem. Tas nebūt nenozīmē, ka tieši šis modelis faktiski apraksta datus, ka tas ir labākais modelis, ka nav iespējams izvēlēties citu modeli datu aprakstīšanai utt. Faktiski pozitīva atbilde, pārbaudot pēc atbilstības kritērija, ir jāsaprot kā “varbūt šos datus apraksta tāds un tāds modelis”, un nekas vairāk.

Rezultātā iegūtās histogrammas atbilstību normālajam sadalījumam pārbauda, izmantojot Pīrsona piemērotības testu.

Daudzās reālās dzīves problēmās galvenās grūtības rada tas, ka neironu tīkls nevar skaidri parādīt cēloņu un seku attiecības un rada sava veida risinājumu saskaņā ar melnās kastes principu. Tajā pašā laikā finanšu analīzē jau sen tiek izmantotas īpaši atlasītas dažādu rādītāju kombinācijas, lai novērtētu uzņēmumu stāvokli, un modeļa kvalitāte tiek novērtēta, izmantojot piemērotības kritērijus, neņemot vērā uzņēmuma struktūru. modelis. Būtībā viss ir atkarīgs no indikatora (vai rādītāju kombinācijas) izvēles, kas atbilst izšķirošajam noteikumam, kas ļauj iekļaut (vai neiekļaut) konkrēto uzņēmumu vienā vai otrā grupā (dzīvotspējīgs, strauji augošs, ļoti ienesīgs). ).

Pamatojoties uz 21. uzdevuma datiem, salāgojiet iedzīvotāju sadalījuma rindas pēc vidējo monetāro ienākumu lieluma uz vienu iedzīvotāju pa normālā sadalījuma līkni. Uzzīmējiet empīrisko un teorētisko sadalījumu grafikus. Novērtējiet empīrisko un teorētisko sadalījumu tuvumu, izmantojot piemērotības testus [Pīrsons (hī kvadrāts), Kolmogorovs vai citi]

Neatkarīgi no vienošanās veida kritērija, ko izmanto pro-

Par S.p.g. tiek izmantoti dažādi kritēriji. Jo īpaši, pārbaudot sakritību starp izlasi un hipotētiskajiem sadalījumiem, tiek izmantots atbilstības tests, piem. Pīrsona hī kvadrāta tests. Skatiet arī kļūdu.

Formulā (2.15) aizstājot M[H(x) un D ar vienādojumiem (2.3), iegūstam galīgo formulu informācijas sakritības kritērijam.

Tabulā 2.3 parāda entropijas parametru vērtības, kas visbiežāk sastopamas sadales likumu tehniskajos lietojumos. Dažādu sadalījuma likumu entropijas parametru tabula dod iespēju, piemērojot informācijas saskaņošanas kritēriju, vienlaikus pārbaudīt vairākas hipotēzes, ko nevar izdarīt, izmantojot esošās metodes bez papildu aprēķiniem.

Tā kā visizplatītākais ir Pīrsona piemērotības tests, salīdzināsim informācijas kritēriju J ar kritēriju %2.

Izlīdzinot empīrisko sadalījumu, nulles hipotēze tiek pieņemta, ja, piemērojot informācijas atbilstības kritēriju

GOST 8.532-85 ierosina, izmantojot vienošanās kritērijus ar vismaz 10% nozīmīguma līmeni pie u>50 un normālā sadalījuma 15, izmantojot Vilkoksona testu pāru atšķirībām, lai pārbaudītu sadalījuma simetriju) klasificēt masīvu RM sertifikācija rezultējas kā viena no sadales klasēm: normāla, simetriska, asimetriska. Katrai sadalījuma klasei atsauces materiāla galveno metroloģisko raksturlielumu vērtības tiek noteiktas dažādos veidos.

Lai noteiktu sakritības pakāpi starp empīrisko un teorētisko sadalījumu, ir piedāvāti dažādi atbilstības kritēriji. Tādējādi ir zināms Pīrsona, Romanovska, Kolmogorova, Jastremska saskaņošanas kritērijs. Pīrsona atbilstības kritērijs tiek reducēts līdz l 2 sasniegšanas varbūtības aprēķināšanai, izmantojot Pīrsona sadalījumu. dotā vērtība P = x2. Šajā gadījumā x2 aprēķina, izmantojot formulu (9.3.)

Ja nav gatavas sistēmas, pētniekam ir jāizmēģina dažādi statistiski piemērotības testi, lai optimāli izvēlētos modeļus. Tādējādi Uthans un Moody novērtēja prognozēšanas risku, kas iegūts dažādās tīkla arhitektūrās, un Kayama et al atrada kopējo elementu dublikātu skaitu slēptajā slānī. Mēs vienkārši salīdzinājām vērtības kvadrātsakne no vidējās kvadrātiskās kļūdas (RMSE) testa komplektā, kas sastāv no 60 novērojumiem saistībā ar novērojumu intervāla pēdējiem 5 gadiem (1981-85). Turpmākam darbam tika ņemta tīkla arhitektūra, kas deva zemāko RMSE.

Šie piemērotības kritēriji ļauj mums pārbaudīt hipotēzes.

Novērtējot n.s.v entropiju. Rodas jautājums par eksperimentālo datu dalīšanas intervālu skaita izvēli. Šis uzdevums ir līdzīgs tipiskām matemātiskās statistikas problēmām: sadales likuma noteikšana, empīrisko sadalījumu aplēšu aprēķināšana un atbilstības kritēriju aprēķināšana. A. Halds parādīja, ka pastāv optimāls grupēšanas intervālu skaits, kad soļu aploksnes histogramma ir vistuvāk populācijas sadalījuma vienmērīgajai līknei. Šādam tuvumam iespējams formulēt vairākus kritērijus, izmantojot rādītājus kurtozes formā, kritēriju %2 utt. Dažādi kritēriji dod nedaudz atšķirīgas vērtības optimālajam grupēšanas intervālu skaitam. Taču pats optimuma pastāvēšanas fakts nav atkarīgs no tuvuma kritērija izvēles, jo, ja dati tiek grupēti pārāk mazos intervālos, daži no tiem būs tukši vai slikti aizpildīti. Histogramma atšķirsies no vienmērīgas sadalījuma līknes, jo tā ir robaina ar daudziem tapas un kritumiem.

Storm R. iesaka Brūksa un Kerutera formulu k = 5 lg p, lai noteiktu optimālo intervālu skaitu. Darbā ieteikta attiecība k = 4 p. Darbā ir sniegta tabula, saskaņā ar kuru intervālu skaits tiek piešķirts no 7 līdz 22 atkarībā no izlases lieluma no 40 līdz 10 000 Šo ieteikumu salīdzinājums, kas parādīts attēlā. 2.2 norāda ieteikumu tuvumu pie n - 100 ar to sekojošo pieaugošo neatbilstību, palielinoties izlases lielumam. Atsevišķa grupa sniegt ieteikumus par vienošanās kritērija %2 izmantošanu. Kritērija %2 piemērošana nemainīga garuma intervāliem ir neefektīva. Visu darbu sākotnējais priekšnoteikums par x2 kritērija efektivitāti ir intervālu ar vienādu varbūtību apsvēršana. Tomēr praksē šie ieteikumi netiek izmantoti to piemērošanas sarežģītības dēļ. Ņemot vērā uzskaitīto ieteikumu neviendabīgumu, ir nepieciešams atsevišķs pētījums par intervālu skaita ietekmi, izmantojot informācijas metodes tehnoloģisko procesu analīzei.

Varat izvēlēties 6 vai 7 intervālus. Nosakām izmēru R izkliedes zonu. Nosakām izmēra maksimālo vērtību x = 0,126 un minimālo xm a = - 0,149, diapazonu R = dgtah - xmin = 0,275 mm. Izvēlamies 7 intervālus un nosaka to dalījuma cenu C = RI k 0,04 mm. Saskaitīsim lieluma noviržu skaitu, kas ietilpst attiecīgajā intervālā. Rezultāti (2.5. tabula) ļauj izvirzīt hipotēzi par pētīto kļūdu sadalījumu pēc Gausa likuma. Lai pārbaudītu hipotēzi, ir nepieciešams sagatavot datus, kas iekļauti

Nejaušības pārbaudes un izņēmuma novērojumu novērtēšanas kritēriji Literatūra Ievads Praksē statistiskā analīze eksperimentālie dati, galvenā interese ir nevis pašas noteiktas statistikas aprēķināšana, bet gan atbildes uz šāda veida jautājumiem. Attiecīgi ir izstrādāti daudzi kritēriji, lai pārbaudītu piedāvātās statistiskās hipotēzes. Visi statistisko hipotēžu pārbaudes kritēriji ir sadalīti divās lielās grupās: parametriskajos un neparametriskos.

Kopīgojiet savus darbus sociālajos tīklos

Ja šis darbs jums neder, lapas apakšā ir līdzīgu darbu saraksts. Varat arī izmantot meklēšanas pogu

Pārbaude

Piekrišanas kritēriju izmantošana

Ievads

Literatūra

Ievads

Eksperimentālo datu statistiskās analīzes praksē galvenā interese ir nevis pašas noteiktas statistikas aprēķināšana, bet gan atbildes uz šāda veida jautājumiem. Vai tiešām vidējais iedzīvotāju skaits vienāds ar kādu skaitli? Vai korelācijas koeficients būtiski atšķiras no nulles? Vai abu paraugu dispersijas ir vienādas? Un var rasties daudzi šādi jautājumi atkarībā no konkrētās izpētes problēmas. Attiecīgi ir izstrādāti daudzi kritēriji, lai pārbaudītu piedāvātās statistiskās hipotēzes. Mēs apsvērsim dažus no visbiežāk sastopamajiem. Tie galvenokārt attieksies uz vidējiem rādītājiem, novirzēm, korelācijas koeficientiem un pārpilnības sadalījumiem.

Visi statistisko hipotēžu pārbaudes kritēriji ir sadalīti divās lielās grupās: parametriskajos un neparametriskos. Parametrisko testu pamatā ir pieņēmums, ka izlases dati ir iegūti no populācijas ar zināmu sadalījumu, un galvenais uzdevums ir novērtēt šī sadalījuma parametrus. Neparametriskajos testos nav nepieciešami nekādi pieņēmumi par sadalījuma raksturu, izņemot pieņēmumu, ka tas ir nepārtraukts.

Vispirms apskatīsim parametriskos kritērijus. Pārbaudes secība ietvers nulles hipotēzes un alternatīvās hipotēzes formulēšanu, izdarāmo pieņēmumu formulēšanu, testā izmantotās izlases statistikas noteikšanu un pārbaudāmās statistikas izlases sadalījuma veidošanu, atlasītajam kritērijam kritisko reģionu identificēšana un izlases statistikas ticamības intervāla izveide.

1 Līdzekļu piemērotības kritēriji

Pārbaudāmā hipotēze ir populācijas parametrs. Šādas pārbaudes nepieciešamība var rasties, piemēram, šādā situācijā. Pieņemsim, ka, balstoties uz plašiem pētījumiem, ir noteikts fosilā mīkstmiešu čaumalas diametrs nogulumos no kādas noteiktas vietas. Lai mūsu rīcībā būtu arī noteikts skaits citā vietā atrastu gliemežvāku, un izdarām pieņēmumu, ka konkrēta vieta čaulas diametru neietekmē, t.i. ka vidējā čaumalas diametra vērtība visai reiz jaunā vietā dzīvojušo gliemju populācijai ir vienāda ar zināmo vērtību, kas iegūta agrāk, pētot šāda veida gliemjus pirmajā biotopā.

Ja šis zināma vērtība vienāds, tad nulles hipotēzi un alternatīvo hipotēzi raksta šādi: Pieņemsim, ka mainīgajam x aplūkojamajā populācijā ir normāls sadalījums un populācijas dispersija nav zināma.

Mēs pārbaudīsim hipotēzi, izmantojot statistiku:

, (1)
kur ir izlases standartnovirze.

Tika parādīts, ka, ja ir taisnība, tad t izteiksmē (1) ir Stjudenta t sadalījums ar n-1 brīvības pakāpēm. Ja nozīmības līmeni (pareizās hipotēzes noraidīšanas varbūtību) izvēlaties vienādu, tad saskaņā ar iepriekšējā nodaļā apskatīto var noteikt testēšanas kritiskās vērtības =0.

Šajā gadījumā, tā kā Stjudenta sadalījums ir simetrisks, tad (1-) daļa no platības zem šī sadalījuma līknes ar n-1 brīvības pakāpēm tiks ietverta starp punktiem un, kas absolūtā vērtībā ir vienādi viens ar otru. . Tāpēc visas vērtības, kas ir mazākas par negatīvo un lielākas par pozitīvo vērtību t sadalījumam ar noteiktu brīvības pakāpju skaitu izvēlētā nozīmīguma līmenī, veidos kritisko reģionu. Ja izlases t vērtība ietilpst šajā reģionā, tiek pieņemta alternatīvā hipotēze.

Pārliecības intervāls for ir konstruēts saskaņā ar iepriekš aprakstīto metodi un tiek noteikts no šādas izteiksmes

(2)

Tātad, dariet mums zināmu mūsu gadījumā, ka fosilās mīkstmiešu čaulas diametrs ir 18,2 mm. Mūsu rīcībā bija 50 jaunatklātu gliemežvāku paraugs, kuriem mm, a = 2,18 mm. Pārbaudīsim: =18.2 pret Mums ir

Ja nozīmīguma līmenis ir izvēlēts =0,05, tad kritiskā vērtība. No tā izriet, ka to var noraidīt par labu nozīmīguma līmenī =0,05. Tādējādi mūsu hipotētiskajam piemēram var apgalvot (ar zināmu varbūtību, protams), ka noteiktas sugas fosilo gliemju čaumalas diametrs ir atkarīgs no vietām, kur tie dzīvoja.

Sakarā ar to, ka t sadalījums ir simetrisks, izvēlētajos nozīmīguma līmeņos un brīvības pakāpju skaitā tiek dotas tikai šī sadalījuma pozitīvas t vērtības. Turklāt tiek ņemta vērā ne tikai platības daļa zem sadalījuma līknes pa labi no t vērtības, bet vienlaikus arī pa kreisi no -t vērtības. Tas ir saistīts ar to, ka vairumā gadījumu, pārbaudot hipotēzes, mūs interesē noviržu nozīme pašam par sevi, neatkarīgi no tā, vai šīs novirzes ir lielākas vai mazākas, t.i. mēs pārbaudām pret, nevis pret: >a vai:

Tagad atgriezīsimies pie mūsu piemēra. 100(1-)% ticamības intervāls ir

18,92,01

Tagad aplūkosim gadījumu, kad ir jāsalīdzina divu vispārējo populāciju vidējie rādītāji. Pārbaudāmā hipotēze izskatās šādi: : =0, : 0. Tāpat tiek pieņemts, ka tai ir normāls sadalījums ar vidējo un dispersiju, un - normāls sadalījums ar vidējo un vienādu dispersiju. Turklāt mēs pieņemam, ka paraugi, no kuriem tiek novērtētas vispārējās populācijas, ir iegūti neatkarīgi viens no otra un tiem ir attiecīgi tilpums, un no paraugu neatkarības izriet, ka, ja mēs ņemam lielāku to skaitu un aprēķinām vidējo vērtības katram pārim, tad šo vidējo pāru kopa būs pilnīgi nekorelēta.

Nulles hipotēzes pārbaude tiek veikta, izmantojot statistiku

(3)

kur un ir dispersijas aprēķini attiecīgi pirmajam un otrajam paraugam. Ir viegli redzēt, ka (3) ir (1) vispārinājums.

Tika parādīts, ka statistikai (3) ir Stjudenta t sadalījums ar brīvības pakāpēm. Ja un ir vienādi, t.i. = = formula (3) ir vienkāršota, un tai ir forma

(4)

Apskatīsim piemēru. Pieņemsim, ka, mērot vienas un tās pašas augu populācijas stumbra lapas divu sezonu garumā, tiek iegūti šādi rezultāti: Pieņemam, ka Stjudenta testa izmantošanas nosacījumi, t.i. populāciju, no kurām ņemti paraugi, normalitāte, nezināmas, bet vienādas dispersijas esamība šīm populācijām un paraugu neatkarība. Novērtēsim nozīmīguma līmenī =0,01. Mums ir

Tabulas vērtība t = 2,58. Tāpēc hipotēze par stumbra lapu garuma vidējo vērtību vienādību augu populācijai divu sezonu laikā ir jānoraida izvēlētajā nozīmīguma līmenī.

Uzmanību! Nulles hipotēze matemātiskajā statistikā ir hipotēze, ka starp salīdzinātajiem rādītājiem nav būtisku atšķirību neatkarīgi no tā, vai mēs runājam par vidējiem, dispersijas vai citu statistiku. Un visos šajos gadījumos, ja kritērija empīriskā (pēc formulas aprēķinātā) vērtība ir lielāka par teorētisko (izvēlēto no tabulām), tas tiek noraidīts. Ja empīriskā vērtība ir mazāka par tabulā norādīto vērtību, tā tiek pieņemta.

Lai izveidotu ticamības intervālu starpībai starp šīm divām populācijām, pievērsīsim uzmanību faktam, ka Stjudenta tests, kā redzams no formulas (3), novērtē starpības starp vidējo relatīvo nozīmīgumu. līdz šīs starpības standarta kļūdai. Ir viegli pārbaudīt, vai (3) saucējs precīzi atspoguļo šo standarta kļūdu, izmantojot iepriekš apspriestās attiecības un izdarītos pieņēmumus. Patiesībā mēs to zinām vispārīgā gadījumā

Ja x un y ir neatkarīgi, tad tādi ir

Ņemot izlases vērtības un x un y vietā un atgādinot izdarīto pieņēmumu, ka abām populācijām ir vienāda dispersija, mēs iegūstam

(5)

Dispersijas novērtējumu var iegūt no šādas attiecības

(6)

(Mēs dalām ar, jo no paraugiem tiek aprēķināti divi lielumi, un tāpēc brīvības pakāpju skaits jāsamazina par diviem.)

Ja tagad aizstājam (6) ar (5) un ņemam kvadrātsakni, mēs iegūstam saucēju izteiksmē (3).

Pēc šīs novirzes atgriezīsimies pie ticamības intervāla izveidošanas cauri -.

Mums ir

Sniegsim dažus komentārus saistībā ar t-testa konstruēšanā izmantotajiem pieņēmumiem. Pirmkārt, tika parādīts, ka normaalitātes pieņēmuma pārkāpumiem ir nenozīmīga ietekme uz testa nozīmīguma un jaudas līmeni 30. Abu populāciju, no kurām ņemti paraugi, dispersiju homogenitātes pieņēmuma pārkāpumi ir arī nenozīmīgi, bet tikai gadījumā, ja izlases lielumi ir vienādi. Ja abu populāciju dispersijas atšķiras viena no otras, tad pirmā un otrā veida kļūdu iespējamības būtiski atšķirsies no paredzamajām.

Šajā gadījumā pārbaudei jāizmanto kritērijs

(7)

ar brīvības pakāpju skaitu

. (8)

Parasti tas izrādās daļskaitlis, tāpēc, izmantojot t sadalījuma tabulas, ir jāņem tabulas vērtības tuvākajām veselajām vērtībām un jāinterpolē, lai atrastu t, kas atbilst ieguva vienu.

Apskatīsim piemēru. Pētot divas ezera vardes pasugas, tika aprēķināta ķermeņa garuma attiecība pret stilba kaula garumu. Tika ņemti divi paraugi ar tilpumu =49 un =27. Mūs interesējošo attiecību vidējie un dispersijas izrādījās vienādi, attiecīgi =2,34; =2,08; =0,21; =0,35. Ja tagad pārbaudām hipotēzi, izmantojot formulu (2), mēs to iegūstam

Pie nozīmīguma līmeņa =0,05 mums ir jānoraida nulles hipotēze (tabulā norādītā vērtība t = 1,995) un jāpieņem, ka izvēlētajā nozīmīguma līmenī pastāv statistiski nozīmīgas atšķirības starp izmērīto parametru vidējām vērtībām divām varžu pasugām. .

Izmantojot formulas (6) un (7), mums ir

Šajā gadījumā tam pašam nozīmīguma līmenim =0,05 tabulas vērtība ir t=2,015, un tiek pieņemta nulles hipotēze.

Šis piemērs skaidri parāda, ka, neievērojot nosacījumus, kas pieņemti, iegūstot konkrētu kritēriju, var iegūt rezultātus, kas ir tieši pretēji tiem, kas faktiski notiek. Protams, šajā gadījumā, ņemot vērā dažāda lieluma paraugus, ja nebija iepriekš konstatēta fakta, ka izmērītā rādītāja dispersijas abās populācijās ir statistiski vienādas, bija jāizmanto formulas (7) un (8), parādīja statistiski nozīmīgu atšķirību neesamību.

Tāpēc es vēlos vēlreiz atkārtot, ka atbilstības pārbaude visiem pieņēmumiem, kas izdarīti, atvasinot konkrētu kritēriju, ir absolūti nepieciešams nosacījums tā pareizai izmantošanai.

Pastāvīgā prasība abās iepriekš minētajās t-testa modifikācijās bija prasība, lai paraugi būtu neatkarīgi viens no otra. Taču praksē nereti ir situācijas, kad šo prasību nevar izpildīt objektīvu iemeslu dēļ. Piemēram, daži rādītāji tiek mērīti uz vienu un to pašu dzīvnieku vai teritorijas apgabalu pirms un pēc ārēja faktora iedarbības utt. Un šajos gadījumos mēs varam būt ieinteresēti pārbaudīt hipotēzi pret. Mēs turpināsim pieņemt, ka abi paraugi ir ņemti no normālām populācijām ar vienādu dispersiju.

Šajā gadījumā mēs varam izmantot to, ka atšķirībām starp normāli sadalītiem lielumiem ir arī normāls sadalījums, un tāpēc mēs varam izmantot Stjudenta t testu formā (1). Tādējādi tiks pārbaudīta hipotēze, ka n atšķirības ir paraugs no normāli sadalītas populācijas ar vidējo vērtību, kas vienāda ar nulli.

Apzīmējot i-to starpību ar, mums ir

, (9)
Kur

Apskatīsim piemēru. Mūsu rīcībā ir dati par atsevišķas nervu šūnas impulsu skaitu noteiktā laika intervālā pirms () un pēc () stimula darbības:

Tādējādi, paturot prātā, ka (9) ir t sadalījums, un izvēloties nozīmīguma līmeni =0,01, no atbilstošās tabulas pielikumā mēs atklājam, ka t kritiskā vērtība n-1=10-1=9 grādi brīvība ir 3,25. Teorētiskās un empīriskās t-statistikas salīdzinājums parāda, ka nulles hipotēze par statistiski nozīmīgu atšķirību neesamību starp šaušanas biežumu pirms un pēc stimula ir jānoraida. Var secināt, ka izmantotais stimuls statistiski būtiski maina impulsu biežumu.

Eksperimentālajos pētījumos, kā minēts iepriekš, atkarīgie paraugi parādās diezgan bieži. Tomēr dažreiz šis fakts tiek ignorēts un t-tests formā (3) tiek izmantots nepareizi.

To nepiemērotību var redzēt, ņemot vērā standarta kļūdas starp nekorelētajiem un korelētajiem vidējiem. Pirmajā gadījumā

Un otrajā

Starpības d standarta kļūda ir

Ņemot to vērā, saucējam (9) būs forma

Tagad pievērsīsim uzmanību tam, ka izteiksmju (4) un (9) skaitītāji sakrīt:

tāpēc t vērtības atšķirība tajos ir atkarīga no saucējiem.

Tādējādi, ja formulu (3) izmanto problēmā ar atkarīgiem paraugiem un paraugiem ir pozitīva korelācija, tad iegūtās t vērtības būs mazākas, nekā tām vajadzētu būt, izmantojot formulu (9), un var rasties situācija. kur nulles hipotēze tiks pieņemta, ja tā ir nepatiesa. Pretēja situācija var rasties, ja starp paraugiem ir negatīva korelācija, t.i. šajā gadījumā par būtiskām tiks atzītas atšķirības, kuras patiesībā nav.

Atgriezīsimies vēlreiz pie piemēra ar impulsa aktivitāti un aprēķina t vērtību dotajiem datiem, izmantojot formulu (3), nepievēršot uzmanību tam, ka paraugi ir saistīti. Mums ir: Brīvības pakāpju skaitam, kas vienāds ar 18 un nozīmīguma līmenim = 0,01, tabulas vērtība ir t = 2,88, un no pirmā acu uzmetiena šķiet, ka nekas nav noticis, pat izmantojot formulu, kas nav piemērota dotajiem nosacījumiem. Un šajā gadījumā aprēķinātā t vērtība noved pie nulles hipotēzes noraidīšanas, t.i. uz to pašu secinājumu, kas tika izdarīts, izmantojot formulu (9), pareizi šajā situācijā.

Tomēr pārformatēsim esošos datus un parādīsim tos šādā formā (2):

Tās ir vienādas vērtības, un tās var iegūt vienā no eksperimentiem. Tā kā visas vērtības abos paraugos ir saglabātas, izmantojot Stjudenta t testu formulā (3), iegūst iepriekš iegūto vērtību = 3,32 un noved pie tā paša secinājuma, kas jau ir izdarīts.

Tagad aprēķināsim t vērtību, izmantojot formulu (9), kas jāizmanto šajā gadījumā. Mums ir: t kritiskā vērtība izvēlētajā nozīmīguma līmenī un deviņās brīvības pakāpēs ir 3,25. Līdz ar to mums nav iemesla noraidīt nulles hipotēzi, mēs to pieņemam, un izrādās, ka šis secinājums ir tieši pretējs tam, kas tika izdarīts, izmantojot formulu (3).

Izmantojot šo piemēru, mēs vēlreiz pārliecinājāmies, cik svarīgi ir iegūt pareizus secinājumus, analizējot eksperimentālos datus, lai stingri ievērotu visas prasības, kas bija par pamatu konkrēta kritērija noteikšanai.

Aplūkotās Studenta testa modifikācijas ir paredzētas, lai pārbaudītu hipotēzes par divu paraugu vidējo vērtību. Tomēr rodas situācijas, kad vienlaikus ir jāizdara secinājumi par k vidējo vērtību vienādību. Šim gadījumam ir izstrādāta arī noteikta statistikas procedūra, kas tiks apspriesta vēlāk, apspriežot ar dispersijas analīzi saistītos jautājumus.

2 Atbilstības testi novirzēm

Statistisko hipotēžu pārbaude attiecībā uz populācijas dispersiju tiek veikta tādā pašā secībā kā vidējo. Īsi atcerēsimies šo secību.

1. Formulēta nulles hipotēze (par statistiski nozīmīgu atšķirību neesamību starp salīdzinātajām dispersijām).

2. Izdarīti daži pieņēmumi attiecībā uz statistikas izlases sadalījumu, ar kuru plānots novērtēt hipotēzē ietverto parametru.

3. Tiek izvēlēts nozīmības līmenis hipotēzes pārbaudei.

4. Tiek aprēķināta mūs interesējošās statistikas vērtība un pieņemts lēmums par nulles hipotēzes patiesumu.

Tagad sāksim ar hipotēzes pārbaudi, ka populācijas dispersija =a, t.i. pret. Ja pieņemam, ka mainīgajam x ir normāls sadalījums un ka izlase ar lielumu n tiek ņemta no populācijas nejauši, tad nulles hipotēzes pārbaudei tiek izmantota statistika.

(10)

Atceroties dispersijas aprēķināšanas formulu, mēs pārrakstām (10) šādi:

. (11)

No šīs izteiksmes ir skaidrs, ka skaitītājs ir normāli sadalīto vērtību noviržu kvadrātu summa no to vidējās vērtības. Katra no šīm novirzēm ir arī parasti sadalīta. Tāpēc saskaņā ar mums zināmo sadalījumu statistikas (10) un (11) normāli sadalīto vērtību kvadrātu summām ir - sadalījums ar n-1 brīvības pakāpēm.

Pēc analoģijas ar t sadalījuma izmantošanu, pārbaudot izvēlēto nozīmīguma līmeni, no sadalījuma tabulas tiek noteikti kritiskie punkti, kas atbilst nulles hipotēzes pieņemšanas varbūtībām un. Atlasītās ticamības intervāls tiek konstruēts šādi:

. (12)

Apskatīsim piemēru. Pieņemsim, pamatojoties uz plašiem eksperimentāliem pētījumiem, ka vienas augu sugas alkaloīdu satura izkliede no noteiktas platības ir vienāda ar 4,37 konvencionālajām vienībām. Speciālista rīcībā ir n = 28 šādu augu paraugs, domājams, no vienas un tās pašas teritorijas. Analīze parādīja, ka šim paraugam =5,01 un mums ir jāpārliecinās, ka šī un iepriekš zināmās dispersijas ir statistiski neatšķiramas pie nozīmīguma līmeņa =0,1.

Saskaņā ar formulu (10) mums ir

Iegūtā vērtība jāsalīdzina ar kritiskajām vērtībām /2=0,05 un 1--/2=0,95. No pielikuma tabulas ar 27 brīvības pakāpēm mums ir attiecīgi 40.1 un 16.2, kas nozīmē, ka nulles hipotēzi var pieņemt. Attiecīgais ticamības intervāls ir 3,37<<8,35.

Atšķirībā no hipotēžu testēšanas par izlases līdzekļiem, izmantojot Studenta testu, kad pirmā un otrā tipa kļūdas būtiski nemainījās, pārkāpjot populāciju normālā sadalījuma pieņēmumu, hipotēžu gadījumā par dispersiju, kad normalitātes nosacījumi nebija. izpildītas, kļūdas būtiski mainījās.

Iepriekš aplūkotā problēma par dispersijas vienādību ar kādu fiksētu vērtību ir ierobežota interese, jo situācijas, kad ir zināma populācijas dispersija, ir diezgan retas. Daudz lielāku interesi rada gadījums, kad jāpārbauda, vai divu populāciju dispersijas ir vienādas, t.i. hipotēzes pārbaude pret alternatīvu. Tiek pieņemts, ka lieluma un izlases paraugi ir nejauši iegūti no vispārējām populācijām ar novirzēm un.

Lai pārbaudītu nulles hipotēzi, tiek izmantots Fišera dispersijas koeficienta tests

(13)

Tā kā normāli sadalītu nejaušības lielumu kvadrātu noviržu summām no to vidējām ir sadalījums, gan (13) skaitītājs, gan saucējs ir sadalītas vērtības, kas attiecīgi dalītas ar un, un tāpēc to attiecībai ir F sadalījums ar -1 un -1 brīvības pakāpe.

Ir vispārpieņemts — un šādi tiek veidotas F sadalījuma tabulas —, ka lielākā no novirzēm tiek ņemta par skaitītāju (13), un tāpēc tiek noteikts tikai viens kritiskais punkts, kas atbilst izvēlētajam nozīmīguma līmenim.

Mūsu rīcībā būs divi tilpuma =11 un =28 paraugi no parasto un ovālo dīķu gliemežu populācijām, kurām augstuma un platuma attiecība ir =0,59 un =0,38. Nepieciešams pārbaudīt hipotēzi par šo rādītāju šo rādītāju dispersiju vienādību pētāmajām populācijām pie nozīmības līmeņa =0,05. Mums ir

Literatūrā dažkārt var atrast apgalvojumu, ka, pārbaudot hipotēzi par vidējo vienlīdzību, izmantojot Stjudenta t-testu, ir jāpārbauda hipotēze par dispersiju vienādību. Šis ir nepareizs ieteikums. Turklāt tas var novest pie kļūdām, no kurām var izvairīties, ja tās netiek ievērotas.

Patiešām, dispersiju vienādības hipotēzes pārbaudes rezultāti, izmantojot Fišera testu, lielā mērā ir atkarīgi no pieņēmuma, ka paraugi ir ņemti no populācijām ar normālu sadalījumu. Tajā pašā laikā Studenta tests ir nejutīgs pret normalitātes pārkāpumiem, un, ja ir iespējams iegūt vienāda lieluma paraugus, tad arī pieņēmums par dispersiju vienādību nav būtisks. Ja n ir nevienāds, verifikācijai jāizmanto formulas (7) un (8).

Pārbaudot hipotēzes par dispersiju vienādību, dažas pazīmes rodas aprēķinos, kas saistīti ar atkarīgajiem paraugiem. Šajā gadījumā statistika tiek izmantota, lai pārbaudītu hipotēzi pret alternatīvu

(14)

Ja nulles hipotēze ir patiesa, tad statistikai (14) ir Stjudenta t sadalījums ar n-2 brīvības pakāpēm.

Mērot spīdumu 35 pārklājuma paraugiem, iegūta dispersija =134,5. Atkārtoti mērījumi pēc divām nedēļām uzrādīja = 199,1. Šajā gadījumā korelācijas koeficients starp pāru mērījumiem izrādījās vienāds ar =0,876. Ja ignorēsim faktu, ka paraugi ir atkarīgi, un hipotēzes pārbaudei izmantosim Fišera testu, iegūsim F=1,48. Ja izvēlaties nozīmīguma līmeni =0,05, tad nulles hipotēze tiks pieņemta, jo F sadalījuma kritiskā vērtība =35-1=34 un =35-1=34 brīvības pakāpēm ir 1,79.

Tajā pašā laikā, ja izmantojam šim gadījumam piemērotu formulu (14), iegūstam t = 2,35, savukārt t kritiskā vērtība 33 brīvības pakāpēm un izvēlētajam nozīmīguma līmenim = 0,05 ir vienāda ar 2,03. Tāpēc nulles hipotēze par vienādu dispersiju abos paraugos ir jānoraida. Tādējādi no šī piemēra ir skaidri redzams, ka, tāpat kā vidējo vienlīdzības hipotēzes testēšanas gadījumā, eksperimentālo datu specifiku neņemot vērā kritērija izmantošana noved pie kļūdas.

Ieteicamajā literatūrā var atrast Bartleta testu, kas tiek izmantots, lai pārbaudītu hipotēzes par k dispersiju vienlaicīgu vienādību. Papildus tam, ka šī kritērija statistikas aprēķināšana ir diezgan darbietilpīga, galvenais šī kritērija trūkums ir tas, ka tas ir neparasti jutīgs pret novirzēm no pieņēmuma par populāciju, no kurām tiek ņemti paraugi, normālu sadalījumu. Tādējādi, to lietojot, jūs nekad nevarat būt pārliecināti, ka nulles hipotēze patiešām tiek noraidīta tāpēc, ka dispersijas ir statistiski nozīmīgi atšķirīgas, nevis tāpēc, ka paraugi nav normāli sadalīti. Tāpēc, ja rodas vairāku dispersiju salīdzināšanas problēma, ir jāmeklē problēmas formulējums, kurā būs iespējams izmantot Fišera kritēriju vai tā modifikācijas.

3 Vienošanās kritēriji attiecībā uz akcijām

Diezgan bieži ir jāanalizē populācijas, kurās objektus var klasificēt vienā no divām kategorijām. Piemēram, pēc dzimuma noteiktā populācijā, pēc noteikta mikroelementa klātbūtnes augsnē, pēc olu tumšās vai gaišās krāsas dažām putnu sugām utt.

Elementu īpatsvaru, kuriem ir noteikta kvalitāte, mēs apzīmējam ar P, kur P apzīmē objektu ar tādu kvalitāti, kas mūs interesē, attiecību pret visiem objektiem kopumā.

Pārbaudīsim hipotēzi, ka kādā pietiekami lielā populācijā daļa P ir vienāda ar kādu skaitli a (0

Dihotomiem (ar divām gradācijām) mainīgajiem, kā tas ir mūsu gadījumā, P spēlē tādu pašu lomu kā kvantitatīvi izmērīto mainīgo lielumu populācijas vidējam rādītājam. No otras puses, iepriekš tika teikts, ka frakcijas P standarta kļūdu var attēlot kā

Tad, ja hipotēze ir patiesa, tad statistika

, (19)
kur p ir parauga P vērtība, ir vienības normālais sadalījums. Uzreiz jāatzīmē, ka šāds tuvinājums ir spēkā, ja mazākais no reizinājumiem np vai (1-p)n ir lielāks par 5.

No literatūras lai būtu zināms, ka ezera varžu populācijā īpatņu īpatsvars ar garenisku svītru mugurā ir 62% jeb 0,62. Mūsu rīcībā bija 125 (n) indivīdu paraugs, no kuriem 93 (f) ir gareniska svītra aizmugurē. Jānoskaidro, vai mums interesējošās pazīmes indivīdu īpatsvars populācijā, no kuras ņemta parauga, atbilst zināmajiem datiem. Mums ir: p=f/n=93/125=0,744, a=0,62, n(1-p)=125(1-0,744)=32>5 un

Tāpēc gan nozīmīguma līmenim = 0,05, gan = 0,01 nulles hipotēze ir jānoraida, jo kritiskā vērtība = 0,05 ir 1,96 un = 0,01 - 2,58.

Ja ir divas lielas populācijas, kurās objektu proporcijas ar mums interesējošo īpašumu ir attiecīgi un, tad hipotēzes pārbaude: = pret alternatīvu: interesē. Testēšanai nejauši un neatkarīgi ekstrahē divus paraugus ar tilpumiem un. Pamatojoties uz šiem paraugiem, tiek aprēķināta un noteikta statistika.

(20)

kur un ir objektu skaits, kuriem ir šis raksturlielums attiecīgi pirmajā un otrajā paraugā.

No formulas (20) var saprast, ka tās atvasināšanā tika izmantots tas pats princips, ar kuru mēs sastapāmies iepriekš. Proti, lai pārbaudītu statistiskās hipotēzes, tiek noteikts standartnoviržu skaits, kas veido atšķirību starp mums interesējošiem rādītājiem, faktiski vērtība (+)/(+) atspoguļo objektu īpatsvaru ar doto raksturlielumu abos paraugus vienlaicīgi. Ja mēs to apzīmējam ar, tad izteiksme saucēja (20) otrajā iekavā apzīmē (1-) un kļūst acīmredzams, ka izteiksme (20) ir ekvivalenta nulles hipotēzes pārbaudes formulai:

Jo.

No otras puses, tā ir standarta kļūda. Tādējādi (20) var uzrakstīt kā

. (21)

Vienīgā atšķirība starp šo statistiku un statistiku, ko izmanto, lai pārbaudītu hipotēzes par vidējo vērtību, ir tāda, ka z ir normālā sadalījuma vienība, nevis t sadalījums.

Lai cilvēku grupas (=82) pētījums parāda, ka to cilvēku īpatsvars, kuriem elektroencefalogrammā ir -ritms, ir 0,84 jeb 84%. Pētījumā ar cilvēku grupu citā apgabalā (=51) šī proporcija ir 0,78. Lai nozīmīguma līmenis būtu =0,05, ir jāpārbauda, vai indivīdu ar smadzeņu alfa aktivitāti proporcijas vispārējās populācijās, no kurām tika ņemti paraugi, ir vienādas.

Pirmkārt, pārliecināsimies, vai pieejamie eksperimentālie dati ļauj izmantot statistiku (20). Mums ir:

un tā kā z ir normāls sadalījums, kuram kritiskais punkts pie =0,05 ir 1,96, tad tiek pieņemta nulles hipotēze.

Aplūkotais kritērijs ir spēkā, ja izlases, kurām tika salīdzinātas objektu proporcijas ar mūs interesējošo raksturlielumu, ir neatkarīgi. Ja šī prasība nav izpildīta, piemēram, kad populācija tiek aplūkota secīgos laika intervālos, tad vienam un tam pašam objektam var būt vai var nebūt šī pazīme šajos intervālos.

Apzīmēsim objekta klātbūtni ar kādu mūs interesējošu atribūtu ar 1 un tā neesamību ar 0. Tad nonākam pie 3. tabulas, kur (a+c) ir objektu skaits pirmajā paraugā, kuriem ir kāds atribūts. , (a+c) ir objektu skaits ar šo raksturlielumu otrajā izlasē, un n ir kopējais pārbaudīto objektu skaits. Acīmredzot šī ir jau labi zināma četru lauku tabula, kuras attiecības tiek novērtētas, izmantojot koeficientu

Šādam galdam un mazam (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
kurai, ja nulles hipotēze ir patiesa, ir hī kvadrāta sadalījums ar vienu brīvības pakāpi.

Apskatīsim piemēru. Lai pārbaudītu dažādos gada laikos veikto malārijas vakcināciju efektivitāti divu gadu garumā. Tiek pārbaudīta hipotēze, ka vakcinācijas efektivitāte nav atkarīga no gada laika, kad tās tiek veiktas. Mums ir

Tabulas vērtība =0,05 ir 3,84 un =0,01 ir 6,64. Līdz ar to jebkurā no šiem nozīmīguma līmeņiem nulles hipotēze ir jānoraida, un šajā hipotētiskajā piemērā (lai arī tas būtu saistīts ar realitāti) var secināt, ka gada otrajā pusē veiktās likmes ir ievērojami efektīvākas.

Kā minēts iepriekš, četru lauku tabulas savienojuma koeficienta dabisks vispārinājums ir Čuprova savstarpējās konjugācijas koeficients. Precīzs šī koeficienta sadalījums nav zināms, tāpēc hipotēzes pamatotība tiek vērtēta, salīdzinot aprēķināto vērtību un izvēlēto nozīmīguma līmeni ar šī sadalījuma kritiskajiem punktiem. Brīvības pakāpju skaitu nosaka pēc izteiksmes (r-1)(c-1), kur r un c ir katra raksturlieluma gradāciju skaits.

Atcerēsimies aprēķinu formulas

Tiek parādīti dati, kas iegūti, pētot redzes diapazonu labajā un kreisajā acī cilvēkiem bez redzes anomālijām. Parasti šis diapazons ir sadalīts četrās kategorijās, un mūs interesē attiecības starp kreisās un labās acs redzes diapazonu. Vispirms atradīsim visus noteikumus dubultā summā. Lai to izdarītu, katras tabulā norādītās vērtības kvadrāts tiek dalīts ar tās rindas un kolonnas summu, kurai pieder atlasītais skaitlis. Mums ir

Izmantojot šo vērtību, mēs iegūstam =3303,6 un T=0,714.

4 Iedzīvotāju sadalījuma salīdzināšanas kritēriji

Klasiskajos zirņu audzēšanas eksperimentos, kas iezīmēja ģenētikas sākumu, G. Mendelis novēroja dažādu sēklu veidu frekvences, kas iegūtas, krustojot augus ar apaļām dzeltenām sēklām un grumbuļainām zaļām sēklām.

Šajā un līdzīgos gadījumos ir interesanti pārbaudīt nulles hipotēzi par to vispārējo populāciju sadalījuma funkciju vienlīdzību, no kurām tiek ņemti paraugi, t.i. Teorētiskie aprēķini ir parādījuši, ka šādas problēmas risināšanai var izmantot statistiku

= (23)

Kritēriju, izmantojot šo statistiku, ierosināja K. Pīrsons, un tas ir viņa vārds. Pīrsona testu izmanto grupētiem datiem neatkarīgi no tā, vai tiem ir nepārtraukts vai diskrēts sadalījums. (23) k ir grupēšanas intervālu skaits, empīriskie skaitļi un paredzamie vai teorētiskie skaitļi (=n). Ja nulles hipotēze ir patiesa, statistikai (23) ir sadalījums ar k-1 brīvības pakāpēm.

Tabulā norādītajiem datiem

Sadalījuma kritiskie punkti ar 3 brīvības pakāpēm =0,05 un =0,01 ir vienādi ar attiecīgi 7,81 un 11,3. Tāpēc tiek pieņemta nulles hipotēze un izdarīts secinājums, ka pēcnācēju segregācija diezgan labi atbilst teorētiskajiem modeļiem.

Apskatīsim citu piemēru. Jūrascūciņu kolonijā gada griezumā, sākot ar janvāri, iegūti šādi tēviņu dzimušo skaitļi: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. Kan. uzskatām, ka iegūtie dati atbilst vienmērīgam sadalījumam, t.i. sadalījums, kurā atsevišķos mēnešos dzimušo vīriešu skaits ir vidēji vienāds? Ja mēs pieņemam šo hipotēzi, tad paredzamais vidējais dzimušo vīriešu skaits būs vienāds. Tad

Sadalījuma kritiskā vērtība ar 11 brīvības pakāpēm un = 0,01 ir 24,7, tāpēc izvēlētajā nozīmīguma līmenī nulles hipotēze tiek noraidīta. Eksperimentālo datu tālāka analīze liecina, ka pieaug iespējamība, ka jūrascūciņu tēviņi piedzims gada otrajā pusē.

Gadījumā, ja tiek pieņemts, ka teorētiskais sadalījums ir vienmērīgs, ar teorētisko skaitļu aprēķināšanu nav problēmu. Citu sadalījumu gadījumā aprēķini kļūst sarežģītāki. Apskatīsim piemērus, kā tiek aprēķināti teorētiskie skaitļi parastajiem un Puasona sadalījumiem, kas pētniecības praksē ir diezgan izplatīti.

Sāksim ar teorētisko skaitļu noteikšanu normālajam sadalījumam. Ideja ir pārveidot mūsu empīrisko sadalījumu sadalījumā ar nulles vidējo un vienības dispersiju. Protams, šajā gadījumā klašu intervālu robežas tiks izteiktas standarta novirzes vienībās, un tad, atceroties, ka laukums zem līknes posma, ko ierobežo katra intervāla augšējās un apakšējās vērtības, ir vienāds ar varbūtību iekrist noteiktā intervālā, reizinot šo varbūtību ar kopējo skaitļu izlasi, mēs iegūsim vēlamo teorētisko skaitli.

Pieņemsim, ka mums ir empīrisks ozola lapu garuma sadalījums un jāpārbauda, vai ar nozīmības līmeni =0,05 var uzskatīt, ka šis sadalījums būtiski neatšķiras no parastā.

Paskaidrosim, kā tika aprēķinātas tabulā norādītās vērtības. Vispirms, izmantojot grupēto datu standarta metodi, tika aprēķināta vidējā un standartnovirze, kas izrādījās vienāda ar =10,3 un =2,67. Izmantojot šīs vērtības, tika atrastas intervālu robežas standartnovirzes vienībās, t.i. ir atrastas standartizētas vērtības, piemēram, intervāla (46) robežām ir: (4-10,3)/2,67=-2,36; (6-10,3)/2,67=-1,61. Pēc tam katram intervālam tika aprēķināta varbūtība tajā iekrist. Piemēram, intervālam (-0.110.64) no normālā sadalījuma tabulas mums ir tāds, ka pa kreisi no punkta (-0.11) ir 0.444 no vienības normālā sadalījuma laukuma un pa kreisi no punkta. punkts (0,64) ir 0,739 no šīs platības. Tādējādi varbūtība iekļūt šajā intervālā ir 0,739-0,444=0,295. Pārējie aprēķini ir acīmredzami. Būtu jāpaskaidro atšķirība starp n un.... Tas rodas tāpēc, ka teorētisko normālo sadalījumu praktiskos nolūkos var uzskatīt par centrētu uz intervālu. Eksperimentā nav nevienas vērtības, kas novirzās vairāk nekā no vidējā. Tāpēc laukums zem empīriskā sadalījuma līknes nav vienāds ar vienību, kā dēļ rodas kļūda. Tomēr šī kļūda būtiski nemaina galīgos rezultātus.

Salīdzinot empīriskos un teorētiskos sadalījumus, brīvības pakāpju skaits - sadalījumam tiek atrasts no attiecības f=m-1-l, kur m ir klases intervālu skaits, bet l ir neatkarīgo sadalījuma parametru skaits, kas novērtēts no paraugs. Normālam sadalījumam l=2, jo tas ir atkarīgs no diviem parametriem: un.

Arī brīvības pakāpju skaits tiek samazināts par 1, jo jebkuram sadalījumam ir nosacījums, ka =1, un tāpēc neatkarīgi noteikto varbūtību skaits ir vienāds ar k-1, nevis k.

Dotajā piemērā f = 8-2-1 = 5 un kritiskā vērtība pie =0,05 -sadalījumam ar 5 brīvības pakāpēm ir 11,07. Tāpēc nulles hipotēze tiek pieņemta.

Apskatīsim paņēmienu, kā salīdzināt empīrisko sadalījumu ar Puasona sadalījumu, izmantojot klasisku piemēru, kā Prūsijas armijā no zirga naga mirušo dragūnu skaitu mēnesī. Dati ir datēti ar 19. gadsimtu, un mirušo skaits ir 0, 1, 2 utt. raksturo šos skumjos, bet, par laimi, salīdzinoši retos notikumus Prūsijas kavalērijā gandrīz 20 gadu novērojumu laikā.

Kā zināms, Puasona sadalījumam ir šāda forma:

kur sadalījuma parametrs ir vienāds ar vidējo,

K =0,1,2,...,n.

Tā kā sadalījums ir diskrēts, mūs interesējošās varbūtības tiek atrastas tieši no formulas.

Parādīsim, piemēram, kā tiek noteikts teorētiskais skaitlis k=3. Parastā veidā mēs atklājam, ka vidējais šajā sadalījumā ir 0,652. Ņemot vērā šo vērtību, mēs atklājam

No šejienes

Ja izvēlamies =0,05, tad kritiskā vērtība -sadalījumam ar divām brīvības pakāpēm ir 5,99, un tāpēc tiek pieņemta hipotēze, ka empīriskais sadalījums izvēlētajā nozīmīguma līmenī neatšķiras no Puasona sadalījuma. Brīvības pakāpju skaits šajā gadījumā ir divas, jo Puasona sadalījums ir atkarīgs no viena parametra, un tāpēc attiecībā f = m-1-l no izlases aprēķinātais parametru skaits ir l = 1, un f = 4-1-1 = 2.

Dažreiz praksē ir svarīgi zināt, vai divi sadalījumi atšķiras viens no otra, pat ja ir grūti izlemt, kurš teorētiskais sadalījums tos var tuvināt. Tas ir īpaši svarīgi gadījumos, kad, piemēram, to vidējie rādītāji un/vai dispersijas statistiski būtiski neatšķiras viens no otra. Būtisku izplatības modeļu atšķirību atrašana var palīdzēt pētniekam prognozēt iespējamos faktorus, kas izraisa šīs atšķirības.

Šajā gadījumā var izmantot statistiku (23), un viena sadalījuma vērtības tiek izmantotas kā empīriskie lielumi, bet cita - kā teorētiskās vērtības. Protams, šajā gadījumā sadalījumam klašu intervālos ir jābūt vienādam abiem sadalījumiem. Tas nozīmē, ka visiem abu paraugu datiem tiek atlasītas minimālās un maksimālās vērtības neatkarīgi no tā, kuram paraugam tie pieder, un pēc tam atbilstoši izvēlētajam klases intervālu skaitam tiek noteikts to platums un objektu skaits. sadalīšanu atsevišķos intervālos aprēķina katram paraugam atsevišķi.

Šajā gadījumā var izrādīties, ka dažas klases nesatur vai tajās ietilpst tikai dažas (35) vērtības. Pīrsona kritērija izmantošana dod apmierinošus rezultātus, ja katrā intervālā ietilpst vismaz 35 vērtības. Tāpēc, ja šī prasība nav izpildīta, blakus esošie intervāli ir jāapvieno. Protams, tas tiek darīts abiem izplatījumiem.

Un visbeidzot vēl viena piezīme par aprēķinātās vērtības un tai kritisko punktu salīdzināšanu izvēlētajā nozīmīguma līmenī. Mēs jau zinām, ka, ja >, tad nulles hipotēze tiek noraidīta. Taču vērtības, kas ir tuvu kritiskajam punktam 1- labajā pusē, mums vajadzētu radīt aizdomas, jo pārāk laba empīriskā un teorētiskā sadalījuma vai divu empīrisko sadalījumu sakritība (galu galā šajā gadījumā skaitļi ļoti nedaudz atšķirsies no viens otru), visticamāk, nenotiks nejaušiem sadalījumiem. Šajā gadījumā ir iespējami divi alternatīvi skaidrojumi: vai nu mums ir darīšana ar likumu, un tad iegūtais rezultāts nepārsteidz, vai arī eksperimentālie dati kaut kādu iemeslu dēļ tiek “piemēroti” viens otram, kas prasa to atkārtotu pārbaudi. .

Starp citu, piemērā ar zirņiem mums ir tieši pirmais gadījums, t.i. dažāda gluduma un krāsas sēklu parādīšanos pēcnācējos nosaka likums, un tāpēc nav jābrīnās, ka aprēķinātā vērtība izrādījās tik maza.

Tagad atgriezīsimies pie statistiskās hipotēzes pārbaudes par divu empīrisku sadalījumu identitāti. Tiek sniegti dati par anemonu ziedu ziedlapu skaita sadalījumu no dažādiem biotopiem.

No tabulas datiem ir skaidrs, ka pirmie divi un pēdējie divi intervāli ir jāapvieno, jo tajos ietilpstošo vērtību skaits nav pietiekams, lai pareizi izmantotu Pīrsona kritēriju. No šī piemēra arī ir skaidrs, ka, ja analizētu tikai izplatību no biotopa A, tad vispār nebūtu neviena klases intervāla, kurā būtu 4 ziedlapiņas. Tas parādījās tāpēc, ka vienlaikus tiek aplūkoti divi sadalījumi, un otrajā sadalījumā ir šāda klase.

Tātad, pārbaudīsim hipotēzi, ka šie divi sadalījumi neatšķiras viens no otra. Mums ir

Vairākām brīvības pakāpēm 4 un nozīmīguma līmenim, kas pat vienāds ar 0,001, nulles hipotēze tiek noraidīta.

Lai salīdzinātu divus izlases sadalījumus, varat izmantot arī neparametrisko kritēriju, ko ierosināja Ņ.V. Smirnovs un pamatojoties uz statistiku, ko iepriekš ieviesa A. N. Kolmogorovs. (Tāpēc šo testu dažreiz sauc par Kolmogorova-Smirnova testu.) Šis tests ir balstīts uz uzkrāto frekvenču sēriju salīdzinājumu. Šī kritērija statistika ir atrodama kā

maks., (24)
kur un ir uzkrāto frekvenču sadalījuma līknes.

Kritiskie punkti statistikai (24) ir atrodami no attiecības

, (25)
kur un ir pirmā un otrā parauga tilpumi.

Kritiskās vērtības =0,1;=0,05; un =0,01 ir attiecīgi vienādi ar 1,22; 1,36; 1.63. Ilustrēsim Smirnova kritērija izmantošanu, izmantojot grupētus datus, kas atspoguļo viena vecuma skolēnu augumu no diviem dažādiem reģioniem.

Maksimālā atšķirība starp uzkrātajām frekvences līknēm ir 0,124. Ja izvēlamies nozīmīguma līmeni =0,05, tad no formulas (25) mums ir

0,098.

Tādējādi maksimālā empīriskā atšķirība ir lielāka par teorētiski sagaidāmo, tāpēc pieņemtajā nozīmīguma līmenī nulles hipotēze par abu aplūkojamo sadalījumu identitāti tiek noraidīta.

Smirnova testu var izmantot arī neklasteru datiem, vienīgā prasība ir, ka dati ir jāiegūst no populācijas ar nepārtrauktu sadalījumu. Ir arī vēlams, lai vērtību skaits katrā paraugā būtu vismaz 40-50.

Lai pārbaudītu nulles hipotēzi, saskaņā ar kuru divi neatkarīgi paraugi ar izmēriem n un m atbilst vienādām sadalījuma funkcijām, F. Vilkoksons piedāvāja neparametrisku kritēriju, kas tika pamatots G. Manna un F. Vitnija darbos. Tāpēc literatūrā šis kritērijs tiek saukts vai nu par Vilkoksona kritēriju, vai par Manna-Vitnija kritēriju. Šo kritēriju ieteicams izmantot, ja iegūto paraugu lielums ir mazs un citu kritēriju izmantošana nav piemērota.

Tālāk sniegtie aprēķini ilustrē pieeju kritēriju veidošanai, izmantojot statistiku, kas saistīta nevis ar pašām izlases vērtībām, bet gan ar to rindām.

Mūsu rīcībā ir divi n un m lieluma paraugi. Izveidosim no tām vispārīgu variāciju sēriju un salīdzināsim katru no šīm vērtībām ar tās rangu (), t.i. sērijas numurs, ko tas ieņem sarindotajā sērijā. Ja nulles hipotēze ir patiesa, tad jebkurš rangu sadalījums ir vienlīdz iespējams, un kopējais iespējamo pakāpju kombināciju skaits dotajiem n un m ir vienāds ar N=n+m elementu kombināciju skaitu par m.

Vilkoksona tests ir balstīts uz statistiku

. (26)

Formāli, lai pārbaudītu nulles hipotēzi, ir nepieciešams saskaitīt visas iespējamās rangu kombinācijas, kurām W statistika ņem vērtības, kas ir vienādas vai mazākas par tām, kas iegūtas konkrētai ranžētai sērijai, un jāatrod šī skaitļa attiecība pret kopējo iespējamo rangu kombināciju skaits abiem paraugiem. Iegūtās vērtības salīdzināšana ar izvēlēto nozīmīguma līmeni ļaus pieņemt vai noraidīt nulles hipotēzi. Šīs pieejas pamatojums ir tāds, ka, ja viens sadalījums ir neobjektīvs attiecībā pret otru, tas izpaudīsies kā fakts, ka mazām rindām galvenokārt jāatbilst vienam paraugam, bet lielajām - citam. Atkarībā no tā atbilstošajām rangu summām jābūt mazām vai lielām atkarībā no tā, kura alternatīva notiek.

Nepieciešams pārbaudīt hipotēzi par abas mērīšanas metodes raksturojošo sadalījuma funkciju identitāti ar nozīmības līmeni =0,05.

Šajā piemērā n = 3, m = 2, N = 2+3 = 5, un rindu summa, kas atbilst mērījumiem, izmantojot metodi B, ir vienāda ar 1+3 = 4.

Pierakstīsim visus =10 iespējamos rangu sadalījumus un to summas:

Pakāpes: 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Summas: 3 4 5 6 5 6 7 7 8 9

Ranga kombināciju skaita, kuru summa nepārsniedz B metodei iegūto vērtību 4, attiecība pret kopējo iespējamo rangu kombināciju skaitu ir 2/10=0,2>0,05, tāpēc šim piemēram nulles hipotēze ir pieņemts.

Mazām n un m vērtībām nulles hipotēzi var pārbaudīt, tieši saskaitot atbilstošo rangu summu kombināciju skaitu. Taču lieliem paraugiem tas kļūst praktiski neiespējami, tāpēc tika iegūts tuvinājums W statistikai, kas, kā izrādījās, asimptotiski tiecas uz normālo sadalījumu ar atbilstošiem parametriem. Mēs aprēķināsim šos parametrus, lai ilustrētu pieeju rangu statistikas testu sintezēšanai. To darot, mēs izmantosim 37. nodaļā sniegtos rezultātus.

Pieņemsim, ka W ir rindu summa, kas atbilst vienam no paraugiem, piemēram, tai, kuras tilpums ir m. Ļaut ir šo rindu vidējais aritmētiskais. Vērtības matemātiskā cerība ir

jo saskaņā ar nulles hipotēzi elementu rindas izlasē ar lielumu m attēlo paraugu no ierobežotas kopas 1, 2,...,N (N=n+m). Ir zināms, ka

Tieši tāpēc.

Aprēķinot dispersiju, mēs izmantojam to, ka vispārējās sarindotās sērijas rindu kvadrātu summa, kas sastāv no abu paraugu vērtībām, ir vienāda ar

Ņemot vērā iepriekš iegūtās sakarības vispārējo populāciju un paraugu dispersiju novērtēšanai, mums ir

No tā izriet

Ir pierādīts, ka statistika

(27)

lieliem n un m tam ir asimptotiski vienības normālais sadalījums.

Apskatīsim piemēru. Ļaujiet iegūt datus par asins seruma filtrāta polarogrāfisko aktivitāti divām vecuma grupām. Nepieciešams pārbaudīt hipotēzi ar nozīmīguma līmeni =0,05, ka paraugi ņemti no vispārējām populācijām, kurām ir vienādas sadalījuma funkcijas. Pakāpju summa pirmajai izlasei ir 30, otrajai - 90. Pakāpju summu aprēķina pareizības pārbaude ir nosacījuma izpilde. Mūsu gadījumā 30+90=(7+8)(7+8+1):

:2=120. Saskaņā ar formulu (27), izmantojot otrās izlases rindu summu, mēs iegūstam

Ja mēs izmantojam rindu summu pirmajam paraugam, mēs iegūstam vērtību = -3,01. Tā kā aprēķinātajai statistikai ir vienības normāls sadalījums, tad likumsakarīgi, ka gan pirmajā, gan otrajā gadījumā nulles hipotēze tiek noraidīta, jo kritiskā vērtība 5% nozīmīguma līmenim ir modulo 1.96.

Izmantojot Vilkoksona testu, rodas zināmas grūtības, ja abos paraugos tiek atrastas vienādas vērtības, jo iepriekš minētās formulas izmantošana izraisa testa jaudas samazināšanos, dažreiz ļoti ievērojami.

Lai šādos gadījumos samazinātu kļūdas līdz minimumam, ieteicams izmantot šādu īkšķa noteikumu. Pirmo reizi, saskaroties ar identiskām vērtībām, kas pieder dažādiem paraugiem, kuru no tām variāciju sērijā likt pirmajā vietā, nosaka nejauši, piemēram, metot monētu. Ja ir vairākas šādas vērtības, tad, nejauši nosakot pirmo, tiek mainītas atlikušās vienādas vērtības no abiem paraugiem. Gadījumos, kad tiek atrastas citas vienādas vērtības, rīkojieties šādi. Ja pirmajā vienādu vērtību grupā pirmā vērtība tika nejauši izvēlēta no viena konkrēta parauga, tad nākamajā vienādu vērtību grupā vispirms tiek atlasīta vērtība no cita parauga utt.

5. Nejaušības pārbaudes un izņēmuma novērojumu novērtēšanas kritēriji

Diezgan bieži dati tiek iegūti sērijveidā laikā vai telpā. Piemēram, veicot psihofizioloģiskus eksperimentus, kas var ilgt vairākas stundas, vairākus desmitus vai simtus reižu, tiek mērīts reakcijas latentais (latents periods) uz uzrādīto vizuālo stimulu, vai ģeogrāfiskos apsekojumos, kad vietās, kas atrodas noteiktās vietās, piemēram, gar mežu malu, tiek skaitīts noteikta veida augu skaits utt. Savukārt, aprēķinot dažādu statistiku, tiek pieņemts, ka avota dati ir neatkarīgi un identiski sadalīti. Tāpēc ir interesanti pārbaudīt šo pieņēmumu.

Pirmkārt, apsveriet kritēriju, lai pārbaudītu nulles hipotēzi par identiski normāli sadalītu vērtību neatkarību. Tādējādi šis kritērijs ir parametrisks. Tas ir balstīts uz secīgu atšķirību vidējo kvadrātu aprēķināšanu

. (28)

Ja mēs ieviešam jaunu statistiku, tad, kā zināms no teorijas, ja nulles hipotēze ir patiesa, statistika

(29)
ja n>10 tiek sadalīts asimptomotiski atbilstoši standarta normālajam sadalījumam.

Apskatīsim piemēru. Ir doti subjekta reakcijas laiki () vienā no psihofizioloģiskajiem eksperimentiem.

Mums ir: no kurienes

Tā kā =0,05 kritiskā vērtība ir 1,96, nulles hipotēze par iegūtās rindas neatkarību tiek pieņemta ar izvēlēto nozīmīguma līmeni.

Vēl viens jautājums, kas bieži rodas, analizējot eksperimentālos datus, ir tas, ko darīt ar dažiem novērojumiem, kas krasi atšķiras no lielākās novērojumu daļas. Šādi novirzes novērojumi var rasties metodoloģisku kļūdu, aprēķinu kļūdu u.c. dēļ. Visos gadījumos, kad eksperimentētājs zina, ka novērojumā ir iezagusies kļūda, viņam šī vērtība ir jāizslēdz neatkarīgi no tās lieluma. Citos gadījumos ir tikai aizdomas par kļūdu, un tad ir jāizmanto atbilstoši kritēriji, lai pieņemtu konkrētu lēmumu, t.i. izslēgt vai atstāt neparastus novērojumus.

Kopumā jautājums tiek uzdots šādi: vai novērojumi tiek veikti par vienu un to pašu populāciju, vai arī dažas daļas vai atsevišķas vērtības pieder citai populācijai?

Protams, vienīgais drošais veids, kā izslēgt atsevišķus novērojumus, ir rūpīgi izpētīt apstākļus, kādos šie novērojumi tika iegūti. Ja kāda iemesla dēļ apstākļi atšķiras no standarta, novērojumi ir jāizslēdz no turpmākās analīzes. Taču atsevišķos gadījumos esošie kritēriji, lai arī nepilnīgi, var dot ievērojamu labumu.

Šeit mēs bez pierādījumiem parādīsim vairākas attiecības, kuras var izmantot, lai pārbaudītu hipotēzi, ka novērojumi tiek veikti nejauši par vienu un to pašu populāciju. Mums ir

(30)

(31)

(32)

kur ir iespējamais “ārējais” novērojums. Ja visas sērijas vērtības ir sarindotas, tad redzamākais novērojums tajā ieņems n-to vietu.

Statistikai (30) sadalījuma funkcija ir parādīta tabulā. Ir doti šī sadalījuma kritiskie punkti dažiem n.

Statistikas kritiskās vērtības (31) atkarībā no n ir

4,0; 6

4,5; 100

5,0; n>1000.

Formulā (31) tiek pieņemts, ka un tiek aprēķināti, neņemot vērā iespējamo novērojumu.

Ar statistiku (32) situācija ir sarežģītāka. Parādīts, ka, ja tie ir sadalīti vienmērīgi, tad matemātiskajai cerībai un dispersijai ir šāda forma:

Kritisko reģionu veido mazas vērtības, kas atbilst lielām vērtībām. Ja vēlaties pārbaudīt mazākās vērtības “novirzi”, vispirms pārveidojiet datus tā, lai tiem būtu vienmērīgs sadalījums pa intervālu, un pēc tam pievienojiet šīs vienotās vērtības 1 un pārbaudiet, izmantojot formulu ( 32).

Apsveriet iespēju izmantot iepriekš minētos kritērijus šādām ranžētām novērojumu sērijām: 3,4,5,5,6,7,8,9,9,10,11,17. Jums jāizlemj, vai lielākā vērtība 17 ir jānoraida.

Mums ir: Saskaņā ar formulu (30) =(17-11)/3,81=1,57, un nulles hipotēze ir jāpieņem pie =0,01. Saskaņā ar formulu (31) = (17-7,0)/2,61 = 3,83, un jāpieņem arī nulles hipotēze. Lai izmantotu trešo kritēriju, mēs atrodam =5,53, tad

W statistika parasti tiek sadalīta ar nulles vidējo un vienības dispersiju, un tāpēc tiek pieņemta nulles hipotēze pie =0,05.

Statistikas (32) izmantošanas grūtības rada nepieciešamība iegūt a priori informāciju par izlases vērtību sadalījuma likumu un pēc tam analītiski pārveidot šo sadalījumu vienmērīgā sadalījumā pa intervālu.

Literatūra

1. Elisejeva I.I. Vispārējā statistikas teorija: mācību grāmata augstskolām / I.I. Elisejeva, M.M. Juzbaševs; rediģēja I.I. Elisejeva. M.: Finanses un statistika, 2009. 656 lpp.

2. Efimova M.R. Seminārs par vispārējo statistikas teoriju: mācību grāmata augstskolām / M.R. Efimova un citi M.: Finanses un statistika, 2007. 368 lpp.

3. Meļkumovs Y.S. Sociāli ekonomiskā statistika: izglītības un metodiskā rokasgrāmata. M.: IMPE-PUBLISH, 2007. 200 lpp.

4. Statistikas vispārīgā teorija: Statistikas metodoloģija komercdarbības izpētē: mācību grāmata augstskolām / O.E. Bašina un citi; rediģēja O.E. Bašina, A.A. Spirina. - M.: Finanses un statistika, 2008. 440 lpp.

5. Salins V.N. Statistikas teorijas kurss finanšu un ekonomikas profilu speciālistu sagatavošanai: mācību grāmata / V.N. Salins, E. Ju. Čurilova. M.: Finanses un statistika, 2007. 480 lpp.

6. Sociāli ekonomiskā statistika: darbnīca: mācību grāmata / V.N. Salin et al.; rediģēja V.N. Salina, E.P. Špakovskaja. M.: Finanses un statistika, 2009. 192 lpp.

7. Statistika: mācību grāmata / A.V. Bagats et al.; rediģēja V.M. Simčers. M.: Finanses un statistika, 2007. 368 lpp.

8. Statistika: mācību grāmata / I.I. Elisejeva un citi; rediģēja I.I. Elisejeva. M.: Augstākā izglītība, 2008. - 566 lpp.

9. Statistikas teorija: mācību grāmata augstskolām / R.A. Šmoilova un citi; rediģēja R.A. Šmoilova. - M.: Finanses un statistika, 2007. 656 lpp.

10. Šmoilova R.A. Seminārs par statistikas teoriju: mācību grāmata augstskolām / R.A. Šmoilova un citi; rediģēja R.A. Šmoilova. - M.: Finanses un statistika, 2007. 416 lpp.

LAPA \* APVIENOT 1

Citi līdzīgi darbi, kas jūs varētu interesēt.vshm>
17926.		Rūpnieciskās robotikas kompaktuma kritēriju analīze	1,77 MB
	Programmatūras risinājumi robota kompaktuma novērtēšanai. Miniatūrie roboti var iekļūt un pārvietoties pa šaurām atverēm, kas ļauj tos izmantot dažādu uzdevumu veikšanai ierobežotās telpās, piemēram, maza diametra caurulēs, kuru izmērs ir dažus milimetrus. Gandrīz visās nozarēs viena no prioritātēm ir pievadu un mehānismu miniaturizācijas jautājumi; tie ir ārkārtīgi svarīgi tehnoloģiskos procesos ar zemiem resursiem...
1884.		Kritēriju izstrāde efektīvai personāla vadībai OJSC Kazan-Orgsintez KVS	204,77 KB
	Personāla vadības sistēmas teorētiskie pamataspekti. Personāls kā vadības objekts. KVS personāla vadības sistēmu izpētes metodes. Personālvadības efektivitātes uzlabošanas veidi.
16316.		un šī teorija atrisina šo dilemmu; b, lai atrisinātu šo dilemmu, ir nepieciešami šīs teorijas kritēriji.	12,12 KB
	Autore apgalvo, ka makroekonomikas politikas dilemmas pamatcēlonis fiksēta valūtas kursa apstākļos ir nevis Tinbergena noteikuma pārkāpums, kas patiesībā ir sekas, nevis cēlonis, bet gan nepieciešamo ekonomisko priekšnoteikumu trūkums valūtas fiksēšanai. kursi, kas parādīti optimālo valūtas zonu teorijā. Par šīs dilemmas cēloni parasti tiek uzskatīts Tinbergena noteikuma pārkāpums, saskaņā ar kuru, lai sasniegtu noteiktu skaitu ekonomisko mērķu, valstij ir jābūt...
18273.		Kazahstānas Republikas prezidenta juridiskā statusa analīze no vispārpieņemtiem tiesiskuma un varas dalīšanas principa kritērijiem	73,64 KB
	Prezidenta pieejas būtība bija tāda, ka valstij jāattīstās dabiskā, evolucionārā veidā. Valsts Satversmē paredzētā prezidenta vara ir noteiktas reģionālās administratīvās vienības pašpārvaldes institūciju darbības pārtraukšana un tās pārvaldības īstenošana ar valsts vadītāja - prezidenta un prezidenta ieceltu pilnvarotu personu starpniecību. personas, kas viņam ir atbildīgas; Satversmē paredzētā valsts vadītāja - prezidenta - ārkārtas pilnvaru piešķiršana globālā mērogā...
5713.		Izmantojot DotNetNuke	1,87 MB
	Šajā kursa darbā mēs pētīsim DotNetNuke. DotNetNuke (saīsinātais nosaukums DNN) ir vietņu satura pārvaldības sistēma (Web Content Management System, saīsināti WCMS), kas ir absorbējusi visus labākos sasniegumus tehnoloģiju jomā tīmekļa projektu veidošanai.
7073.		IZMANTOJOT INTERFESES	56,59 KB
	Vārda saskarne ir polisemantisks vārds, un tam ir atšķirīga nozīme dažādos kontekstos. Ir programmatūras vai aparatūras saskarnes jēdziens, taču vairumā gadījumu vārds interfeiss ir saistīts ar kaut kādu savienojumu starp objektiem vai procesiem.
6471.		Reģistra struktūra un izmantošana	193,04 KB
	Reģistru struktūra un izmantošana Reģistri ir paredzēti vairāku bitu bināro skaitļu glabāšanai un konvertēšanai. Reģistri tiek veidoti kā sakārtota flip-flop secība. Mikroprocesoros reģistri ir galvenais līdzeklis digitālās informācijas ātrai iegaumēšanai un glabāšanai. Elementi, no kuriem tiek veidoti reģistri, ir D RS JK flip-flops ar dinamisku impulsa izslēgšanu vai statisku vadību.
6472.		Skaitītāju uzbūve un izmantošana	318,58 KB
	Asinhrono skaitītāju klasifikācija un uzbūves princips Skaitītājs ir ierīce, kuras izejas ģenerē bināro kodu, kas izsaka skaitītāja ieejā saņemto impulsu skaitu. Skaitītāja iespējamo stāvokļu skaitu sauc par tā moduli vai skaitīšanas koeficientu un norāda. Skaitītāju galvenie laika raksturlielumi: maksimālā skaitīšanas impulsu pienākšanas biežums; pārejas laiks no viena stāvokļa uz otru; Ir pašas skaitītāju mikroshēmas un shēmas, kas veidotas, pamatojoties uz vienu vai vairākām...
7066.		IZVĒLNES IZMANTOŠANA LIETOJUMĀ	240,2 KB
	Programmas izvēlne Programmas izvēlnei jāatbilst programmas galvenajiem darbības režīmiem, tādēļ izvēlnes elementu izvēle un atsevišķu vienumu komandas ir jāizturas īpaši uzmanīgi. Lai labāk izprastu izvēlņu izmantošanas tehnoloģiju programmās, risinot tālāk norādīto apmācību programmu, apsveriet darbību secību. Visas darbības ir jāpabeidz, izmantojot izvēlni.
7067.		DIALOGA IZVĒLŅU IZMANTOŠANA	73,13 KB
	Turpinot izstrādāt lietojumprogrammu ar izvēlni un rīkjoslu, mums ir jāraksta ziņojumu apstrādātāju kods komandām, lai izveidotu 6*6 matricu un izvadītu (drukātu) matricu mūsu lietojumprogrammas klienta apgabalā. Matricas izveide jāpabeidz, ekrānā parādot ziņojumu, kas norāda uz apdarinātāja veiksmīgu pabeigšanu, piemēram, “Matrica ir izveidota”.

Ievads

Šīs tēmas aktualitāte ir tāda, ka, pētot biostatistikas pamatus, mēs pieņēmām, ka populācijas sadalījuma likums ir zināms. Bet ko darīt, ja sadalījuma likums nav zināms, bet ir pamats pieņemt, ka tam ir noteikta forma (sauksim to par A), tad tiek pārbaudīta nulles hipotēze: vispārējā populācija tiek sadalīta saskaņā ar likumu A. Šī hipotēze tiek pārbaudīta, izmantojot īpaši izvēlēts nejaušs lielums - atbilstības kritērijs.

Atbilstības kritēriji ir kritēriji hipotēžu pārbaudei par empīriskā sadalījuma atbilstību teorētiskajam varbūtības sadalījumam. Šādi kritēriji ir sadalīti divās klasēs:

III Vispārējie atbilstības testi attiecas uz hipotēzes vispārīgāko formulējumu, proti, hipotēzi, ka novērotie rezultāti sakrīt ar jebkuru a priori pieņemto varbūtības sadalījumu.
Ш Speciālie piemērotības testi ietver īpašas nulles hipotēzes, kas formulē sakritību ar noteiktu varbūtības sadalījuma formu.

Vienošanās kritērijs

Visizplatītākie piemērotības testi ir omega kvadrāts, hī kvadrāts, Kolmogorovs un Kolmogorovs-Smirnovs.

Plaši tiek izmantoti neparametriskie piemērotības testi Kolmogorova, Smirnova un omega kvadrātā. Taču tās ir saistītas arī ar plaši izplatītām kļūdām statistikas metožu pielietošanā.

Fakts ir tāds, ka uzskaitītie kritēriji tika izstrādāti, lai pārbaudītu vienošanos ar pilnībā zināmu teorētisko sadalījumu. Plaši tiek izmantotas aprēķinu formulas, sadalījumu tabulas un kritiskās vērtības. Kolmogorova, omega kvadrāta un līdzīgu testu galvenā ideja ir izmērīt attālumu starp empīrisko sadalījuma funkciju un teorētisko sadalījuma funkciju. Šie kritēriji atšķiras pēc attāluma veida sadalījuma funkciju telpā.

Pīrsona piemērotības testi vienkāršai hipotēzei

K. Pīrsona teorēma attiecas uz neatkarīgiem izmēģinājumiem ar ierobežotu iznākumu skaitu, t.i. uz Bernulli testiem (nedaudz paplašinātā nozīmē). Tas ļauj mums spriest, vai novērojumi daudzos šo rezultātu biežuma izmēģinājumos atbilst to aplēstajām varbūtībām.

Daudzās praktiskās problēmās precīzs sadales likums nav zināms. Tāpēc tiek izvirzīta hipotēze par esošā empīriskā likuma, kas konstruēts no novērojumiem, atbilstību kādam teorētiskam. Šī hipotēze prasa statistisku pārbaudi, kuras rezultāti tiks vai nu apstiprināti, vai atspēkoti.

Pieņemsim, ka X ir pētāmais gadījuma lielums. Jāpārbauda hipotēze H0, ka šis nejaušais lielums pakļaujas sadalījuma likumam F(x). Lai to izdarītu, ir nepieciešams izveidot n neatkarīgu novērojumu paraugu un izmantot to, lai izveidotu empīrisko sadalījuma likumu F "(x). Lai salīdzinātu empīriskos un hipotētiskos likumus, tiek izmantots noteikums, ko sauc par atbilstības kritēriju. Viens no populārākajiem ir K. Pīrsona hī kvadrāta piemērotības tests. Tajā tiek aprēķināta hī kvadrāta statistika.

kur N ir intervālu skaits, saskaņā ar kuriem tika izveidots empīriskais sadalījuma likums (atbilstošās histogrammas kolonnu skaits), i ir intervāla numurs, pt i ir varbūtība, ka nejaušā lieluma vērtība nonāks i- th intervāls teorētiskajam sadalījuma likumam, pe i ir varbūtība, ka gadījuma lieluma vērtība iekrīt i-tajā intervālā empīriskajam sadalījuma likumam. Tam vajadzētu ievērot hī kvadrāta sadalījumu.

Ja statistikas aprēķinātā vērtība noteiktam nozīmīguma līmenim pārsniedz hī kvadrāta sadalījuma kvantili ar k-p-1 brīvības pakāpēm, tad hipotēze H0 tiek noraidīta. Pretējā gadījumā tas tiek pieņemts norādītajā nozīmīguma līmenī. Šeit k ir novērojumu skaits, p ir sadalījuma likuma novērtēto parametru skaits.

Apskatīsim statistiku:

H2 statistiku vienkāršai hipotēzei sauc par Pīrsona hī kvadrāta statistiku.

Ir skaidrs, ka h2 apzīmē noteikta attāluma kvadrātu starp diviem r-dimensijas vektoriem: relatīvo frekvenču vektoru (mi /n, ..., mr /n) un varbūtību vektoru (pi, ..., pr). ). Šis attālums atšķiras no Eiklīda attāluma tikai ar to, ka tajā ievada dažādas koordinātas ar dažādu svaru.

Apspriedīsim statistikas h2 uzvedību gadījumā, ja hipotēze H ir patiesa un gadījumā, kad H ir nepatiesa. Ja H ir patiess, tad h2 asimptotiskā uzvedība n > ? norāda K. Pīrsona teorēmu. Lai saprastu, kas notiek ar (2.2), ja H ir nepatiess, ņemiet vērā, ka saskaņā ar lielu skaitļu likumu mi /n > pi, ja n > ?, ja i = 1, …, r. Tāpēc n > ?:

Šī vērtība ir vienāda ar 0. Tāpēc, ja H ir nepareizs, tad h2 >? (par n > ?).

No iepriekš minētā izriet, ka H ir jānoraida, ja eksperimentā iegūtā vērtība h2 ir pārāk liela. Šeit, kā vienmēr, vārdi “pārāk liels” nozīmē, ka novērotā h2 vērtība pārsniedz kritisko vērtību, ko šajā gadījumā var ņemt no hī kvadrāta sadalījuma tabulām. Citiem vārdiem sakot, varbūtība P(ch2 npi h2) ir maza vērtība, un tāpēc maz ticams, ka tā nejauši iegūs tādu pašu kā eksperimentā vai vēl lielāku neatbilstību starp frekvences vektoru un varbūtības vektoru.

Šī noteikuma pamatā esošās K. Pīrsona teorēmas asimptotiskais raksturs prasa piesardzību tās praktiskajā lietošanā. Uz to var paļauties tikai uz lieliem n. Jāspriest, vai n ir pietiekami liels, ņemot vērā varbūtības pi, ..., pr. Tāpēc nevar teikt, ka, piemēram, pietiks ar simts novērojumiem, jo ne tikai n jābūt lielam, bet arī reizinājumiem npi , ..., npr (paredzamās frekvences) nevajadzētu būt maziem. Tāpēc h2 (nepārtrauktā sadalījuma) tuvināšana h2 statistikai, kuras sadalījums ir diskrēts, izrādījās sarežģīta. Teorētisku un eksperimentālu argumentu kombinācija ir radījusi pārliecību, ka šī tuvināšana ir piemērojama, ja visas paredzamās frekvences npi> 10. ja skaitlis r (dažādu iznākumu skaits) palielinās, robeža tiek samazināta (līdz 5 vai pat līdz 3, ja r ir vairāki desmiti). Lai izpildītu šīs prasības, praksē dažreiz ir nepieciešams apvienot vairākus rezultātus, t.i. pāriet uz Bernulli shēmu ar mazāku r.

Aprakstīto sakritības pārbaudes metodi var piemērot ne tikai Bernulli testiem, bet arī izlases veida paraugiem. Pirmkārt, viņu novērojumi ir jāpārvērš Bernulli testos, grupējot. Viņi to dara šādi: novērošanas telpa tiek sadalīta ierobežotā skaitā nepārklājošu reģionu, un tad katram reģionam tiek aprēķināta novērotā biežums un hipotētiskā varbūtība.

Šajā gadījumā iepriekš uzskaitītajām tuvināšanas grūtībām tiek pievienota vēl viena - sākotnējās telpas saprātīga nodalījuma izvēle. Šajā gadījumā ir jārūpējas, lai kopumā hipotēzes par izlases sākotnējo sadalījumu pārbaudes noteikums būtu pietiekami jutīgs pret iespējamām alternatīvām. Visbeidzot, es atzīmēju, ka statistikas kritēriji, kuru pamatā ir Bernulli shēmas samazināšana, parasti neatbilst visām alternatīvām. Tāpēc šai piekrišanas pārbaudes metodei ir ierobežota vērtība.

Kolmogorova-Smirnova atbilstības tests tā klasiskajā formā ir spēcīgāks par h2 kritēriju, un ar to var pārbaudīt hipotēzi par empīriskā sadalījuma atbilstību jebkuram teorētiskam nepārtrauktam sadalījumam F(x) ar iepriekš zināmiem parametriem. Pēdējais apstāklis ierobežo šī kritērija plašas praktiskas pielietošanas iespējas, analizējot mehānisko pārbaužu rezultātus, jo mehānisko īpašību raksturlielumu sadalījuma funkcijas parametri parasti tiek novērtēti no paša parauga datiem.

Kolmogorova-Smirnova kritēriju izmanto negrupētiem datiem vai grupētiem neliela intervāla platuma gadījumā (piemēram, vienāds ar spēka mērītāja, slodzes ciklu skaitītāja skalas iedalījumu u.c.). Lai n paraugu sērijas testēšanas rezultāts ir mehānisko īpašību raksturlielumu variāciju sērija

x1? x2? ...? xi? ...? xn. (3,93)

Nepieciešams pārbaudīt nulles hipotēzi, ka izlases sadalījums (3.93) pieder teorētiskajam likumam F(x).

Kolmogorova-Smirnova kritērijs ir balstīts uz uzkrātās partitūras maksimālās novirzes sadalījumu no sadalījuma funkcijas vērtības. Lietojot, statistika tiek aprēķināta

kas ir Kolmogorova kritērija statistika. Ja nevienlīdzība pastāv

Dnvn? piere (3,97)

lieliem paraugu izmēriem (n > 35) vai

Dn(vn + 0,12 + 0,11/vn) ? piere (3,98)

par n? 35, tad nulles hipotēze netiek noraidīta.

Ja nevienādības (3.97) un (3.98) nav izpildītas, tiek pieņemta alternatīva hipotēze, ka izlase (3.93) pieder nezināmam sadalījumam.

Lb kritiskās vērtības ir: l0,1 = 1,22; l0,05 = 1,36; l0,01 = 1,63.

Ja funkcijas F(x) parametri nav zināmi iepriekš, bet tiek novērtēti pēc izlases datiem, Kolmogorova-Smirnova kritērijs zaudē savu universālumu un ar to var pārbaudīt tikai eksperimentālo datu atbilstību tikai dažām specifiskām sadalījuma funkcijām.

Ja to izmanto kā nulles hipotēzi, ka eksperimentālie dati pieder normālam vai lognormālam sadalījumam, statistika tiek aprēķināta:

kur Ц(zi) ir Laplasa funkcijas vērtība

Ц(zi) = (xi - xср)/s Kolmogorova-Smirnova kritēriju jebkuram izlases lielumam n raksta formā

Lb kritiskās vērtības šajā gadījumā ir: l0,1 = 0,82; l0,05 = 0,89; l0,01 = 1,04.

Ja tiek pārbaudīta hipotēze, ka izlase atbilst *** eksponenciālajam sadalījumam, kura parametrs tiek novērtēts no eksperimentāliem datiem, tiek aprēķināta līdzīga statistika:

kritērijs empīriskā varbūtība

un veido Kolmogorova-Smirnova kritēriju.

Lb kritiskās vērtības šajā gadījumā: l0,1 = 0,99; l0,05 = 1,09; l0,01 = 1,31.

Saistītie raksti

Apspriežot:

Apmācības uzdevumi ketam skolām: Sveicināti, mani dārgie lasītāji. Dažreiz, lai mūsu sapņi piepildītos...
“Un mēs satikām dzīvu rakstnieku!:Šogad “DET GIZ” apritēja 80 gadi. Par godu jubilejai cienījamākie un...
Laika norādes – Zeitangaben ceturtdiena vācu valodā:Šodien pastāstīsim par kādu diezgan interesantu tēmu, piemēram, par nedēļas dienām....
Gogolis "Taras Bulba" (6. klase): Raksturojot stepi, Gogols ir izcils verbālās glezniecības meistars,...