Vienošanās kritēriju veidi. Skatiet lapas, kurās ir minēts termins piekrišanas kritērijs
Tā kā visi pieņēmumi par konkrēta sadalījuma būtību ir hipotēzes, tie ir jāpakļauj statistiskai pārbaudei, izmantojot vienošanās kritēriji, kas ļauj noteikt, kad neatbilstības starp teorētiskajām un empīriskajām frekvencēm uzskatāmas par nenozīmīgām, t.i. nejauši, un kad - nozīmīgi (nejauši). Tādējādi vienošanās kritēriji ļauj noraidīt vai apstiprināt hipotēzes pareizību par sadalījuma raksturu empīriskajās rindās, kas izvirzīta, saskaņojot rindas.
Ir vairāki piekrišanas kritēriji. Visbiežāk izmantotie kritēriji ir Pīrsons, Romanovskis un Kolmogorovs.
Pīrsona piemērotības tests
- viens no galvenajiem:
kur k ir grupu skaits, kurās ir sadalīts empīriskais sadalījums,
- novērotā pazīmes biežums in i-tā grupa,
– teorētiskā frekvence.
Sadalījumam ir apkopotas tabulas, kas norāda atbilstības kritērija kritisko vērtību izvēlētajam nozīmīguma līmenim un brīvības pakāpēm df.(vai )
Nozīmīguma līmenis ir iespējamība kļūdaini noraidīt izvirzīto hipotēzi, t.i. varbūtība, ka pareizā hipotēze tiks noraidīta. Statistikā tiek izmantoti trīs līmeņi:
- a= 0,10, tad P=0,90 (10 gadījumos no 100 pareizo hipotēzi var noraidīt);
- a= 0,05, tad P=0,95;
- a= 0,01, tad P=0,99.
Brīvības pakāpju skaits df tiek definēts kā grupu skaits sadalījuma rindā mīnus savienojumu skaits: df = k –z. Ar savienojumu skaitu saprot teorētisko frekvenču aprēķināšanā izmantoto empīrisko sēriju rādītāju skaitu, t.i. indikatori, kas savieno empīriskās un teorētiskās frekvences.
Piemēram, izlīdzinot ar zvana līkni, pastāv trīs attiecības:
; ; .
Tāpēc, izlīdzinot normālā sadalījuma līkni, brīvības pakāpju skaits tiek noteikts kā df = k –3.
Lai novērtētu nozīmīgumu, aprēķinātā vērtība tiek salīdzināta ar tabulā norādīto vērtību.
Ja teorētiskais un empīriskais sadalījums pilnībā sakrīt, pretējā gadījumā >0. Ja >, tad noteiktam nozīmīguma līmenim un brīvības pakāpju skaitam noraidām hipotēzi par neatbilstību nenozīmīgumu (nejaušību).
Gadījumā , secinām, ka empīriskā rinda labi sakrīt ar hipotēzi par paredzamo sadalījumu un ar varbūtību P = (1-a) var apgalvot, ka neatbilstība starp teorētiskajām un empīriskajām frekvencēm ir nejauša.
Pīrsona piemērotības testu izmanto, ja populācijas lielums ir pietiekami liels un katras grupas biežumam jābūt vismaz 5.
Romanovska kritērijs ar
ir balstīta uz Pīrsona kritērija izmantošanu, t.i. jau atrastās vērtības un brīvības pakāpju skaits df:
Tas ir ērti, ja nav galdiņu.
Ja ar<3, то расхождения распределений случайны, если же с>3, tad tie nav nejauši un teorētiskais sadalījums nevar kalpot par modeli pētāmajam empīriskajam sadalījumam.
Kolmogorova kritērijs
l
ir balstīta uz maksimālās neatbilstības noteikšanu starp uzkrātajām frekvencēm un empīrisko un teorētisko sadalījumu frekvencēm:
vai ,
kur D un d ir attiecīgi maksimālā starpība starp empīriskās un teorētiskās sadalījumu sērijas uzkrātajām frekvencēm un uzkrātajām frekvencēm;
N ir vienību skaits populācijā.
Aprēķinot l vērtību, no tabulas P(l) tiek noteikta varbūtība, ar kuru var apgalvot, ka empīrisko frekvenču novirzes no teorētiskajām ir nejaušas. Varbūtība Р(l) var mainīties no 0 līdz 1. Ja Р(l)=1 ir pilnīga frekvenču sakritība, Р(l)=0 – pilnīga nesakritība. Ja l ņem vērtības līdz 0,3, tad P(l)=1.
Galvenais nosacījums Kolmogorova kritērija izmantošanai ir pietiekami liels novērojumu skaits.
Lai pārbaudītu hipotēzi par empīriskā sadalījuma atbilstību teorētiskajam sadalījuma likumam, tiek izmantoti īpaši statistikas rādītāji - piemērotības kritēriji (jeb atbilstības kritēriji). Tie ietver Pīrsona, Kolmogorova, Romanovska, Jastremska uc kritērijus. Lielākā daļa vienošanās kritēriju ir balstīti uz empīrisko frekvenču noviržu izmantošanu no teorētiskajām.
Acīmredzot, jo mazākas šīs novirzes, jo labāk teorētiskais sadalījums atbilst empīriskajam (vai apraksta to). Piekrišanas kritēriji
Vienošanās kritēriji, pamatojoties uz noteikto sadales likumu, ļauj noteikt, kad neatbilstības starp teorētiskajām un empīriskajām frekvencēm uzskatāmas par nenozīmīgām (nejaušas), bet kad par būtiskām (negadījuma rakstura). No tā izriet, ka saskaņošanas kritēriji ļauj noraidīt vai apstiprināt hipotēzes pareizību, kas izvirzīta, saskaņojot rindas par sadalījuma raksturu empīriskajā rindā, un atbildēt, vai ir iespējams pieņemt konkrētam empīriskam sadalījumam. modelis, kas izteikts ar kādu teorētisku sadalījuma likumu.
Pīrsona piemērotības tests c 2 (hī kvadrāts) ir viens no galvenajiem vienošanās kritērijiem. Angļu matemātiķa Karla Pīrsona (1857-1936) ierosinājums novērtēt empīrisko un teorētisko sadalījumu biežuma neatbilstību nejaušību (nozīmību):
Shēma kritērija c 2 piemērošanai, lai novērtētu teorētisko un empīrisko sadalījumu konsekvenci, ir šāda:
1. Tiek noteikts aprēķinātais neatbilstības mērs.
2. Noteikts brīvības pakāpju skaits.
3. Pamatojoties uz brīvības pakāpju skaitu n, izmantojot īpašu tabulu, nosaka.
4. Ja , tad noteiktam nozīmīguma līmenim α un brīvības pakāpju skaitam n tiek noraidīta hipotēze par neatbilstību nenozīmīgumu (nejaušību). Pretējā gadījumā hipotēzi var atzīt par nepretrunīgu ar iegūtajiem eksperimentālajiem datiem un ar varbūtību (1 – α) var apgalvot, ka neatbilstības starp teorētiskajām un empīriskajām frekvencēm ir nejaušas.
Nozīmes līmenis ir varbūtība kļūdaini noraidīt izvirzīto hipotēzi, t.i. varbūtība, ka pareizā hipotēze tiks noraidīta. Statistikas pētījumos atkarībā no risināmo problēmu nozīmīguma un atbildības tiek izmantoti šādi trīs nozīmīguma līmeņi:
1) a = 0,1, tad R = 0,9;
2) a = 0,05, tad R = 0,95;
3) a = 0,01, tad R = 0,99.
Izmantojot vienošanās kritēriju c 2, ir jāievēro šādi nosacījumi:
1. Pētāmās populācijas apjomam jābūt pietiekami lielam ( N≥ 50), savukārt biežumam vai grupas lielumam jābūt vismaz 5. Ja šis nosacījums tiek pārkāpts, vispirms ir jāapvieno mazas frekvences (mazākas par 5).
2. Empīriskajam sadalījumam jāsastāv no datiem, kas iegūti nejaušās izlases rezultātā, t.i. tiem jābūt neatkarīgiem.
Pīrsona piemērotības kritērija trūkums ir daļa no sākotnējās informācijas, kas saistīta ar nepieciešamību grupēt novērojumu rezultātus intervālos un apvienot atsevišķus intervālus ar nelielu novērojumu skaitu. Šajā sakarā ir ieteicams papildināt sadales atbilstības pārbaudi atbilstoši kritērijam ar 2 citiem kritērijiem. Tas ir īpaši nepieciešams, ja izlases lielums ir salīdzinoši neliels ( n ≈ 100).
Statistikā Kolmogorova piemērotības tests(pazīstams arī kā Kolmogorova-Smirnova atbilstības tests) tiek izmantots, lai noteiktu, vai divi empīriski sadalījumi atbilst vienam un tam pašam likumam, vai arī lai noteiktu, vai iegūtais sadalījums atbilst pieņemtajam modelim. Kolmogorova kritērijs ir balstīts uz maksimālās neatbilstības noteikšanu starp uzkrātajām frekvencēm vai empīrisko vai teorētisko sadalījumu frekvencēm. Kolmogorova kritēriju aprēķina, izmantojot šādas formulas:
Kur D Un d- attiecīgi maksimālā starpība starp uzkrātajām frekvencēm ( f – f¢) un starp uzkrātajām frekvencēm ( lpp – lpp¢) empīriskās un teorētiskās sadalījumu rindas; N- vienību skaits summā.
Aprēķinot λ vērtību, tiek izmantota īpaša tabula, lai noteiktu varbūtību, ar kuru var apgalvot, ka empīrisko frekvenču novirzes no teorētiskajām ir nejaušas. Ja zīmei ir vērtības līdz 0,3, tas nozīmē, ka pastāv pilnīga frekvenču sakritība. Ar lielu skaitu novērojumu Kolmogorova tests spēj noteikt jebkādas novirzes no hipotēzes. Tas nozīmē, ka jebkura izlases sadalījuma atšķirība no teorētiskā tiks konstatēta ar tās palīdzību, ja būs pietiekami liels novērojumu skaits. Praktiskā nozīmeŠī īpašība nav nozīmīga, jo vairumā gadījumu ir grūti paļauties uz liela skaita novērojumu iegūšanu nemainīgos apstākļos, teorētiskā ideja par sadalījuma likumu, kuram paraugam būtu jāievēro, vienmēr ir aptuvena, un statistikas precizitāte. testi nedrīkst pārsniegt izvēlētā modeļa precizitāti.
Romanovska piemērotības pārbaude ir balstīta uz Pīrsona kritērija izmantošanu, t.i. jau atrastās vērtības c 2 un brīvības pakāpju skaits:
kur n ir variācijas brīvības pakāpju skaits.
Romanovska kritērijs ir ērts, ja nav tabulu priekš . Ja< 3, то расхождения распределений случайны, если же >3, tad tie nav nejauši un teorētiskais sadalījums nevar kalpot par modeli pētāmajam empīriskajam sadalījumam.
B. S. Jastremskis vienošanās kritērijā izmantoja nevis brīvības pakāpju skaitu, bet gan grupu skaitu ( k), īpaša q vērtība atkarībā no grupu skaita un hī kvadrāta vērtība. Jastremska piemērotības pārbaude ir tāda pati nozīme kā Romanovska kritērijam, un to izsaka ar formulu
kur c 2 ir Pīrsona atbilstības kritērijs; - grupu skaits; q - koeficients, grupu skaitam, kas mazāks par 20, vienāds ar 0,6.
Ja L fakts > 3, neatbilstības starp teorētiskajiem un empīriskajiem sadalījumiem nav nejaušas, t.i. empīriskais sadalījums neatbilst normālā sadalījuma prasībām. Ja L fakts< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.
Tika apspriests Čap. 5 šeit mēs pieteiksim šī metode kapitālieguldījumu projektiem. Ierobežojumi un nosacījumi, kādos šī metode tiek izmantota, tiks apspriesti sadaļā. 15, kur aplūkojam riskantu ieguldījumu piemērotības kritēriju. Mūsu mērķis šeit ir tikai parādīt, kā tiek mērīts risks riskantu ieguldījumu kombinācijām, pieņemot, ka šāds kritērijs ir nepieciešams.
Nākamais posms ir saistīts ar augstāku atvasinājumu izmantošanu (Teilora formula), un šis posms beidzas ar metodes apskatu kopumā. Tālāk daži funkciju skaitlisko raksturlielumu jautājumi - skaitliskās metodes (diferenciālrēķina pielietošana tuvināšanai). aprēķini) tiek ņemti vērā. Šajā posmā novirzes kļūda lauztām līnijām no sekantiem, lauztām līnijām no tangentēm, gabalos līknēm no Teilora parabolām tiek noteikta vairāk nekā augstas pakāpes no dotās funkcijas atkarībā no tās diferenciālajām īpašībām, un kļūda tiek salīdzināta. Vienkāršības labad mēs apsveram gadījumu, kad mezgli atrodas vienādi. Tādējādi tiek noteiktas diferenciālrēķina metodes pielietojamības robežas. Kā šī posma tālāku izvērstu varam aplūkot citus tuvināšanas modeļus, tos konstruējot, vadoties, piemēram, pēc sekojošas diagrammas 1. Kādus mezglus izmantosim 2. Kādu aproksimēšanas funkciju klasi izmantosim 3. Kādu saskaņošanas kritēriju pielietosim 4. Kādu precizitāti vēlēsimies
Šajā analīzē, novērtējot empīriskā un teorētiskā sadalījuma konsekvences pakāpi, tika izmantots V. I. Romanovska sakritības kritērijs, pamatojoties uz Pīrsona kritēriju.
Sadalījuma līknes parametru aprēķinu rezultāti doti tabulā. 10. Aprēķinātās frekvences tika aprēķinātas, izmantojot formulas 10, 11, 12. Objektīvs empīrisko un teorētisko frekvenču sakritības pakāpes novērtējums ir sakritības kritērijs (šajā pētījumā tika izmantots V. I. Romanovska sakritības kritērijs). Pārbaude parādīja, ka pētītās empīriskās intervālu rindas darba objektu gulēšanas laika sadalījumam pārnešanas atlikumos ir diezgan precīzi aprakstītas ar atrastajām blīvuma funkcijas p(x) līknēm.
Vienību skaits izlasē, N intervāla lielums, N sērijas asimetrijas rādītājs, ch Kurtozes rādītājs, Ex dispersija, a vidējā vērtība, X atbilstības kritērijs, K
Iegūtais empīriskais sadalījums tiks tuvināts ar nepārtrauktu analītisko funkciju, tas ir, tiks identificēts nejaušā lieluma sadalījuma likums. Aplūkota arī vienošanās kritēriju izmantošana izplatīšanas likuma identificēšanā.
Piemērotības kritēriju izmantošana izplatīšanas likuma noteikšanai nejaušais mainīgais.
Izmantojot Pīrsona piemērotības testu, ir jāaprēķina vērtība
Īpaši jāuzsver, ka, pārbaudot modeli pēc saskaņošanas kritērija, droša ir tikai noraidoša atbilde, tas ir, modeļa noraidīšana.
Pozitīva atbilde nozīmē tikai to, ka modelis nav pretrunā ar empīriskiem datiem. Tas nebūt nenozīmē, ka tieši šis modelis faktiski apraksta datus, ka tas ir labākais modelis, ka nav iespējams izvēlēties citu modeli datu aprakstīšanai utt. Faktiski pozitīva atbilde, pārbaudot pēc atbilstības kritērija, ir jāsaprot kā “varbūt šos datus apraksta tāds un tāds modelis”, un nekas vairāk.
Rezultātā iegūtās histogrammas atbilstību normālajam sadalījumam pārbauda, izmantojot Pīrsona piemērotības testu.
Pamatojoties uz 21. uzdevuma datiem, salāgojiet iedzīvotāju sadalījuma rindas pēc vidējo monetāro ienākumu lieluma uz vienu iedzīvotāju pa normālā sadalījuma līkni. Uzzīmējiet empīrisko un teorētisko sadalījumu grafikus. Novērtējiet empīrisko un teorētisko sadalījumu tuvumu, izmantojot piemērotības testus [Pīrsons (hī kvadrāts), Kolmogorovs vai citi]
Neatkarīgi no vienošanās veida kritērija, ko izmanto pro-
Par S.p.g. tiek izmantoti dažādi kritēriji. Jo īpaši, pārbaudot sakritību starp izlasi un hipotētiskajiem sadalījumiem, tiek izmantots atbilstības tests, piem. Pīrsona hī kvadrāta tests. Skatiet arī kļūdu.
Formulā (2.15) aizstājot M[H(x) un D ar vienādojumiem (2.3), iegūstam galīgo formulu informācijas sakritības kritērijam.
Tabulā 2.3 parāda entropijas parametru vērtības, kas visbiežāk sastopamas sadales likumu tehniskajos lietojumos. Dažādu sadalījuma likumu entropijas parametru tabula dod iespēju, piemērojot informācijas saskaņošanas kritēriju, vienlaikus pārbaudīt vairākas hipotēzes, ko nevar izdarīt, izmantojot esošās metodes bez papildu aprēķiniem.
Tā kā visizplatītākais ir Pīrsona piemērotības tests, salīdzināsim informācijas kritēriju J ar kritēriju %2.
Izlīdzinot empīrisko sadalījumu, nulles hipotēze tiek pieņemta, ja, piemērojot informācijas atbilstības kritēriju
GOST 8.532-85 ierosina, izmantojot vienošanās kritērijus ar vismaz 10% nozīmīguma līmeni pie u>50 un normālā sadalījuma 15, izmantojot Vilkoksona testu pāru atšķirībām, lai pārbaudītu sadalījuma simetriju) klasificēt masīvu RM sertifikācija rezultējas kā viena no sadales klasēm: normāla, simetriska, asimetriska. Katrai sadalījuma klasei atsauces materiāla galveno metroloģisko raksturlielumu vērtības tiek noteiktas dažādos veidos.
Lai noteiktu sakritības pakāpi starp empīrisko un teorētisko sadalījumu, ir piedāvāti dažādi atbilstības kritēriji. Tādējādi ir zināms Pīrsona, Romanovska, Kolmogorova, Jastremska saskaņošanas kritērijs. Pīrsona atbilstības kritērijs tiek reducēts līdz l 2 sasniegšanas varbūtības aprēķināšanai, izmantojot Pīrsona sadalījumu. dotā vērtība P = x2. Šajā gadījumā x2 aprēķina, izmantojot formulu (9.3.)
Ja nav gatavas sistēmas, pētniekam ir jāizmēģina dažādi statistiski piemērotības testi, lai optimāli izvēlētos modeļus. Tādējādi Uthans un Moody novērtēja prognozēšanas risku, kas iegūts dažādās tīkla arhitektūrās, un Kayama et al atrada kopējo elementu dublikātu skaitu slēptajā slānī. Mēs vienkārši salīdzinājām vērtības kvadrātsakne no vidējās kvadrātiskās kļūdas (RMSE) testa komplektā, kas sastāv no 60 novērojumiem saistībā ar novērojumu intervāla pēdējiem 5 gadiem (1981-85). Turpmākam darbam tika ņemta tīkla arhitektūra, kas deva zemāko RMSE.
Šie piemērotības kritēriji ļauj mums pārbaudīt hipotēzes.
Novērtējot n.s.v entropiju. Rodas jautājums par eksperimentālo datu dalīšanas intervālu skaita izvēli. Šis uzdevums ir līdzīgs tipiskām matemātiskās statistikas problēmām: sadales likuma noteikšana, empīrisko sadalījumu aplēšu aprēķināšana un atbilstības kritēriju aprēķināšana. A. Halds parādīja, ka pastāv optimāls grupēšanas intervālu skaits, kad soļu aploksnes histogramma ir vistuvāk populācijas sadalījuma vienmērīgajai līknei. Šādam tuvumam iespējams formulēt vairākus kritērijus, izmantojot rādītājus kurtozes formā, kritēriju %2 utt. Dažādi kritēriji dod nedaudz atšķirīgas vērtības optimālajam grupēšanas intervālu skaitam. Taču pats optimuma pastāvēšanas fakts nav atkarīgs no tuvuma kritērija izvēles, jo, ja dati tiek grupēti pārāk mazos intervālos, daži no tiem būs tukši vai slikti aizpildīti. Histogramma atšķirsies no vienmērīgas sadalījuma līknes, jo tā ir robaina ar daudziem tapas un kritumiem.
Storm R. iesaka Brūksa un Kerutera formulu k = 5 lg p, lai noteiktu optimālo intervālu skaitu. Darbā ieteikta attiecība k = 4 p. Darbā ir sniegta tabula, saskaņā ar kuru intervālu skaits tiek piešķirts no 7 līdz 22 atkarībā no izlases lieluma no 40 līdz 10 000 Šo ieteikumu salīdzinājums, kas parādīts attēlā. 2.2 norāda ieteikumu tuvumu pie n - 100 ar to sekojošo pieaugošo neatbilstību, palielinoties izlases lielumam. Atsevišķa grupa sniegt ieteikumus par vienošanās kritērija %2 izmantošanu. Kritērija %2 piemērošana nemainīga garuma intervāliem ir neefektīva. Visu darbu sākotnējais priekšnoteikums par x2 kritērija efektivitāti ir intervālu ar vienādu varbūtību apsvēršana. Tomēr praksē šie ieteikumi netiek izmantoti to piemērošanas sarežģītības dēļ. Ņemot vērā uzskaitīto ieteikumu neviendabīgumu, ir nepieciešams atsevišķs pētījums par intervālu skaita ietekmi, izmantojot informācijas metodes tehnoloģisko procesu analīzei.
Varat izvēlēties 6 vai 7 intervālus. Nosakām izmēru R izkliedes zonu. Nosakām izmēra maksimālo vērtību x = 0,126 un minimālo xm a = - 0,149, diapazonu R = dgtah - xmin = 0,275 mm. Izvēlamies 7 intervālus un nosaka to dalījuma cenu C = RI k 0,04 mm. Saskaitīsim lieluma noviržu skaitu, kas ietilpst attiecīgajā intervālā. Rezultāti (2.5. tabula) ļauj izvirzīt hipotēzi par pētīto kļūdu sadalījumu pēc Gausa likuma. Lai pārbaudītu hipotēzi, ir nepieciešams sagatavot datus, kas iekļauti
Nejaušības pārbaudes un izņēmuma novērojumu novērtēšanas kritēriji Literatūra Ievads Praksē statistiskā analīze eksperimentālie dati, galvenā interese ir nevis pašas noteiktas statistikas aprēķināšana, bet gan atbildes uz šāda veida jautājumiem. Attiecīgi ir izstrādāti daudzi kritēriji, lai pārbaudītu piedāvātās statistiskās hipotēzes. Visi statistisko hipotēžu pārbaudes kritēriji ir sadalīti divās lielās grupās: parametriskajos un neparametriskos.
Kopīgojiet savus darbus sociālajos tīklos
Ja šis darbs jums neder, lapas apakšā ir līdzīgu darbu saraksts. Varat arī izmantot meklēšanas pogu
Piekrišanas kritēriju izmantošana
Ievads
Literatūra
Ievads
Eksperimentālo datu statistiskās analīzes praksē galvenā interese ir nevis pašas noteiktas statistikas aprēķināšana, bet gan atbildes uz šāda veida jautājumiem. Vai tiešām vidējais iedzīvotāju skaits vienāds ar kādu skaitli? Vai korelācijas koeficients būtiski atšķiras no nulles? Vai abu paraugu dispersijas ir vienādas? Un var rasties daudzi šādi jautājumi atkarībā no konkrētās izpētes problēmas. Attiecīgi ir izstrādāti daudzi kritēriji, lai pārbaudītu piedāvātās statistiskās hipotēzes. Mēs apsvērsim dažus no visbiežāk sastopamajiem. Tie galvenokārt attieksies uz vidējiem rādītājiem, novirzēm, korelācijas koeficientiem un pārpilnības sadalījumiem.
Visi statistisko hipotēžu pārbaudes kritēriji ir sadalīti divās lielās grupās: parametriskajos un neparametriskos. Parametrisko testu pamatā ir pieņēmums, ka izlases dati ir iegūti no populācijas ar zināmu sadalījumu, un galvenais uzdevums ir novērtēt šī sadalījuma parametrus. Neparametriskajos testos nav nepieciešami nekādi pieņēmumi par sadalījuma raksturu, izņemot pieņēmumu, ka tas ir nepārtraukts.
Vispirms apskatīsim parametriskos kritērijus. Pārbaudes secība ietvers nulles hipotēzes un alternatīvās hipotēzes formulēšanu, izdarāmo pieņēmumu formulēšanu, testā izmantotās izlases statistikas noteikšanu un pārbaudāmās statistikas izlases sadalījuma veidošanu, atlasītajam kritērijam kritisko reģionu identificēšana un izlases statistikas ticamības intervāla izveide.
1 Līdzekļu piemērotības kritēriji
Pārbaudāmā hipotēze ir populācijas parametrs. Šādas pārbaudes nepieciešamība var rasties, piemēram, šādā situācijā. Pieņemsim, ka, balstoties uz plašiem pētījumiem, ir noteikts fosilā mīkstmiešu čaumalas diametrs nogulumos no kādas noteiktas vietas. Lai mūsu rīcībā būtu arī noteikts skaits citā vietā atrastu gliemežvāku, un izdarām pieņēmumu, ka konkrēta vieta čaulas diametru neietekmē, t.i. ka vidējā čaumalas diametra vērtība visai reiz jaunā vietā dzīvojušo gliemju populācijai ir vienāda ar zināmo vērtību, kas iegūta agrāk, pētot šāda veida gliemjus pirmajā biotopā.
Ja šis zināma vērtība vienāds, tad nulles hipotēzi un alternatīvo hipotēzi raksta šādi: Pieņemsim, ka mainīgajam x aplūkojamajā populācijā ir normāls sadalījums un populācijas dispersija nav zināma.
Mēs pārbaudīsim hipotēzi, izmantojot statistiku:
, (1)
kur ir izlases standartnovirze.
Tika parādīts, ka, ja ir taisnība, tad t izteiksmē (1) ir Stjudenta t sadalījums ar n-1 brīvības pakāpēm. Ja nozīmības līmeni (pareizās hipotēzes noraidīšanas varbūtību) izvēlaties vienādu, tad saskaņā ar iepriekšējā nodaļā apskatīto var noteikt testēšanas kritiskās vērtības =0.
Šajā gadījumā, tā kā Stjudenta sadalījums ir simetrisks, tad (1-) daļa no platības zem šī sadalījuma līknes ar n-1 brīvības pakāpēm tiks ietverta starp punktiem un, kas absolūtā vērtībā ir vienādi viens ar otru. . Tāpēc visas vērtības, kas ir mazākas par negatīvo un lielākas par pozitīvo vērtību t sadalījumam ar noteiktu brīvības pakāpju skaitu izvēlētā nozīmīguma līmenī, veidos kritisko reģionu. Ja izlases t vērtība ietilpst šajā reģionā, tiek pieņemta alternatīvā hipotēze.
Pārliecības intervāls for ir konstruēts saskaņā ar iepriekš aprakstīto metodi un tiek noteikts no šādas izteiksmes
(2)
Tātad, dariet mums zināmu mūsu gadījumā, ka fosilās mīkstmiešu čaulas diametrs ir 18,2 mm. Mūsu rīcībā bija 50 jaunatklātu gliemežvāku paraugs, kuriem mm, a = 2,18 mm. Pārbaudīsim: =18.2 pret Mums ir
Ja nozīmīguma līmenis ir izvēlēts =0,05, tad kritiskā vērtība. No tā izriet, ka to var noraidīt par labu nozīmīguma līmenī =0,05. Tādējādi mūsu hipotētiskajam piemēram var apgalvot (ar zināmu varbūtību, protams), ka noteiktas sugas fosilo gliemju čaumalas diametrs ir atkarīgs no vietām, kur tie dzīvoja.
Sakarā ar to, ka t sadalījums ir simetrisks, izvēlētajos nozīmīguma līmeņos un brīvības pakāpju skaitā tiek dotas tikai šī sadalījuma pozitīvas t vērtības. Turklāt tiek ņemta vērā ne tikai platības daļa zem sadalījuma līknes pa labi no t vērtības, bet vienlaikus arī pa kreisi no -t vērtības. Tas ir saistīts ar to, ka vairumā gadījumu, pārbaudot hipotēzes, mūs interesē noviržu nozīme pašam par sevi, neatkarīgi no tā, vai šīs novirzes ir lielākas vai mazākas, t.i. mēs pārbaudām pret, nevis pret: >a vai: Tagad atgriezīsimies pie mūsu piemēra. 100(1-)% ticamības intervāls ir 18,92,01
Tagad aplūkosim gadījumu, kad ir jāsalīdzina divu vispārējo populāciju vidējie rādītāji. Pārbaudāmā hipotēze izskatās šādi: : =0, : 0. Tāpat tiek pieņemts, ka tai ir normāls sadalījums ar vidējo un dispersiju, un - normāls sadalījums ar vidējo un vienādu dispersiju. Turklāt mēs pieņemam, ka paraugi, no kuriem tiek novērtētas vispārējās populācijas, ir iegūti neatkarīgi viens no otra un tiem ir attiecīgi tilpums, un no paraugu neatkarības izriet, ka, ja mēs ņemam lielāku to skaitu un aprēķinām vidējo vērtības katram pārim, tad šo vidējo pāru kopa būs pilnīgi nekorelēta. Nulles hipotēzes pārbaude tiek veikta, izmantojot statistiku (3)
kur un ir dispersijas aprēķini attiecīgi pirmajam un otrajam paraugam. Ir viegli redzēt, ka (3) ir (1) vispārinājums. Tika parādīts, ka statistikai (3) ir Stjudenta t sadalījums ar brīvības pakāpēm. Ja un ir vienādi, t.i. = = formula (3) ir vienkāršota, un tai ir forma (4)
Apskatīsim piemēru. Pieņemsim, ka, mērot vienas un tās pašas augu populācijas stumbra lapas divu sezonu garumā, tiek iegūti šādi rezultāti: Pieņemam, ka Stjudenta testa izmantošanas nosacījumi, t.i. populāciju, no kurām ņemti paraugi, normalitāte, nezināmas, bet vienādas dispersijas esamība šīm populācijām un paraugu neatkarība. Novērtēsim nozīmīguma līmenī =0,01. Mums ir Tabulas vērtība t = 2,58. Tāpēc hipotēze par stumbra lapu garuma vidējo vērtību vienādību augu populācijai divu sezonu laikā ir jānoraida izvēlētajā nozīmīguma līmenī. Uzmanību! Nulles hipotēze matemātiskajā statistikā ir hipotēze, ka starp salīdzinātajiem rādītājiem nav būtisku atšķirību neatkarīgi no tā, vai mēs runājam par vidējiem, dispersijas vai citu statistiku. Un visos šajos gadījumos, ja kritērija empīriskā (pēc formulas aprēķinātā) vērtība ir lielāka par teorētisko (izvēlēto no tabulām), tas tiek noraidīts. Ja empīriskā vērtība ir mazāka par tabulā norādīto vērtību, tā tiek pieņemta. Lai izveidotu ticamības intervālu starpībai starp šīm divām populācijām, pievērsīsim uzmanību faktam, ka Stjudenta tests, kā redzams no formulas (3), novērtē starpības starp vidējo relatīvo nozīmīgumu. līdz šīs starpības standarta kļūdai. Ir viegli pārbaudīt, vai (3) saucējs precīzi atspoguļo šo standarta kļūdu, izmantojot iepriekš apspriestās attiecības un izdarītos pieņēmumus. Patiesībā mēs to zinām vispārīgā gadījumā Ja x un y ir neatkarīgi, tad tādi ir Ņemot izlases vērtības un x un y vietā un atgādinot izdarīto pieņēmumu, ka abām populācijām ir vienāda dispersija, mēs iegūstam (5)
Dispersijas novērtējumu var iegūt no šādas attiecības (6)
(Mēs dalām ar, jo no paraugiem tiek aprēķināti divi lielumi, un tāpēc brīvības pakāpju skaits jāsamazina par diviem.) Ja tagad aizstājam (6) ar (5) un ņemam kvadrātsakni, mēs iegūstam saucēju izteiksmē (3). Pēc šīs novirzes atgriezīsimies pie ticamības intervāla izveidošanas cauri -. Mums ir Sniegsim dažus komentārus saistībā ar t-testa konstruēšanā izmantotajiem pieņēmumiem. Pirmkārt, tika parādīts, ka normaalitātes pieņēmuma pārkāpumiem ir nenozīmīga ietekme uz testa nozīmīguma un jaudas līmeni 30. Abu populāciju, no kurām ņemti paraugi, dispersiju homogenitātes pieņēmuma pārkāpumi ir arī nenozīmīgi, bet tikai gadījumā, ja izlases lielumi ir vienādi. Ja abu populāciju dispersijas atšķiras viena no otras, tad pirmā un otrā veida kļūdu iespējamības būtiski atšķirsies no paredzamajām. Šajā gadījumā pārbaudei jāizmanto kritērijs (7)
ar brīvības pakāpju skaitu . (8)
Parasti tas izrādās daļskaitlis, tāpēc, izmantojot t sadalījuma tabulas, ir jāņem tabulas vērtības tuvākajām veselajām vērtībām un jāinterpolē, lai atrastu t, kas atbilst ieguva vienu. Apskatīsim piemēru. Pētot divas ezera vardes pasugas, tika aprēķināta ķermeņa garuma attiecība pret stilba kaula garumu. Tika ņemti divi paraugi ar tilpumu =49 un =27. Mūs interesējošo attiecību vidējie un dispersijas izrādījās vienādi, attiecīgi =2,34; =2,08; =0,21; =0,35. Ja tagad pārbaudām hipotēzi, izmantojot formulu (2), mēs to iegūstam Pie nozīmīguma līmeņa =0,05 mums ir jānoraida nulles hipotēze (tabulā norādītā vērtība t = 1,995) un jāpieņem, ka izvēlētajā nozīmīguma līmenī pastāv statistiski nozīmīgas atšķirības starp izmērīto parametru vidējām vērtībām divām varžu pasugām. . Izmantojot formulas (6) un (7), mums ir Šajā gadījumā tam pašam nozīmīguma līmenim =0,05 tabulas vērtība ir t=2,015, un tiek pieņemta nulles hipotēze. Šis piemērs skaidri parāda, ka, neievērojot nosacījumus, kas pieņemti, iegūstot konkrētu kritēriju, var iegūt rezultātus, kas ir tieši pretēji tiem, kas faktiski notiek. Protams, šajā gadījumā, ņemot vērā dažāda lieluma paraugus, ja nebija iepriekš konstatēta fakta, ka izmērītā rādītāja dispersijas abās populācijās ir statistiski vienādas, bija jāizmanto formulas (7) un (8), parādīja statistiski nozīmīgu atšķirību neesamību. Tāpēc es vēlos vēlreiz atkārtot, ka atbilstības pārbaude visiem pieņēmumiem, kas izdarīti, atvasinot konkrētu kritēriju, ir absolūti nepieciešams nosacījums tā pareizai izmantošanai. Pastāvīgā prasība abās iepriekš minētajās t-testa modifikācijās bija prasība, lai paraugi būtu neatkarīgi viens no otra. Taču praksē nereti ir situācijas, kad šo prasību nevar izpildīt objektīvu iemeslu dēļ. Piemēram, daži rādītāji tiek mērīti uz vienu un to pašu dzīvnieku vai teritorijas apgabalu pirms un pēc ārēja faktora iedarbības utt. Un šajos gadījumos mēs varam būt ieinteresēti pārbaudīt hipotēzi pret. Mēs turpināsim pieņemt, ka abi paraugi ir ņemti no normālām populācijām ar vienādu dispersiju. Šajā gadījumā mēs varam izmantot to, ka atšķirībām starp normāli sadalītiem lielumiem ir arī normāls sadalījums, un tāpēc mēs varam izmantot Stjudenta t testu formā (1). Tādējādi tiks pārbaudīta hipotēze, ka n atšķirības ir paraugs no normāli sadalītas populācijas ar vidējo vērtību, kas vienāda ar nulli. Apzīmējot i-to starpību ar, mums ir , (9) Apskatīsim piemēru. Mūsu rīcībā ir dati par atsevišķas nervu šūnas impulsu skaitu noteiktā laika intervālā pirms () un pēc () stimula darbības: Tādējādi, paturot prātā, ka (9) ir t sadalījums, un izvēloties nozīmīguma līmeni =0,01, no atbilstošās tabulas pielikumā mēs atklājam, ka t kritiskā vērtība n-1=10-1=9 grādi brīvība ir 3,25. Teorētiskās un empīriskās t-statistikas salīdzinājums parāda, ka nulles hipotēze par statistiski nozīmīgu atšķirību neesamību starp šaušanas biežumu pirms un pēc stimula ir jānoraida. Var secināt, ka izmantotais stimuls statistiski būtiski maina impulsu biežumu. Eksperimentālajos pētījumos, kā minēts iepriekš, atkarīgie paraugi parādās diezgan bieži. Tomēr dažreiz šis fakts tiek ignorēts un t-tests formā (3) tiek izmantots nepareizi. To nepiemērotību var redzēt, ņemot vērā standarta kļūdas starp nekorelētajiem un korelētajiem vidējiem. Pirmajā gadījumā Un otrajā Starpības d standarta kļūda ir Ņemot to vērā, saucējam (9) būs forma Tagad pievērsīsim uzmanību tam, ka izteiksmju (4) un (9) skaitītāji sakrīt: tāpēc t vērtības atšķirība tajos ir atkarīga no saucējiem. Tādējādi, ja formulu (3) izmanto problēmā ar atkarīgiem paraugiem un paraugiem ir pozitīva korelācija, tad iegūtās t vērtības būs mazākas, nekā tām vajadzētu būt, izmantojot formulu (9), un var rasties situācija. kur nulles hipotēze tiks pieņemta, ja tā ir nepatiesa. Pretēja situācija var rasties, ja starp paraugiem ir negatīva korelācija, t.i. šajā gadījumā par būtiskām tiks atzītas atšķirības, kuras patiesībā nav. Atgriezīsimies vēlreiz pie piemēra ar impulsa aktivitāti un aprēķina t vērtību dotajiem datiem, izmantojot formulu (3), nepievēršot uzmanību tam, ka paraugi ir saistīti. Mums ir: Brīvības pakāpju skaitam, kas vienāds ar 18 un nozīmīguma līmenim = 0,01, tabulas vērtība ir t = 2,88, un no pirmā acu uzmetiena šķiet, ka nekas nav noticis, pat izmantojot formulu, kas nav piemērota dotajiem nosacījumiem. Un šajā gadījumā aprēķinātā t vērtība noved pie nulles hipotēzes noraidīšanas, t.i. uz to pašu secinājumu, kas tika izdarīts, izmantojot formulu (9), pareizi šajā situācijā. Tomēr pārformatēsim esošos datus un parādīsim tos šādā formā (2): Tās ir vienādas vērtības, un tās var iegūt vienā no eksperimentiem. Tā kā visas vērtības abos paraugos ir saglabātas, izmantojot Stjudenta t testu formulā (3), iegūst iepriekš iegūto vērtību = 3,32 un noved pie tā paša secinājuma, kas jau ir izdarīts. Tagad aprēķināsim t vērtību, izmantojot formulu (9), kas jāizmanto šajā gadījumā. Mums ir: t kritiskā vērtība izvēlētajā nozīmīguma līmenī un deviņās brīvības pakāpēs ir 3,25. Līdz ar to mums nav iemesla noraidīt nulles hipotēzi, mēs to pieņemam, un izrādās, ka šis secinājums ir tieši pretējs tam, kas tika izdarīts, izmantojot formulu (3). Izmantojot šo piemēru, mēs vēlreiz pārliecinājāmies, cik svarīgi ir iegūt pareizus secinājumus, analizējot eksperimentālos datus, lai stingri ievērotu visas prasības, kas bija par pamatu konkrēta kritērija noteikšanai. Aplūkotās Studenta testa modifikācijas ir paredzētas, lai pārbaudītu hipotēzes par divu paraugu vidējo vērtību. Tomēr rodas situācijas, kad vienlaikus ir jāizdara secinājumi par k vidējo vērtību vienādību. Šim gadījumam ir izstrādāta arī noteikta statistikas procedūra, kas tiks apspriesta vēlāk, apspriežot ar dispersijas analīzi saistītos jautājumus. 2 Atbilstības testi novirzēm Statistisko hipotēžu pārbaude attiecībā uz populācijas dispersiju tiek veikta tādā pašā secībā kā vidējo. Īsi atcerēsimies šo secību. 1. Formulēta nulles hipotēze (par statistiski nozīmīgu atšķirību neesamību starp salīdzinātajām dispersijām). 2. Izdarīti daži pieņēmumi attiecībā uz statistikas izlases sadalījumu, ar kuru plānots novērtēt hipotēzē ietverto parametru. 3. Tiek izvēlēts nozīmības līmenis hipotēzes pārbaudei. 4. Tiek aprēķināta mūs interesējošās statistikas vērtība un pieņemts lēmums par nulles hipotēzes patiesumu. Tagad sāksim ar hipotēzes pārbaudi, ka populācijas dispersija =a, t.i. pret. Ja pieņemam, ka mainīgajam x ir normāls sadalījums un ka izlase ar lielumu n tiek ņemta no populācijas nejauši, tad nulles hipotēzes pārbaudei tiek izmantota statistika. (10)
Atceroties dispersijas aprēķināšanas formulu, mēs pārrakstām (10) šādi: . (11)
No šīs izteiksmes ir skaidrs, ka skaitītājs ir normāli sadalīto vērtību noviržu kvadrātu summa no to vidējās vērtības. Katra no šīm novirzēm ir arī parasti sadalīta. Tāpēc saskaņā ar mums zināmo sadalījumu statistikas (10) un (11) normāli sadalīto vērtību kvadrātu summām ir - sadalījums ar n-1 brīvības pakāpēm. Pēc analoģijas ar t sadalījuma izmantošanu, pārbaudot izvēlēto nozīmīguma līmeni, no sadalījuma tabulas tiek noteikti kritiskie punkti, kas atbilst nulles hipotēzes pieņemšanas varbūtībām un. Atlasītās ticamības intervāls tiek konstruēts šādi: . (12)
Apskatīsim piemēru. Pieņemsim, pamatojoties uz plašiem eksperimentāliem pētījumiem, ka vienas augu sugas alkaloīdu satura izkliede no noteiktas platības ir vienāda ar 4,37 konvencionālajām vienībām. Speciālista rīcībā ir n = 28 šādu augu paraugs, domājams, no vienas un tās pašas teritorijas. Analīze parādīja, ka šim paraugam =5,01 un mums ir jāpārliecinās, ka šī un iepriekš zināmās dispersijas ir statistiski neatšķiramas pie nozīmīguma līmeņa =0,1. Saskaņā ar formulu (10) mums ir Iegūtā vērtība jāsalīdzina ar kritiskajām vērtībām /2=0,05 un 1--/2=0,95. No pielikuma tabulas ar 27 brīvības pakāpēm mums ir attiecīgi 40.1 un 16.2, kas nozīmē, ka nulles hipotēzi var pieņemt. Attiecīgais ticamības intervāls ir 3,37<<8,35.
Atšķirībā no hipotēžu testēšanas par izlases līdzekļiem, izmantojot Studenta testu, kad pirmā un otrā tipa kļūdas būtiski nemainījās, pārkāpjot populāciju normālā sadalījuma pieņēmumu, hipotēžu gadījumā par dispersiju, kad normalitātes nosacījumi nebija. izpildītas, kļūdas būtiski mainījās. Iepriekš aplūkotā problēma par dispersijas vienādību ar kādu fiksētu vērtību ir ierobežota interese, jo situācijas, kad ir zināma populācijas dispersija, ir diezgan retas. Daudz lielāku interesi rada gadījums, kad jāpārbauda, vai divu populāciju dispersijas ir vienādas, t.i. hipotēzes pārbaude pret alternatīvu. Tiek pieņemts, ka lieluma un izlases paraugi ir nejauši iegūti no vispārējām populācijām ar novirzēm un. Lai pārbaudītu nulles hipotēzi, tiek izmantots Fišera dispersijas koeficienta tests (13)
Tā kā normāli sadalītu nejaušības lielumu kvadrātu noviržu summām no to vidējām ir sadalījums, gan (13) skaitītājs, gan saucējs ir sadalītas vērtības, kas attiecīgi dalītas ar un, un tāpēc to attiecībai ir F sadalījums ar -1 un -1 brīvības pakāpe. Ir vispārpieņemts — un šādi tiek veidotas F sadalījuma tabulas —, ka lielākā no novirzēm tiek ņemta par skaitītāju (13), un tāpēc tiek noteikts tikai viens kritiskais punkts, kas atbilst izvēlētajam nozīmīguma līmenim. Mūsu rīcībā būs divi tilpuma =11 un =28 paraugi no parasto un ovālo dīķu gliemežu populācijām, kurām augstuma un platuma attiecība ir =0,59 un =0,38. Nepieciešams pārbaudīt hipotēzi par šo rādītāju šo rādītāju dispersiju vienādību pētāmajām populācijām pie nozīmības līmeņa =0,05. Mums ir Literatūrā dažkārt var atrast apgalvojumu, ka, pārbaudot hipotēzi par vidējo vienlīdzību, izmantojot Stjudenta t-testu, ir jāpārbauda hipotēze par dispersiju vienādību. Šis ir nepareizs ieteikums. Turklāt tas var novest pie kļūdām, no kurām var izvairīties, ja tās netiek ievērotas. Patiešām, dispersiju vienādības hipotēzes pārbaudes rezultāti, izmantojot Fišera testu, lielā mērā ir atkarīgi no pieņēmuma, ka paraugi ir ņemti no populācijām ar normālu sadalījumu. Tajā pašā laikā Studenta tests ir nejutīgs pret normalitātes pārkāpumiem, un, ja ir iespējams iegūt vienāda lieluma paraugus, tad arī pieņēmums par dispersiju vienādību nav būtisks. Ja n ir nevienāds, verifikācijai jāizmanto formulas (7) un (8). Pārbaudot hipotēzes par dispersiju vienādību, dažas pazīmes rodas aprēķinos, kas saistīti ar atkarīgajiem paraugiem. Šajā gadījumā statistika tiek izmantota, lai pārbaudītu hipotēzi pret alternatīvu (14)
Ja nulles hipotēze ir patiesa, tad statistikai (14) ir Stjudenta t sadalījums ar n-2 brīvības pakāpēm. Mērot spīdumu 35 pārklājuma paraugiem, iegūta dispersija =134,5. Atkārtoti mērījumi pēc divām nedēļām uzrādīja = 199,1. Šajā gadījumā korelācijas koeficients starp pāru mērījumiem izrādījās vienāds ar =0,876. Ja ignorēsim faktu, ka paraugi ir atkarīgi, un hipotēzes pārbaudei izmantosim Fišera testu, iegūsim F=1,48. Ja izvēlaties nozīmīguma līmeni =0,05, tad nulles hipotēze tiks pieņemta, jo F sadalījuma kritiskā vērtība =35-1=34 un =35-1=34 brīvības pakāpēm ir 1,79. Tajā pašā laikā, ja izmantojam šim gadījumam piemērotu formulu (14), iegūstam t = 2,35, savukārt t kritiskā vērtība 33 brīvības pakāpēm un izvēlētajam nozīmīguma līmenim = 0,05 ir vienāda ar 2,03. Tāpēc nulles hipotēze par vienādu dispersiju abos paraugos ir jānoraida. Tādējādi no šī piemēra ir skaidri redzams, ka, tāpat kā vidējo vienlīdzības hipotēzes testēšanas gadījumā, eksperimentālo datu specifiku neņemot vērā kritērija izmantošana noved pie kļūdas. Ieteicamajā literatūrā var atrast Bartleta testu, kas tiek izmantots, lai pārbaudītu hipotēzes par k dispersiju vienlaicīgu vienādību. Papildus tam, ka šī kritērija statistikas aprēķināšana ir diezgan darbietilpīga, galvenais šī kritērija trūkums ir tas, ka tas ir neparasti jutīgs pret novirzēm no pieņēmuma par populāciju, no kurām tiek ņemti paraugi, normālu sadalījumu. Tādējādi, to lietojot, jūs nekad nevarat būt pārliecināti, ka nulles hipotēze patiešām tiek noraidīta tāpēc, ka dispersijas ir statistiski nozīmīgi atšķirīgas, nevis tāpēc, ka paraugi nav normāli sadalīti. Tāpēc, ja rodas vairāku dispersiju salīdzināšanas problēma, ir jāmeklē problēmas formulējums, kurā būs iespējams izmantot Fišera kritēriju vai tā modifikācijas. 3 Vienošanās kritēriji attiecībā uz akcijām Diezgan bieži ir jāanalizē populācijas, kurās objektus var klasificēt vienā no divām kategorijām. Piemēram, pēc dzimuma noteiktā populācijā, pēc noteikta mikroelementa klātbūtnes augsnē, pēc olu tumšās vai gaišās krāsas dažām putnu sugām utt. Elementu īpatsvaru, kuriem ir noteikta kvalitāte, mēs apzīmējam ar P, kur P apzīmē objektu ar tādu kvalitāti, kas mūs interesē, attiecību pret visiem objektiem kopumā.
Kur