Joonis 90 usaldusvahemik. Usaldusvahemiku konstrueerimine üldkogumi matemaatilise ootuse jaoks

Intervallide hindamise näide on usaldusvahemik. Usaldusvahemik on segment, mille keskpunkt on arvulise karakteristiku punkthinnang, sealhulgas selle arvtunnuse tegelik väärtus antud tõenäosusega. Seda tõenäosust nimetatakse usalduse tõenäosus. Seega on usaldusintervall hinnangu täpsuse mõõdupuu ja usalduse tõenäosus iseloomustab selle usaldusväärsust. Usaldusvahemiku suurus sõltub sellest, millise usalduse tõenäosuse väärtuse katse läbiviija annab. Mida kõrgem on usaldusnivoo, seda laiem peab olema intervall, et kaasata arvulise karakteristiku tegelik väärtus antud tõenäosusega. Sageli valitakse usaldusväärtus P d = 0,95, uskudes, et see väärtus on piisavalt suur, et arvata, et usaldusvahemik "peaaegu alati" katab tegeliku väärtuse. Ainult mõnikord, vastutustundliku ja väga vastutustundliku uurimistöö puhul, eeldatakse, et P d = 0,99 ja 0,999.

Usaldusvahemiku koostamise protseduur koosneb kahest etapist:

Mõnda juhuslikku funktsiooni puudutava tõenäosusliku väite kirje, mis sisaldab hinnangu ja arvulise karakteristiku erinevust või suhet. Selline funktsioon kannab teavet nimetatud väärtuste lähedusastme kohta. On vaja, et funktsiooni jaotusseadus oleks teada;

Tõenäosuslik väide teisendatakse kujule, milles arvulise tunnuse usaldusvahemiku piirid esitatakse eksplitsiitsel kujul.

Näited teadaoleva jaotusega funktsioonidest, mis vastavad nõutavatele nõuetele, on järgmised:

normaaljaotusega, kui X väärtus on normaaljaotus ja s[X] väärtus on teada;

2) (3.25)

millel on Studenti jaotus c m = N-1, kui X väärtus on normaaljaotus ja s[X] väärtus ei ole ette teada, kuid selle hinnangu saab katseandmetest valemi (3.23) abil;

3) (3.26)

millel on Pearsoni jaotus m = N-1, kui X väärtus on normaaljaotus.

Tuletame meelde, et jaotuse parameetrid m on vabadusastmete arvud. Lisaks kasutatakse siin järgmisi tähiseid: - aritmeetiline keskmine väärtus, - ruutkeskmine väärtus, mis on võrdne dispersiooni ruutjuurega, [X] - hinnang keskmisele kaadri väärtusele, mis on määratletud kui kaadri erapooletu hinnangu ruutjuur. dispersioon, N - valimi suurus.

Funktsioone Z ja t saab kasutada keskmise usaldusvahemiku konstrueerimiseks, samas kui funktsioon c 2 konstrueerib dispersiooni usaldusvahemiku.


Koostame matemaatilise ootuse usaldusvahemiku eeldusel, et meie käsutuses on normaaljaotusega suuruse X N vaatluse tulemused ja keskmine ruutväärtus on sõltumatute vaatluste põhjal ette teada. Kuna funktsioon Z on normaaljaotusega, saate vastava tabeli abil määrata z a väärtuse nii, et väljapoole - z a ja + z a jääb jaotuskõvera alune pindala summaks, mis on võrdne a-ga, samas kui [- z a ,+ z a ] on osa piirkonnast , mis on võrdne 1 - a . Äsja öeldu vastab järgmisele tõenäosuslikule väitele:

Р(- z a £ £+za )= 1-a. (3,27)

(Kokkis sulgudes oleva võrratuse täitumise tõenäosus on 1-a.). Teisendame sulgudes oleva avaldise:

Р(-z a )= 1 - a

Väärtust 1-a = Р d nimetame usaldustõenäosuseks Р d. Vastavalt (3.28) on selle usaldustõenäosusega M[X] usaldusvahemik antud piiridega:

. (3.29)

Kommentaar: Kahjuks on tavajaotustabelid erinevates raamatutes erinevalt üles ehitatud. Mõnikord on antud tõenäosusintegraal

Ф(z) =

Iga valim annab ainult ligikaudse ettekujutuse üldkogumist ja kõik valimi statistilised karakteristikud (keskmine, moodus, dispersioon ...) on üldiste parameetrite ligikaudsed või näiteks hinnangud, mida enamikul juhtudel ei saa arvutada üldrahvastiku ligipääsmatus (joonis 20) .

Joonis 20. Valimiviga

Kuid saate määrata intervalli, milles teatud tõenäosusega asub statistilise tunnuse tegelik (üldine) väärtus. Seda intervalli nimetatakse d usaldusvahemik (CI).

Nii et üldine keskmine tõenäosusega 95% jääb sees

alates kuni, (20)

Kus t - Studenti kriteeriumi tabeliväärtus α =0,05 ja f= n-1

Võib leida ja 99% CI, antud juhul t jaoks valitud α =0,01.

Mis on usaldusvahemiku praktiline tähtsus?

    Lai usaldusvahemik näitab, et valimi keskmine ei kajasta populatsiooni keskmist täpselt. Tavaliselt on selle põhjuseks valimi ebapiisav suurus või selle heterogeensus, s.t. suur dispersioon. Mõlemad annavad suure keskmise vea ja vastavalt laiema CI. Ja see on põhjus naasta uurimistöö planeerimise etappi.

    CI ülemine ja alumine piir hindab, kas tulemused on kliiniliselt olulised

Peatugem üksikasjalikumalt rühmaomaduste uurimise tulemuste statistilise ja kliinilise olulisuse küsimusel. Tuletame meelde, et statistika ülesanne on avastada näidisandmete põhjal vähemalt mõningaid erinevusi üldistes populatsioonides. Arsti ülesanne on leida sellised (mitte igasugused) erinevused, mis aitavad diagnoosida või ravida. Ja mitte alati statistilised järeldused ei ole kliiniliste järelduste aluseks. Seega statistiliselt oluline hemoglobiini langus 3 g/l ei tekita muret. Ja vastupidi, kui mõnel inimkeha probleemil pole kogu elanikkonna tasandil massilist iseloomu, ei ole see põhjus selle probleemiga mitte tegeleda.

Me kaalume seda seisukohta näiteks.

Teadlased mõtlesid, kas poisid, kellel oli mingisugune nakkushaigus, jäid kasvus oma eakaaslastest maha. Sel eesmärgil viidi läbi valikuuring, milles osales 10 seda haigust põdenud poissi. Tulemused on toodud tabelis 23.

Tabel 23. Statistilised tulemused

madalam limiit

ülempiir

Tehnilised andmed (cm)

keskel

Nendest arvutustest järeldub, et 10-aastaste poiste, kellel on mingi nakkushaigus, selektiivne keskmine pikkus on normilähedane (132,5 cm). Usaldusvahemiku alumine piir (126,6 cm) viitab aga sellele, et 95% tõenäosusega vastab nende laste tegelik keskmine pikkus mõistele "lühikest kasvu", s.o. need lapsed on kidurad.

Selles näites on usaldusvahemiku arvutuste tulemused kliiniliselt olulised.

Sageli peab hindaja analüüsima selle segmendi kinnisvaraturgu, kus hindamisobjekt asub. Kui turg on arenenud, võib kogu esitatud objektide komplekti analüüsimine olla keeruline, seetõttu kasutatakse analüüsimiseks objektide valimit. See valim ei ole alati homogeenne, mõnikord tuleb see puhastada äärmustest - liiga kõrgetest või liiga madalatest turupakkumistest. Sel eesmärgil rakendatakse seda usaldusvahemik. Käesoleva uuringu eesmärk on läbi viia kahe usaldusintervalli arvutamise meetodi võrdlev analüüs ja valida parim arvutusvõimalus süsteemis estimatica.pro erinevate valimitega töötamisel.

Usaldusvahemik - arvutatakse valimi põhjal, tunnuse väärtuste intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi hinnangulist parameetrit.

Usaldusvahemiku arvutamise mõte on koostada selline intervall näidisandmete põhjal, et saaks etteantud tõenäosusega väita, et hinnangulise parameetri väärtus on selles intervallis. Teisisõnu sisaldab teatud tõenäosusega usaldusvahemik hinnangulise suuruse tundmatut väärtust. Mida laiem on intervall, seda suurem on ebatäpsus.

Usaldusvahemiku määramiseks on erinevaid meetodeid. Selles artiklis käsitleme kahte võimalust:

  • läbi mediaani ja standardhälbe;
  • läbi t-statistika kriitilise väärtuse (Studendi koefitsient).

Erinevate CI arvutamise meetodite võrdleva analüüsi etapid:

1. moodustada andmeproov;

2. töötleme seda statistiliste meetoditega: arvutame keskmise väärtuse, mediaani, dispersiooni jne;

3. arvutame usaldusvahemiku kahel viisil;

4. Analüüsige puhastatud proove ja saadud usaldusvahemikke.

1. etapp. Andmete valim

Valim moodustati süsteemi estimatica.pro abil. Valimisse kuulus 91 pakkumist 3. hinnatsooni 1-toaliste korterite müügiks planeeringuga "Hruštšov".

Tabel 1. Esialgne valim

Hind 1 ruutmeetrit, c.u.

Joonis 1. Esialgne proov



2. etapp. Algproovi töötlemine

Proovide töötlemine statistiliste meetoditega nõuab järgmiste väärtuste arvutamist:

1. Aritmeetiline keskmine

2. Mediaan - valimit iseloomustav arv: täpselt pooled valimi elemendid on mediaanist suuremad, teine ​​pool on mediaanist väiksemad

(paaritu arvu väärtustega proovi jaoks)

3. Vahemik - erinevus proovi maksimaalsete ja minimaalsete väärtuste vahel

4. Dispersioon – kasutatakse andmete varieerumise täpsemaks hindamiseks

5. Valimi standardhälve (edaspidi RMS) on kõige levinum näitaja, mis näitab korrigeerimisväärtuste hajumist aritmeetilise keskmise ümber.

6. Variatsioonikoefitsient – ​​peegeldab korrigeerimisväärtuste hajumise astet

7. võnkekoefitsient – ​​peegeldab valimi hindade äärmuslike väärtuste suhtelist kõikumist keskmise ümber

Tabel 2. Algvalimi statistilised näitajad

Andmete homogeensust iseloomustav variatsioonikordaja on 12,29%, kuid võnketegur on liiga suur. Seega võime väita, et esialgne valim ei ole homogeenne, seega liigume edasi usaldusvahemiku arvutamise juurde.

3. etapp. Usaldusvahemiku arvutamine

Meetod 1. Arvutamine läbi mediaani ja standardhälbe.

Usaldusvahemik määratakse järgmiselt: minimaalne väärtus - standardhälve lahutatakse mediaanist; maksimaalne väärtus – mediaanile lisatakse standardhälve.

Seega usaldusvahemik (47179 CU; 60689 CU)

Riis. 2. Väärtused usaldusvahemikus 1.



Meetod 2. Usaldusvahemiku loomine läbi t-statistika kriitilise väärtuse (õpilase koefitsient)

S.V. Gribovsky kirjeldab raamatus "Vara väärtuse hindamise matemaatilised meetodid" meetodit usaldusvahemiku arvutamiseks läbi Studenti koefitsiendi. Selle meetodiga arvutamisel peab hindaja ise määrama olulisuse taseme ∝, mis määrab usaldusvahemiku koostamise tõenäosuse. Tavaliselt kasutatakse olulisuse tasemeid 0,1; 0,05 ja 0,01. Need vastavad usalduse tõenäosusele 0,9; 0,95 ja 0,99. Selle meetodi puhul loetakse matemaatilise ootuse ja dispersiooni tegelikud väärtused praktiliselt tundmatuks (mis on praktiliste hindamisülesannete lahendamisel peaaegu alati tõsi).

Usaldusvahemiku valem:

n - valimi suurus;

t-statistika (Studendi jaotused) kriitiline väärtus olulisuse tasemega ∝, vabadusastmete arv n-1, mis määratakse spetsiaalsete statistiliste tabelitega või MS Exceli abil (→"Statistiline"→ STUDRASPOBR);

∝ - olulisuse tase, võtame ∝=0,01.

Riis. 2. Väärtused usaldusvahemikus 2.

Etapp 4. Usaldusvahemiku arvutamise erinevate võimaluste analüüs

Kaks usaldusintervalli arvutamise meetodit - läbi mediaani ja Studenti koefitsiendi - viisid intervallide erinevate väärtusteni. Sellest lähtuvalt saadi kaks erinevat puhastatud proovi.

Tabel 3. Kolme valimi statistilised näitajad.

Indeks

Esialgne proov

1 variant

2. variant

Keskmine väärtus

Dispersioon

Coef. variatsioonid

Coef. võnkumisi

Vanade objektide arv, tk.

Tehtud arvutuste põhjal võime öelda, et erinevate meetoditega saadud usaldusvahemike väärtused ristuvad, nii et saate hindaja äranägemisel kasutada mis tahes arvutusmeetodeid.

Siiski usume, et süsteemis estimatica.pro töötades on soovitav valida usaldusvahemiku arvutamise meetod, mis sõltub turu arenguastmest:

  • kui turg ei ole arenenud, rakendage mediaani ja standardhälbe kaudu arvutamise meetodit, kuna kasutuselt kõrvaldatud objektide arv on sel juhul väike;
  • kui turg on arenenud, rakenda arvutust läbi t-statistika kriitilise väärtuse (Studendi koefitsient), kuna on võimalik moodustada suur algvalim.

Artikli ettevalmistamisel kasutati:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaatilised meetodid vara väärtuse hindamiseks. Moskva, 2014

2. Andmed süsteemist estimatica.pro

Juhusliku vea hindamise meetod põhineb tõenäosusteooria ja matemaatilise statistika põhimõtetel. Juhuslikku viga on võimalik hinnata ainult juhul, kui on tehtud korduvaid sama suuruse mõõtmisi.

Laske teostatud mõõtmiste tulemusena P koguse väärtused X: X 1 , X 2 , …, x n. Tähistage aritmeetilise keskmisega

Tõenäosusteoorias on tõestatud, et mõõtmiste arvu suurenemisega P mõõdetud väärtuse aritmeetiline keskmine väärtus läheneb tõele:

Väikese arvu mõõtmistega ( P 10 naela) võib keskmine väärtus tegelikust oluliselt erineda. Selleks, et teada saada, kui täpselt väärtus mõõdetud väärtust iseloomustab, on vaja määrata saadud tulemuse nn usaldusvahemik.

Kuna absoluutselt täpne mõõtmine on võimatu, on väite õigsuse tõenäosus " x väärtus on täpselt võrdne» on võrdne nulliga. Väite tõenäosus x-il on väärtus» võrdub ühega (100%). Seega jääb mis tahes vaheväite õigsuse tõenäosus vahemikku 0 kuni 1. Mõõtmise eesmärk on leida selline intervall, milles etteantud tõenäosusega a(0 < a < 1) находится истинное значение измеряемой величины. Этот интервал называется usaldusvahemik , ja sellega lahutamatult seotud väärtus ausalduse tase (või usaldusväärsuse tegur). Valemiga (3) arvutatud keskmine väärtus võetakse intervalli keskpunktiks. Pool usaldusvahemiku laiusest on juhuslik viga D s x(joonis 1).



Ilmselgelt on usaldusvahemiku laius (ja sellest ka viga D s x) sõltub koguse individuaalsetest mõõtmistest x i keskmisest väärtusest. Mõõtmistulemuste "hajuvust" keskmise suhtes iseloomustab ruutkeskmine viga s, mis leitakse valemiga

, (4)

Soovitud usaldusvahemiku laius on otseselt võrdeline ruutkeskmise veaga:



. (5)

Proportsionaalsustegur t n, a helistas Üliõpilaste koefitsient; see oleneb katsete arvust P ja usalduse tase a.

Joonisel fig. 1, a, b Selgelt on näidatud, et kui muud asjaolud on võrdsed, on tõenäolise väärtuse usaldusvahemikku sattumise tõenäosuse suurendamiseks vaja suurendada viimase laiust (väärtuse "katmise" tõenäosus X laiem intervall ülal). Seetõttu väärtus t n, a peaks olema suurem, seda kõrgem on usaldustase a.

Katsete arvu suurenemisega läheneb keskmine väärtus tegelikule väärtusele; seega sama tõenäosusega a usaldusvahemikku võib võtta kitsamaks (vt joonis 1, a, c). Seega koos kasvuga P sudent koefitsient peaks vähenema. Õpilase koefitsiendi väärtuste tabel sõltuvalt P Ja a antud käesoleva juhendi lisades.

Tuleb märkida, et usaldustasemel pole mõõtmistulemuse täpsusega mingit pistmist. Väärtus a on eelnevalt paika pandud, lähtudes nende töökindluse nõuetest. Enamikus tehnilistes katsetes ja laboripraktikas on väärtus a võetakse võrdseks 0,95.

Juhusliku vea arvutamine suuruse mõõtmisel X viiakse läbi järgmises järjekorras:

1) arvutatakse mõõdetud väärtuste summa ja seejärel arvutatakse valemi (3) järgi koguse keskmine väärtus;

2) iga i katses arvutatakse mõõdetud ja keskmiste väärtuste erinevus, samuti selle erinevuse (hälbe) ruut (D x i) 2 ;

3) leitakse hälvete ruudu summa ja seejärel ruutkeskmise viga s vastavalt valemile (4);

4) vastavalt etteantud usaldustasemele a ja katsete arv P tabelist lk. 149 rakendust valivad sobiva Õpilase koefitsiendi väärtuse t n, a ja juhuslik viga D s x vastavalt valemile (5).

Arvutuste ja vahetulemuste kontrollimise hõlbustamiseks kantakse andmed tabelisse, mille kolm viimast veergu täidetakse vastavalt tabeli 1 mudelile.

Tabel 1

Kogemuse number X D X (D X) 2
P
S= S=

Igal konkreetsel juhul väärtus X omab teatud füüsikalist tähendust ja vastavaid mõõtühikuid. See võib olla näiteks vabalangemise kiirendus g (Prl 2), vedeliku viskoossus h (Pa×s) jne. Tabeli veerud puuduvad. 1 võib sisaldada vahepealseid mõõdetud väärtusi, mis on vajalikud vastavate väärtuste arvutamiseks X.

Näide 1 Kiirenduse määramiseks A keha liigutuste mõõdetud aeg t oma teed mööda minema S algkiirus puudub. Kasutades teadaolevat seost, saame arvutusvalemi

Tee mõõtmise tulemused S ja aeg t on toodud tabeli teises ja kolmandas veerus. 2. Pärast valemi (6) abil arvutuste tegemist täidame

neljas veerg kiirenduse väärtustega a i ja leiame nende summa, mille kirjutame selle veeru alla lahtrisse "S =". Seejärel arvutame keskmise väärtuse vastavalt valemile (3)

.

tabel 2

Kogemuse number S, m t, c A, Prl 2 D A, Prl 2 (D A) 2 , (Prl 2) 2
2,20 2,07 0,04 0,0016
2,68 1,95 -0,08 0,0064
2,91 2,13 0,10 0,0100
3,35 1,96 -0,07 0,0049
S= 8,11 S= 0,0229

Igast väärtusest lahutamine a i keskmine, leidke erinevused D a i ja pane need tabeli viiendasse veergu. Nende erinevuste ruudustamiseks täidame viimase veeru. Seejärel arvutame hälvete ruudu summa ja kirjutame selle teise lahtrisse "S =". Vastavalt valemile (4) määrame ruutkeskmise vea:

.

Arvestades usalduse tõenäosuse väärtust a= 0,95, katsete arvu jaoks P= 4 lisades olevast tabelist (lk 149) vali Studenti koefitsiendi väärtus t n, a= 3,18; valemi (5) abil hindame kiirenduse mõõtmise juhuslikku viga

D s a= 3,18 × 0,0437 » 0,139 ( Prl 2) .

Usaldusvahemike hindamine

Õppeeesmärgid

Statistika arvestab järgmist kaks peamist ülesannet:

    Meil on näidisandmetel põhinev hinnang ja me tahame teha tõenäosusliku väite selle kohta, kus on hinnatava parameetri tegelik väärtus.

    Meil on konkreetne hüpotees, mida tuleb prooviandmete põhjal testida.

Selles teemas käsitleme esimest probleemi. Tutvustame ka usaldusvahemiku määratlust.

Usaldusvahemik on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus hinnangulise parameetri tegelik väärtus on a priori antud tõenäosusega.

Pärast selle teema materjali uurimist:

    õppida, milline on hinnangu usaldusvahemik;

    õppida klassifitseerima statistilisi probleeme;

    valdama usaldusvahemike konstrueerimise tehnikat, kasutades nii statistilisi valemeid kui ka tarkvaratööriistu;

    õppida määrama vajalikke valimi suurusi, et saavutada statistiliste hinnangute täpsuse teatud parameetrid.

Valimi tunnuste jaotused

T-jaotus

Nagu eespool mainitud, on juhusliku suuruse jaotus lähedane standardiseeritud normaaljaotusele parameetritega 0 ja 1. Kuna me ei tea σ väärtust, asendame selle mõne hinnanguga s . Kogusel on juba erinev jaotus, nimelt või Üliõpilaste jaotus, mis määratakse parameetriga n -1 (vabadusastmete arv). See jaotus on lähedane normaaljaotusele (mida suurem n, seda lähemal on jaotused).

Joonisel fig. 95
Esitatakse õpilase jaotus 30 vabadusastmega. Nagu näete, on see normaaljaotusele väga lähedal.

Sarnaselt normaaljaotusega NORMDIST ja NORMINV töötavatele funktsioonidele on olemas ka t-jaotusega töötamise funktsioonid - STUDIST (TDIST) ja STUDRASPBR (TINV). Nende funktsioonide kasutamise näite leiate failist STUDRIST.XLS (mall ja lahendus) ja jooniselt fig. 96
.

Muude tunnuste jaotused

Nagu me juba teame, on ootushinnangu täpsuse määramiseks vaja t-jaotust. Teiste parameetrite, näiteks dispersiooni, hindamiseks on vaja teisi jaotusi. Kaks neist on F-jaotus ja x 2 -jaotus.

Keskmise usaldusvahemik

Usaldusvahemik on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus asub hinnangulise parameetri tegelik väärtus a priori antud tõenäosusega.

Tekib keskmise väärtuse usaldusvahemiku konstrueerimine järgmisel viisil:

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks plaanib juht valida juba proovinute hulgast juhuslikult 40 külastajat ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatav punktide arv, mille uus toode saab, ja koostage selle hinnangu jaoks 95% usaldusvahemik. Kuidas seda teha? (vt faili SANDWICH1.XLS (mall ja lahendus).

Lahendus

Selle probleemi lahendamiseks võite kasutada . Tulemused on esitatud joonisel fig. 97
.

Koguväärtuse usaldusvahemik

Mõnikord on näidisandmete põhjal vaja hinnata mitte matemaatilist ootust, vaid väärtuste kogusummat. Näiteks olukorras, kus on audiitor, võib olla huvitav hinnata mitte arve keskmist väärtust, vaid kõigi arvete summat.

Olgu N üksuste koguarv, n on valimi suurus, T 3 on valimi väärtuste summa, T" on summa hinnang kogu populatsiooni kohta, siis , ja usaldusvahemik arvutatakse valemiga , kus s on valimi standardhälbe hinnang, on valimi hinnanguline keskmine.

Näide

Oletame, et maksuamet soovib hinnata 10 000 maksumaksja maksutagastuse kogusummat. Maksumaksja kas saab raha tagasi või maksab täiendavalt makse. Leidke tagasimakse summa 95% usaldusvahemik, eeldades, et valimi suurus on 500 inimest (vt faili REFUND AMOUNT.XLS (mall ja lahendus).

Lahendus

StatPro-s pole selle juhtumi jaoks spetsiaalset protseduuri, kuid näete, et ülaltoodud valemite abil saab keskmise piiridest saada piirid (joonis 98).
).

Proportsiooni usaldusvahemik

Olgu p klientide osakaalu ootus ja pv selle osakaalu hinnang, mis on saadud n suuruse valimi põhjal. Võib näidata, et piisavalt suur hinnanguline jaotus on keskmise p ja standardhälbega normaalsele lähedane . Hinnangu standardviga väljendatakse sel juhul järgmiselt , ja usaldusvahemik as .

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Selle nõudluse hindamiseks valis juht juhuslikult 40 külastajat juba proovinute hulgast ja palus neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatavat osakaalu klientidest, kes hindavad uut toodet vähemalt 6 punktiga (ta eeldab, et need kliendid on uue toote tarbijad).

Lahendus

Esialgu loome uue veeru 1 alusel, kui kliendi skoor oli üle 6 punkti ja muul juhul 0 (vt faili SANDWICH2.XLS (mall ja lahendus).

1. meetod

Arvestades summa 1, hindame osakaalu ja seejärel kasutame valemeid.

Z cr väärtus on võetud spetsiaalsetest normaaljaotuse tabelitest (näiteks 1,96 95% usaldusvahemiku korral).

Kasutades seda lähenemisviisi ja konkreetseid andmeid 95% intervalli koostamiseks, saame järgmised tulemused (joonis 99
). Parameetri z cr kriitiline väärtus on 1,96. Hinnangu standardviga on 0,077. Usaldusvahemiku alumine piir on 0,475. Usaldusvahemiku ülempiir on 0,775. Seega võib juht 95% kindlusega eeldada, et klientide osakaal, kes hindavad uut toodet 6 punkti või rohkem, jääb vahemikku 47,5–77,5.

2. meetod

Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui märkida, et osakaal langeb sel juhul kokku veeru Tüüp keskmise väärtusega. Järgmisena kandideeri StatPro/Statistiline järeldus/Ühe proovi analüüs veeru Tüüp keskmise väärtuse (ootusehinnangu) usaldusvahemiku loomiseks. Sel juhul saadud tulemused on väga lähedased 1. meetodi tulemusele (joonis 99).

Standardhälbe usaldusvahemik

s kasutatakse standardhälbe hinnanguna (valem on toodud jaotises 1). Hinnangu s tihedusfunktsioon on hii-ruutfunktsioon, millel on sarnaselt t-jaotusele n-1 vabadusastet. Selle distributsiooniga töötamiseks on olemas erifunktsioonid CHI2DIST (CHIDIST) ja CHI2OBR (CHIINV) .

Sel juhul ei ole usaldusvahemik enam sümmeetriline. Piiride tingimuslik skeem on näidatud joonisel fig. 100 .

Näide

Masin peaks tootma 10 cm läbimõõduga detaile, kuid erinevatel asjaoludel tuleb ette vigu. Kvaliteedikontrolör on mures kahe asja pärast: esiteks peaks keskmine väärtus olema 10 cm; teiseks, isegi sel juhul, kui kõrvalekalded on suured, lükatakse paljud detailid tagasi. Iga päev teeb ta 50 osast koosneva näidise (vt faili QUALITY CONTROL.XLS (mall ja lahendus). Milliseid järeldusi selline näidis annab?

Lahendus

Me koostame 95% usaldusvahemikud keskmise ja standardhälbe jaoks, kasutades StatPro/Statistiline järeldus/Ühe proovi analüüs(Joonis 101
).

Lisaks arvutame läbimõõtude normaaljaotuse eeldusel defektsete toodete osakaalu, seades maksimaalseks kõrvalekaldeks 0,065. Kasutades otsingutabeli võimalusi (kahe parameetri juhtum), konstrueerime tagasilükkamiste protsendi sõltuvuse keskmisest väärtusest ja standardhälbest (joonis 102).
).

Kahe keskmise erinevuse usaldusvahemik

See on statistiliste meetodite üks olulisemaid rakendusi. Olukorra näited.

    Rõivapoe juhataja tahaks teada, kui palju keskmine naissoost ostja poes rohkem või vähem kulutab kui mees.

    Need kaks lennufirmat lendavad sarnastel marsruutidel. Tarbijaorganisatsioon soovib võrrelda mõlema lennufirma keskmiste eeldatavate lendude hilinemise aegade erinevust.

    Ettevõte saadab teatud tüüpi kaupade kupongid välja ühes linnas ja teises linnas välja ei saada. Juhid soovivad võrrelda nende kaupade keskmisi oste järgmise kahe kuu jooksul.

    Automüüja tegeleb esitlustel sageli abielupaaridega. Et mõista nende isiklikke reaktsioone esitlusele, intervjueeritakse paare sageli eraldi. Juht soovib hinnata meeste ja naiste antud hinnangute erinevust.

Sõltumatute proovide juhtum

Keskmise erinevuse t-jaotus on n 1 + n 2 - 2 vabadusastmega. Usaldusvahemikku μ 1 - μ 2 kohta väljendatakse suhtega:

Seda probleemi saab lahendada mitte ainult ülaltoodud valemitega, vaid ka standardsete StatPro tööriistadega. Selleks piisab taotlemisest

Proportsioonide erinevuse usaldusvahemik

Laskma olla aktsiate matemaatiline ootus. Olgu nende valimi hinnangud, mis on üles ehitatud vastavalt n 1 ja n 2 suurustele valimitele. Siis on erinevuse hinnang. Seetõttu väljendatakse selle erinevuse usaldusvahemikku järgmiselt:

Siin z cr on väärtus, mis saadakse eritabelite normaaljaotusest (näiteks 1,96 95% usaldusvahemiku korral).

Hinnangu standardviga väljendatakse sel juhul seosega:

.

Näide

Kauplus võttis suurmüügiks valmistudes ette järgmised turundusuuringud. 300 parimat ostjat valiti välja ja jagati juhuslikult kahte 150-liikmelisse rühma. Kõikidele väljavalitud ostjatele saadeti kutsed müügil osalemiseks, kuid ainult esimese grupi liikmetele oli lisatud kupong, mis annab õiguse 5% allahindlusele. Müügi käigus fikseeriti kõigi 300 valitud ostja ostud. Kuidas saab juht tulemusi tõlgendada ja kupongide tõhususe kohta hinnanguid anda? (Vt faili COUPONS.XLS (mall ja lahendus)).

Lahendus

Meie konkreetse juhtumi puhul tegi 150 sooduskupongi saanud kliendist 55 soodusostu ja 150 kupongi mittesaanud kliendist sooritas ostu ainult 35 (joonis 103).
). Siis on proovi proportsioonide väärtused vastavalt 0,3667 ja 0,2333. Ja nende valimi erinevus on vastavalt 0,1333. Kui eeldada, et usaldusvahemik on 95%, leiame normaaljaotuse tabelist z cr = 1,96. Valimi erinevuse standardvea arvutus on 0,0524. Lõpuks saame, et 95% usaldusvahemiku alumine piir on vastavalt 0,0307 ja ülemine piir 0,2359. Saadud tulemusi võib tõlgendada nii, et iga 100 sooduskupongi saanud kliendi kohta on meil oodata 3 kuni 23 uut klienti. Siiski tuleb meeles pidada, et see järeldus iseenesest ei tähenda kupongide kasutamise efektiivsust (sest allahindlust tehes jääme kasumist ilma!). Näitame seda konkreetsete andmetega. Oletame, et keskmine ostusumma on 400 rubla, millest 50 rubla. on poe kasum. Siis on oodatav kasum 100 kupongi mitte saanud kliendi kohta võrdne:

50 0,2333 100 \u003d 1166,50 rubla.

Sarnased arvutused 100 kupongi saanud ostja kohta annavad:

30 0,3667 100 \u003d 1100,10 rubla.

Keskmise kasumi vähenemine 30-le on seletatav asjaoluga, et soodustust kasutades sooritavad kupongi saanud ostjad keskmiselt 380 rubla eest ostu.

Seega näitab lõppjäreldus selliste kupongide kasutamise ebaefektiivsust selles konkreetses olukorras.

Kommenteeri. Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui taandada see probleem kahe keskmise erinevuse hindamise probleemiks meetodi abil ja seejärel rakendada StatPro/Statistiline järeldus/Kahe proovi analüüs kahe keskmise väärtuse erinevuse usaldusvahemiku loomiseks.

Usaldusintervalli kontroll

Usaldusvahemiku pikkus sõltub järgmisi tingimusi:

    otseandmed (standardhälve);

    olulisuse tase;

    näidissuurus.

Valimi suurus keskmise hindamiseks

Mõelgem esmalt probleemile üldiselt. Tähistame meile antud usaldusvahemiku poole pikkuse väärtust B-ga (joon. 104
). Teame, et mõne juhusliku suuruse X keskmise väärtuse usaldusvahemik on väljendatud kujul , Kus . Eeldusel:

ja väljendades n , saame .

Kahjuks ei tea me juhusliku suuruse X dispersiooni täpset väärtust. Lisaks ei tea me t cr väärtust, kuna see sõltub vabadusastmete arvust n-st. Sellises olukorras saame teha järgmist. Dispersiooni s asemel kasutame mingit dispersiooni hinnangut uuritava juhusliku muutuja mõne olemasoleva realisatsiooni puhul. T cr väärtuse asemel kasutame normaaljaotuse jaoks z cr väärtust. See on täiesti vastuvõetav, kuna normaal- ja t-jaotuse tihedusfunktsioonid on väga lähedased (välja arvatud väikese n korral). Seega on soovitud valem järgmine:

.

Kuna valem annab üldiselt mittetäisarvulisi tulemusi, võetakse soovitud valimi suuruseks ümardamine tulemuse ülejäägiga.

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks plaanib juhataja juhuslikult valida juba proovinute hulgast külastajaid ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib et hinnata eeldatavat punktide arvu, mille uus toode saab. toode ja joonistage selle hinnangu 95% usaldusvahemik. Küll aga soovib ta, et pool usaldusvahemiku laiusest ei ületaks 0,3. Kui palju külastajaid ta küsitlemiseks vajab?

järgnevalt:

Siin r ots on murdosa p hinnang ja B on antud pool usaldusvahemiku pikkusest. Väärtuse abil saab saada n-i täispuhutud väärtuse r ots= 0,5. Sel juhul ei ületa usaldusvahemiku pikkus p ühegi tegeliku väärtuse jaoks antud väärtust B.

Näide

Laske eelmise näite juhil hinnata uut tüüpi toodet eelistavate klientide osakaalu. Ta soovib konstrueerida 90% usaldusvahemiku, mille poole pikkus on 0,05 või väiksem. Kui palju kliente tuleks juhuslikult valida?

Lahendus

Meie puhul on z cr väärtus 1,645. Seetõttu arvutatakse vajalik kogus järgmiselt .

Kui juhil oleks põhjust arvata, et p soovitud väärtus on näiteks umbes 0,3, siis asendades selle väärtuse ülaltoodud valemis, saaksime juhusliku valimi väiksema väärtuse, nimelt 228.

Valem määramiseks juhuslikud valimi suurused kahe keskmise erinevuse korral kirjutatud kui:

.

Näide

Mõnel arvutifirmal on klienditeeninduskeskus. Viimasel ajal on suurenenud klientide kaebuste arv teenuse halva kvaliteedi kohta. Teeninduskeskuses töötab põhiliselt kahte tüüpi töötajaid: vähese kogemusega, kuid erikoolituse läbinud ja suurte praktiliste kogemustega, kuid erikursusi läbimata. Ettevõte soovib analüüsida viimase kuue kuu klientide kaebusi ja võrrelda nende keskmist arvu kahe töötajate rühma kohta. Eeldatakse, et mõlema rühma valimite numbrid on samad. Kui palju töötajaid peab valimisse kaasama, et saada 95% intervall, mille poole pikkus ei ületa 2?

Lahendus

Siin on σ ots mõlema juhusliku suuruse standardhälbe hinnang eeldusel, et need on lähedased. Seega peame oma ülesande täitmisel selle hinnangu kuidagi saama. Seda saab teha näiteks järgmiselt. Vaadates viimase kuue kuu klientide kaebuste andmeid, võib juht märgata, et töötaja kohta on üldiselt 6–36 kaebust. Teades, et normaaljaotuse korral on praktiliselt kõik väärtused kuni kolm standardhälvet keskmisest, võib ta mõistlikult arvata, et:

Kust σ ots = 5.

Asendades selle väärtuse valemis, saame .

Valem määramiseks juhusliku valimi suurus aktsiate vahe hindamisel paistab nagu:

Näide

Mõnel ettevõttel on sarnaste toodete tootmiseks kaks tehast. Ettevõtte juht soovib võrrelda mõlema tehase defektide taset. Olemasoleva teabe kohaselt on tagasilükkamise määr mõlemas tehases 3–5%. See peaks koostama 99% usaldusvahemiku, mille poole pikkus ei ületa 0,005 (või 0,5%). Kui palju tooteid tuleks igast tehasest valida?

Lahendus

Siin on p 1ot ja p 2ot hinnangud kahe tundmatu praagi fraktsiooni kohta 1. ja 2. tehases. Kui paneme p 1ots \u003d p 2ots \u003d 0,5, saame n jaoks ülehinnatud väärtuse. Aga kuna meil on nende aktsiate kohta a priori info olemas, siis võtame nende aktsiate ülemise hinnangu, nimelt 0,05. Saame

Kui mõningaid üldkogumi parameetreid hinnatakse valimiandmete põhjal, on kasulik esitada mitte ainult parameetri punkthinnang, vaid ka usaldusvahemik, mis näitab, kus hinnatava parameetri täpne väärtus võib asuda.

Selles peatükis tutvusime ka kvantitatiivsete seostega, mis võimaldavad ehitada selliseid intervalle erinevate parameetrite jaoks; õppinud viise usaldusvahemiku pikkuse kontrollimiseks.

Samuti märgime, et valimi suuruse hindamise probleemi (katse planeerimise probleem) saab lahendada standardsete StatPro tööriistade abil, nimelt StatPro/statistiline järeldus/proovi suuruse valik.

Sarnased artiklid

2023 liveps.ru. Kodutööd ja valmisülesanded keemias ja bioloogias.