Construiți un interval de încredere de 90. Construirea unui interval de încredere pentru așteptarea matematică a populației

Un exemplu de estimare a intervalului este interval de încredere. Un interval de încredere este un segment al cărui centru este o estimare punctuală a unei caracteristici numerice, inclusiv valoarea adevărată a unei caracteristici numerice date cu o probabilitate dată. Această probabilitate se numește probabilitatea de încredere. Astfel, intervalul de încredere este o măsură a acurateței estimării, iar probabilitatea de încredere caracterizează fiabilitatea acesteia. Mărimea intervalului de încredere depinde de valoarea probabilității de încredere stabilită de experimentator. Cu cât probabilitatea de încredere este mai mare, cu atât intervalul trebuie să fie mai larg pentru a include valoarea adevărată a caracteristicii numerice cu o probabilitate dată. Adesea se alege o valoare de încredere de P d = 0,95, crezând astfel că această valoare este suficient de mare pentru a considera că intervalul de încredere „aproape întotdeauna” acoperă valoarea adevărată. Doar uneori, în cazul studiilor responsabile și foarte responsabile, acestea presupun P d = 0,99 și, respectiv, 0,999.

Procedura de construire a unui interval de încredere include două etape:

Înregistrarea unei declarații probabilistice cu privire la o funcție aleatoare, inclusiv diferența sau raportul dintre o estimare și o caracteristică numerică. O astfel de funcție poartă informații despre gradul de apropiere a cantităților menționate. Este necesar ca legea de distribuție a funcției să fie cunoscută;

Enunțul probabilistic este transformat într-o formă în care limitele intervalului de încredere ale unei caracteristici numerice sunt prezentate în mod explicit.

Exemple de funcții cu distribuții cunoscute care îndeplinesc cerințele necesare sunt următoarele:

având o distribuție normală dacă valoarea X este distribuită normal și este cunoscută valoarea s[X];

2) (3.25)

având o distribuție Student cu m = N-1, dacă valoarea X este distribuită normal și valoarea s[X] este necunoscută în prealabil, dar estimarea acesteia poate fi obținută din date experimentale folosind formula (3.23);

3) (3.26)

având o distribuţie Pearson cu m = N-1 dacă valoarea X este distribuită normal.

Reamintim că parametrii de distribuție m sunt numerele de grade de libertate. În plus, se folosesc următoarele notații: - valoarea medie aritmetică, - valoarea medie pătrată egală cu rădăcina pătrată a varianței, [X] - estimarea valorii medii pătrate, definită ca rădăcina pătrată a estimării nepărtinitoare a varianței , N - dimensiunea eșantionului.

Funcțiile Z și t pot fi utilizate pentru a construi un interval de încredere pentru așteptări matematice, în timp ce se utilizează funcția c 2 se construiește un interval de încredere pentru varianță.


Să construim un interval de încredere pentru așteptarea matematică, cu condiția să avem la dispoziție rezultatele N observații ale unei valori X distribuite normal, iar valoarea pătrată medie să fie cunoscută dinainte din observații independente. Deoarece funcția Z este distribuită în mod normal, puteți utiliza tabelul corespunzător pentru a determina valoarea lui z a astfel încât dincolo de - z a și + z a să rămână o parte din aria de sub curba de distribuție în total egală cu a, în timp ce în [- z a ,+ z a ] există o parte din zonă , egală cu 1 - a. Ceea ce tocmai s-a spus corespunde următoarei afirmații probabilistice:

Р(- z a £ £+z a )= 1-a. (3,27)

(Probabilitatea de a satisface inegalitatea cuprinsă între acolade este 1-a.). Să transformăm expresia dintre paranteze:

Р(- z a )= 1 - a

Să numim valoarea 1-a = P d probabilitatea de încredere P d Conform (3.28), cu această probabilitate de încredere, intervalul de încredere pentru M[X] este dat de limitele:

. (3.29)

Comentariu: Scuze mesele distributie normala V diferite cărți nu sunt construite la fel. Uneori este dată integrala de probabilitate

Ф(z) =

Orice mostră oferă doar o idee aproximativă despre populatie, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță...) sunt o aproximare sau estimare a parametrilor generali, care în majoritatea cazurilor nu sunt posibil de calculat din cauza inaccesibilității populației generale (Figura 20).

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care se află, cu un anumit grad de probabilitate, valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci, valoarea medie generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t – valoarea de tabel a testului Student pentru α =0,05 și f= n-1

Un CI de 99% poate fi găsit, de asemenea, în acest caz t selectat pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mai mare a mediei și, în consecință, un CI mai larg. Și aceasta este baza pentru revenirea la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI oferă o estimare a faptului dacă rezultatele vor fi semnificative clinic

Să ne oprim în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Să ne amintim că sarcina statisticilor este de a detecta cel puțin unele diferențe în populațiile generale pe baza datelor eșantionului. Provocarea pentru clinicieni este de a detecta diferențele (nu oricare) care vor ajuta la diagnostic sau tratament. Iar concluziile statistice nu sunt întotdeauna la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă vreo problemă din corpul uman nu este răspândită la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Să ne uităm la această situație exemplu.

Cercetătorii s-au întrebat dacă băieții care au suferit de vreun fel de boală infecțioasă sunt în urmă față de semenii lor în creștere. În acest scop, s-a realizat un studiu tip eșantion la care au participat 10 băieți care au suferit această boală. Rezultatele sunt prezentate în Tabelul 23.

Tabelul 23. Rezultatele prelucrărilor statistice

limita inferioară

limita superioara

Standarde (cm)

medie

Din aceste calcule rezultă că eșantionul inaltime medie băieți de 10 ani care au suferit ceva boala infectioasa, aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „înălțime mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

Adesea, evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află proprietatea evaluată. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, așa că pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu se dovedește întotdeauna a fi omogen, uneori este necesar să îl curățați de punctele extreme - oferte de piață prea mari sau prea scăzute. În acest scop este folosit interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a selecta opțiunea optimă de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Intervalul de încredere este un interval de valori ale atributelor calculate pe baza unui eșantion, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Scopul calculării unui interval de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere conține valoarea necunoscută a valorii estimate cu o anumită probabilitate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol ne vom uita la 2 metode:

  • prin abaterea mediană și standard;
  • prin valoarea critică a t-statisticilor (coeficientul Student).

Etapele analizei comparative moduri diferite calcul CI:

1. formați un eșantion de date;

2. o procesăm folosind metode statistice: calculăm valoarea medie, mediana, varianța etc.;

3. calculați intervalul de încredere în două moduri;

4. analizați probele curățate și intervalele de încredere rezultate.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona a 3-a de preț cu aspectul de tip „Hrușciov”.

Tabelul 1. Proba inițială

Pret 1 mp, bucati

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei inițiale

Procesarea unui eșantion folosind metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediana este un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate sunt mai mici decât mediana

(pentru o mostră având număr impar valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosită pentru a estima mai precis variația datelor

5. Abaterea standard eșantion (în continuare - SD) este cel mai frecvent indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de împrăștiere a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul valorii medii

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem spune că eșantionul original nu este omogen, așa că să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calcul folosind mediana și abaterea standard.

Intervalul de încredere se determină astfel: valoare minimă - abaterea standard se scade din mediană; valoarea maximă - abaterea standard se adaugă la mediană.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori care se încadrează în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere folosind valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea „ Metode matematice Estimarea valorii proprietății” descrie o metodă pentru calcularea unui interval de încredere folosind coeficientul Student. Atunci când calculează folosind această metodă, estimatorul trebuie să stabilească el însuși nivelul de semnificație ∝, care determină probabilitatea cu care va fi construit intervalul de încredere. În mod obișnuit, sunt utilizate niveluri de semnificație de 0,1; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, se presupune că adevăratele valori ale așteptării și varianței matematice sunt practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de estimare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuția Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care se determină din tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDIST);

∝ - nivelul de semnificație, luați ∝=0,01.

Orez. 2. Valori care se încadrează în intervalul de încredere 2.

Etapa 4. Analiza diferitelor metode de calcul a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la sensuri diferite intervale. În consecință, am primit două mostre diferite curățate.

Tabelul 3. Statistici pentru trei eșantioane.

Indicator

Proba inițială

1 opțiune

Opțiunea 2

Valoare medie

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalului de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere în funcție de gradul de dezvoltare a pieței:

  • dacă piața este nedezvoltată, utilizați metoda de calcul folosind mediana și abaterea standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit următoarele:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de evaluare a valorii proprietatii. Moscova, 2014

2. System data estimatica.pro

Metoda de estimare a erorii aleatoare se bazează pe principiile teoriei probabilităților și ale statisticii matematice. O eroare aleatorie poate fi evaluată numai dacă aceeași cantitate este măsurată în mod repetat.

Să se obțină, în urma măsurătorilor efectuate n valorile valorice X: X 1 , X 2 , …, x n. Să notăm cu valoarea medie aritmetică

În teoria probabilității s-a dovedit că odată cu creșterea numărului de măsurători n valoarea medie aritmetică a valorii măsurate se apropie de valoarea adevărată:

Cu un număr mic de măsurători ( n£ 10) valoarea medie poate diferi semnificativ de valoarea reală. Pentru a cunoaște cât de exact o valoare caracterizează valoarea măsurată, este necesar să se determine așa-numitul interval de încredere al rezultatului obținut.

Deoarece o măsurare absolut exactă este imposibilă, probabilitatea ca afirmația să fie corectă „ cantitatea x are o valoare exact egală cu" este egal cu zero. Probabilitatea afirmației „ are x vreun sens?» este egal cu unu (100%). Astfel, probabilitatea corectitudinii oricărei afirmații intermediare se află în intervalul de la 0 la 1. Scopul măsurării este de a găsi un interval în care, cu o probabilitate predeterminată o(0 < o < 1) находится истинное значение измеряемой величины. Этот интервал называется interval de încredere , și cantitatea indisolubil legată de aceasta oprobabilitatea de încredere (sau coeficient de fiabilitate). Valoarea medie calculată folosind formula (3) este considerată mijlocul intervalului. Jumătate din lățimea intervalului de încredere reprezintă eroarea aleatorie D s x(Fig. 1).



Evident, lățimea intervalului de încredere (și, prin urmare, eroarea D s x) depinde de cât de mult diferă măsurătorile individuale ale cantității x i din valoarea medie. „Dispersia” rezultatelor măsurătorilor în raport cu medie este caracterizată de eroare pătratică medie s, care se găsește prin formula

, (4)

Lățimea intervalului de încredere dorit este direct proporțională cu eroarea pătratică medie:



. (5)

Factorul de proporționalitate tn,a numit Coeficientul elevului; depinde de numărul de experimente nși probabilitatea de încredere o.

În fig. 1, a, b se arată clar că, în egală măsură, pentru a crește probabilitatea ca valoarea adevărată să cadă în intervalul de încredere, este necesară creșterea lățimii acestuia din urmă (probabilitatea de „acoperire” a valorii X interval mai larg de mai sus). Prin urmare, valoarea tn,a ar trebui să fie mai mare, cu cât probabilitatea de încredere este mai mare o.

Odată cu creșterea numărului de experimente, valoarea medie se apropie de valoarea adevărată; deci cu aceeasi probabilitate o intervalul de încredere poate fi luat mai îngust (vezi Fig. 1, a,c). Astfel, cu creșterea n Coeficientul t ar trebui să scadă. Tabelul valorilor coeficientului Student în funcție de nŞi o este prezentată în anexele acestui manual.

Trebuie remarcat faptul că probabilitatea de încredere nu este în nici un fel legată de acuratețea rezultatului măsurării. Dimensiune o sunt specificate în prealabil pe baza cerințelor de fiabilitate a acestora. În majoritatea experimentelor tehnice și în atelier de laborator sens o se ia egal cu 0,95.

Calculul erorii de măsurare aleatoare a unei mărimi X efectuate în următoarea ordine:

1) se calculează suma valorilor măsurate, iar apoi se calculează valoarea medie conform formulei (3);

2) pentru toată lumea i al-lea experiment, se calculează diferența dintre valorile măsurate și cele medii, precum și pătratul acestei diferențe (abatere) (D x i) 2 ;

3) găsiți suma abaterilor pătrate și apoi eroarea pătratică medie s conform formulei (4);

4) în funcție de o probabilitate de încredere dată oși numărul de experimente efectuate n din tabelul de la p. 149 de aplicații selectează valoarea corespunzătoare a coeficientului Student tn,a iar eroarea aleatorie D este determinată s x conform formulei (5).

Pentru ușurință în calcul și verificare rezultate intermediare datele sunt introduse într-un tabel, ale cărui ultime trei coloane sunt completate conform modelului din tabelul 1.

Tabelul 1

Numărul de experiență X D X (D X) 2
n
S= S=

În fiecare caz specific valoarea X are o anumită semnificație fizică și unități de măsură corespunzătoare. Aceasta ar putea fi, de exemplu, accelerarea căderii libere g (Domnișoară 2), coeficientul de vâscozitate lichid h (Pa×s), etc. Lipsesc coloane din tabel 1 poate conține mărimi măsurate intermediare necesare pentru calcularea valorilor corespunzătoare X.

Exemplul 1. Pentru a determina accelerația O a fost măsurat timpul de mișcare a corpului t calea lor S fara viteza initiala. Folosind relația cunoscută, obținem formula de calcul

Rezultatele măsurării traseului S si timp t sunt date în a doua și a treia coloană a tabelului. 2. După ce am efectuat calcule conform formulei (6), completăm

a patra coloană cu valori de accelerație un iși găsiți suma lor, pe care o scriem sub această coloană în celula „S =”. Apoi calculăm valoarea medie folosind formula (3)

.

Tabelul 2

Numărul de experiență S, m t, c O, Domnișoară 2 D O, Domnișoară 2 (D O) 2 , (Domnișoară 2) 2
2,20 2,07 0,04 0,0016
2,68 1,95 -0,08 0,0064
2,91 2,13 0,10 0,0100
3,35 1,96 -0,07 0,0049
S= 8,11 S= 0,0229

Scăzând din fiecare valoare un i medie, găsiți diferențele D un iși puneți-le în coloana a cincea a tabelului. Punând la pătrat aceste diferențe, completăm ultima coloană. Apoi calculăm suma abaterilor pătrate și o scriem în a doua celulă „S =”. Folosind formula (4), determinăm eroarea pătratică medie:

.

Având în vedere valoarea probabilității de încredere o= 0,95, pentru numărul de experimente n= 4 din tabelul din anexe (pag. 149) selectați valoarea coeficientului Student tn,a= 3,18; folosind formula (5) estimăm eroarea aleatorie în măsurarea accelerației

D s a= 3,18×0,0437 » 0,139 ( Domnișoară 2) .

Estimarea intervalelor de încredere

Obiectivele de învățare

Statisticile iau în considerare următoarele două sarcini principale:

    Avem o estimare bazată pe date de eșantion și dorim să facem o declarație probabilistică despre unde se află adevărata valoare a parametrului estimat.

    Avem o ipoteză specifică care trebuie testată folosind date eșantion.

În acest subiect luăm în considerare prima sarcină. Să introducem și definiția unui interval de încredere.

Un interval de încredere este un interval care este construit în jurul valorii estimate a unui parametru și arată unde este situată valoarea adevărată a parametrului estimat cu o probabilitate specificată a priori.

După ce ați studiat materialul pe această temă, dvs.:

    afla ce este un interval de încredere pentru o estimare;

    învață să clasifice problemele statistice;

    stăpânește tehnica construirii intervalelor de încredere, atât folosind formule statistice, cât și cu instrumente software;

    învață să determine dimensiunile eșantionului necesare pentru a realiza anumiți parametri de acuratețe a estimărilor statistice.

Distribuția caracteristicilor eșantionului

distribuție T

După cum sa discutat mai sus, distribuția variabilei aleatoare este apropiată de distribuția normală standardizată cu parametrii 0 și 1. Deoarece nu cunoaștem valoarea lui σ, o înlocuim cu o estimare a lui s. Cantitatea are deja o distribuție diferită și anume sau Repartizarea elevilor, care este determinat de parametrul n -1 (numărul de grade de libertate). Această distribuție este apropiată de distribuția normală (cu cât n este mai mare, cu atât distribuțiile sunt mai apropiate).

În fig. 95
este prezentată distribuţia Student cu 30 de grade de libertate. După cum puteți vedea, este foarte aproape de distribuția normală.

Similar cu funcțiile pentru lucrul cu distribuția normală NORMIDIST și NORMINV, există funcții pentru lucrul cu distribuția t - STUDIST (TDIST) și STUDRASOBR (TINV). Un exemplu de utilizare a acestor funcții poate fi văzut în fișierul STUDRASP.XLS (șablon și soluție) și în Fig. 96
.

Distribuții ale altor caracteristici

După cum știm deja, pentru a determina acuratețea estimării așteptărilor matematice, avem nevoie de o distribuție t. Pentru a estima alți parametri, cum ar fi varianța, sunt necesare distribuții diferite. Două dintre ele sunt distribuția F și x 2 -distributie.

Interval de încredere pentru medie

Interval de încredere- acesta este un interval care este construit în jurul valorii estimate a parametrului și arată unde este situată valoarea reală a parametrului estimat cu o probabilitate specificată a priori.

Are loc construirea unui interval de încredere pentru valoarea medie după cum urmează:

Exemplu

Restaurantul fast-food plănuiește să-și extindă sortimentul cu un nou tip de sandviș. Pentru a estima cererea pentru acesta, managerul plănuiește să selecteze aleatoriu 40 de vizitatori dintre cei care l-au încercat deja și să le solicite să își evalueze atitudinea față de noul produs pe o scară de la 1 la 10. Managerul dorește să estimeze valoarea așteptată. numărul de puncte pe care noul produs le va primi și construiți un interval de încredere de 95% pentru această estimare. Cum să faci asta? (vezi fișierul SANDWICH1.XLS (șablon și soluție).

Soluţie

Pentru a rezolva această problemă puteți folosi . Rezultatele sunt prezentate în Fig. 97
.

Interval de încredere pentru valoarea totală

Uneori, folosind datele eșantionului, este necesar să se estimeze nu așteptările matematice, ci suma totală a valorilor. De exemplu, într-o situație cu un auditor, interesul poate fi estimarea nu a mărimii medii a contului, ci a sumei tuturor conturilor.

Fie N numărul total de elemente, n dimensiunea eșantionului, T 3 să fie suma valorilor din eșantion, T" să fie estimarea pentru suma pentru întreaga populație, apoi , iar intervalul de încredere este calculat prin formula în care s este estimarea abaterii standard pentru eșantion, este media estimată pentru eșantion.

Exemplu

Să presupunem că o agenție fiscală dorește să estimeze rambursările totale de taxe pentru 10.000 de contribuabili. Contribuabilul fie primește o rambursare, fie plătește taxe suplimentare. Găsiți intervalul de încredere de 95% pentru suma rambursării, presupunând o dimensiune a eșantionului de 500 de persoane (a se vedea fișierul SUMA REFUND.XLS (șablon și soluție).

Soluţie

StatPro nu are o procedură specială pentru acest caz, cu toate acestea, se poate observa că limitele pot fi obținute din limitele pentru medie pe baza formulelor de mai sus (Fig. 98).
).

Interval de încredere pentru proporție

Fie p așteptarea matematică a cotei clienților și fie p b estimarea acestei cote obținută dintr-un eșantion de mărimea n. Se poate demonstra că pentru suficient de mare distribuția evaluării va fi apropiată de normal cu așteptările matematice p și abaterea standard . Eroarea standard de estimare în acest caz este exprimată ca , iar intervalul de încredere este ca .

Exemplu

Restaurantul fast-food plănuiește să-și extindă sortimentul cu un nou tip de sandviș. Pentru a evalua cererea pentru acesta, managerul a selectat aleatoriu 40 de vizitatori dintre cei care l-au încercat deja și le-a cerut să își evalueze atitudinea față de noul produs pe o scară de la 1 la 10. Managerul dorește să estimeze proporția așteptată de clienții care evaluează noul produs cu cel puțin 6 puncte (se așteaptă ca acești clienți să fie consumatorii noului produs).

Soluţie

Inițial, creăm o nouă coloană pe baza atributului 1 dacă ratingul clientului a fost mai mare de 6 puncte și 0 în caz contrar (vezi fișierul SANDWICH2.XLS (șablon și soluție).

Metoda 1

Numărând numărul de 1, estimăm cota și apoi folosim formulele.

Valoarea zcr este luată din tabele speciale de distribuție normală (de exemplu, 1,96 pentru un interval de încredere de 95%).

Folosind această abordare și date specifice pentru a construi un interval de 95%, obținem următoarele rezultate (Fig. 99
). Valoarea critică a parametrului zcr este 1,96. Eroarea standard a estimării este 0,077. Limita inferioară a intervalului de încredere este 0,475. Limita superioară a intervalului de încredere este 0,775. Astfel, managerul are dreptul să creadă cu 95% de încredere că procentul de clienți care evaluează noul produs cu 6 puncte sau mai mult se va situa între 47,5 și 77,5.

Metoda 2

Această problemă poate fi rezolvată folosind instrumentele standard StatPro. Pentru a face acest lucru, este suficient să rețineți că cota în acest caz coincide cu valoarea medie a coloanei Tip. În continuare aplicăm StatPro/Inferență statistică/Analiza unui eșantion pentru a construi un interval de încredere al mediei (estimarea așteptărilor matematice) pentru coloana Tip. Rezultatele obţinute în acest caz vor fi foarte apropiate de rezultatele primei metode (Fig. 99).

Interval de încredere pentru abaterea standard

s este utilizat ca estimare a abaterii standard (formula este dată în secțiunea 1). Funcția de densitate a estimării s este funcția chi-pătrat, care, ca și distribuția t, are n-1 grade de libertate. Există funcții speciale pentru lucrul cu această distribuție CHIDIST și CHIINV.

Intervalul de încredere în acest caz nu va mai fi simetric. O diagramă de limite convențională este prezentată în Fig. 100.

Exemplu

Mașina trebuie să producă piese cu un diametru de 10 cm. Cu toate acestea, din diverse circumstanțe, apar erori. Controlorul de calitate este preocupat de două circumstanțe: în primul rând, valoarea medie ar trebui să fie de 10 cm; în al doilea rând, chiar și în acest caz, dacă abaterile sunt mari, atunci multe părți vor fi respinse. Zilnic face o mostră de 50 de părți (vezi fișierul CONTROL DE CALITATE.XLS (șablon și soluție). Ce concluzii poate da un astfel de eșantion?

Soluţie

Să construim intervale de încredere de 95% pentru medie și abaterea standard folosind StatPro/Inferență statistică/Analiza unui eșantion(Fig. 101
).

Apoi, folosind ipoteza unei distribuții normale a diametrelor, calculăm proporția de produse defecte, stabilind o abatere maximă de 0,065. Folosind capacitățile tabelului de substituție (cazul a doi parametri), graficăm dependența proporției defectelor de valoarea medie și abaterea standard (Fig. 102).
).

Interval de încredere pentru diferența dintre două medii

Aceasta este una dintre cele mai importante aplicații metode statistice. Exemple de situații.

    Un manager de magazin de îmbrăcăminte ar dori să știe cât cheltuie mai mult sau mai puțin clientul mediu de sex feminin în magazin decât clientul mediu de sex masculin.

    Cele două companii aeriene zboară pe rute similare. O organizație de consumatori ar dori să compare diferența dintre timpii medii de întârziere a zborului estimați pentru ambele companii aeriene.

    Compania trimite cupoane pentru anumite tipuri de mărfuri într-un oraș și nu în altul. Managerii doresc să compare volumele medii de achiziție ale acestor produse în următoarele două luni.

    Un dealer de mașini se ocupă adesea de cupluri căsătorite la prezentări. Pentru a înțelege reacțiile lor personale la prezentare, cuplurile sunt adesea intervievate separat. Managerul vrea să evalueze diferența dintre ratingurile acordate de bărbați și femei.

Cazul probelor independente

Diferența dintre medii va avea o distribuție t cu n 1 + n 2 - 2 grade de libertate. Intervalul de încredere pentru μ 1 - μ 2 este exprimat prin relația:

Această problemă poate fi rezolvată nu numai folosind formulele de mai sus, ci și folosind instrumentele standard StatPro. Pentru a face acest lucru, este suficient să utilizați

Interval de încredere pentru diferența dintre proporții

Să fie așteptarea matematică a acțiunilor. Fie estimările lor ale eșantionului, construite din eșantioane de dimensiunea n 1 și respectiv n 2. Atunci este o estimare a diferenței. Prin urmare, intervalul de încredere al acestei diferențe este exprimat astfel:

Aici z cr este o valoare obținută dintr-o distribuție normală folosind tabele speciale (de exemplu, 1,96 pentru un interval de încredere de 95%).

Eroarea standard de estimare este exprimată în acest caz prin relația:

.

Exemplu

Magazinul, pregătindu-se pentru o vânzare mare, a întreprins următoarele cercetări de marketing. Primii 300 de cumpărători au fost selectați și împărțiți aleatoriu în două grupuri a câte 150 de membri fiecare. Tuturor clienților selectați li s-au trimis invitații pentru a participa la vânzare, dar numai membrii primului grup au primit un cupon care le dă dreptul la o reducere de 5%. În timpul vânzării, au fost înregistrate achizițiile tuturor celor 300 de cumpărători selectați. Cum poate un manager să interpreteze rezultatele și să emită o judecată cu privire la eficacitatea cupoanelor? (vezi fișierul COUPONS.XLS (șablon și soluție)).

Soluţie

Pentru cazul nostru specific, din 150 de clienți care au primit un cupon de reducere, 55 au făcut o achiziție la vânzare, iar dintre cei 150 care nu au primit un cupon, doar 35 au făcut o achiziție (Fig. 103).
). Apoi, valorile proporțiilor eșantionului sunt 0,3667 și, respectiv, 0,2333. Și diferența de eșantion dintre ele este egală cu 0,1333, respectiv. Presupunând un interval de încredere de 95%, găsim din tabelul de distribuție normală z cr = 1,96. Calculul erorii standard a diferenței de eșantion este 0,0524. În cele din urmă constatăm că limita inferioară a intervalului de încredere de 95% este 0,0307, ​​​​iar limita superioară este 0,2359, respectiv. Rezultatele obținute pot fi interpretate în așa fel încât pentru fiecare 100 de clienți care au primit un cupon de reducere să ne așteptăm de la 3 până la 23 de clienți noi. Totuși, trebuie să ținem cont de faptul că această concluzie în sine nu înseamnă eficiența utilizării cupoanelor (întrucât prin acordarea unei reduceri pierdem profit!). Să demonstrăm acest lucru cu date specifice. Să presupunem că dimensiunea medie a achiziției este de 400 de ruble, din care 50 de ruble. există profit pentru magazin. Atunci profitul așteptat pentru 100 de clienți care nu au primit un cupon este:

50 0,2333 100 = 1166,50 rub.

Calcule similare pentru 100 de clienți care au primit un cupon oferă:

30 0,3667 100 = 1100,10 rub.

Scăderea profitului mediu la 30 se explică prin faptul că, folosind reducerea, clienții care au primit un cupon vor face în medie o achiziție de 380 de ruble.

Astfel, concluzia finală indică ineficacitatea utilizării unor astfel de cupoane în această situație particulară.

Comentariu. Această problemă poate fi rezolvată folosind instrumentele standard StatPro. Pentru a face acest lucru, este suficient să reduceți această problemă la problema estimării diferenței dintre două medii folosind metoda și apoi să aplicați StatPro/Inferență statistică/Analiza cu două eșantioane pentru a construi un interval de încredere pentru diferența dintre două valori medii.

Controlul lungimii intervalului de încredere

Lungimea intervalului de încredere depinde de urmatoarele conditii:

    date direct (abatere standard);

    nivelul de semnificație;

    dimensiunea eșantionului.

Dimensiunea eșantionului pentru estimarea mediei

În primul rând, să luăm în considerare problema în cazul general. Să notăm valoarea jumătății din lungimea intervalului de încredere dat nouă ca B (Fig. 104).
). Știm că intervalul de încredere pentru valoarea medie a unei variabile aleatoare X este exprimat ca , Unde . a crede:

și exprimând n, obținem .

Din păcate, nu știm valoarea exactă a varianței variabilei aleatoare X. În plus, nu cunoaștem valoarea lui tcr, deoarece depinde de n prin numărul de grade de libertate. În această situație, putem face următoarele. În loc de varianța s, folosim o estimare a varianței bazată pe orice implementări disponibile ale variabilei aleatoare studiate. În loc de valoarea t cr, folosim valoarea z cr pentru distribuția normală. Acest lucru este destul de acceptabil, deoarece funcțiile de densitate de distribuție pentru distribuțiile normale și t sunt foarte apropiate (cu excepția cazului n mic). Astfel, formula necesară ia forma:

.

Deoarece formula dă, în general vorbind, rezultate non-întregi, rotunjirea cu un exces din rezultat este luată ca dimensiune a eșantionului dorită.

Exemplu

Restaurantul fast-food plănuiește să-și extindă sortimentul cu un nou tip de sandviș. Pentru a evalua cererea pentru acesta, managerul plănuiește să selecteze aleatoriu un număr de vizitatori dintre cei care l-au încercat deja și să le solicite să-și evalueze atitudinea față de noul produs pe o scară de la 1 la 10. Managerul dorește să estimeze numărul așteptat de puncte pe care noul produs le va primi produs și construiți un interval de încredere de 95% pentru această estimare. În același timp, el dorește ca jumătatea lățimii intervalului de încredere să nu depășească 0,3. Câți vizitatori trebuie să intervieveze?

arata asa:

Aici r ots este o estimare a proporției p, iar B este o jumătate dată din lungimea intervalului de încredere. O supraestimare pentru n poate fi obținută folosind valoarea r ots= 0,5. În acest caz, lungimea intervalului de încredere nu va depăși valoarea specificată B pentru orice valoare adevărată a lui p.

Exemplu

Lăsați managerul din exemplul anterior să planifice să estimeze ponderea clienților care au preferat un nou tip de produs. El vrea să construiască un interval de încredere de 90% a cărui jumătate de lungime nu depășește 0,05. Câți clienți ar trebui să fie incluși în eșantionul aleatoriu?

Soluţie

În cazul nostru, valoarea lui z cr = 1,645. Prin urmare, cantitatea necesară este calculată ca .

Dacă managerul ar avea motive să creadă că valoarea p dorită este, de exemplu, aproximativ 0,3, atunci prin înlocuirea acestei valori în formula de mai sus, am obține o valoare ale eșantionului aleatoriu mai mică, și anume 228.

Formula de determinare mărimea eșantionului aleatoriu în cazul diferenței dintre două medii scris ca:

.

Exemplu

O companie de calculatoare are un centru de servicii pentru clienți. Recent, a crescut numărul de plângeri ale clienților cu privire la calitatea slabă a serviciilor. Centrul de servicii angajează în principal două tipuri de angajați: cei care nu au prea multă experiență, dar care au absolvit de specialitate. cursuri pregătitoare, și având un mare experiență practică, dar nu au urmat cursuri speciale. Compania dorește să analizeze reclamațiile clienților din ultimele șase luni și să compare numărul mediu de reclamații pentru fiecare dintre cele două grupuri de angajați. Se presupune că numerele din eșantioane pentru ambele grupuri vor fi aceleași. Câți angajați trebuie să fie incluși în eșantion pentru a obține un interval de 95% cu o jumătate de lungime de cel mult 2?

Soluţie

Aici σ ots este o estimare a abaterii standard a ambelor variabile aleatoare în ipoteza că acestea sunt apropiate. Astfel, în problema noastră trebuie să obținem cumva această estimare. Acest lucru se poate face, de exemplu, după cum urmează. După ce a analizat datele privind reclamațiile clienților din ultimele șase luni, un manager poate observa că fiecare angajat primește în general de la 6 la 36 de reclamații. Știind că, pentru o distribuție normală, aproape toate valorile sunt la cel mult trei abateri standard de la medie, el poate crede în mod rezonabil că:

Unde are σ ots = 5.

Înlocuind această valoare în formulă, obținem .

Formula de determinare mărimea eşantionului aleatoriu în cazul estimării diferenţei dintre proporţii are forma:

Exemplu

O anumită companie are două fabrici care produc produse similare. Un manager de companie dorește să compare procentul de produse defecte din ambele fabrici. Conform informațiilor disponibile, rata defectelor la ambele fabrici variază de la 3 la 5%. Este intenționat să construiască un interval de încredere de 99% cu o jumătate de lungime de cel mult 0,005 (sau 0,5%). Câte produse trebuie selectate din fiecare fabrică?

Soluţie

Aici p 1ots și p 2ots sunt estimări ale a două cote necunoscute de defecte la prima și a doua fabrică. Dacă punem p 1ots = p 2ots = 0,5, atunci obținem o valoare supraestimată pentru n. Dar din moment ce în cazul nostru avem câteva informații a priori despre aceste acțiuni, luăm estimarea superioară a acestor acțiuni și anume 0,05. Primim

Atunci când se estimează unii parametri ai populației din datele eșantionului, este util să se dea nu numai o estimare punctuală a parametrului, ci și să se furnizeze un interval de încredere care arată unde se poate afla valoarea exactă a parametrului estimat.

În acest capitol ne-am familiarizat și cu relații cantitative care ne permit să construim astfel de intervale pentru diverși parametri; a învățat modalități de a controla durata intervalului de încredere.

Rețineți, de asemenea, că problema estimării dimensiunilor eșantionului (problema planificării unui experiment) poate fi rezolvată folosind instrumente standard StatPro, și anume StatPro/Inferență statistică/Selectare dimensiune eșantion.

Articole înrudite

2024 liveps.ru. Teme și probleme gata făcute în chimie și biologie.