Legea distribuției unei variabile aleatoare discrete. Exemple de rezolvare a problemelor

Definiția 3. X are legea distribuției normale (legea lui Gauss), dacă densitatea sa de distribuție are forma:

Unde m = M(X), σ 2 = D(X), σ > 0 .

Curba de distribuție normală se numește curba normala sau gaussiana(Fig. 6.7).

O curbă normală este simetrică în raport cu o linie dreaptă x = m, are un maxim la punct x = m, egal .

Funcția de distribuție variabilă aleatoare X, distribuit conform legii normale, se exprimă prin funcția Laplace Ф( X) conform formulei:

F( x) – Funcția Laplace.

Comentariu. Funcția Ф( X) este impar (Ф(- X) = -F( X)), în plus, când X> 5 poate fi considerat Ф( X) ≈ 1/2.

Tabelul de valori al funcției Ф( X) este dat în anexă (Tabelul P 2.2).

Graficul funcției de distribuție F(x) este prezentată în fig. 6.8.

Probabilitatea ca variabila aleatoare X să ia valori aparținând intervalului ( a;b) se calculează prin formula:

R(o< X < b ) = .

Probabilitatea ca valoarea absolută a abaterii unei variabile aleatoare de la ea așteptări matematice Mai puțin număr pozitivδ se calculează folosind formula:

P(| X - m| .

În special, când m=0 egalitatea este adevărată:

P(| X | .

„Regula celor trei sigma”

Dacă variabila aleatoare X are o lege de distribuție normală cu parametri mși σ, atunci este aproape sigur că valorile sale se află în intervalul ( m 3σ; m+ 3σ), deoarece P(| X - m| = 0,9973.

Problema 6.3. Variabila aleatoare X este distribuit normal cu o așteptare matematică de 32 și o varianță de 16. Aflați: a) densitatea distribuției probabilităților f(x);

X va lua valoarea din intervalul (28;38). Soluţie: m După condiție

= 32, σ 2 = 16, prin urmare, σ = 4, atunci

O)

R(b) Să folosim formula:< o )= .

X Înlocuind= 28, o= 38, m b

R(28< o < 38)= = 32, σ= 4, obținem

F(1,5) F(1) X Conform tabelului cu valorile funcției Φ(

) găsim Ф(1,5) = 0,4332, Ф(1) = 0,3413.

P(28

Deci, probabilitatea dorită:

6.1. Variabila aleatoare X Sarcini

distribuite uniform în intervalul (-3;5). Găsi: f(x);

a) densitatea distribuţiei F(x);

b) funcţii de distribuţie

c) caracteristici numerice; R(4<X<6).

6.2. Variabila aleatoare X d) probabilitate

distribuite uniform în intervalul (-3;5). Găsi: f(x);

distribuite uniform pe segment. Găsi: F(x);

b) funcţii de distribuţie

c) caracteristici numerice; R(3≤X≤6).

6.3. b) funcţia de distribuţie


6.4. Trenurile de metrou circulă regulat la intervale de 2 minute. Un pasager intră pe platformă la un moment dat. Care este probabilitatea ca un pasager să fie nevoit să aștepte mai mult de 50 de secunde pentru un tren? Aflați așteptările matematice ale unei variabile aleatoare X- timpul de așteptare a trenului.

6.5. Aflați varianța și abaterea standard a distribuției exponențiale date de funcția de distribuție:

6.6. Variabilă aleatoare continuă X dat de densitatea distribuției de probabilitate:

a) Numiți legea de distribuție a variabilei aleatoare luate în considerare.

b) Aflați funcția de distribuție F(x) și caracteristicile numerice ale unei variabile aleatoare X.

6.7. Variabila aleatoare X distribuite conform legii exponențiale specificate de densitatea distribuției de probabilitate:

X va lua o valoare din intervalul (2,5;5).

6.8. Variabilă aleatoare continuă X distribuit conform legii exponențiale specificate de funcția de distribuție:

Găsiți probabilitatea ca în urma testului X va lua valoarea din segmentul .

6.9. Valoarea așteptată și abaterea standard a unei variabile aleatoare distribuite normal sunt 8 și, respectiv, 2.

a) densitatea distribuții f(x);

b) probabilitatea ca în urma testului X va lua o valoare din intervalul (10;14).

6.10. Variabila aleatoare X distribuit normal cu o așteptare matematică de 3,5 și o varianță de 0,04. Găsi:

distribuite uniform în intervalul (-3;5). Găsi: f(x);

b) probabilitatea ca în urma testului X va lua valoarea din segmentul .

6.11. Variabila aleatoare X distribuite în mod normal cu M(X) = 0 și D(X)= 1. Care dintre evenimente: | X|≤0,6 sau | X|≥0,6 este mai probabil?

6.12. Variabila aleatoare X distribuite în mod normal cu M(X) = 0 și D(X)= 1. Din ce interval (-0,5; -0,1) sau (1; 2) este mai probabil să ia o valoare în timpul unui test?

6.13. Prețul curent pe acțiune poate fi modelat folosind o distribuție normală cu M(X)= 10 zile unitati și σ( X) = 0,3 den. unitati Găsi:

a) probabilitatea ca prețul curent al acțiunii să fie de la 9,8 den. unitati până la 10,4 zile unități;

b) folosind „regula trei sigma”, găsiți limitele în care se va afla prețul actual al acțiunilor.

6.14. Se cântărește substanța fără erori sistematice. Erorile de cântărire aleatoare sunt supuse legii normale cu o abatere standard σ= 5g. Aflați probabilitatea ca în patru experimente independente eroarea în trei cântăriri să nu depășească 3 g în valoare absolută.

6.15. Variabila aleatoare X distribuite în mod normal cu M(X)= 12.6. Probabilitatea ca o variabilă aleatoare să cadă în intervalul (11,4; 13,8) este 0,6826. Găsiți abaterea standard σ.

6.16. Variabila aleatoare X distribuite în mod normal cu M(X) = 12 și D(X) = 36. Aflați intervalul în care, cu o probabilitate de 0,9973, variabila aleatoare va cădea în urma testului X.

6.17. O piesă produsă de o mașină automată este considerată defectă dacă abaterea X parametrul său controlat depășește valoarea nominală cu 2 unități de măsură. Se presupune că variabila aleatoare X distribuite în mod normal cu M(X) = 0 și σ( X) = 0,7. Ce procent de piese defecte produce mașina?

3.18. Parametru X piesele sunt distribuite normal cu o așteptare matematică de 2 egală cu valoarea nominală și o abatere standard de 0,014. Găsiți probabilitatea ca abaterea X din valoarea nominală nu va depăşi 1% din valoarea nominală.

Răspunsuri

V) M(X)=1, D(X)=16/3, σ( X)= 4/ , d)1/8.



V) M(X)=4,5, D(X) =2 , σ ( X)= , d)3/5.


6.3. 40/51.

6.4. 7/12, M(X)=1.


6.5. D(X) = 1/64, σ ( X)=1/8

6.6. M(X)=1 , D(X) =2 , σ ( X)= 1 .


6.7. P(2,5<X<5)=e -1 e -2 ≈0,2325 6.8. P(2≤ X≤5)=0,252.


b) R(10 < X < 14) ≈ 0,1574.

b) R(3,1 ≤ X ≤ 3,7) ≈ 0,8185.


6.11. |x|≥0,6.

6.12. (-0,5; -0,1).


6.13. a) P(9,8 ≤ X ≤ 10,4) ≈ 0,6562 6.14. 0,111.

b) (9,1; 10,9).


6.15. σ = 1,2.

6.16. (-6; 30).

6.17. 0,4 %.

– numărul băieților din 10 nou-născuți.

Este absolut clar că acest număr nu este cunoscut în prealabil, iar următorii zece copii născuți pot include:

Sau baieti - unul si numai unul din opțiunile enumerate.

Și, pentru a fi în formă, puțină educație fizică:

- distanta de saritura in lungime (în unele unități).

Nici măcar un maestru al sportului nu o poate prezice :)

Totuși, ipotezele tale?

2) Variabilă aleatoare continuă – acceptă Toate valori numerice dintr-un interval finit sau infinit.

Nota : abrevierile DSV și NSV sunt populare în literatura educațională

Mai întâi, să analizăm variabila aleatoare discretă, apoi - continuu.

Legea distribuției unei variabile aleatoare discrete

- Asta corespondenţăîntre valorile posibile ale acestei mărimi și probabilitățile acestora. Cel mai adesea, legea este scrisă într-un tabel:

Termenul apare destul de des rând distributie, dar în unele situații sună ambiguu, așa că voi rămâne la „lege”.

Și acum punct foarte important: din moment ce variabila aleatoare Neapărat va accepta una dintre valori, apoi se formează evenimentele corespunzătoare grup complet iar suma probabilităților apariției lor este egală cu unu:

sau, dacă este scris condensat:

Deci, de exemplu, legea distribuției probabilității a punctelor aruncate pe un zar are următoarea formă:

Fara comentarii.

Este posibil să aveți impresia că o variabilă aleatoare discretă poate lua numai valori întregi „bune”. Să risipim iluzia - pot fi orice:

Exemplul 1

Un joc are următoarea lege de distribuție câștigătoare:

...probabil că ai visat de mult timp la astfel de sarcini :) Îți spun un secret - și eu. Mai ales după terminarea lucrărilor teoria câmpului.

Soluţie: deoarece o variabilă aleatoare poate lua doar una din trei valori, se formează evenimentele corespunzătoare grup complet, ceea ce înseamnă că suma probabilităților lor este egală cu unu:

Demascarea „partizanului”:

– astfel, probabilitatea de a câștiga unități convenționale este de 0,4.

Control: de asta trebuia să ne asigurăm.

Răspuns:

Nu este neobișnuit când trebuie să întocmești singur o lege de distribuție. Pentru aceasta folosesc definiția clasică a probabilității, teoreme de înmulțire/adunare pentru probabilitățile de evenimenteși alte chips-uri tervera:

Exemplul 2

Cutia conține 50 de bilete de loterie, dintre care 12 sunt câștigătoare, iar 2 dintre ele câștigă câte 1000 de ruble fiecare, iar restul - câte 100 de ruble fiecare. Întocmește o lege pentru distribuirea unei variabile aleatoare - mărimea câștigurilor, dacă un bilet este extras la întâmplare din casetă.

Soluţie: după cum ați observat, valorile unei variabile aleatoare sunt de obicei plasate în în ordine crescătoare. Prin urmare, începem cu cele mai mici câștiguri, și anume ruble.

Sunt 50 de astfel de bilete în total - 12 = 38, și conform definiție clasică:
– probabilitatea ca un bilet extras aleatoriu să fie învins.

În alte cazuri, totul este simplu. Probabilitatea de a câștiga ruble este:

Verificați: – și acesta este un moment deosebit de plăcut al unor astfel de sarcini!

Răspuns: legea dorită de distribuire a câștigurilor:

Următoarea sarcină este pe care o puteți rezolva singur:

Exemplul 3

Probabilitatea ca trăgătorul să lovească ținta este de . Întocmește o lege de distribuție pentru o variabilă aleatorie - numărul de lovituri după 2 lovituri.

...știam că ți-a fost dor de el :) Să ne amintim teoreme de înmulțire și adunare. Soluția și răspunsul sunt la sfârșitul lecției.

Legea distribuției descrie complet o variabilă aleatoare, dar în practică poate fi util (și uneori mai util) să cunoști doar o parte din ea. caracteristici numerice .

Așteptarea unei variabile aleatoare discrete

În termeni simpli, asta este valoarea medie aşteptată când testarea se repetă de mai multe ori. Lăsați variabila aleatoare să ia valori cu probabilități respectiv. Atunci așteptarea matematică a acestei variabile aleatoare este egală cu suma de produse toate valorile sale la probabilitățile corespunzătoare:

sau prăbușit:

Să calculăm, de exemplu, așteptarea matematică a unei variabile aleatoare - numărul de puncte aruncate pe un zar:

Acum să ne amintim jocul nostru ipotetic:

Apare întrebarea: este profitabil să joci acest joc? ...cine are impresii? Așa că nu o poți spune „de la îndemână”! Dar la această întrebare se poate răspunde cu ușurință prin calcularea așteptărilor matematice, în esență - medie ponderată după probabilitatea de câștig:

Astfel, așteptările matematice ale acestui joc pierzând.

Nu ai încredere în impresiile tale - ai încredere în cifre!

Da, aici poți câștiga de 10 sau chiar de 20-30 de ori la rând, dar pe termen lung ne așteaptă o ruină inevitabilă. Și nu te-aș sfătui să joci astfel de jocuri :) Ei bine, poate doar pentru distracție.

Din toate cele de mai sus rezultă că așteptarea matematică nu mai este o valoare RANDOM.

Sarcina creativă pentru cercetare independentă:

Exemplul 4

Domnul X joacă la ruleta europeană folosind următorul sistem: pariază constant 100 de ruble pe „roșu”. Întocmește o lege de distribuție a unei variabile aleatoare - câștigurile acesteia. Calculați așteptările matematice ale câștigurilor și rotunjiți-o la copecul cel mai apropiat. Câți în medie Pierde jucătorul pentru fiecare sută pe care a pariat?

Referinţă : Ruleta europeană conține 18 sectoare roșii, 18 negre și 1 verde („zero”). Dacă apare un „roșu”, jucătorul este plătit dublu pariul, în caz contrar, acesta merge la venitul cazinoului

Există multe alte sisteme de ruletă pentru care vă puteți crea propriile tabele de probabilitate. Dar acesta este cazul când nu avem nevoie de nicio lege sau tabele de distribuție, pentru că s-a stabilit cu siguranță că așteptările matematice ale jucătorului vor fi exact aceleași. Singurul lucru care se schimbă de la sistem la sistem este

1.2.4. Variabile aleatoare și distribuțiile lor

Distribuții ale variabilelor aleatoare și funcții de distribuție. Distribuția unei variabile aleatoare numerice este o funcție care determină în mod unic probabilitatea ca variabila aleatoare să ia o valoare dată sau să aparțină unui interval dat.

Prima este dacă variabila aleatoare ia un număr finit de valori. Atunci distribuția este dată de funcție P(X = x), atribuirea fiecărei valori posibile X variabilă aleatoare X probabilitatea ca X = x.

Al doilea este dacă variabila aleatoare ia infinit de valori. Acest lucru este posibil numai atunci când spațiul probabilistic pe care este definită variabila aleatoare constă dintr-un număr infinit de evenimente elementare. Atunci distribuția este dată de mulțimea probabilităților P(a < X pentru toate perechile de numere a, b astfel încât b) Să folosim formula: . Distribuția poate fi specificată folosind așa-numitul. funcția de distribuție F(x) = P(X definitoriu pentru toate reale X probabilitatea ca variabila aleatoare X ia valori mai mici decât X. Este clar că

P(a < X

Această relație arată că atât distribuția poate fi calculată din funcția de distribuție, cât și, invers, funcția de distribuție poate fi calculată din distribuție.

Folosit în probabilism metode statistice luarea deciziilor și altele cercetare aplicata Funcțiile de distribuție sunt fie discrete, fie continue sau combinații ale acestora.

Funcțiile de distribuție discretă corespund variabilelor aleatoare discrete care iau un număr finit de valori sau valori dintr-o mulțime ale cărei elemente pot fi numerotate prin numere naturale (astfel de mulțimi sunt numite numărabile în matematică). Graficul lor arată ca o scară în trepte (Fig. 1).

Exemplul 1. Număr X articolele defecte dintr-un lot iau o valoare de 0 cu o probabilitate de 0,3, o valoare de 1 cu o probabilitate de 0,4, o valoare de 2 cu o probabilitate de 0,2 și o valoare de 3 cu o probabilitate de 0,1. Graficul funcției de distribuție a unei variabile aleatoare X prezentat în Fig. 1.

Fig.1. Graficul funcției de distribuție a numărului de produse defecte.

Funcțiile de distribuție continuă nu au salturi. Ele cresc monoton pe măsură ce argumentul crește - de la 0 la 1 la . Variabilele aleatoare care au funcții de distribuție continuă se numesc continue.

Funcțiile de distribuție continuă utilizate în metodele decizionale probabilistic-statistice au derivate. Prima derivată f(x) functii de distributie F(x) se numește densitate de probabilitate,

Folosind densitatea de probabilitate, puteți determina funcția de distribuție:

Pentru orice funcție de distribuție

Proprietățile enumerate ale funcțiilor de distribuție sunt utilizate în mod constant în metodele probabilistice și statistice de luare a deciziilor. În special, ultima egalitate implică o formă specifică de constante în formulele pentru densitățile de probabilitate considerate mai jos.

Exemplul 2. Următoarea funcție de distribuție este adesea folosită:

(1)

Unde ÎnlocuindŞi o– unele numere, b) Să folosim formula: . Să găsim densitatea de probabilitate a acestei funcții de distribuție:

(la puncte x = aŞi x = b derivata unei functii F(x) nu există).

O variabilă aleatoare cu funcție de distribuție (1) se numește „distribuită uniform pe intervalul [ o; b]».

Funcțiile de distribuție mixte apar, în special, atunci când observațiile se opresc la un moment dat. De exemplu, atunci când se analizează datele statistice obținute din utilizarea planurilor de testare a fiabilității care prevăd încetarea testării după o anumită perioadă. Sau la analiza datelor despre produse tehnice care necesitau reparații în garanție.

Exemplul 3. Să fie, de exemplu, durata de viață a unui bec electric o variabilă aleatorie cu funcție de distribuție F(t), iar testul se efectuează până când becul se defectează, dacă aceasta are loc în mai puțin de 100 de ore de la începutul testului, sau până când t 0= 100 de ore. Lasă G(t)– functie de distributie a timpului de functionare al becului in stare buna in timpul acestei incercari. Apoi

Funcţie G(t) are un salt la un punct t 0, deoarece variabila aleatoare corespunzătoare ia valoarea t 0 cu probabilitate 1- F(t 0)> 0.

Caracteristicile variabilelor aleatoare.În metodele probabilistic-statistice de luare a deciziilor se folosesc o serie de caracteristici ale variabilelor aleatoare, exprimate prin funcții de distribuție și densități de probabilitate.

Când se descrie diferențierea veniturilor, când se găsesc limite de încredere pentru parametrii distribuțiilor variabilelor aleatoare și în multe alte cazuri, se folosește un astfel de concept precum „quantila de ordine”. r", unde 0< p < 1 (обозначается x p). Comandă cuantilă r– valoarea unei variabile aleatoare pentru care funcția de distribuție ia valoarea r sau există un „salt” de la o valoare mai mică r la o valoare mai mare r(Fig. 2). Se poate întâmpla ca această condiție să fie îndeplinită pentru toate valorile lui x aparținând acestui interval (adică funcția de distribuție este constantă pe acest interval și este egală cu r). Apoi fiecare astfel de valoare este numită „cuantilă de ordine” r" Pentru funcțiile de distribuție continuă, de regulă, există o singură cuantilă x p comanda r(Fig. 2) și

F(x p) = p. (2)

Fig.2. Definiţia quantile x p comanda r.

Exemplul 4. Să găsim cuantila x p comanda r pentru funcția de distribuție F(x) din (1).

La 0< p < 1 квантиль x p se găsește din ecuație

aceste. x p = a + p(b – a) = a( 1- p) +bp. La p= 0 oricare x < o este o cuantilă de ordine p= 0. Cuantila de ordin p= 1 este orice număr x > b.

Pentru distribuțiile discrete, de regulă, nu există x p, care satisface ecuația (2). Mai precis, dacă distribuția unei variabile aleatoare este dată în Tabelul 1, unde x 1< x 2 < … < x k , apoi egalitatea (2), considerată ca o ecuație în raport cu x p, are solutii doar pt k valorile p, și anume,

p = p 1 ,

p = p 1 + p 2 ,

p = p 1 + p 2 + p 3 ,

p = p 1 + p 2 + …+ p m, 3 < m < k,

p = p 1 + p 2 + … + p k.

Tabelul 1.

Distribuția unei variabile aleatoare discrete

Pentru cei enumerați k valori de probabilitate p soluţie x p ecuația (2) nu este unică, și anume,

F(x) = p 1 + p 2 + … + p m

pentru toată lumea X astfel încât x m< x < x m+1. Aceste. x p – orice număr din interval (x m; x m+1). Pentru toți ceilalți r din intervalul (0;1), neinclus în lista (3), există un „salt” de la o valoare mai mică r la o valoare mai mare r. Și anume dacă

p 1 + p 2 + … + p m

x p = x m+1.

Proprietatea considerată a distribuțiilor discrete creează dificultăți semnificative la tabelarea și utilizarea unor astfel de distribuții, deoarece este imposibil să se mențină cu exactitate valorile numerice tipice ale caracteristicilor distribuției. În special, acest lucru este valabil pentru valorile critice și nivelurile de semnificație ale testelor statistice neparametrice (a se vedea mai jos), deoarece distribuțiile statisticilor acestor teste sunt discrete.

Ordinea cuantilelor este de mare importanță în statistică r= ½. Se numește mediană (variabilă aleatoare X sau funcţiile sale de distribuţie F(x)) si este desemnat Eu (X).În geometrie există conceptul de „mediană” - o linie dreaptă care trece prin vârful unui triunghi și își împarte latura opusă în jumătate. În statistica matematică, mediana împarte în jumătate nu latura triunghiului, ci distribuția unei variabile aleatoare: egalitatea F(x 0,5)= 0,5 înseamnă că probabilitatea de a ajunge la stânga x 0,5și probabilitatea de a ajunge la dreapta x 0,5(sau direct la x 0,5) sunt egale între ele și egale cu ½, adică

P(X < x 0,5) = P(X > x 0,5) = ½.

Mediana indică „centrul” distribuției. Din punctul de vedere al unuia dintre conceptele moderne - teoria procedeelor ​​statistice stabile - mediana este o caracteristică mai bună a unei variabile aleatoare decât așteptarea matematică. Când se prelucrează rezultatele măsurătorilor pe o scară ordinală (vezi capitolul despre teoria măsurării), mediana poate fi folosită, dar așteptările matematice nu.

O caracteristică a unei variabile aleatoare, cum ar fi modul, are o semnificație clară - valoarea (sau valorile) unei variabile aleatoare corespunzătoare maximului local al densității de probabilitate pentru o variabilă aleatoare continuă sau maximului local al probabilității pentru o variabilă aleatoare discretă .

Dacă x 0– modul unei variabile aleatoare cu densitate f(x), apoi, după cum se știe din calculul diferențial, .

O variabilă aleatoare poate avea mai multe moduri. Deci, pentru distribuția uniformă (1) fiecare punct X astfel încât o< x < b , este moda.

Cu toate acestea, aceasta este o excepție. Majoritatea variabilelor aleatoare utilizate în metodele statistice probabilistice de luare a deciziilor și alte cercetări aplicate au un singur mod. Variabilele aleatoare, densitățile, distribuțiile care au un singur mod sunt numite unimodale. X Așteptările matematice pentru variabile aleatoare discrete cu un număr finit de valori sunt discutate în capitolul „Evenimente și probabilități”. Pentru o variabilă aleatoare continuă așteptări matematice M(X)

satisface egalitatea

care este un analog al formulei (5) din afirmația 2 din capitolul „Evenimente și probabilități”. Exemplul 5. X Așteptări pentru o variabilă aleatoare distribuită uniform

Pentru variabilele aleatoare luate în considerare în acest capitol, sunt adevărate toate acele proprietăți ale așteptărilor și varianțelor matematice care au fost luate în considerare mai devreme pentru variabile aleatoare discrete cu un număr finit de valori. Cu toate acestea, nu oferim dovezi ale acestor proprietăți, deoarece ele necesită aprofundarea subtilităților matematice, ceea ce nu este necesar pentru înțelegerea și aplicarea calificată a metodelor probabilistic-statistice de luare a deciziilor.

Comentariu. Acest manual evită în mod conștient subtilitățile matematice asociate, în special, cu conceptele de mulțimi măsurabile și funcții măsurabile, algebra evenimentelor etc. Cei care doresc să stăpânească aceste concepte ar trebui să apeleze la literatura de specialitate, în special, la enciclopedie.

Fiecare dintre cele trei caracteristici - așteptare matematică, mediană, mod - descrie „centrul” distribuției probabilităților. Conceptul de „centru” poate fi definit în moduri diferite - de aici trei caracteristici diferite. Cu toate acestea, pentru o clasă importantă de distribuții — simetric unimodal — toate cele trei caracteristici coincid.

Densitatea de distribuție f(x)– densitatea distribuției simetrice, dacă există un număr x 0 astfel încât

. (3)

Egalitatea (3) înseamnă că graficul funcției y = f(x) simetric față de o linie verticală care trece prin centrul de simetrie X = X 0 . Din (3) rezultă că funcția de distribuție simetrică satisface relația

(4)

Pentru o distribuție simetrică cu un singur mod, așteptarea matematică, mediana și modul coincid și sunt egale x 0.

Cel mai important caz este simetria în jurul 0, adică. x 0= 0. Atunci (3) și (4) devin egalități

(6)

respectiv. Relațiile de mai sus arată că nu este nevoie să se tabulare distribuțiile simetrice pentru toate X, este suficient sa ai mese la x > x 0.

Să remarcăm încă o proprietate a distribuțiilor simetrice, care este utilizată constant în metodele probabilistic-statistice de luare a deciziilor și alte cercetări aplicate. Pentru o funcție de distribuție continuă

P(|X| < a) = P(-a < X < a) = F(a) – F(-a),

Unde F– funcția de distribuție a unei variabile aleatoare X. Dacă funcţia de distribuţie F este simetric în jurul valorii de 0, adică formula (6) este valabilă pentru aceasta, atunci

P(|X| < a) = 2F(a) – 1.

Deseori se foloseşte o altă formulare a enunţului în cauză: dacă

.

Dacă și sunt cuantile de ordin și, respectiv (vezi (2)) ale unei funcții de distribuție simetrice în jurul lui 0, atunci din (6) rezultă că

Din caracteristicile poziției - așteptare matematică, mediană, mod - să trecem la caracteristicile răspândirii variabilei aleatoare X: varianță, abatere standard și coeficient de variație v. Definiția și proprietățile dispersiei pentru variabile aleatoare discrete au fost discutate în capitolul anterior. Pentru variabile aleatoare continue

Abaterea standard este valoarea nenegativă a rădăcinii pătrate a varianței:

Coeficientul de variație este raportul dintre abaterea standard și așteptările matematice:

Coeficientul de variație se aplică atunci când M(X)> 0. Măsoară răspândirea în unități relative, în timp ce abaterea standard este în unități absolute.

Exemplul 6. Pentru o variabilă aleatoare distribuită uniform X Să găsim dispersia, abaterea standard și coeficientul de variație. Varianta este:

Schimbarea variabilei face posibilă scrierea:

Unde c = (oÎnlocuind)/ 2. Prin urmare, abaterea standard este egală cu și coeficientul de variație este:

Pentru fiecare variabilă aleatoare X determina inca trei marimi - centrate Y, normalizat Vși dat U. Variabilă aleatoare centrată Y este diferența dintre o variabilă aleatoare dată Xși așteptările sale matematice M(X), aceste. Y = X – M(X). Așteptarea unei variabile aleatoare centrate Y este egal cu 0, iar varianța este varianța unei variabile aleatoare date: M(Y) = 0, D(Y) = D(X). Funcția de distribuție F Y(x) variabilă aleatoare centrată Y legate de funcţia de distribuţie F(x) variabilă aleatoare inițială X raport:

F Y(x) = F(x + M(X)).

Densitățile acestor variabile aleatoare au următoarea egalitate:

f Y(x) = f(x + M(X)).

Variabilă aleatorie normalizată V este raportul unei variabile aleatoare date X la abaterea sa standard, adică . Așteptările și varianța unei variabile aleatoare normalizate V exprimate prin caracteristici X Aşa:

,

Unde v– coeficientul de variație al variabilei aleatoare inițiale X. Pentru funcția de distribuție F V(x) si densitate f V(x) variabilă aleatoare normalizată V avem:

Unde F(x) – funcția de distribuție a variabilei aleatoare originale X, A f(x) – densitatea sa de probabilitate.

Variabilă aleatoare redusă U este o variabilă aleatoare centrată și normalizată:

.

Pentru variabila aleatoare dată

Variabile aleatoare normalizate, centrate și reduse sunt utilizate în mod constant atât în ​​studii teoretice, cât și în algoritmi, produse software, documentație de reglementare, tehnică și instrucțională. În special, pentru că egalitățile fac posibilă simplificarea justificării metodelor, formularea de teoreme și formule de calcul.

Se folosesc transformări ale variabilelor aleatoare și altele mai generale. Deci, dacă Y = topor + o, Unde ÎnlocuindŞi o– niște numere, atunci

Exemplul 7. Dacă atunci Y este variabila aleatoare redusă, iar formulele (8) se transformă în formule (7).

Cu fiecare variabilă aleatoare X puteți asocia multe variabile aleatoare Y, dat de formula Y = topor + o la diferit Înlocuind> 0 și o. Acest set se numește familie cu schimbare la scară, generat de variabila aleatoare X. Funcții de distribuție F Y(x) constituie o familie de distribuții cu schimbare la scară generată de funcția de distribuție F(x). În loc de Y = topor + o folosesc adesea înregistrarea

Număr Cu se numește parametrul de schimbare și numărul d- parametrul de scară. Formula (9) arată că X– rezultatul măsurării unei anumite cantități – intră în U– rezultatul măsurării aceleiași mărimi dacă începutul măsurării este mutat la punct Cu, apoi utilizați noua unitate de măsură, în d ori mai mare decât cea veche.

Pentru familia scale-shift (9), distribuția lui X se numește standard. În metodele statistice probabilistice de luare a deciziilor și alte cercetări aplicate, sunt utilizate distribuția normală standard, distribuția standard Weibull-Gnedenko, distribuția gamma standard etc. (vezi mai jos).

Sunt folosite și alte transformări ale variabilelor aleatoare. De exemplu, pentru o variabilă aleatoare pozitivă X iau în considerare Y= jurnal X, unde lg X– logaritmul zecimal al unui număr X.

Lanț de egalități F Y (x) = P( X< x) = P(X < 10lg 10x) = F(

x) XŞi Y.

conectează funcțiile de distribuție X La procesarea datelor, sunt utilizate următoarele caracteristici ale unei variabile aleatorii ca momente de ordine q , adică așteptările matematice ale unei variabile aleatorii, ca momente de ordine Xq ca momente de ordine= 1, 2, ... Astfel, așteptarea matematică în sine este un moment de ordin 1. Pentru o variabilă aleatoare discretă, momentul de ordin

poate fi calculat ca

Pentru o variabilă aleatoare continuă ca momente de ordine Momente de ordine ca momente de ordine, numite și momente inițiale de ordine ca momente de ordine, spre deosebire de caracteristicile conexe – momente centrale de ordine

dat de formula

Astfel, dispersia este un moment central de ordinul 2. Distribuția normală și teorema limitei centrale.

În metodele probabilistic-statistice de luare a deciziilor vorbim adesea despre distribuție normală. Uneori încearcă să-l folosească pentru a modela distribuția datelor inițiale (aceste încercări nu sunt întotdeauna justificate - vezi mai jos). Mai important, multe metode de procesare a datelor se bazează pe faptul că valorile calculate au distribuții apropiate de normal. X 1 , X 2 ,…, Lasă M(X n) = m X i D(X n) = , și variații = 1, 2,…, i n

,... După cum rezultă din rezultatele capitolului anterior, Luați în considerare variabila aleatoare redusă U n pentru suma

, și anume, M(Luați în considerare variabila aleatoare redusă) = 0, D(Luați în considerare variabila aleatoare redusă) = 1.

După cum rezultă din formulele (7), X 1 , X 2 ,…, Lasă, … – variabile aleatoare independente distribuite identic cu așteptări matematice M(X n) = m X i D(X n) = , și variații = 1, 2,…, i,... Atunci pentru orice x există o limită

Unde F(x)– funcția de distribuție normală standard.

Mai multe despre caracteristică F(x) – mai jos (citiți „phi din x”, pentru că F- Literă majusculă grecească „phi”).

Teorema limită centrală (CLT) își primește numele deoarece este rezultatul matematic central, cel mai frecvent utilizat al teoriei probabilităților și al statisticii matematice. Istoria CLT durează aproximativ 200 de ani - din 1730, când matematicianul englez A. Moivre (1667-1754) a publicat primul rezultat legat de CLT (vezi mai jos despre teorema Moivre-Laplace), până în anii douăzeci și treizeci de ani. secolul al XX-lea, când Finn J.W. Lindeberg, francezul Paul Levy (1886-1971), iugoslav V. Feller (1906-1970), rusul A.Ya. Khinchin (1894-1959) și alți oameni de știință au obținut condiții necesare și suficiente pentru valabilitatea teoremei limitei centrale clasice.

Dezvoltarea subiectului luat în considerare nu s-a oprit aici - au studiat variabile aleatoare care nu au dispersie, adică. cei pentru care

(academician B.V. Gnedenko și alții), situație în care variabile aleatoare (mai precis, elemente aleatoare) de natură mai complexă decât numerele sunt însumate (academicienii Yu.V. Prokhorov, A.A. Borovkov și asociații lor), etc. .d.

Funcția de distribuție F(x) este dat de egalitate

,

unde este densitatea distribuției normale standard, care are o expresie destul de complexă:

.

Aici =3,1415925... este un număr cunoscut în geometrie, egal cu raportul dintre circumferință și diametru, e = 2,718281828... - baza logaritmilor naturali (pentru a reține acest număr, rețineți că 1828 este anul nașterii scriitorului L.N. Tolstoi). După cum se știe din analiza matematică,

La procesarea rezultatelor observației, funcția de distribuție normală nu este calculată folosind formulele date, ci este găsită folosind tabele speciale sau programe de calculator. Cele mai bune „Tabele de statistici matematice” în limba rusă au fost întocmite de membrii corespunzători ai Academiei de Științe a URSS L.N. Bolşev şi N.V. Smirnov.

Forma densității distribuției normale standard decurge din teoria matematică, pe care nu o putem considera aici, precum și demonstrația CLT.

Pentru ilustrare, oferim mici tabele ale funcției de distribuție F(x)(Tabelul 2) și cuantilele sale (Tabelul 3). Funcţie F(x) simetric în jurul valorii de 0, care este reflectat în Tabelul 2-3.

Tabelul 2.

Funcția de distribuție normală standard.

Dacă variabila aleatoare X are o funcție de distribuție F(x),așteptări matematice = 0, D(X) = 1. Această afirmație este dovedită în teoria probabilității pe baza formei densității probabilității. Este în concordanță cu o afirmație similară pentru caracteristicile variabilei aleatoare reduse Luați în considerare variabila aleatoare redusă, ceea ce este destul de firesc, întrucât CLT precizează că, cu o creștere nelimitată a numărului de termeni, funcția de distribuție Luați în considerare variabila aleatoare redusă tinde spre funcția de distribuție normală standard F(x), si pentru orice X.

Tabelul 3.

Cuantile ale distribuției normale standard.

Comandă cuantilă r

Comandă cuantilă r

Să introducem conceptul de familie de distribuții normale. Prin definiție, o distribuție normală este distribuția unei variabile aleatoare X, pentru care distribuția variabilei aleatoare reduse este F(x). După cum rezultă din proprietățile generale ale familiilor de distribuții cu schimbare la scară (vezi mai sus), o distribuție normală este o distribuție a unei variabile aleatoare

Unde X– variabilă aleatoare cu distribuție F(X),şi m = M(Y), = D(Y). Distribuție normală cu parametrii de schimbare m iar scara este de obicei indicată N(m, ) (uneori se folosește notația N(m, ) ).

După cum rezultă din (8), densitatea de probabilitate a distribuției normale N(m, ) Există

Distribuțiile normale formează o familie cu schimbare la scară. În acest caz, parametrul scară este d= 1/ și parametrul de deplasare c = - m/ .

Pentru momentele centrale de ordinul trei și al patrulea ale distribuției normale sunt valabile următoarele egalități:

Aceste egalități formează baza metodelor clasice de verificare a faptului că observațiile urmează o distribuție normală. În zilele noastre se recomandă de obicei testarea normalității folosind criteriul W Shapiro - Wilka. Problema testării normalității este discutată mai jos.

Dacă variabile aleatorii X 1Şi X 2 au funcții de distribuție N(m 1 , 1) Şi N(m 2 , 2) în consecință, atunci X 1+ X 2 are o distributie Prin urmare, dacă variabile aleatoare X 1 , X 2 ,…, Lasă N(m, ) , apoi media lor aritmetică

are o distributie N(m, ) . Aceste proprietăți ale distribuției normale sunt utilizate în mod constant în diferite metode probabilistice și statistice de luare a deciziilor, în special, în reglementarea statistică a proceselor tehnologice și în controlul acceptării statistice bazat pe criterii cantitative.

Folosind distribuția normală, sunt definite trei distribuții care sunt acum adesea folosite în procesarea datelor statistice.

Distribuție (chi - pătrat) – distribuția unei variabile aleatoare

unde sunt variabilele aleatoare X 1 , X 2 ,…, Lasă independente și au aceeași distribuție N(0,1). În acest caz, numărul de termeni, adică i, se numește „numărul de grade de libertate” al distribuției chi-pătrat.

Distributie t t al lui Student este distribuția unei variabile aleatoare

unde sunt variabilele aleatoare UŞi X independent, U are o distribuție normală standard N(0,1) și X– distribuția chi – pătratul c i grade de libertate. În același timp i se numește „numărul de grade de libertate” al distribuției Student. Această distribuție a fost introdusă în 1908 de statisticianul englez W. Gosset, care lucra la o fabrică de bere.

Pentru luarea deciziilor economice și tehnice la această fabrică au fost folosite metode probabilistice și statistice, așa că conducerea acesteia i-a interzis lui V. Gosset să publice articole științifice sub nume propriu. În acest fel au fost protejate secretele comerciale și „know-how” sub forma metodelor probabilistice și statistice dezvoltate de V. Gosset. A avut însă ocazia să publice sub pseudonimul „Student”. Istoria Gosset-Student arată că încă o sută de ani, managerii din Marea Britanie au fost conștienți de eficiența economică mai mare a metodelor probabilistic-statistice de luare a deciziilor.

unde sunt variabilele aleatoare X 1Şi X 2 Distribuția Fisher este distribuția unei variabile aleatoare k 1 Şi k 2 sunt independente și au distribuții chi-pătrat cu numărul de grade de libertate (k 1 , k 2 ) respectiv. În același timp, cuplul k 1 – o pereche de „grade de libertate” ale distribuției Fisher și anume, k 2 este numărul de grade de libertate ale numărătorului și

– numărul de grade de libertate al numitorului. Distribuția variabilei aleatoare F este numită după marele statistician englez R. Fisher (1890-1962), care a folosit-o activ în lucrările sale.

Expresiile pentru funcțiile de distribuție chi-pătrat, Student și Fisher, densitățile și caracteristicile acestora, precum și tabele pot fi găsite în literatura de specialitate (vezi, de exemplu,).

După cum sa menționat deja, distribuțiile normale sunt acum adesea folosite în modele probabilistice în diferite domenii aplicate. Care este motivul pentru care această familie de distribuții cu doi parametri este atât de răspândită? Se clarifică prin următoarea teoremă. X 1 , X 2 ,…, Lasă Teorema limitei centrale M(X 1 (pentru termeni distribuiti diferit). LasăX 2 ,… - variabile aleatoare independente cu așteptări matematiceX), M( D(X 1 ), D(X 2 ),…, D(X),…, M(

n), ... și variațiile Luați în considerare variabila aleatoare redusă,

n), ... respectiv. Lasă X.

Apoi, dacă anumite condiții sunt valabile, asigurându-se că contribuția oricăruia dintre condițiile în

Teorema limită centrală arată că în cazul în care rezultatul unei măsurători (observări) se formează sub influența mai multor cauze, fiecare dintre ele aducând doar o mică contribuție, iar rezultatul total este determinat. aditiv, adică

prin adăugare, atunci distribuția rezultatului măsurării (observării) este aproape de normal. X Uneori se crede că pentru ca distribuția să fie normală, este suficient ca rezultatul măsurării (observării) X se formează sub influența mai multor motive, fiecare dintre ele având un impact mic. Acest lucru este greșit. Ceea ce contează este modul în care acţionează aceste cauze. Dacă este aditiv, atunci are o distribuție aproximativ normală. Dacăîn mod multiplicativ X(adică acțiunile cauzelor individuale sunt multiplicate și nu adăugate), apoi distribuția X aproape nu de normal, ci de așa-zis. normal din punct de vedere logaritmic, adică Nu X, iar log X are o distribuție aproximativ normală.

Dacă nu există niciun motiv să credem că unul dintre aceste două mecanisme pentru formarea rezultatului final funcționează (sau un alt mecanism bine definit), atunci despre distribuție

nimic cert nu se poate spune. Din cele de mai sus rezultă că într-o problemă aplicată specifică, normalitatea rezultatelor măsurătorilor (observațiilor), de regulă, nu poate fi stabilită din considerații generale, aceasta trebuie verificată folosind criterii statistice; Sau utilizați metode statistice neparametrice care nu se bazează pe ipoteze despre apartenența funcțiilor de distribuție a rezultatelor măsurătorilor (observații) la una sau la alta familie de parametri.

Distribuții continue utilizate în metodele probabilistice și statistice de luare a deciziilor. XÎn plus față de familia de distribuții normale cu schimbare la scară, o serie de alte familii de distribuții sunt utilizate pe scară largă - distribuții lognormale, exponențiale, Weibull-Gnedenko, gamma. Y= jurnal X Să ne uităm la aceste familii. Variabila aleatoare are o distribuție lognormală dacă variabila aleatoare X = 2,3026…Y are o distribuție normală. Apoi N(Înlocuind 1 Z= jurnal X are de asemenea o distribuție normală X,σ 1)

, unde ln X = X 1 X 2 Lasă- logaritmul natural X n, și variații = 1, 2,…, i. i poate fi aproximată printr-o distribuție lognormală. În special, modelul multiplicativ al formării salariilor sau veniturilor conduce la recomandarea de a aproxima distribuțiile salariilor și veniturilor prin legi normale din punct de vedere logaritmic. Pentru Rusia, această recomandare s-a dovedit a fi justificată - datele statistice o confirmă.

Există și alte modele probabilistice care conduc la legea lognormală.

Un exemplu clasic de astfel de model a fost dat de A.N Kolmogorov, care, dintr-un sistem de postulate bazat fizic, a ajuns la concluzia că dimensiunile particulelor la zdrobirea bucăților de minereu, cărbune etc. în morile cu bile au o distribuţie lognormală. X Să trecem la o altă familie de distribuții, utilizată pe scară largă în diverse metode probabilistic-statistice de luare a deciziilor și alte cercetări aplicate - familia distribuțiilor exponențiale. Să începem cu un model probabilistic care duce la astfel de distribuții. Pentru a face acest lucru, luați în considerare „fluxul de evenimente”, adică. o succesiune de evenimente care au loc unul după altul în anumite momente în timp. Exemplele includ: fluxul de apeluri la o centrală telefonică; fluxul defecțiunilor echipamentelor în lanțul tehnologic; fluxul de defecțiuni ale produsului în timpul testării produsului; fluxul cererilor clienților către sucursala băncii; fluxul de cumpărători care solicită bunuri și servicii etc. În teoria fluxurilor de evenimente este valabilă o teoremă similară teoremei limitei centrale, dar nu este vorba despre însumarea variabilelor aleatoare, ci despre însumarea fluxurilor de evenimente. Considerăm un debit total compus dintr-un număr mare de fluxuri independente, niciunul dintre care nu are o influență predominantă asupra debitului total. De exemplu, un flux de apeluri care intră într-o centrală telefonică este compus dintr-un număr mare de fluxuri de apeluri independente care provin de la abonați individuali. S-a dovedit că în cazul în care caracteristicile fluxurilor nu depind de timp, debitul total este complet descris printr-un număr - intensitatea fluxului. Pentru debitul total, luați în considerare variabila aleatoare

(10)

- lungimea intervalului de timp dintre evenimente succesive. Funcția sa de distribuție are forma eAceastă distribuție se numește distribuție exponențială deoarece formula (10) implică funcția exponențială x Cu. Valoarea 1/λ este un parametru de scară. Uneori este introdus și un parametru de schimbare , distribuția unei variabile aleatoare se numește exponențială X + s X, unde distribuția

Distribuțiile exponențiale sunt un caz special al așa-numitelor. Distribuții Weibull - Gnedenko. Ele sunt numite după numele inginerului V. Weibull, care a introdus aceste distribuții în practica analizării rezultatelor testelor de oboseală, și ale matematicianului B.V. Gnedenko (1912-1995), care au primit astfel de distribuții ca fiind limitative la studierea maximului. a rezultatelor testelor. Lasă X- o variabilă aleatorie care caracterizează durata de funcționare a unui produs, sistem complex, element (adică resursă, timp de funcționare până la o stare limită etc.), durata de funcționare a unei întreprinderi sau viața unei ființe vii etc. Intensitatea eșecului joacă un rol important

(11)

Unde F(x) Şi f(x) - funcţia de distribuţie şi densitatea unei variabile aleatoare X.

Să descriem comportamentul tipic al ratei de eșec. Întregul interval de timp poate fi împărțit în trei perioade. Pe primul dintre ele funcţia λ(x) are valori ridicate și o tendință clară de scădere (cel mai adesea scade monoton). Acest lucru poate fi explicat prin prezența în lotul de unități de produs în cauză cu defecte evidente și ascunse, care duc la o defecțiune relativ rapidă a acestor unități de produs. Prima perioadă se numește „perioada de evaziune” (sau „perioada de evaziune”). Aceasta este ceea ce acoperă de obicei perioada de garanție.

Urmează apoi o perioadă de funcționare normală, caracterizată printr-o rată de eșec aproximativ constantă și relativ scăzută. Natura defecțiunilor în această perioadă este bruscă (accidente, erori ale personalului de exploatare etc.) și nu depinde de durata de funcționare a unității de produs.

În sfârșit, ultima perioadă de funcționare este perioada de îmbătrânire și uzură. Natura defecțiunilor în această perioadă este în modificări fizice, mecanice și chimice ireversibile ale materialelor, ducând la o deteriorare progresivă a calității unei unități de produs și defecțiunea finală a acesteia.

Fiecare perioadă are propriul său tip de funcție λ(x). Să luăm în considerare clasa dependențelor de putere

λ(x) = λ 0bx b -1 , (12)

Unde λ 0 > 0 și o> 0 - unii parametri numerici. Valori o < 1, o= 0 și o> 1 corespund tipului de defecțiune în perioadele de rodare, de funcționare normală și, respectiv, de îmbătrânire.

Relația (11) la o rată de eșec dată λ(x)- ecuație diferențială pentru o funcție F(x). Din teoria ecuaţiilor diferenţiale rezultă că

(13)

Înlocuind (12) în (13), obținem că

(14)

Distribuția dată de formula (14) se numește distribuție Weibull - Gnedenko. Din moment ce

apoi din formula (14) rezultă că cantitatea O, dat de formula (15), este un parametru de scară. F(x - c Uneori este introdus și un parametru de schimbare, de ex. Se numesc funcțiile de distribuție Weibull-Gnedenko F(x), Unde o.

) este dat de formula (14) pentru unele λ 0 și

(16)

Unde Înlocuind Densitatea de distribuție Weibull-Gnedenko are forma o> 0 - parametrul de scară, Cu> 0 - parametru de formă, O- parametrul de schimbare. În acest caz, parametrul λ din formula (16) este asociat cu parametrul

0 din formula (14) prin relația specificată în formula (15). o = 1.

Distribuția exponențială este un caz foarte special al distribuției Weibull-Gnedenko, corespunzătoare valorii parametrului de formă. X 1 , X 2 ,…, Lasă Distribuția Weibull-Gnedenko este, de asemenea, utilizată în construirea modelelor probabilistice ale situațiilor în care comportamentul unui obiect este determinat de „cea mai slabă verigă”. Există o analogie cu un lanț, a cărui siguranță este determinată de veriga care are cea mai mică rezistență. Cu alte cuvinte, lasă

- variabile aleatoare independente distribuite identic, X(1) =min(), X 1, X 2,…, X n X(n) =max().

X 1, X 2,…, X n X(1) Şi X(i) Într-o serie de probleme aplicate, acestea joacă un rol important X(1) Şi X(i) , în special, atunci când se studiază valorile maxime posibile („înregistrări”) ale anumitor valori, de exemplu, plăți de asigurare sau pierderi datorate riscurilor comerciale, atunci când se studiază limitele de elasticitate și rezistență ale oțelului, o serie de caracteristici de fiabilitate etc. . Se arată că pentru n mari distribuţiile X(1) Şi X(i) , de regulă, sunt bine descrise de distribuțiile Weibull-Gnedenko. Contribuție fundamentală la studiul distribuțiilor

contribuit de matematicianul sovietic B.V. Gnedenko. Lucrările lui V. Weibull, E. Gumbel, V.B sunt dedicate utilizării rezultatelor obținute în economie, management, tehnologie și alte domenii. Nevzorova, E.M. Kudlaev și mulți alți specialiști. k Să trecem la familia distribuțiilor gamma. Ele sunt utilizate pe scară largă în economie și management, teoria și practica fiabilității și testării, în diverse domenii ale tehnologiei, meteorologiei etc. În special, în multe situații, distribuția gamma este supusă unor cantități precum durata de viață totală a produsului, lungimea lanțului de particule conductoare de praf, timpul în care produsul atinge starea limită în timpul coroziunii, timpul de funcționare până la k- al-lea refuz,

= 1, 2, … etc. Speranța de viață a pacienților cu boli cronice și timpul pentru a obține un anumit efect în timpul tratamentului au în unele cazuri o distribuție gamma. Această distribuție este cea mai adecvată pentru descrierea cererii în modelele economice și matematice de gestionare a stocurilor (logistică).

(17)

Densitatea de probabilitate din formula (17) este determinată de trei parametri Înlocuind, o, c, Unde Înlocuind>0, o>0. În același timp Înlocuind este un parametru de formă, o- parametrul de scară și Cu- parametrul de schimbare. Factor 1/Γ(а) se normalizează, a fost introdus

Aici Γ(a)- una dintre funcțiile speciale utilizate în matematică, așa-numita „funcție gamma”, după care se numește distribuția dată de formula (17),

La fix O formula (17) specifică o familie de distribuții cu deplasare la scară generată de o distribuție cu densitate

(18)

O distribuție de forma (18) se numește distribuție gamma standard. Se obține din formula (17) la o= 1 și Cu= 0.

Un caz special de distribuții gamma pentru O= 1 sunt distribuții exponențiale (cu λ = 1/o). Cu naturale OŞi Cu=0 distribuțiile gamma se numesc distribuții Erlang. Din lucrările savantului danez K.A Erlang (1878-1929), angajat al Companiei de telefonie din Copenhaga, care a studiat în 1908-1922. funcţionarea reţelelor de telefonie, a început dezvoltarea teoriei cozilor de aşteptare. Această teorie se ocupă de modelarea probabilistică și statistică a sistemelor în care un flux de cereri este deservit pentru a lua decizii optime. Distribuțiile Erlang sunt utilizate în aceleași domenii de aplicație în care sunt utilizate distribuțiile exponențiale. Aceasta se bazează pe următoarele fapt matematic Cu: suma k variabile aleatoare independente, distribuite exponențial cu aceiași parametri λ și , are o distribuție gamma cu un parametru de formăk a = o, parametrul de scară = 1/λ și parametrul de deplasare. La Cu kc

Dacă variabila aleatoare X= 0 obținem distribuția Erlang. O are o distribuție gamma cu un parametru de formă d = 2 Înlocuind astfel încât o= 1 și Cu- întreg, X= 0, apoi 2 d are o distribuție chi-pătrat cu

Distribuții continue utilizate în metodele probabilistice și statistice de luare a deciziilor. X grade de libertate.

cu distribuția gvmma are următoarele caracteristici: AşteptareM(X) = + c,

ab D(X) = σ 2 = M(X) = 2 ,

Varianta

Coeficientul de variație

Asimetrie

Exces

n), ... respectiv. Lasă Distribuția normală este un caz extrem al distribuției gamma. Mai precis, să fie Z o variabilă aleatoare având o distribuție gamma standard dată de formula (18). Apoi X număr real F(x), Unde N(0,1).

- functie de distributie normala standard

În cercetarea aplicată se folosesc și alte familii parametrice de distribuții, dintre care cele mai cunoscute sunt sistemul de curbe Pearson, seria Edgeworth și Charlier. Ele nu sunt luate în considerare aici. Discret Cele mai frecvent utilizate sunt trei familii de distribuții discrete - binomială, hipergeometrică și Poisson, precum și alte familii - geometrice, binom negative, multinomiale, hipergeometrice negative etc.

După cum sa menționat deja, distribuția binomială are loc în încercări independente, în fiecare dintre acestea cu probabilitate r apare evenimentul O. i Dacă numărul total de încercări Y dat, apoi numărul de teste O, în care a apărut evenimentul , are o distribuție binomială. Pentru distribuție binomială Y probabilitatea de a fi acceptată ca variabilă aleatoare valorile y

este determinat de formula i Numărul de combinații de valorile elemente prin valorile, cunoscut din combinatorică. Pentru toată lumea i, cu excepția 0, 1, 2, …, P(Y= valorile)= , avem i 0. Distribuție binomială cu dimensiunea eșantionului fix p este specificat de parametru

Dacă Y 1 Şi Y 2 , adică distribuțiile binomiale formează o familie cu un singur parametru. Ele sunt utilizate în analiza datelor din studiile eșantionului, în special în studiul preferințelor consumatorilor, controlul selectiv al calității produselor conform planurilor de control într-o singură etapă, la testarea populațiilor de indivizi în demografie, sociologie, medicină, biologie etc. . p 0 - variabile aleatoare binomiale independente cu același parametru i 1 Şi i 2 în consecință, atunci Y 1 + Y 2 , determinat din probe cu volume r = p 0 Şi i = i 1 + i 2 - variabilă aleatoare binomială având distribuţia (19) cu

. Această remarcă extinde aplicabilitatea distribuției binomiale permițând combinarea rezultatelor mai multor grupuri de teste atunci când există motive să credem că același parametru corespunde tuturor acestor grupuri.

M(Y) = Caracteristicile distribuției binomiale au fost calculate mai devreme:, D(Y) = Caracteristicile distribuției binomiale au fost calculate mai devreme:( 1- p).

n.p.

În secțiunea „Evenimente și probabilități” legea numerelor mari este dovedită pentru o variabilă aleatoare binomială: Y/ i pentru oricine. Folosind teorema limitei centrale, legea numerelor mari poate fi rafinată indicând cât r.

diferit de Teorema lui De Moivre-Laplace. o, Înlocuind< o Pentru orice numere a și

Unde F(X, avem

) este o funcție a distribuției normale standard cu așteptarea matematică 0 și varianța 1. Y Pentru a dovedi, este suficient să folosim reprezentarea M(Y) Şi D(Y) sub forma unei sume de variabile aleatoare independente corespunzătoare rezultatelor testelor individuale, formule pentru

și teorema limitei centrale. r Această teoremă este pentru caz

Distribuția hipergeometrică are loc în timpul controlului selectiv al unui set finit de obiecte de volum N conform unui criteriu alternativ. Fiecare obiect controlat este clasificat fie ca având atributul O, sau ca neavând această caracteristică. Distribuția hipergeometrică are o variabilă aleatorie Y, egală cu numărul obiecte care au caracteristica Oîntr-o probă aleatorie de volum i, Unde i< N. De exemplu, numărul Y unități defecte de produs într-un eșantion aleatoriu de volum i din volumul lotului N are o distribuţie hipergeometrică dacă i< N. Un alt exemplu este loteria. Lasă semnul O biletul este un semn de „a fi un câștigător”. Lăsați numărul total de bilete N, și o persoană dobândită i dintre ei. Atunci numărul de bilete câștigătoare pentru această persoană are o distribuție hipergeometrică.

Pentru o distribuție hipergeometrică, probabilitatea ca o variabilă aleatoare Y să accepte valoarea y are forma

(20)

Unde D– numărul de obiecte care au atributul O, în setul considerat de volum N. În același timp valorile ia valori de la max(0, i - (N - D)) la min( i, D), alte lucruri valorile probabilitatea din formula (20) este egală cu 0. Astfel, distribuția hipergeometrică este determinată de trei parametri - volum populatia N, numărul de obiecte Dîn ea, posedând caracteristica în cauză O, și dimensiunea eșantionului i.

Eșantionare simplă aleatoare a volumului i din volumul total N este un eșantion obținut ca urmare a selecției aleatorii în care oricare dintre seturile de i obiectele au aceeași probabilitate de a fi selectate. Metodele de selectare aleatorie a eșantioanelor de respondenți (intervievați) sau a unităților de mărfuri sunt discutate în documentele de instrucție, metodologice și de reglementare. Una dintre metodele de selecție este aceasta: obiectele sunt selectate unul din altul, iar la fiecare pas, fiecare dintre obiectele rămase din set are aceeași șansă de a fi selectat. În literatură, termenii „eșantion aleatoriu” și „eșantion aleatoriu fără returnare” sunt utilizați și pentru tipul de eșantioane luate în considerare.

Deoarece volumele populației (lotul) Nși mostre i sunt de obicei cunoscute, atunci parametrul distribuției hipergeometrice de estimat este D. În metodele statistice de management al calității produselor D– de obicei numărul de unități defecte dintr-un lot. D/ N Caracteristica distribuției este, de asemenea, de interes

– nivelul defectelor.

Pentru distribuția hipergeometrică N>10 i Ultimul factor din expresia pentru varianță este aproape de 1 dacă p = D/ N, atunci expresiile pentru așteptarea și varianța matematică a distribuției hipergeometrice se vor transforma în expresii pentru așteptarea și varianța matematică a distribuției binomiale. Aceasta nu este o coincidență. Se poate arăta că

la N>10 i, Unde p = D/ N. Raportul limitativ este valabil

iar această relaţie limitativă poate fi folosită când N>10 i.

A treia distribuție discretă utilizată pe scară largă este distribuția Poisson.

,

Variabila aleatoare Y are o distribuție Poisson dacă P(Y= valorile)= unde λ este parametrul distribuției Poisson și valorile 0 pentru toate celelalte

M(Y) = λ, D(Y) = λ.

(pentru y=0 este desemnat 0! =1). Pentru distribuția Poisson r Această distribuție este numită după matematicianul francez S. D. Poisson (1781-1840), care a obținut-o pentru prima dată în 1837. Distribuția Poisson este cazul limită al distribuției binomiale, când probabilitatea i implementarea evenimentului este mică, dar numărul de teste Caracteristicile distribuției binomiale au fost calculate mai devreme: grozav, și

= λ. Mai exact, relația limită este valabilă

Prin urmare, distribuția Poisson (în vechea terminologie „legea distribuției”) este adesea numită și „legea evenimentelor rare”. t Distribuția Poisson își are originea în teoria fluxului de evenimente (vezi mai sus). S-a dovedit că pentru cel mai simplu flux cu intensitate constantă Λ, numărul de evenimente (apeluri) care au loc în timpul t, are o distribuție Poisson cu parametrul λ = Λ t. Prin urmare, probabilitatea ca pe parcursul timpului e - Λ nu va avea loc nici un eveniment, egal cu t

, adică funcţia de distribuţie a lungimii intervalului dintre evenimente este exponenţială. Distribuția Poisson este utilizată atunci când se analizează rezultatele sondajelor de marketing prin eșantion ale consumatorilor, se calculează caracteristicile operaționale ale planurilor de control al acceptării statistice în cazul valorilor scăzute ale nivelului de acceptare a defectelor, pentru a descrie numărul de defecțiuni ale unui control statistic. proces tehnologic

pe unitatea de timp, numărul de „cereri de servicii” care intră în sistemul de așteptare pe unitatea de timp, modelele statistice ale accidentelor și bolilor rare etc. Descrierea altor familii parametrice de distribuții discrete și posibilitățile acestora utilizare practică


sunt luate în considerare în literatură.

În unele cazuri, de exemplu, atunci când se studiază prețurile, volumele de producție sau timpul total dintre eșecurile problemelor de fiabilitate, funcțiile de distribuție sunt constante pe anumite intervale în care valorile variabilelor aleatoare studiate nu pot cădea.

Anterior Distribuția normală înseamnă următoarele : există valori ale înălțimii umane, masa de pești din aceeași specie, care sunt percepute intuitiv ca „normale” (și de fapt, mediate), iar într-o probă suficient de mare se găsesc mult mai des decât cele care diferă în sus sau în jos.

Distribuția normală de probabilitate a unei variabile aleatoare continue (uneori o distribuție gaussiană) poate fi numită în formă de clopot datorită faptului că funcția de densitate a acestei distribuții, simetrică față de medie, este foarte asemănătoare cu tăietura unui clopot (curba roșie). în figura de mai sus).

Probabilitatea de a întâlni anumite valori într-un eșantion este egală cu aria figurii de sub curbă, iar în cazul unei distribuții normale vedem că sub partea de sus a „clopotului”, care corespunde valorilor. tinzând spre medie, aria și, prin urmare, probabilitatea, este mai mare decât sub margini. Astfel, obținem același lucru care s-a spus deja: probabilitatea de a întâlni o persoană de înălțime „normală” și de a prinde un pește de greutate „normală” este mai mare decât pentru valori care diferă în sus sau în jos. În multe cazuri practice, erorile de măsurare sunt distribuite conform unei legi apropiate de normal.

Să ne uităm din nou la figura de la începutul lecției, care arată funcția de densitate a unei distribuții normale. Graficul acestei funcții a fost obținut prin calcularea unui anumit eșantion de date din pachetul software STATISTICA. Pe el, coloanele histogramei reprezintă intervale de valori ale eșantionului, a căror distribuție este apropiată de (sau, după cum se spune în mod obișnuit în statistică, nu diferă semnificativ de) graficul real al funcției de densitate a distribuției normale, care este o curbă roșie. . Graficul arată că această curbă este într-adevăr în formă de clopot.

Distribuția normală este valoroasă în multe feluri, deoarece cunoscând doar valoarea așteptată a unei variabile aleatoare continue și abaterea ei standard, puteți calcula orice probabilitate asociată cu acea variabilă.

Distribuția normală are și avantajul de a fi una dintre cele mai ușor de utilizat. teste statistice utilizate pentru testarea ipotezelor statistice - testul t Student- poate fi utilizat numai dacă datele eșantionului respectă legea distribuției normale.

Funcția de densitate a distribuției normale a unei variabile aleatoare continue poate fi găsit folosind formula:

,

Unde x- valoarea cantității în schimbare, - valoarea medie, - abaterea standard, e=2,71828... - baza logaritmului natural, =3,1416...

Proprietăți ale funcției de densitate de distribuție normală

Modificările mediei mută curba funcției de densitate normală spre axă Bou. Dacă crește, curba se deplasează la dreapta, dacă scade, atunci la stânga.

Dacă abaterea standard se modifică, înălțimea vârfului curbei se modifică. Când deviația standard crește, vârful curbei este mai mare, iar când scade, este mai jos.

Probabilitatea ca o variabilă aleatorie distribuită normal să se încadreze într-un interval dat

Deja în acest paragraf vom începe să rezolvăm probleme practice, al căror sens este indicat în titlu. Să ne uităm la ce posibilități oferă teoria pentru rezolvarea problemelor. Conceptul de pornire pentru calcularea probabilității ca o variabilă aleatorie distribuită normal să se încadreze într-un interval dat este funcția cumulativă a distribuției normale.

Funcția de distribuție normală cumulativă:

.

Cu toate acestea, este problematic să se obțină tabele pentru fiecare combinație posibilă de medie și abatere standard. Prin urmare, unul dintre moduri simple Calcularea probabilității ca o variabilă aleatorie distribuită normal să se încadreze într-un interval dat este utilizarea tabelelor de probabilități pentru o distribuție normală standardizată.

O distribuție normală se numește standardizată sau normalizată., a cărui medie este , iar abaterea standard este .

Funcția de densitate de distribuție normală standardizată:

.

Funcția cumulativă a distribuției normale standardizate:

.

Figura de mai jos prezintă funcția integrală a distribuției normale standardizate, al cărei grafic a fost obținut prin calcularea unui anumit eșantion de date în pachetul software STATISTICA. Graficul în sine este o curbă roșie, iar valorile eșantionului se apropie de el.


Pentru a mări imaginea, puteți da clic pe ea cu butonul stâng al mouse-ului.

Standardizarea unei variabile aleatoare înseamnă trecerea de la unitățile originale utilizate în sarcină la unitățile standardizate. Standardizarea se realizează conform formulei

În practică, toate valorile posibile ale unei variabile aleatoare sunt adesea necunoscute, astfel încât valorile mediei și ale abaterii standard nu pot fi determinate cu precizie. Ele sunt înlocuite cu media aritmetică a observațiilor și abaterea standard s. Magnitudinea z exprimă abaterile valorilor unei variabile aleatoare de la media aritmetică la măsurarea abaterilor standard.

Interval deschis

Tabelul de probabilități pentru distribuția normală standardizată, care poate fi găsit în aproape orice carte de statistică, conține probabilitățile ca o variabilă aleatorie să aibă o distribuție normală standard Variabila aleatoare va lua o valoare mai mică decât un anumit număr z. Adică va cădea în intervalul deschis de la minus infinit până la z. De exemplu, probabilitatea ca cantitatea Variabila aleatoare mai mic de 1,5, egal cu 0,93319.

Exemplul 1. Compania produce piese a căror durată de viață este distribuită în mod normal cu o medie de 1000 de ore și o abatere standard de 200 de ore.

Pentru o piesă selectată aleatoriu, calculați probabilitatea ca durata de viață a acesteia să fie de cel puțin 900 de ore.

Soluţie. Să introducem prima notație:

Probabilitatea dorită.

Valorile variabilelor aleatoare sunt într-un interval deschis. Dar știm cum să calculăm probabilitatea ca o variabilă aleatoare să ia o valoare mai mică decât una dată și, în funcție de condițiile problemei, trebuie să găsim una egală sau mai mare decât una dată. Aceasta este cealaltă parte a spațiului de sub curba de densitate normală (clopot). Prin urmare, pentru a găsi probabilitatea dorită, trebuie să scădeți din unitate probabilitatea menționată ca variabila aleatoare să ia o valoare mai mică decât 900 specificat:

Acum variabila aleatoare trebuie standardizată.

Continuăm să introducem notația:

z = (X ≤ 900) ;

x= 900 - valoarea specificată a variabilei aleatoare;

μ = 1000 - valoare medie;

σ = 200 - abatere standard.

Folosind aceste date, obținem condițiile problemei:

.

Conform tabelelor de variabile aleatoare standardizate (limita intervalului) z= −0,5 corespunde unei probabilități de 0,30854. Scădeți-l din unitate și obțineți ceea ce este necesar în enunțul problemei:

Deci, probabilitatea ca piesa să aibă o durată de viață de cel puțin 900 de ore este de 69%.

Această probabilitate poate fi obținută folosind funcția MS Excel NORM.DIST (valoare integrală - 1):

P(X≥900) = 1 - P(X≤900) = 1 - NORM.DIST(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

Despre calcule în MS Excel - într-unul dintre paragrafele următoare ale acestei lecții.

Exemplul 2.Într-un anumit oraș, venitul mediu anual al familiei este o variabilă aleatorie distribuită în mod normal, cu o medie de 300.000 și o abatere standard de 50.000. Se știe că venitul a 40% dintre familii este mai mic decât O. Găsiți valoarea O.

Soluţie. În această problemă, 40% nu este altceva decât probabilitatea ca variabila aleatoare să ia o valoare dintr-un interval deschis care este mai mică decât o anumită valoare, indicată de litera O.

Pentru a găsi valoarea O, mai întâi compunem funcția integrală:

În funcție de condițiile problemei

μ = 300000 - valoare medie;

σ = 50000 - abaterea standard;

x = O- cantitatea de găsit.

Alcătuirea unei egalități

.

Din tabelele statistice constatăm că probabilitatea de 0,40 corespunde valorii limitei intervalului z = −0,25 .

Prin urmare, creăm egalitatea

și găsiți-i soluția:

O = 287300 .

Răspuns: 40% dintre familii au venituri mai mici de 287.300.

Interval închis

În multe probleme este necesar să se găsească probabilitatea ca o variabilă aleatoare distribuită normal să ia o valoare în intervalul de la z 1 la z 2. Adică va cădea într-un interval închis. Pentru a rezolva astfel de probleme, este necesar să găsiți în tabel probabilitățile corespunzătoare limitelor intervalului și apoi să găsiți diferența dintre aceste probabilități. Acest lucru necesită scăderea valorii mai mici din cea mai mare. Exemple de soluții la aceste probleme comune sunt următoarele și vi se cere să le rezolvați singur, iar apoi puteți vedea soluțiile și răspunsurile corecte.

Exemplul 3. Profitul unei întreprinderi pentru o anumită perioadă este o variabilă aleatorie supusă legii distribuției normale cu o valoare medie de 0,5 milioane. și abaterea standard 0,354. Determinați, cu două zecimale, probabilitatea ca profitul întreprinderii să fie de la 0,4 la 0,6 c.u.

Exemplul 4. Lungimea piesei fabricate este o variabilă aleatorie distribuită conform legii normale cu parametri μ =10 și σ =0,071. Găsiți probabilitatea de defecte, cu precizie cu două zecimale, dacă dimensiunile admisibile ale piesei trebuie să fie 10±0,05.

Sugestie: în această problemă, pe lângă găsirea probabilității ca o variabilă aleatorie să se încadreze într-un interval închis (probabilitatea de a primi o piesă nedefectă), trebuie să efectuați încă o acțiune.

vă permite să determinați probabilitatea ca valoarea standardizată Variabila aleatoare nici mai puțin -z si nu mai mult +z, Unde z- o valoare selectată în mod arbitrar a unei variabile aleatoare standardizate.

O metodă aproximativă pentru verificarea normalității unei distribuții

O metodă aproximativă de verificare a normalității distribuției valorilor eșantionului se bazează pe următoarele proprietatea distribuției normale: coeficientul de asimetrie β 1 și coeficientul de curtoză β 2 sunt egale cu zero.

Coeficient de asimetrie β 1 caracterizează numeric simetria distribuţiei empirice faţă de medie. Dacă coeficientul de asimetrie este zero, atunci media aritmetică, mediana și modul sunt egale: iar curba densității distribuției este simetrică față de medie. Dacă coeficientul de asimetrie este mai mic decât zero (β 1 < 0 ), atunci media aritmetică este mai mică decât mediana, iar mediana, la rândul său, este mai mică decât modul () și curba este deplasată la dreapta (comparativ cu distribuția normală). Dacă coeficientul de asimetrie este mai mare decât zero (β 1 > 0 ), atunci media aritmetică este mai mare decât mediana, iar mediana, la rândul ei, este mai mare decât modul () și curba este deplasată spre stânga (comparativ cu distribuția normală).

Coeficientul de kurtoză β 2 caracterizează concentrarea distribuţiei empirice în jurul mediei aritmetice în direcţia axei Oişi gradul de vârf al curbei densităţii distribuţiei. Dacă coeficientul de curtoză este mai mare decât zero, atunci curba este mai alungită (comparativ cu distribuția normală) de-a lungul axei Oi(graficul este mai cu vârf). Dacă coeficientul de curtoză este mai mic decât zero, atunci curba este mai aplatizată (comparativ cu distribuția normală) de-a lungul axei Oi(graficul este mai obtuz).

Coeficientul de asimetrie poate fi calculat folosind funcția MS Excel SKOS. Dacă bifați o singură matrice de date, atunci trebuie să introduceți intervalul de date într-o casetă „Număr”.


Coeficientul de curtoză poate fi calculat folosind funcția MS Excel KURTESS. Când verificați o matrice de date, este suficient să introduceți intervalul de date într-o casetă „Număr”.


Deci, după cum știm deja, cu o distribuție normală coeficienții de asimetrie și curtoză sunt egali cu zero. Dar dacă am obține coeficienți de asimetrie de -0,14, 0,22, 0,43 și coeficienți de curtoză de 0,17, -0,31, 0,55? Întrebarea este destul de corectă, deoarece în practică avem de-a face numai cu valori aproximative, eșantion de asimetrie și curtoză, care sunt supuse unei împrăștieri inevitabile, necontrolate. Prin urmare, nu se poate cere ca acești coeficienți să fie strict egali cu zero, ei trebuie să fie suficient de aproape de zero; Dar ce înseamnă suficient?

Este necesar să se compare valorile empirice obținute cu valorile acceptabile. Pentru a face acest lucru, trebuie să verificați următoarele inegalități (comparați valorile coeficienților modulului cu valorile critice - limitele zonei de testare a ipotezelor).

Pentru coeficientul de asimetrie β 1 .

Articole înrudite

2024 liveps.ru. Teme și probleme gata făcute în chimie și biologie.