Ce sunt populațiile generale și eșantionul? Populații generale și eșantionare

Deci, tiparele la care este supusă variabila aleatoare studiată sunt complet determinate fizic de setul real de condiții pentru observarea (sau experimentul) acesteia și sunt specificate matematic de spațiul de probabilitate corespunzător sau, ceea ce este același, de spațiul corespunzător. legea distribuției probabilităților. Cu toate acestea, atunci când se efectuează cercetări statistice, o altă terminologie asociată conceptului de populație generală se dovedește a fi ceva mai convenabilă.

Populația generală este totalitatea tuturor observațiilor imaginabile (sau a tuturor obiectelor posibile mental de tipul care ne interesează, din care observațiile sunt „înlăturate”) care ar putea fi făcute într-un anumit set real de condiții. Întrucât definiția se referă la toate observațiile (sau obiectele) posibile din punct de vedere mental, conceptul de populație generală este un concept condiționat matematic, abstract și nu trebuie confundat cu populațiile reale supuse cercetării statistice. Astfel, după ce am examinat chiar și toate întreprinderile sub-industriei din punctul de vedere al înregistrării valorilor indicatorilor tehnici și economici care le caracterizează, putem considera populația chestionată doar ca reprezentant al unei populații mai largi ipotetic posibil de întreprinderi. care ar putea funcționa în același set real de condiții

ÎN munca practica este mai convenabil să asociem alegerea cu obiectele de observaţie decât cu caracteristicile acestor obiecte. Selectăm mașini, probe geologice, oameni pentru studiu, dar nu și valorile caracteristicilor mașinilor, probelor, oamenilor. Pe de altă parte, în teoria matematică, obiectele și totalitatea caracteristicilor lor nu diferă și dispare dualitatea definiției introduse.

După cum vedem, conceptul matematic de „populație generală” este determinat fizic complet, precum și conceptele de „spațiu de probabilitate”, „variabilă aleatorie” și „legea distribuției probabilității”, de setul real corespunzător de condiții și, prin urmare, toate aceste patru concepte matematice pot fi considerate într-un anumit sens sinonime. O populație se numește finită sau infinită, în funcție de faptul că colecția tuturor observațiilor imaginabile este finită sau infinită.

Din definiție rezultă că continuu populatia(formate din observații ale semnelor de natură continuă) sunt întotdeauna infinite. Populațiile generale discrete pot fi infinite sau finite. De exemplu, dacă un lot de N produse este analizat pentru grad (a se vedea exemplul din clauza 4.1.3), când fiecare produs poate fi atribuit uneia dintre cele patru clase, variabila aleatoare studiată este numărul de grad al unui produs extras aleatoriu din lotul și setul de valori posibile variabilă aleatoare este formată respectiv din patru puncte (1, 2, 3 și 4), atunci, evident, populația va fi finită (doar N observații imaginabile).

Conceptul de populație infinită este o abstractizare matematică, la fel ca și ideea că măsurarea unei variabile aleatoare poate fi repetată de un număr infinit de ori. O populație generală aproximativ infinită poate fi interpretată ca un caz limitativ al uneia finite, atunci când numărul de obiecte generate de un anumit set real de condiții crește la nesfârșit. Deci, dacă în exemplul recent dat, în loc de loturi de produse, luăm în considerare producția continuă în masă a acelorași produse, atunci vom ajunge la conceptul de populație generală infinită. În practică, o astfel de modificare este echivalentă cu cerința

Un eșantion dintr-o populație dată este rezultatul unei serii limitate de observații ale unei variabile aleatorii. Un eșantion poate fi considerat un fel de analog empiric al unei populații generale, lucru cu care ne confruntăm cel mai adesea în practică, deoarece sondarea întregii populații generale poate fi fie prea intensivă în muncă (în cazul N mare), fie fundamental imposibilă. (în cazul populațiilor generale infinite).

Numărul de observații care formează un eșantion se numește dimensiunea eșantionului.

Dacă dimensiunea eșantionului este mare și avem de-a face cu un unidimensional valoare continuă(sau cu date discrete unidimensionale, al căror număr de valori posibile este destul de mare, să zicem mai mult de 10), atunci este adesea mai convenabil, din punctul de vedere al simplificării prelucrării statistice ulterioare a rezultatelor observațiilor, pentru a trece la așa-numitele date de eșantion „grupate”. Această tranziție se realizează de obicei după cum urmează:

a) cel mai mic şi cea mai mare valoareîn probă;

b) întregul interval sondat este împărțit într-un anumit număr de 5 intervale egale de grupare; în acest caz, numărul de intervale s nu trebuie să fie mai mic de 8-10 și mai mult de 20-25: alegerea numărului de intervale depinde în mod semnificativ de dimensiunea eșantionului pentru o orientare aproximativă în alegerea 5; formula aproximativă

care ar trebui luată mai degrabă ca o estimare mai mică pentru s (în special pentru mari

c) punctele extreme ale fiecăruia dintre intervale sunt marcate în ordine crescătoare, precum și punctele mijlocii ale acestora

d) se numără numărul de date eșantion care se încadrează în fiecare dintre intervale: (evident); datele eșantionului care se încadrează la limitele intervalelor fie sunt distribuite uniform pe două intervale adiacente, fie sunt convenite să fie atribuite doar unuia dintre ele, de exemplu, celui din stânga.

În funcție de conținutul specific al problemei, pot fi aduse unele modificări acestei scheme de grupare (de exemplu, în unele cazuri este recomandabil să se abandoneze cerința de lungimi egale a intervalelor de grupare).

În toate argumentele ulterioare care utilizează date eșantion, vom continua de la notația descrisă.

Să ne amintim că esența metodelor statistice este de a folosi o anumită parte a populației generale (adică, un eșantion) pentru a face judecăți despre proprietățile sale în ansamblu.

Una dintre cele mai importante probleme, a cărei soluție cu succes determină fiabilitatea concluziilor obținute ca urmare a prelucrării statistice a datelor, este problema reprezentativității eșantionului, adică. întrebarea completitudinii și adecvării reprezentării sale a proprietăților populației generale analizate care ne interesează. În munca practică, același grup de obiecte luate pentru studiu poate fi considerat ca un eșantion din diferite populații generale. Astfel, un grup de familii selectate aleatoriu din casele cooperatiste ale unuia dintre birourile de întreținere a locuințelor (ZhEK) ale unuia dintre cartierele orașului pentru o anchetă sociologică detaliată poate fi considerat atât ca un eșantion din populația generală de familii (cu o cooperativă). formă de locuință) din acest ZhEK și ca eșantion din familiile populației generale dintr-o zonă dată și ca eșantion din populația generală a tuturor familiilor din oraș și, în sfârșit, ca eșantion din populația generală a tuturor familiile din oraș care locuiesc în case cooperative. Interpretarea semnificativă a rezultatelor testării depinde în mod semnificativ de populația generală din care considerăm grupul de familii selectat ca fiind reprezentativ, pentru care populație generală acest eșantion poate fi considerat reprezentativ. Răspunsul la această întrebare depinde de mulți factori. În exemplul de mai sus, în special, depinde de prezența sau absența unui factor special (poate ascuns) care determină apartenența familiei la un anumit birou de locuințe sau districtul în ansamblu (un astfel de factor ar putea fi, de exemplu, venitul mediu pe cap de locuitor al familiei, localizarea geografică a districtului în oraș, „vârsta” zonei etc.).


Întreaga gamă de indivizi dintr-o anumită categorie se numește populație generală. Mărimea populației este determinată de obiectivele studiului.

Dacă se studiază orice specie de animale sau plante sălbatice, atunci populația generală va fi toți indivizii acestei specii. În acest caz, volumul populației va fi foarte mare și în calcule se ia ca o valoare infinit de mare.

Dacă se studiază efectul unui agent asupra plantelor și animalelor dintr-o anumită categorie, atunci populația generală va fi toate plantele și animalele din acea categorie (specie, sex, vârstă, scop economic) cărora le-au aparținut obiectele experimentale. Acesta nu mai este un număr foarte mare de indivizi, dar este încă inaccesibil pentru un studiu cuprinzător.

Volumul populației generale nu este întotdeauna disponibil pentru un studiu cuprinzător. Uneori sunt studiate populații mici, de exemplu, se determină producția medie de lapte sau se determină tăierea medie a lânii a unui grup de animale repartizate unui anumit muncitor. În astfel de cazuri, populația va fi un număr foarte mic de indivizi, toți fiind studiati. O populație mică se găsește și la studierea plantelor sau animalelor găsite într-o colecție pentru a caracteriza un anumit grup din această colecție.

Caracteristicile proprietăților grupului (etc.) legate de întreaga populație se numesc parametri generali.

Un eșantion este un grup de obiecte care diferă prin trei caracteristici:

1 face parte din populația generală;

2 selectate aleatoriu într-un anumit mod;

3 studiat pentru a caracteriza întreaga populație.

Pentru a obține o descriere destul de exactă a întregii populații dintr-un eșantion, este necesar să se organizeze selecția corectă a obiectelor din populație.

Teoria și practica au dezvoltat mai multe sisteme de selectare a indivizilor pentru eșantionare. Toate aceste sisteme se bazează pe dorința de a oferi oportunitatea maximă de a selecta orice obiect din populația generală. Tendința și părtinirea în selecția obiectelor pentru un studiu eșantion împiedică primirea concluziilor generale corecte și fac ca rezultatele unui studiu prin eșantion să fie neindicative pentru întreaga populație, adică nereprezentative.

Pentru a obține o caracteristică corectă, nedistorsionată a întregii populații, este necesar să se străduiască să se asigure posibilitatea selectării oricărui obiect din orice parte a populației în eșantion. Această cerință de bază trebuie îndeplinită cu cât mai strict, cu atât mai variabilă este trăsătura studiată. Este de înțeles că atunci când diversitatea se apropie de zero, cum ar fi în cazul studiilor privind culoarea părului sau a penelor la unele specii, orice metodă de selecție a probei va produce rezultate reprezentative.

În diverse studii, sunt utilizate următoarele metode de selectare a obiectelor din eșantion.

4 Selecția repetată aleatorie, în care obiectele de studiu sunt selectate din populația generală fără a lua în considerare mai întâi evoluția caracteristicii studiate, adică într-o ordine aleatorie (pentru o caracteristică dată); După selecție, fiecare obiect este studiat și apoi reîntors la populația sa, astfel încât orice obiect poate fi re-selectat. Această metodă de selecție este echivalentă cu selecția dintr-o populație generală infinit de mare, pentru care au fost dezvoltați principalii indicatori ai relației dintre eșantion și valorile generale.

5 Selecția aleatorie nerepetitivă, în care obiectele selectate, ca în metoda anterioară, întâmplător, nu revin în populația generală și nu pot fi reintroduse în eșantion. Acesta este cel mai comun mod de a organiza un eșantion; este echivalent cu selecția dintr-o populație mare, dar limitată, care este luată în considerare la determinarea indicatorilor generali din eșantioane.

6 Selecția mecanică, în care obiectele sunt selectate din părți individuale ale populației generale, iar aceste părți sunt desemnate preliminar mecanic în funcție de pătratele câmpului experimental, în funcție de grupuri aleatorii de animale luate din diferite zone ale populației etc. De obicei, ca multe astfel de părți sunt conturate așa cum se așteaptă să fie luate obiecte pentru a fi studiate, astfel încât numărul de părți este egal cu dimensiunea eșantionului. Selecția mecanică se realizează uneori prin alegerea de a studia indivizii după un anumit număr, de exemplu, prin trecerea animalelor printr-o despicare și selectând fiecare zecime, sutime etc., sau prin cosirea la fiecare 100 sau 200 m sau selectând una. obiect la fiecare 10 întâlnite 100 etc exemplare la studierea întregii populații.

8 Selecția în serie (cluster), în care populația generală este împărțită în părți - serii, unele dintre ele sunt studiate în întregime. Această metodă este folosită cu succes în cazurile în care obiectele studiate sunt distribuite destul de uniform într-un anumit volum sau pe un anumit teritoriu. De exemplu, atunci când se studiază contaminarea aerului sau a apei cu microorganisme, se prelevează probe și se supune unei examinări complete. În unele cazuri, obiectele agricole pot fi, de asemenea, supravegheate folosind metoda cuibării. Când se studiază producția de carne și alte produse prelucrate ale unei rase de animale de carne, eșantionul poate include toate animalele din această rasă care au ajuns la două sau trei fabrici de procesare a cărnii. Când se studiază dimensiunea ouălor în crescătorii de păsări de curte, este posibil să se studieze această trăsătură în mai multe ferme colective din întreaga populație de pui.

Caracteristicile proprietăților grupului (μ, s etc.) obținute pentru eșantion se numesc indicatori de eșantion.

Reprezentativitatea

Studiul direct al unui grup de obiecte selectate oferă, în primul rând, materialul primar și caracteristicile eșantionului în sine.

Toate datele eșantionului și indicatorii de sinteză sunt importante ca fapte primare relevate de studiu și sunt supuse unei analize, analize și comparări atente cu rezultatele altor lucrări. Dar acest lucru nu limitează procesul de extragere a informațiilor inerente materialelor primare de cercetare.

Faptul că obiectele au fost selectate pentru eșantion folosind tehnici speciale și în cantitate suficientă face ca rezultatele studiului eșantionului să fie orientative nu numai pentru eșantionul în sine, ci și pentru întreaga populație din care a fost prelevat acest eșantion.

Un eșantion, în anumite condiții, devine o reflectare mai mult sau mai puțin exactă a întregii populații. Această proprietate a unui eșantion se numește reprezentativitate, ceea ce înseamnă reprezentativitate cu o anumită acuratețe și fiabilitate.

Ca orice proprietate, reprezentativitatea datelor eșantionului poate fi exprimată într-o măsură suficientă sau insuficientă. În primul caz, se obțin estimări fiabile ale parametrilor generali în eșantion, în al doilea, se obțin estimări nesigure. Este important de reținut că obținerea de estimări nesigure nu scade valoarea indicatorilor eșantionului pentru caracterizarea eșantionului în sine. Obținerea unor estimări fiabile extinde sfera de aplicare a realizărilor obținute într-un studiu eșantion.

Cercetarea începe de obicei cu o presupunere care necesită testare cu fapte. Această ipoteză – o ipoteză – este formulată în raport cu legătura fenomenelor sau proprietăților dintr-un anumit set de obiecte. Pentru a testa astfel de ipoteze față de fapte, este necesar să se măsoare proprietățile corespunzătoare ale purtătorilor lor. Dar este imposibil de măsurat, de exemplu, anxietatea la toți adolescenții. Prin urmare, atunci când se efectuează cercetări, aceasta este limitată doar la un grup relativ mic de reprezentanți ai populațiilor relevante de oameni.

Populația- acesta este întregul ansamblu de obiecte în raport cu care se formulează o ipoteză de cercetare. Teoretic, se crede că dimensiunea populației este nelimitată. În practică, volumul populației generale este întotdeauna limitat și poate varia în funcție de subiectul de observație și de sarcina pe care o are de rezolvat psihologul. De obicei, populația generală include un număr foarte mare de obiecte - studenți, școlari, angajați ai întreprinderii, pensionari etc. Un studiu complet al populațiilor generale este extrem de dificil, prin urmare, de regulă, o mică parte a populației generale este studiată, numită populație eșantion sau eșantion.

Eșantionare - acesta este un număr limitat de obiecte (în psihologie - subiecți, respondenți), special selectate din populația generală pentru a-i studia proprietățile. În consecință, studierea proprietăților unei populații folosind un eșantion se numește cercetare prin eșantionare. Aproape toate studiile psihologice sunt selective, iar concluziile lor se aplică populațiilor generale.

Eșantionului i se aplică o serie de cerințe obligatorii, determinate în primul rând de scopurile și obiectivele studiului. Ar trebui să fie astfel încât generalizarea constatărilor unui studiu prin eșantion să fie justificată - generalizarea, extinderea lor la populația generală.

Eșantionul trebuie să îndeplinească următoarele condiții:



1. Acesta este un grup de obiecte disponibile pentru studiu. Mărimea eșantionului este determinată de sarcinile și capacitățile de observare și experiment.

2. Face parte dintr-o populație pre-desemnată.

3. Este un grup selectat la întâmplare astfel încât orice element din populație să aibă șanse egale de a fi inclus în eșantion.

Principalele criterii de validitate a rezultatelor cercetării sunt reprezentativitatea eșantionului și fiabilitatea statistică a rezultatelor (empirice).

Reprezentativitate - cu alte cuvinte, reprezentativitatea sa este capacitatea de a caracteriza populația corespunzătoare cu o anumită acuratețe și fiabilitate suficientă. Dacă eșantionul de subiecți este reprezentativ pentru populația generală în caracteristicile sale, atunci există motive să extindem rezultatele obținute în urma studiului său la întreaga populație generală.

În mod ideal, un eșantion reprezentativ ar trebui să fie astfel încât fiecare dintre principalele caracteristici, trăsături, trăsături de personalitate etc. studiate de un psiholog să fie reprezentate în acesta proporțional cu aceleași caracteristici în populația generală.

Erorile de reprezentativitate apar în două cazuri:

1. Un eșantion mic care caracterizează populația generală.

2. Discrepanță între proprietățile (parametrii) eșantionului și parametrii populației generale.

Semnificație statistică Semnificația sau semnificația statistică a rezultatelor unui studiu este determinată folosind tehnici de inferență statistică. Aceste metode vor fi discutate mai detaliat în subiectul „Testarea ipotezelor”. Rețineți că acestea impun anumite cerințe privind dimensiunea sau dimensiunea eșantionului.

Cea mai mare dimensiune a eșantionului este necesară atunci când se dezvoltă o tehnică de diagnosticare - de la 200 la 1000-2500 de persoane.

Dacă este necesară compararea a 2 mostre, numărul total al acestora trebuie să fie de cel puțin 50 de persoane; numărul de probe comparate ar trebui să fie aproximativ același.

Dacă se studiază relația dintre proprietăți, dimensiunea eșantionului ar trebui să fie de cel puțin 30-35 de persoane.

Cu cât variabilitatea proprietății studiate este mai mare, cu atât dimensiunea eșantionului ar trebui să fie mai mare. Prin urmare, variabilitatea poate fi redusă prin creșterea omogenității eșantionului, de exemplu după sex, vârstă etc. Acest lucru reduce în mod natural posibilitatea de a generaliza concluziile.

Eșantioane dependente și independente. O situație obișnuită de cercetare este atunci când o proprietate de interes pentru un cercetător este studiată pe două sau mai multe eșantioane în scopul unei comparații ulterioare. Aceste mostre pot fi în proporții diferite, în funcție de procedura de organizare a acestora. Eșantioanele independente sunt caracterizate prin faptul că probabilitatea de selecție a oricărui subiect dintr-un eșantion nu depinde de selecția vreunuia dintre subiecții din celălalt eșantion. Dimpotrivă, eșantioanele dependente se caracterizează prin faptul că fiecare subiect dintr-un eșantion este corelat după un anumit criteriu de către un subiect dintr-un alt eșantion.

Cel mai tipic exemplu de eșantion independent este, de exemplu, o comparație între bărbați și femei în ceea ce privește inteligența.

Populația - ansamblul persoanelor despre care sociologul caută să obțină informații în cercetarea sa. În funcție de cât de largă este tema de cercetare, populația va fi la fel de largă.

Eșantion de populație – model de populație redusă; cei cărora sociologul le distribuie chestionare, care se numesc respondenți, care, în final, fac obiectul cercetărilor sociologice.

Cine este inclus exact în populația generală este determinat de obiectivele studiului și cine este inclus în populația eșantion este decis metode matematice. Dacă un sociolog intenționează să privească războiul afgan prin ochii participanților săi, populația generală va include toți soldații afgani, dar va trebui să intervieveze o mică parte - populația eșantion. Pentru ca eșantionul să reflecte cu exactitate populația generală, sociologul respectă regula: orice soldat afgan, indiferent de locul de reședință, locul de muncă, starea de sănătate și alte circumstanțe, trebuie să aibă aceeași probabilitate de a fi inclus în eșantion. populatia.

Odată ce sociologul a decis pe cine vrea să intervieveze, el determină cadru de prelevare. Apoi se decide problema tipului de eșantionare.

Eșantioanele sunt împărțite în trei clase mari:

O) solid(recensăminte, referendumuri). Toate unitățile din populație sunt chestionate;

b) aleatoriu;

V) non-aleatorie.

Tipurile de eșantionare aleatoare și non-aleatoare, la rândul lor, sunt împărțite în mai multe tipuri.

Cele aleatorii includ:

1) probabilistic;

2) sistematic;

3) zonat (stratificat);

4) cuibărit

Cele non-aleatorie includ:

1) "spontan";

2) cota;

3) metoda „matrice principală”.

O listă completă și precisă a unităților din formularele de populație eșantion cadru de prelevare . Elementele destinate selecției sunt numite unități de selecție . Unitățile de eșantionare pot fi aceleași cu unitățile de observare deoarece unitate de observație este considerat a fi un element al populației generale de la care se colectează direct informații. De obicei, unitatea de observație este individul. Selectarea dintr-o listă se face cel mai bine prin numerotarea unităților și folosind un tabel de numere aleatoare, deși adesea se folosește o metodă cvasialeatorie, când fiecare al n-lea element este luat dintr-o listă simplă.

Dacă cadrul de eșantionare include o listă de unități de eșantionare, atunci structura de eșantionare presupune gruparea acestora în funcție de unele caracteristici importante, de exemplu, distribuția persoanelor pe profesie, calificări, sex sau vârstă. Dacă în populația generală, de exemplu, există 30% tineri, 50% persoane de vârstă mijlocie și 20% persoane în vârstă, atunci aceleași proporții procentuale ale celor trei vârste trebuie să fie observate în populația eșantion. La vârste pot fi adăugate clase, sex, naționalitate etc. Pentru fiecare, se stabilesc proporții procentuale în populația generală și eșantion. Astfel, cadru de prelevare – proporții procentuale ale caracteristicilor obiectului, pe baza cărora se întocmește populația eșantion.

Dacă tipul eșantionului ne spune cum intră oamenii în populația eșantionului, atunci dimensiunea eșantionului ne spune câți dintre ei au ajuns acolo.

Dimensiunea eșantionului – numărul de unități din populația eșantion. Deoarece populația eșantion este o parte a populației generale selectată prin metode speciale, volumul acesteia este întotdeauna mai mic decât volumul populației generale. Prin urmare, este atât de important ca partea să nu denatureze ideea întregului, adică să o reprezinte.

Fiabilitatea datelor este influențată nu de caracteristicile cantitative ale populației eșantionului (volumul acesteia), ci de caracteristicile calitative ale populației generale - gradul de omogenitate a acesteia. Se numește discrepanța dintre populația generală și populația eșantion eroare de reprezentativitate , abatere admisă – 5%.

Iată câteva modalități de a evita eroarea:

    fiecare unitate din populație trebuie să aibă o probabilitate egală de a fi inclusă în eșantion;

    este recomandabil să se selecteze din populații omogene;

    trebuie să cunoașteți caracteristicile populației;

    La compilarea unei populații eșantion, trebuie luate în considerare erorile aleatoare și sistematice.

Dacă populația eșantion (eșantionul) este întocmită corect, atunci sociologul obține rezultate sigure care caracterizează întreaga populație.

Care sunt principalele metode de eșantionare?

Metoda mecanică de prelevare a probelor, când numărul necesar de respondenți este selectat din lista generală a populației generale la intervale regulate (de exemplu, la fiecare 10).

Metoda de eșantionare în serie. În acest caz, populația generală este împărțită în părți omogene și unități de analiză sunt selectate proporțional din fiecare (de exemplu, 20% dintre bărbați și femei dintr-o întreprindere).

Metoda de eșantionare în cluster. Unitățile de selecție nu sunt respondenți individuali, ci grupuri cu cercetare continuă ulterioară în ei. Acest eșantion va fi reprezentativ dacă componența grupurilor este similară (de exemplu, un grup de studenți din fiecare ramură a unei secții universitare).

Metoda matricei principale– sondaj la 60–70% din populația generală.

Metoda de eșantionare a cotelor. Cele mai multe metoda complexa, necesitând determinarea a cel puțin patru caracteristici prin care sunt selectați respondenții. Folosit de obicei cu o populație mare.

Ca urmare a studierii materialului din capitolul 2, studentul ar trebui:

stiu

  • concepte de bază ale populațiilor generale și eșantionului;
  • metode de estimare, tipuri și proprietăți ale estimărilor parametrilor populației generale;
  • metode de bază pentru testarea statistică a ipotezelor privind parametrii populaţiilor univariate şi multivariate;

a putea

  • găsiți estimări ale parametrilor populațiilor generale unidimensionale și multidimensionale folosind date eșantionate;
  • analiza proprietățile parametrilor;
  • testarea ipotezelor privind parametrii și tipul de distribuție a populației;
  • comparați parametrii mai multor populații generale;

proprii

  • aptitudini evaluare statistică parametrii populațiilor generale unidimensionale și multidimensionale;
  • abilități în testarea ipotezelor privind parametrii și tipul de distribuție a populației la efectuarea cercetărilor socio-economice cu ajutorul softurilor analitice.

Distribuția populației

Probabilistică metode statistice analiza datelor presupune că tiparele la care se supune variabila studiată (variabila aleatoare) sunt complet determinate de setul de condiții pentru observarea acesteia. Din punct de vedere matematic, aceste modele sunt date de legea corespunzătoare a distribuției probabilităților. Cu toate acestea, atunci când se efectuează cercetări statistice, conceptul de populație generală este mai convenabil.

Astfel, conceptele matematice „populație generală”, „variabilă aleatorie” și „legea distribuției probabilităților”, corespunzătoare unui set dat de condiții, pot fi considerate într-un anumit sens sinonime.

Populația generală numiți ansamblul tuturor observațiilor imaginabile care ar putea fi făcute într-un anumit set de condiții.

Întrucât definiția tratează observații (sau obiecte) posibile din punct de vedere mental, populația generală este un concept abstract și nu trebuie confundată cu populațiile reale supuse cercetării statistice. Astfel, după ce am examinat chiar și toate întreprinderile unei subindustrii, le putem considera reprezentanți ai unui set mai larg posibil ipotetic de întreprinderi care ar putea funcționa într-un set de condiții.

Populația generală poate fi fie finită, fie infinită. Final agregarea are loc, de exemplu, într-o anchetă a bugetelor familiei, când se prelevează un eșantion din totalitatea familiilor existente efectiv în țară. Apoi se fac observații asupra veniturilor și cheltuielilor familiilor selectate. Infinit populaţia generală se observă, de exemplu, în cercetarea stiintifica cand suntem interesati rezultat mediu un număr mare de experimente.

În cel mai simplu caz, populația este o variabilă aleatoare unidimensională X cu o funcţie de distribuţie care determină probabilitatea ca X va lua o valoare mai mică decât un număr real fix.

În general, se studiază populațiile generale care includ mai multe caracteristici (de obicei mai mult de două). Setul de caracteristici luate în considerare este notat printr-un vector având k componente, fiecare dintre care caracterizează caracteristica corespunzătoare. Pentru analiza vectoriala X Se folosesc metode statistice multivariate.

Astfel, obiectul de studiu în analiza multivariata este un vector aleatoriu X, sau un punct aleatoriu în spațiul euclidian ft-dimensional, sistem La variabile aleatoare (unidimensionale), variabile aleatoare ft-dimensionale

Funcția de distribuție vectorială aleatorie este o mărime deterministă nenegativă determinată de formulă

unde este un vector dimensional de numere reale fixe.

Mărimea nenegativă deterministă F(X)

Sunt:

  • continuu k-variabile aleatoare dimensionale, ale căror toate componentele sunt variabile aleatoare continue (unidimensionale);
  • discret k-variabile aleatoare dimensionale, ale căror toate componentele sunt variabile aleatoare discrete;
  • mixt k-variabile aleatoare dimensionale, printre componentele cărora se află atât variabile aleatoare discrete, cât și continue.

Funcția de distribuție F(X) pentru continuu k-variabila aleatoare dimensionala este continua prin definitie.

Densitatea distribuției de probabilitate a unei continue k-variabila aleatoare dimensionala satisface conditia

Densitate f(X) are urmatoarele proprietati:

Aria delimitată mai sus de graficul densității este întotdeauna egală cu unitatea:

unde prin k este indicat numărul total (multiplicitatea) integralelor;

Probabilitatea ca punctul () să lovească o zonă G egal cu

Din definiția densității rezultă că dacă integrăm densitatea de distribuție comună a două mărimi X 1, X 2 pe rând, de exemplu, în limite infinite, obținem densitatea distribuției de probabilitate a unei alte valori:

La fel avem

Densități de probabilitate, funcții de distribuție ale subsistemelor, variabile aleatoare ale sistemului La sunt numite variabile aleatoare privat sau distribuţiile marginale .

Distribuții condiționate vector aleatoriu X sunt numite distribuții ale unui subsistem, componentele acestuia, cu condiția ca componentele rămase să fie fixe. Aceste componente vor fi separate de cele nefixate printr-o bară oblică.

Pentru o variabilă aleatoare continuă, de exemplu, sunt valabile formule care determină densitatea distribuției condiționate a unei variabile aleatoare bidimensionale (), care este un subsistem al sistemului (), cu condiția ca ultimele trei componente să fie fixate în acesta. :

Subsistem, componente și componente vectoriale suplimentare ale subsistemului X sunt numite independent(stochastic, probabilistic), dacă egalitatea este adevărată

În special, componentele vectorului X sunt numite independent, Dacă

În cazul independenței, formule similare sunt valabile pentru produsele de densități sau probabilități ale distribuțiilor marginale și coincidența distribuțiilor condiționate cu cele marginale corespunzătoare (23).

Articole înrudite

2024 liveps.ru. Teme și probleme gata făcute în chimie și biologie.