Numărul de ore petrecute de elevii de liceu pe... Calculul dependențelor de corelare în Microsoft Excel

În clasa I nu sunt deloc, la 2-3 este o oră și jumătate, la 4-5 clase - două ore, la 6-8 - două ore și jumătate, iar din clasa a IX-a până la a XI-a elevul. trebuie să cheltuiască teme pentru acasă nu mai mult de 3,5 ore pe zi. În același timp dificil materii educaționale, cărora li se dau de obicei multe teme la școală, nu ar trebui să fie în program în aceeași zi. Mai simplu spus, nu poți avea chimie, biologie, fizică și matematică într-o singură zi.

Apropo, același lucru este menționat și în SanPiNs, care a intrat în vigoare în 2011. De ce a fost necesar să reamintim din nou școlilor regulile? Ministerul Educației și Științei a declarat pentru RG că recent ministerul a primit multe plângeri de la părinți cu privire la volumul mare de teme și volumul de muncă la școală.

Ministerul a supus în discuție publică proiecte de amendamente la Procedura de organizare și implementare activități educaționale, având înscrise în el cerințele aprobate de SanPiN pentru a atrage atenția deosebită a școlilor asupra volumului de încărcături admisibile, a explicat Ministerul Educației și Științei către RG.

Chiar sunt probleme cu temele. Există concurență între școli pentru granturi, subvenții, Rezultatele examenului de stat unificatși locul în rating. Anul acesta, monitorizarea obligatorie va avea loc chiar și în scoala elementara. Desigur, nimeni nu vrea să fie un învins. Profesorii și-au triplat eforturile la lecții și au crescut teme pentru acasă.

Există școli în care iau bani de la copiii din orele de după școală pentru a face temele și îl consideră un serviciu suplimentar.

Uneori un profesor se gândește: cu cât cere mai mult, cu atât mai bine. Temele sunt necesare, dar trebuie și reglementate. Există o mulțime de profesori care pun multă muncă inutilă copiilor. Un copil nu ar trebui să stea la lecții timp de șase ore pe zi! - Boris Davidovich, director adjunct al celebrei școli N57 din Moscova, își exprimă părerea - Dar eu aș stabili temele nu în funcție de timp, ci de cantitatea de material: am făcut patru exemple în clasă - nu puteți da mai mult de șase. acasă.

La a 57-a Școală de Fizică și Matematică, un elev poate rezolva o problemă acasă toată ziua sau săptămâna. — Și uneori pentru tot restul vieții! - glumește Boris Mihailovici.

„Am trecut la o săptămână de cinci zile pentru a-i ajuta pe copii”, spune Irina Golikova, directorul școlii N17 din Bryansk, „încercăm să oferim mai puține sarcini în weekend”. Al doilea schimb învață până la șapte seara, iar copiii de obicei își fac temele dimineața.” „Deci, fără părinți? - O să clarific. - Cum afectează acest lucru performanța academică - „Avem una dintre cele mai bune școli!”

Sunt temele cu adevărat necesare? Pe vremuri, în secolul al XIX-lea, deja a izbucnit o dispută pe această problemă, dar „temele” au supraviețuit. A fost anulat în 1917 și a revenit abia în anii 30 ai secolului trecut. Acum unii experți își pun din nou întrebarea: dacă vorbim despre trecerea la școală zi intreaga, abandonând cadrul rigid al predării unei lecții, poate chiar este timpul să anulăm și temele?

Irina Ilyina, mama unui elev de clasa a treia, profesor la RGSU:

Fiul meu petrece același timp pe lecții în care unii studenți se pregătesc pentru un seminar - aproximativ două ore. Dar seminarul este o dată pe săptămână, iar lecțiile sunt în fiecare zi.

„Galton a fost foarte impresionat de teoria evoluției a lui Darwin și mai ales de ideea că indivizii aparținând aceleiași specii biologice diferă între ei. Caracteristicile individuale care promovează supraviețuirea sunt supuse „selecției naturale” și transmise descendenților. Galton credea că inteligența este o trăsătură care varia între indivizi, era importantă pentru supraviețuire și era moștenită în același mod ca și caracteristicile fizice, cum ar fi culoarea ochilor sau înălțimea. El a adunat fapte care confirmă heritabilitatea inteligenței și a publicat două cărți despre această problemă: Hereditary Geniuses (1869) și English Scientists: Nature and Nurture (1874). Această din urmă lucrare a popularizat termenii „natură” și „îngrijire” care sunt larg cunoscuți astăzi. În lucrarea sa, Hupton a remarcat o tendință statistică conform căreia geniul și abilitatea în anumite domenii (de exemplu, aptitudinea pentru chimie sau drept) pot fi urmărite de-a lungul mai multor generații în cadrul unei familii. Cu toate acestea, a subestimat influența mediului și a concluzionat că geniul ia naștere ca urmare a transmiterii de informații ereditare. El și-a argumentat punctul de vedere, în special, prin faptul că inteligența într-o populație are distributie normala. Alte trăsături ereditare (cum ar fi înălțimea) au și ele o distribuție normală, așa că Galton a luat acest fapt statistic ca un indicator al influenței eredității.

Abia în 1888, omul de știință a reușit să arate frecvența mare de apariție a unor trăsături precum geniul în familii: și-a formulat ideile într-o lucrare intitulată „Correlation and its Measurement”. Mai întâi, Galton a descoperit că datele pot fi organizate în rânduri și coloane într-un mod special și a venit cu prototipul „diagramei de dispersie” de astăzi. În al doilea rând, Galton a observat că atunci când „corelația” a fost incompletă, a început să apară un model. Părinții cu înălțime peste medie aveau copii înalți, dar destul de des nu erau la fel de înalți ca mama și tatăl. Părinții cu înălțime sub medie au avut copii mici, dar nu atât de scunzi. Aceasta înseamnă că înălțimea copiilor tinde să fie pipernicită sau regres, spre media aritmetică în populație.

Fenomenul de „regresie la medie”, care reprezintă o amenințare la adresa validității interne a cercetării, este una dintre cele mai remarcabile descoperiri ale lui Galton.

A treia observație a lui Galton a fost că un grafic al mediei aritmetice pentru fiecare coloană a tabelului de dispersie a produs o linie mai mult sau mai puțin dreaptă. În esență, este un tip de „linie de regresie”.

Astfel, Galton a descoperit principalele caracteristici ale analizei corelației.

După ce a citit despre munca lui Galton, Karl Pearson și-a continuat cercetările în acest domeniu și a dezvoltat o formulă pentru calcularea coeficientului de corelație. El a etichetat coeficientul „r”, care înseamnă „regresie”, în onoarea descoperirii lui Galton a regresiei la medie. În urma lui Galton, Pearson a crezut că analiza corelației confirmă ideea de moștenire a multor proprietăți găsite în familii individuale. (Citat de Goodwin D., Research in Psychology. Peter, 2004, pp. 312-313).

Variabilele sunt considerate a fi corelate dacă există vreo relație între ele. Acest lucru este implicat de însuși termenul „corelație” - conexiune reciprocă, relație. În cazul corelației directe sau pozitive, relația este de așa natură încât valorile mari ale unei variabile sunt asociate cu valorile mari ale alteia, iar valorile scăzute ale primei cu valorile scăzute ale celei de-a doua. O corelație negativă înseamnă o relație inversă. Valorile mari ale unei variabile sunt asociate cu valorile scăzute ale alteia și invers. Relația dintre timpul dedicat studiului și note este un exemplu de corelație pozitivă. Un exemplu de corelație negativă ar fi relația dintre timpul pierdut și GPA. Timpul pierdut poate fi definit ca numărul de ore pe săptămână petrecute în activități specifice, cum ar fi jocuri video sau vizionarea unor seriale de televiziune.

Puterea corelației este arătată de o valoare specială a statisticii descriptive - „coeficientul de corelație”. Coeficientul de corelație este -1,00 pentru o corelație negativă directă, 0,00 pentru nicio corelație și +1,00 pentru o corelație pozitivă perfectă. Cel mai comun coeficient de corelație este r-ul lui Pearson. Pearson r este calculat pentru datele obținute folosind interval sau scară de raport. Pentru alte scale de măsurare sunt luate în considerare alte tipuri de corelații. De exemplu, pentru datele ordinale (adică ordonate), se calculează ρ(rho) lui Spearman (altfel cunoscut sub numele de r s).

La fel ca media aritmetică și abaterea standard, coeficientul de corelație este o statistică descriptivă. Analiza finală determină dacă o anumită corelație este semnificativ mai mare (sau mai mică) decât zero. Astfel, pentru studiile de corelație, ipoteza nulă (H 0) spune că valoarea reală a lui r = 0 (adică nu există nicio relație), iar ipoteza alternativă (H 1) spune că r ≠ 0. Pentru a respinge ipoteza nulă este de a decide că există o relație semnificativă între două variabile.

Graficul de dispersie

Puterea corelației poate fi descoperită analizând un grafic de dispersie. Este o reprezentare grafică a relației pe care o indică corelația. În cazul unei corelații complet pozitive sau complet negative, punctele formează o linie dreaptă, iar o corelație zero produce un grafic de dispersie de tip (a) ale cărui puncte sunt distribuite aleatoriu. În comparație cu corelația moderată (d și e), punctele forte sunt situate mai aproape unul de celălalt (b și c). În general, pe măsură ce corelația slăbește, punctele de pe diagrama de dispersie se îndepărtează mai mult de diagonala care leagă punctele la corelație completă. exlație egală cu +1,00 sau -1,00.

a) r = 0 b) r = -0,9 c) r = +0,9

d) r = - 0,56 d) r = +0,61

Diagramele de dispersie discutate mai sus (cu excepția lui a) au fost aproximate prin linii drepte, adică au reflectat dependențe liniare. Cu toate acestea, nu toate relațiile sunt liniare, iar calcularea lui Pearson r pentru un caz neliniar nu va ajuta la dezvăluirea naturii unei astfel de relații. Figura următoare prezintă un exemplu ipotetic al relației dintre excitare și performanța sarcinii, ilustrând legea Yerkes-Dodson: sarcinile complexe sunt efectuate bine la niveluri moderate de excitare, dar slab la niveluri foarte scăzute și foarte înalte. Graficul de dispersie arată că punctele cad de-a lungul unei anumite curbe, dar dacă încercăm să aplicăm o corelație liniară vom ajunge r aproape de zero.

Atunci când efectuați cercetări corelaționale, este important să luați în considerare persoanele ale căror scoruri se încadrează într-un interval larg. Limitarea intervalului uneia sau ambelor variabile reduce corelația. Să presupunem că studiem relația dintre GPA și performanța academică la universitate (măsurată prin scorurile medii obținute de boboci la sfârșitul anului). În fig. a) arată cum ar putea arăta o diagramă de dispersie într-un studiu pe 25 de elevi. Coeficientul de corelație este +0,87. Dar dacă studiezi această relație ligatura folosind exemplul elevilor care au primit un punctaj mediu la școală de 4,5 și peste, t o corelația se va schimba, scade la +0,27.

a) r = 0,87 b) r = 0,27

Coeficient de determinare - g 2

Este important să rețineți că este destul de ușor greşitînțelegeți semnificația unei anumite valori Pearson r Dacă este +0,70, atunci relația este într-adevăr relativ puternică, dar nu credeți că +0,70 este cumva legat de 70%, iar in acest caz relatia se stabileste la 70%. Acest lucru nu este adevărat. Pentru a interpreta valoarea corelației, trebuie utilizat coeficientul de determinare (r 2). Se găsește prin pătratul lui r și, prin urmare, valoarea sa nu este niciodată negativă. Acest coeficient este definit formal ca gradul de variabilitate într-o variabilă de corelație cauzat de variabilitatea unei alte variabile. Să explicăm acest lucru cu un exemplu concret.

Se desfășoară un studiu în care 100 de participanți sunt măsurați pentru nivelurile de depresie emoțională și GPA. Testăm relația dintre cele două variabile și găsim o corelație negativă: cu cât nivelul depresiei este mai mare, cu atât scorul mediu este mai scăzut și invers, cu cât depresia este mai mică, cu atât scorul mediu este mai mare. Luați în considerare două valori de corelație care pot fi obținute din acest studiu - -1,00 și -0,50. Coeficientul de determinare va fi egal cu 1,00, respectiv 0,25. Pentru a înțelege semnificația acestor valori, luați în considerare mai întâi că scorul mediu de 100 de persoane studiate va varia probabil de la 3,0 la 5,0. În calitate de cercetători, vrem să aflăm motivul pentru o astfel de variabilitate– de ce o persoană primește 3,2 puncte și alta 4,4 etc. Cu alte cuvinte, vrem să știm ceea ce cauzează diferențele individuale în GPA? In realitate, acest lucru se poate datora mai multor factori: obiceiuri de studiu, nivel general de inteligență, stabilitate emoțională, tendință de a alege subiecte ușor de studiat etc. După cum arată scorurile testelor de depresie, studiul nostru ipotetic examinează unul dintre acești factori- stabilitate emoțională, G 2 arată cât de multă variabilitate a scorurilor medii poate fi atribuitădirect cu depresie.În primul caz, unde r = -1,00 și r 2 = 1,00, putem concluziona că 100% din variabilitatea scorurilor medii se datorează variabilității scorurilor de depresie. Prin urmare, putem spune că 100% din diferențele dintre scorurile medii (3,2 și 4,4 etc.) sunt cauzate de depresie. Într-un studiu real, un astfel de rezultat, desigur, nu poate fi obținut. În al doilea caz, unde r = -0,5 și r2 = 0,25, doar un sfert (25%) din variația scorurilor medii s-ar datora depresiei. Restul de 75% se datorează altor factori similari celor enumerați mai sus. Pe scurt, coeficientul de determinare este o măsură mai bună a puterii unei relații decât r-ul lui Pearson.

Analiza de regresie: formularea de ipoteze

Cea mai importantă caracteristică a studiilor de corelație este posibilitatea dacă există o corelație puternică face ipoteze despre comportamentul viitor. Corelația dintre două variabile face posibilă, pe baza valorilor uneia dintre ele, să se prezică valorile celeilalte. Acest lucru este ușor de arătat folosind un exemplu cu scoruri medii. Dacă știm că timpul dedicat studiului și GPA sunt corelate și că cineva studiază 45 de ore pe săptămână, putem prezice cu exactitate un GPA relativ mare pentru acel student. De asemenea, un GPA mare va prezice timpul petrecut studiind. Efectuarea de ipoteze bazate pe studii de corelație se numește analiza regresiei.

În fig. prezintă un grafic de dispersie pentru: a) timpul dedicat studiului și GPA și b) timpul pierdut și GPA. Fiecare grafic afișează, de asemenea, o linie de regresie, care este folosită pentru a face ipoteze. Linia de regresie este numită și „linia optimă”: reprezintă cel mai bun mod posibil de a rezuma punctele unui grafic de dispersie. Aceasta înseamnă că valorile absolute ale distanțelor verticale dintre fiecare punct de pe grafic și linia de regresie sunt minime.

Linia de regresie este calculată folosind formula Y = o + b X, unde a este punctul în care linia dreaptă intersectează axa Y (adică, segmentul tăiat pe axa Y), a b– acesta este unghiul de înclinare al dreptei sau abrupta relativă a acesteia. X este o cantitate cunoscută, iar Y este cantitatea pe care încercăm să o prezicem. Știind 1) puterea corelației și 2) abaterea standard pentru variabilele corelate, putem calcula cantitatea. b, cunoscând 1) valoarea bși 2) pot fi găsite valorile medii ale variabilelor corelate O.

Analiza de regresie folosește o ecuație de regresie pentru a prezice o valoare Y (cum ar fi GPA) pe baza unei valori X (cum ar fi timpul dedicat studiului). Uneori se numește Y criteriu variabilă și X - predicat-rupt variabilă. Cu toate acestea, pentru a face ipoteze corecte, corelația trebuie să fie mult peste zero. Cu cât corelația este mai mare, cu atât punctele diagramei de dispersie vor fi mai apropiate de linia de regresie și cu atât vei fi mai încrezător că presupunerile tale sunt corecte. Astfel, problema limitării intervalului menționată mai devreme, care reduce corelația, reduce și validitatea predicțiilor.

Un grafic de ecuație de regresie arată cum să faci predicții folosind o linie de regresie.

De exemplu, ce notă medie ar trebui să se aștepte de la un student care petrece 34 de ore pe săptămână studiind. Pentru a obține răspunsul, desenăm perpendiculare de la axa X la dreapta de regresie, apoi de la punctul de intersecție la axa Y Valoarea punctului de pe axa Y va fi valoarea estimată (rețineți că corectitudinea ipotezei. depinde de puterea corelației). Astfel, 40 de ore de studiu ar prezice un GPA de 3,4, iar 41 de ore pierdute ar prezice un GPA chiar peste 2,3. Prin utilizarea formule regresia poate calcula valori mai precise și poate face predicții mai precise.

Ar trebui să știți că analiza de regresie este folosită în majoritatea studiilor despre care aflăm din mass-media.

De exemplu, putem întâlni un raport al unui studiu privind „factorii de risc de atac de cord” care, pe baza unei corelații semnificative între fumat și boli de inimă, concluzionează că fumătorii înrăiți sunt mai susceptibili de a dezvolta boli cardiovasculare decât nefumătorii. Aceasta înseamnă că fumatul este un predictor al bolilor de inimă. Pe baza unui alt studiu care examinează „profilul unui soț abuziv”, se poate concluziona că probabilitatea unui astfel de comportament crește dacă făptuitorul este șomer. Aceasta rezultă din corelația dintre șomaj și tendința de a se angaja într-un comportament abuziv. Pe baza prezenței corelației folosind analiza de regresie, cunoscând prima, se poate face o presupunere despre a doua.

>>Informatica: Atelier de calculatoare: Lucrul 15. Calculul dependentelor de corelare in MS Excel

Atelier de calculatoare

Lucrarea 15. Calculul dependențelor de corelare în MS Excel

Obiectivele muncii:

Obținerea unei idei despre dependența de corelație a cantităților;

Stăpânirea metodei de calcul a coeficientului de corelație cu ajutorul funcției CORREL.

Folosit software mijloace: procesor de foi de calcul MS Excel.

Sarcina 1

În cele de mai jos masă conține date despre măsurători perechi a două cantități realizate într-o anumită școală; temperatura aerului în clasa x și proporția elevilor cu răceli y:

Dependența este de natură statistică, deoarece este imposibil să spunem în mod sigur, de exemplu, că la o temperatură de 15°C la școală 5% dintre elevi sunt bolnavi și la o temperatură de 20°C - 2%. Pe lângă temperatură, există și alți factori care influențează răceala, diferiți pentru diferite școli și este imposibil să-i controlezi pe toți.

Faceți următoarele succesiv:

=> introduceți datele în Excela așa cum se arată în fig. 2.12 (vezi subiectul 9);

=> utilizați Chart Wizard pentru a construi o diagramă de dispersie care afișează vizual dependența tabelului;

=> răspunde la întrebarea dacă, pe baza acestui punct, este posibilă formularea unei ipoteze despre prezența unei corelații liniare între valori;

=> dacă răspunsul este clar negativ, atunci corectați tabelul astfel încât ipoteza unei corelații liniare să devină mai plauzibilă;


Sarcina 2

Vino cu un tabel de măsurători perechi ale valorilor unor cantități între care există o corelație ipotetică. Analizați această relație pentru prezența unei corelații liniare.

Exemple de cantități relevante relevante includ:

Nivelul de educație (măsurat, de exemplu, în anii de școală în general) și nivelul venitului lunar;

nivelul de educațieși nivelul postului deținut (pentru acesta din urmă, veniți cu o scală convențională);

Numărul de calculatoare din școală per elev și rating mediu la testarea nivelului de competență în tehnologiile standard de prelucrare a informațiilor;

Numărul de ore petrecute de un elev de liceu la teme și nota medie;

Cantitatea de îngrășământ aplicată pe sol și randamentul unei anumite culturi.

Semakin I.G., Henner E.K., Computer Science and ICT, 11

Trimis de cititorii de pe site-uri de internet

Conținutul lecției notele de lecție sprijinirea metodelor de accelerare a prezentării lecției cadru tehnologii interactive Practica sarcini și exerciții ateliere de autotestare, instruiri, cazuri, întrebări teme pentru acasă întrebări de discuție întrebări retorice de la elevi Ilustrații audio, clipuri video și multimedia fotografii, imagini, grafice, tabele, diagrame, umor, anecdote, glume, benzi desenate, pilde, proverbe, cuvinte încrucișate, citate Suplimente rezumate articole trucuri pentru pătuțurile curioși manuale dicționar de bază și suplimentar de termeni altele Îmbunătățirea manualelor și lecțiilorcorectarea erorilor din manual actualizarea unui fragment dintr-un manual, elemente de inovație în lecție, înlocuirea cunoștințelor învechite cu altele noi Doar pentru profesori lecții perfecte planul calendaristic pentru anul recomandări metodologice programe de discuții Lecții integrate

Dependențe de corelație

Regresia modele matematice sunt construite în cazurile în care se știe că există o relație între doi factori și se cere obținerea descrierii sale matematice. Acum ne vom uita la probleme de alt fel. Să fie o caracteristică importantă a unora sistem complex este factorul A. Poate fi influențat simultan de mulți alți factori: B, C, D și așa mai departe.

Vom lua în considerare două tipuri de probleme - trebuie să determinăm:

1. factorul B are vreun efect regulat vizibil asupra factorului A?

Ca exemplu de sistem complex, vom lua în considerare o școală. Pentru primul tip de sarcină, să fie factorul A performanța academică medie a elevilor școlii, iar factorul B să fie cheltuielile financiare ale școlii pentru nevoi economice: reparații clădiri, renovarea mobilierului, designul estetic al localului etc. Aici, influența a factorului B asupra factorului A nu este evident. Probabil, alte motive au o influență mult mai puternică asupra performanței academice: nivelul de calificare al profesorilor, numărul de studenți, nivelul mijloace tehnice antrenament și altele.

Statisticienii știu că, pentru a identifica dependența de un anumit factor, este necesar să excludem pe cât posibil influența altor factori. Mai simplu spus, atunci când colectați informații de la diferite școli, trebuie să alegeți școli care au aproximativ aceeași populație de elevi, calificări ale profesorilor etc., dar cheltuielile de funcționare ale școlilor sunt diferite (unele școli pot avea sponsori bogați, altele nu).


Deci, cheltuielile de afaceri ale școlii să fie exprimate prin numărul de ruble pe numărul de elevi din școală (rub/persoană) petrecute într-o anumită perioadă de timp (de exemplu, în ultimii 5 ani). Lăsați performanța academică să fie evaluată prin scorul mediu al elevilor din școală pe baza rezultatelor ultimei lor an universitar. Încă o dată, vă atragem atenția asupra faptului că în calculele statistice se folosesc de obicei valori relative și medii.

Rezultatele colectării datelor pentru 20 de școli, introduse într-o foaie de calcul, sunt prezentate în Fig. 1. În Fig. Figura 2 prezintă un grafic de dispersie construit din aceste date.

Orez. 1 Statistici

Orez. 2 Graficul de dispersie

Valorile ambelor cantități: costurile financiare și performanța elevilor au o împrăștiere semnificativă și, la prima vedere, relația dintre ele nu este vizibilă. Cu toate acestea, s-ar putea să existe.

Dependența dintre cantități, fiecare dintre acestea fiind supusă unei dispersări complet necontrolate, se numesc dependențe de corelație.

Ramura statisticii matematice care studiază astfel de dependențe se numește analiză de corelație. Analiza corelației studiază legea medie de comportament a fiecărei mărimi în funcție de valorile altei mărimi, precum și măsura unei astfel de dependențe.

O evaluare a corelației valorilor începe cu o ipoteză despre natura posibilă a relației dintre valorile lor. Cel mai adesea, se presupune o relație liniară. În acest caz, măsura dependenței de corelație este o valoare numită coeficient de corelație. Ca mai înainte, nu vom scrie formulele prin care se calculează; Nu sunt greu de scris, dar este mult mai greu de înțeles de ce sunt așa cum sunt. În această etapă, tot ce trebuie să știți este următoarele:

· coeficientul de corelație (notat de obicei cu litera greacă ρ) este un număr cuprins între -1 și +1;

· dacă acest număr este apropiat în valoare absolută de 1, atunci există o corelație puternică, dacă este aproape de 0, atunci este slab;

· apropierea lui ρ la +1 înseamnă că o creștere a unui set de valori corespunde unei creșteri a unui alt set, apropierea de -1 înseamnă opusul;

· valoarea lui ρ este ușor de găsit folosind Excel (funcții statistice încorporate).

În Excel, funcția de calcul al coeficientului de corelație se numește CORREL și face parte din grupul funcțiilor statistice. Vă vom arăta cum să-l utilizați. Pe aceeași foaie Excel unde tabelul prezentat în Fig. 1, trebuie să plasați cursorul pe orice celulă liberă și să rulați funcția CORREL. Va solicita două intervale de valori. Vom indica Costurile și Performanța. După introducerea acestora, se va afișa răspunsul: ρ = 0,. Această valoare indică un nivel mediu de corelație.

Relația dintre costurile de funcționare a școlii și performanța academică nu este greu de înțeles. Elevii sunt bucuroși să meargă la o școală curată, frumoasă și confortabilă, se simt ca acasă acolo și, prin urmare, învață mai bine.

În exemplul următor, se realizează un studiu pentru a determina dependența performanței elevilor de liceu de doi factori: furnizarea de manuale în biblioteca școlii și asigurarea de calculatoare la școală. Ambele caracteristici sunt exprimate cantitativ ca procent din normă. Standardul de furnizare a manualelor este setul lor complet, adică o astfel de cantitate încât fiecărui elev să i se ofere de la bibliotecă toate cărțile de care are nevoie pentru studii. Vom considera numărul de calculatoare ca normă, astfel încât să existe un computer pentru fiecare patru elevi de liceu la școală. Se presupune că elevii folosesc computerele nu numai în informatică, ci și în alte lecții, precum și în timpul orelor extrașcolare.


În tabelul prezentat în Fig. Tabelul 3 prezintă rezultatele măsurării ambilor factori în 11 școli diferite. Să reamintim că influența fiecărui factor este studiată independent de ceilalți (adică influența altor factori semnificativi ar trebui să fie aproximativ aceeași).

S-au obținut coeficienți de corelație liniară pentru ambele dependențe. După cum se poate observa din tabel, corelația dintre furnizarea de manuale și performanța academică este mai puternică decât corelația dintre suportul computerizat și performanța academică (deși ambii coeficienți de corelație nu sunt foarte mari). Din aceasta putem concluziona că cartea rămâne încă o sursă de cunoștințe mai semnificativă decât computerul.

Pe scurt despre principalul lucru

Dependența dintre cantități, fiecare dintre acestea fiind supusă unei dispersări complet incontrolabile, se numesc corelații.

Folosind analiza corelației, puteți rezolva următoarele probleme: determinați dacă un factor are un impact semnificativ asupra altui factor; alegeți cel mai semnificativ dintre mai mulți factori.

O măsură cantitativă a corelației dintre două mărimi este coeficientul de corelație.

Valoarea coeficientului de corelație se află între -1 și +1. Cu cât valoarea sa absolută este mai aproape de 1, cu atât corelația (conexiunea) este mai puternică.

În MS Excel, pentru determinarea coeficientului de corelație se folosește funcția CORREL din grupul de funcții statistice.

Întrebări și sarcini

1. Ce este dependența de corelație?

2. Ce este analiza corelației?

3. Ce tipuri de probleme pot fi rezolvate folosind analiza corelației?

4. Ce valoare este o măsură cantitativă a corelației? Ce valori poate lua?

5. Cu ce ​​procesor de foi de calcul puteți calcula coeficientul de corelație?

6. Pentru datele din tabelul prezentat în Fig. 3, construiți două modele de regresie liniară.

7. Pentru aceleași date se calculează coeficientul de corelație. Comparați cu cele prezentate în fig. 3 rezultate.

Atelier de informatică „Calculul dependențelor de corelare în MS Excel”

Obiectivele lucrării: obținerea unei idei despre dependența de corelație a cantităților; însuşirea metodei de calcul a coeficientului de corelaţie cu ajutorul funcţiei CORREL.

Software utilizat: procesor de foi de calcul MS Excel.

Sarcina 1. Tabelul de mai jos conține date privind măsurătorile pereche a două cantități efectuate într-o anumită școală: temperatura aerului în clasa x și proporția elevilor cu răceli y:

Dependența este de natură statistică, deoarece este imposibil să spunem în mod sigur, de exemplu, că la o temperatură de 15°C la școală 5% dintre elevi sunt bolnavi și la o temperatură de 20°C - 2%. Pe lângă temperatură, există și alți factori care influențează răceala, diferiți pentru diferite școli și este imposibil să-i controlezi pe toți.

Faceți următoarele:

Þ utilizați un grafic de dispersie pentru a afișa vizual dependența tabelară;

Þ raspundeti la intrebarea daca, pe baza acestei diagrame de dispersie, este posibila ipoteza ca exista o corelatie liniara intre marimi;

Þ dacă răspunsul este în mod evident negativ, atunci corectează tabelul astfel încât ipoteza unei corelații liniare să devină mai plauzibilă;

Þ folosind funcția CORREL, găsiți coeficientul de corelație și confirmați sau infirmați ipoteza specificată.

Sarcina 2. Vino cu un tabel de măsurători perechi ale valorilor unor cantități între care există o corelație ipotetică. Analizați această relație pentru prezența unei corelații liniare.

Exemple de cantități relevante relevante includ:

ü nivelul de studii (măsurat, de exemplu, în anii de studii în general) și nivelul venitului lunar;

ü nivelul de educație și nivelul postului deținut (pentru acesta din urmă, veniți cu o scală convențională);

ü numărul de calculatoare din școală per elev, și scorul mediu la testare pentru nivelul de competență în tehnologiile standard de procesare a informațiilor;

ü numărul de ore petrecute de un elev de liceu la teme și nota medie;

ü cantitatea de îngrășământ aplicată solului și randamentul unei anumite culturi agricole.

În acest caz, puteți merge în două moduri. Primul, mai serios și util practic - nu doar găsiți o corelație ipotetică, ci găsiți și date reale despre aceasta în literatură. Al doilea mod, mai ușor - considerați această sarcină ca un joc necesar pentru a înțelege ce este o corelație și pentru a dezvolta abilitățile tehnice de analiză a acesteia și a veni cu datele corespunzătoare, încercând să faceți acest lucru în cel mai plauzibil mod.

Scopul lucrării: obținerea unei idei despre dependența de corelație a cantităților; însuşirea metodei de calcul a coeficientului de corelaţie cu ajutorul funcţiei KOPPEL.
Folosit software: procesor de foi de calcul Microsoft Office Excel.

Sarcina 1

Este necesar să se efectueze calcule ale corelației dintre performanța elevilor și cheltuielile de afaceri ale școlii, descrise în § 38 din manual.
1. Completați foaia de calcul cu următoarele date:

2. Construiți o diagramă de împrăștiere a dependenței cantităților.

3. Executați funcția statistică KOPEL, specificând intervalele de valori în caseta de dialog: B2:B21 și C2:C21.
4. Notați valoarea coeficientului de corelație.

Sarcina 2

Efectuați calcule de corelare a performanțelor elevilor la furnizarea de manuale și la furnizarea de calculatoare, prezentate în tabelul următor.

Misiunea pentru autoexecuție pe tema „Dependențe de corelație”

Vino cu un tabel de măsurători perechi ale valorilor unor cantități între care există o corelație ipotetică. Analizați această dependență pentru prezența unei corelații liniare.

      Exemple de cantități relevante relevante includ:
      nivelul de educație (măsurat, de exemplu, în anii de școlarizare per total) și nivelul venitului lunar;
      nivelul de educație și nivelul postului deținut (pentru acesta din urmă, veniți cu o scală convențională);
      numărul de calculatoare din școală per elev și scorul mediu la test pentru nivelul de competență în tehnologiile standard de procesare a informațiilor;
      numărul de ore petrecute elevii de liceu la teme și nota medie;
      cantitatea de îngrășământ aplicată solului și randamentul unei anumite culturi.

În acest caz, puteți merge în două moduri. Prima, mai serioasă și mai utilă practic: nu doar găsiți o corelație ipotetică, ci găsiți și date reale despre aceasta în literatură. A doua modalitate este mai simplă: o tratezi ca pe un joc pentru a înțelege ce este corelația și a dezvolta abilitățile tehnice de a o analiza și a veni cu datele corespunzătoare, încercând să o faci în cel mai plauzibil mod.

Articole înrudite

2024 liveps.ru. Teme și probleme gata făcute în chimie și biologie.