LP10 - TATITICA INFERENŢIALĂ. Itervale de îcredere. Cosiderații teoretice Majoritatea studiilor statistice u se realizează pe îtreaga populaţie statistică di uul sau mai multe icoveiete: - talia populaţie poate fi ueori foarte mare; - timpul efectiv de studiu este proporţioal cu umărul etităţilor studiate; - costurile şi resursele alocate cresc proporţioal cu umărul etităţilor studiate; - există situaţii î care u se pot culege iformaţii despre toţi idivizii populaţiei. De aceea petru studierea parametrilor caracteristicilor populaţiei statistice se procedează astfel: a. se extrage u eşaţio reprezetativ.talia (volumul) eşatioului se alege astfel îcât să se permită u studiu exhautiv al caracteristicilor; b. î fucţie de atura caracteristicilor (catitative sau calitative) folosid statistica descriptivă se determiă pricipalii parametrii; c. folosid statistica ifereţială se îcearcă estimarea parametrilor petru îtreaga populaţie poriduse de la rezultatele obţiute la ivelul eşatioului. Exemplu: Procedeu petru o variabilă catitativă. e presupue că e aflăm î următoarea situație: - Media şi abaterea stadard (µ,) teoretică a uei caracteristici petru o populaţie u se cuosc. e va proceda astfel: - e extrage aleatoriu u eşatio reprezetativ petru care se determiă media şi abaterea stadard (m și s) e va proceda la realizarea uei estimări a parametrilor populaţiei plecâdu-se de la valorile parametrilor observaţi pe eșatioul extras. Estimarea poate fi: - puctuală - pri itermediul uui iterval de îcredere. Estimatorul uui parametru este o fucţie depizâd de observaţiile efectuate pe u eşatio extras la îtâmplare care furizează o valoare aleatoare umită estimarea puctuală a parametrului. Exemplu: Dacă eşatioul E are valorile x 1,...,x petru caracteristica studiată, estimatorul puctual al mediei aritmetice a uei populaţii P este m = (x 1 +x 2 +...+x )/ Estimarea itervalului de îcredere Estimarea puctuală a uui parametru teoretic furizează o valoare ce depide de fluctuaţiile de eşatioare şi deci poate fi diferită de valoarea reală a parametrului estimat. Astfel estimarea uui parametru teoretic u se face pritr-o sigură valoare ci pritru iterval î care parametrul estimat se găseşte cu o probabilitate mare umit iterval de îcredere. Este recomadabil să se estimeze u parametru teoretic pritr-u iterval, umit iterval de îcredere (cofidece iterval CI), î care să se poată afirma că parametrul estimat se găseşte cu o probabilitate ridicată. ETIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE Itervalul de îcredere este u iterval mărgiit de valori (limitele poartă umele de limite de îcredere), care iclude media caracteristicii studiate. Cu cât itervalul este mai larg, cu atât sutem mai siguri că media caracteristicii studiate se va regăsi î acel iterval. Mărimea îcrederii, cofideţa, este dată de probabilitatea ca valoarea (valorile) studiate să se găsească î acel iterval. 1
Îcrederea (cofideţa) utilizată î mod frecvet este de 95%, 99% sau 99.9% Cazul uei variabile catitative - estimarea uei medii Fie P o populaţie î care variabila X are o media teoretică µ ecuoscută. Di populaţia P se extrage la îtâmplare eşatioul E reprezetativ. I eşatioul E petru variabila X se observă o medie m şi se calculează o deviație stadard puctuală estimată s; e îcearcă să se determie petru valoarea ecuoscută a mediei teoretice µ u iterval de îcredere cu pragul α, (cu ajutorul lui m şi s observate), adică să se determie u iterval *a,b+ î care probabilitatea ca media teoretică µ să se afle este de 1-α: Pr(a µ b) = 1 α α se umește prag de semificație sau risc 1 α se umește ivel de îcredre sau ivel de cofideță a și b se umesc limite de îcredere α și 1- α poate fi exprimat ca valori umerice sau procetuale Pragurile de semificație uzitate î statistică sut: =0,05 sau =5% =0,01 sau =1% =0,001 sau =0,1% Acestora le corespud ivelele de îcredere sau probabilitățile: Prag de semificație Nivel de îcredere =0,05 sau =5% 95% =0,01 sau =1% 99% =0,001 sau =0,1% 99,9% Determiarea itervalelor de îcredre se face pe baza formulelor de calcul prezetate mai jos: I. Câd (deviația stadard a populației) se cuoaşte, itervalul de îcredere petru media µ cu pragul de semificaţie α este: x u x u u se umește marjă de eroare =0,05 sau =5% u =1,96 =0,01 sau =1% u =2,58 =0,001 sau =0,1% u =3,29 II. Dacă u se cuoaşte a. Eșatioul are >120, î calculul itervalului de îcredere se folosește deviația stadard a eșatioului x u x u =0,05 sau =5% u =1,96 =0,01 sau =1% u =2,58 =0,001 sau =0,1% u =3,29 2
u se umește marjă de eroare b. Eșatioul are <120, î calculul itervalului de îcredere se folosește deviația stadard a eșatioului x t, 1 x t, 1 t, 1 se umește marjă de eroare t,-1 se citeşte di tabelul cu distribuţia "t" la ivelul şi -1 grade de libertate sau cu ajutorul fucției TINV implemetată î EXCEL. TINV (Fucția TINV) Returează iversul distribuției t tudet bi-alterativă Această fucție a fost îlocuită cu ua sau mai multe fucții oi, care pot oferi precizie îmbuătățită și ale căror ume reflectă mai bie utilizarea lor. ( fucția T.INV.2T sau fucția T.INV.) itaxa TINV(probabilitate,grade_libertate) itaxa fucției TINV are următoarele argumete: - Probabilitate Obligatoriu. Este probabilitatea asociată cu repartiția t tudet bi-alterativă. - Grade_libertate Obligatoriu. Este umărul gradelor de libertate care să caracterizezeă repartiția. Determiarea volumului al eşatioului ut situații î care pe cercetător îl iteresează cât de mare trebuie să fie eșatioul cercetat astfel îcât să se poată estima u parametru cu o aumită probabilitate. La estimarea mediei teoretice a uei variabile catitative defiite pe o populaţie statistică P, itervalul de îcredere pe baza mediei observate m se calculează pe u eşatio reprezetativ E cu talia (volumul). Petru u prag de semificație (risc) și o precizie a itervalului de îcredere *m-, țiâdu-se cot de faptul că itervalul de îcredere se exprimă: m z s m z s 2 2z e obție: s z s Deci volumul eșatioul se poate xprima fucție de: - Precizie - Deviația stdard 2 3
- probabilitate Exemplu de problemă rezolvată petru calculul itervalului de îcredere Pe u eşatio aleator de 100 ou ăscuţi cuoaştem media greutăţii la aştere a oilor ăscuţi: 3275 g şi abaterea stadard: 854. Care este itervalul de icredere estimat cu probabilitatea de 95% petru media greutatii la astere pe populatia di care este extras esatioul? Formula care se aplică este (se cuoaște deviația stadard petru populație): x u x u =0,05 sau =5% u =1,96 Limita iferioara a itervalului de icredere: Media marja de eroare limita iferioară Limita superioara a itervalului de icredere: Media marja de eroare limita superioarî Itervalul de icredere estimat cu probabilitatea (ivelul de îcredere) de 95% petru media greutatii la astere di populatia studiata este: [3107,6 ; 3442,4] Calculul valorii ce se aduă și se scade di valoarea medie (marja de eroare) se poate face pe baza formulei de calcul sau cu ajutorul fucțiilor iplemetate î Excel (fucția CONFIDENCE). Fucția CONFIDENCE Returează marja de eroare, adica valoarea ce trebuie scăzută respectiv aduată la valoarea medie petru a afla itervalul de îcredre. Media eșatioului, x, este la cetrul acestui iterval, iar itervalul este x ± CONFIDENCE. CONFIDENCE(alfa,dev_stadard,dimesiue) itaxa fucției CONFIDENCE are următoarele argumete: Alfa Obligatoriu. Este pragul de semificație sau riscul utilizat petru a calcula ivelul de îcredere. Dev_stadard Obligatoriu. Este abaterea stadard a populației petru zoa de date și se presupue a fi cuoscută. Dimesiue Obligatoriu. Este mărimea eșatioului. Petru exemplu dat apelarea fucției CONFIDENCE cu următoarele argumete: CONFIDENCE(0,05;854;100), geerează valoarea : 167,3809 Media= 3275 e obție: Limita iferioară: 3107,619 Limita superioară: 3442,381 4
Obiective: - îsuşirea modului de determiare al itervalului de îcredere (de cofideţă) petru media uui eşatio - Determiarea umărului de observații ce trebuie să-l coțiă eșatioul petru a determia u iterval de îcredere a uui parametru de o aumită mărime. Petru setul de 100 de valori valoarea CI se poate calcula și cu ajutorul opțiuii Descriptive tatistics di data Aalyses. 3585 2376 3197 1919 4817 4619 3734 3042 2908 936 3519 3644 3384 2716 3179 1854 2976 4043 3229 3755 4034 3632 4159 2654 3134 2856 3311 2845 1511 3462 3755 2682 2329 3091 3045 3579 2446 3410 3560 4347 3966 4009 2541 2865 2697 2890 3336 2984 2285 3641 2987 4108 2964 3471 2652 4351 2522 3398 3274 3059 3250 3475 4106 4194 3155 4087 3168 3553 2917 3213 4282 3795 4212 3309 2907 2798 3196 3350 2659 2536 3586 2790 2085 3635 3135 4181 3324 2894 5005 3598 2684 4474 4008 3209 3975 2946 3010 1823 2336 2734 Apelâd fucțiile implemetate î Excel media dev stadard CONFIDENCE Limita iferioară Limita superioară =AVERAGE(A1:J10) =TDEV.(A1:J10) =CONFIDENCE(0,05;O4;100) =O3-O5 =O3+O5 e obție: media 3248,71 dev stadard 709,65 CONFIDENCE 140,8104 Limita iferioară 3107,87 Limita superioară 3389,49 CONFIDENCE.T Apelâd Descriptive tatistics di Data Aalyses se obție: Ateție! Cele 100 de valori trebuie sa apara pe o coloaă î foaia de calcul di Excel. Valoarea di râdul cu eticheta Cofidece Level(95,0%) reprezită valoarea ce se va scădea și adua la medie petru a obție limita iferioară și superioarî a itervalului de icredere. Colum1 Mea 3248,708 tadard Error 70,96509 Media 3210,982 Mode #N/A tadard Deviatio 709,6509 ample Variace 503604,3 5
Kurtosis 0,642855 kewess -0,22385 Rage 4069,028 Miimum 935,989 Maximum 5005,017 um 324870,8 Cout 100 Cofidece Level(95,0%) 140,8101 Exemplu de problemă rezolvată petru aflarea umărului de observații ă se afle umărul de observaţii ce trebuie efectuate petru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că 2 =9 cm 2 şi se cere o precizie =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95. Riscul =0.05 Deviația stadard =3 cm Precizia =1 cm z =1,96 3 1,96 1 petru =34 z 0,05;34 =2,033 2 35,574 35 2 3 2.033 37,197 37 1 ut ecesare 37 de observaţii petru estimarea taliei medii cu precizia de 1 cm. 6
Problema propuse. 1. ă se calculeze cu probabilitatea (ivelul de îcredre) de 95%, 99% și 99.9% itervalul de îcredre petru valoarea medie a TA, petru o populație cu o repartiție ormală di care s-a extras u eșatio de 40 de idivizi la care s-au măsurat următoarele valori ale TA. TA Nr_id (mm/hg) 1 126 2 130 3 135 4 116 5 122 6 126 7 128 8 130 9 123 10 124 11 140 12 125 13 120 14 121 15 140 16 135 17 115 18 135 19 132 20 128 21 126 22 125 23 115 24 117 25 121 26 125 27 129 28 124 29 131 30 127 31 127 32 125 33 140 34 115 35 110 36 112 37 125 38 143 39 122 40 135 2. Există ipoteza că bolavii de artrită reumatoidă au u risc mai mare de a dezvolta osteoporoză. Au fost observaţi 20 de bolavi de artrită reumatoidă toţi de sex masculi şi de aceeaşi vârstă. Petru aceşti pacieţi s-a măsurat ivelul calcitoiei (HCT). Valorile HCT observate se găsesc mai jos: Nr_id HCT (pg/ml) 1 26 2 21 3 44 4 30 5 37 6 20 7 35 8 39 9 48 10 19 11 19 12 22 13 27 14 39 15 38 16 20 17 21 18 21 19 23 20 45 e cere: Calculaţi itervalul de îcredere petru media HCT ecuoscută a populaţiei bolave de artrită reumatoidă ştiid valorile măsurate petru u eșatio format di 20 de idivizi. 7
3. Maagerul uei compaii farmaceutice este preocupat de faptul că medicamete similare sut vâdute la preţuri sesibil diferite î farmaciile di zoă. De aceea, au fost îregistrate preţurile de vâzare ale uuia şi aceluiaşi medicamet î 40 de farmacii. Prețurile de vâzare sut: 26; 32; 33; 12; 11; 19;18; 21; 21; 40; 39; 27; 30; 32; 34; 12; 17; 36; 25; 15; 24; 23; 29; 30; 30; 26; 17; 23; 14; 28; 29; 24; 19; 21; 28; 20; 22; 27; 22; 27. Estimaţi cu probabilitatea de 95% itervalul de îcredere al preţului de vâzare a medicametului î cele 40 de farmacii. 4. Nivelul sagvi al calciului la u umăr de 52 de pui broiler costituiți i Lotul L1, hraiți î codiții de aport de alumiiu î rație și ivelul sagvi al calciului la u umăr de 52 de pui broiler costituiți i Lotul martor este prezetat î tabelul urmator: Lotul 1 martor 17,7 8,9 11,6 9,6 13,4 15,2 13,5 9,2 9,6 9,5 15,6 10,2 9,5 13,5 14,2 15,2 12,4 9,6 14,2 11,6 9,9 14,2 10,2 13,5 11,6 10,2 16,2 15,6 9,6 9,8 11,6 14,2 11,7 11,6 14,6 14,2 10,7 10,1 14,3 9,9 10,2 15,6 12,4 16,2 10,6 10,4 10,7 11,2 11,6 14,2 11,6 14,6 15,2 11,3 15,2 10,7 12,9 12,4 11,7 12,4 12,9 10,7 13,5 10,6 9,8 11,6 10,2 11,6 11,6 10,6 14,2 15,2 8,9 11,7 14,2 11,7 10,3 15,2 11,1 12,9 9,5 10,2 12,4 10,2 9,8 12,9 15,2 11,6 9,6 8,9 11,6 10,1 8,9 11,6 13,5 10,3 10,2 9,5 11,7 10,7 15,2 10,3 14,2 12,4 Estimaţi cu probabilitatea de 95% itervalul de îcredere petru valoarea medie a ivelului sagui al calciului petru lotul martor. 5. Producţia de lapte î mii litrii la două loturi de vaci di rasa A şi rasa B sut prezetate î tabelul de mai jos: rasa A rasa B 2,9 5,9 4 5 3,8 5 5,1 5,7 5 4,3 2 4,7 5,4 3,6 - Calculați eroarea stadard a mediei petru eșatioaele di 4,6 2,4 5 2,9 4 6 5 rasa A și B 3,9 5,1 2 4,6 6 5,4 3,8 - Estimaţi cu probabilitatea de 95% itervalul de îcredere 4,2 3,6 2,9 3,9 3,6 4,1 4 petru producţia de lapte petru rasa B. 3,8 5,1 5,7 4 4,2 5,2 6 4,3 3,6 4,6 2,2 3,1 5,2 3,6 3 5,4 3,9 4,3 4,3 6 4,2 5,3 3,5 4,2 5,7 4,1 4,1 3,1 2,8 4 3,8 5 5,2 5 4,3 2,5 4,2 4,3 5,2 5 4,1 4,6 5 3 4,1 5,2 5,2 2,2 5,3 5 5,2 8
6. Î urma uei diete prescrise de faimosul dieteticia Dr. C, se pierd î greutate săptămâal, î medie î jur de 2kg. Pierderile î greutate la u lot de 50 de persoae care au urmat această dietă este prezetată î tabelul de mai jos. 0,3 3,1 3,3 0,6 2,2 1,2 1,5 3,7 0,8 3,7 1,1 2,4 4 1,5 3,7 2,8 0,5 3,9 0,3 3,3 1 3,3 2,4 3,8 0,5 1,6 0,4 0,5 0,6 1,8 0,4 3 1 0,8 0,9 0 3,1 1,5 2,1 1,2 0,8 2,9 3,7 0,7 0,5 0 1,1 2 3,4 0,8 a. ă se determie poderea cazurilor care se găsesc î itervalele: ( -s; +s); ( -2s; +2s); b. Estimaţi cu probabilitatea de 95% itervalul de îcredere petru valoarea medie a scăderii î greutate petru lotul studiat. 7. Câte observații sut ecesare petru a determia itervalul de îcredere petru media greutații la astere cu precizia de 280g ( ) și riscul de 1% știid că acest parametru are o distribuție ormală cu o deviație stadard de 709,65g. 8. Câte observații sut ecesare petru a determia itervalul de îcredere petru media greutații pierdută î urma uei diete, cu riscul de 5%, precizia de 0,5kg știid că acest parametru are o distribuție ormală cu o deviație stadard de 1,2688kg. 9