1
Date de tip calitativ: Proporții, Rate, Rapoarte Date de tip cantitativ: Media aritmetica, Mediana, Modul, Media geometrica, Media armonica, Valoarea centrala Cvartile, Percentile Dispersia, Abaterea standard, Coeficientul de variatie, Eroarea standard, Amplitudinea Asimetria Boltirea 2
Date de tip calitativ Proporții Rate Rapoarte 3
Proporția celor expuși in grupul de control= 45/315=14,3% Proporția celor expuși in grupul de risc= 84/397=21,2% 4
=număr de bolnavi / număr de persoane examinate 5
Media aritmetica, Mediana, Modul, Media geometrica, Media armonica, Valoarea centrala Cvartile, Percentile Dispersia, Abaterea standard, Coeficientul de variatie, Eroarea standard, Amplitudinea Asimetria Boltirea Observatie: Toate măsuratorile se referă la seria unidimensională: X: X 1, X 2,, X n 6
se face printr-o serie de indicatori care descriu valorile de la mijlocul unei distributii de frecventa; acesti indicatori dau o masura sumara a distributiei respective. Seriile pot consta din: esantioane de observatii observatii asupra intregii populatii. 7
Media aritmetica X X1 X 2... n X n i 1 n n X i Exemplu Numar de zile de spitalizare: 19, 21, 21, 24, 30, 20, 19, 19 Talia esantion: 8 Media: (19+21+21+24+30+20+19+19)/8 =173/8=21.625
Orice valoare a seriei este luată în considerare în calculul mediei. Valorile extreme pot influenţa media aritmetică distrugândui reprezentativitatea. Media aritmetică se situează printre valorile seriei de date. Media aritmetică este o măsură a valorii centrale a setului de date în jurul căreia fluctuează datele setului. Media nu dă nicio indicaţie asupra gradului de fluctuaţie (de abatere) de la medie Suma diferenţelor dintre valorile individuale din serie şi medie este zero.
Schimbarea originii scalei de măsură a variabilei X din care provine seria de date are influenţă asupra mediei. Transformarea scalei de măsură a variabilei X influenţează media aritmetică. Suma pătratelor abaterilor valorilor seriei de la media aritmetică este minimul sumei pătratelor abaterilor valorilor seriei de la o valoare X a dreptei reale (principiul sau criteriul celor mai mici pătrate)
Intr-un studiu privind incidența fumatului la elevii de liceu, un eşantion de 200 de persoane au fost intervievate privind numărul de țigări fumate zilnic și au răspuns astfel: ഥX = 0 + 1 + 2 + 5 + 0 + + 0 + 2 + 2000 + 0 + + 2000 + 5+.. +0 200 ഥX 4000 200 ഥX 20 11
media aritmetică este puternic afectată de valorile extreme. este necesar să introducem și alți indicatori de centralitate 12
Mediana este o valoare astfel încât jumătate dintre observaţii îi sunt inferioare (sau egale) şi cealaltă jumătate superioare (sau egale). Procedura de calcul a medianei urmează paşii: 1. Se ordonează crescător datele seriei. 2. Se localizează poziţia medianei în acest şir şi se determină valoarea ei. Dacă volumul n al seriei este impar, atunci mediana este dată prin formula: X n 1 2 Dacă n este par, atunci mediana este dată prin formula: X n X n 1 2 2 2 13
Lista de mai jos prezintă conţinutul în calorii pentru 17 sortimente de fast-food : 107, 135, 136, 138, 139, 140, 146, 147, 153, 172, 173, 175, 179, 182, 190, 191, 195 Media =158.7 Mediana = 153. Rangul medianei în seria de date este = 17 1 2 9 14
Modul (valoarea modală, dominanta) unei serii statistice este o valoare care are cea mai mare frecvenţă din serie. Dacă seria statistică este prezentată sub forma unui tabel de clase de frecvenţe, modul corespunde centrului clasei de frecvenţă maximă. -distribuţie de frecvenţe unimodală - dacă tabelul de frecvenţe are un singur maxim -distribuţie de frecvenţe multimodală dacă tabelul de frecvenţe are mai multe valori maxime. Din punct de vedere grafic, modulul reprezintă abscisa căreia îi corespunde ordonata maximă. Exemplu: 12, 14, 12, 9, 5 -unimodală; modulul=12 12, 14, 12, 14, 9, 5 - bimodală 15
X pond = σ i=1 n p i x i n X p geom = i σ i=1 n n i=1 x i X armonică = 1 σn i=1 1 x i Val. centrală = X min + X max 2 16
Dacă datele au o distribuţie simetrică, media, mediana si modulul sunt egale. Distribuţie simetrică Distribuţie asimetrică (skew) Mediana Media Modul Modul Mediana Media
Asimetrie spre dreapta= asimetrie (Skew) pozitivă Modul < Mediana < Media
Asimetrie spre stânga= asimetrie (Skew) negativă Media < Mediana < Modul
Alte măsuri de tendință centrală: Media geometrica n X X... X 1 2 n Media armonica Valoarea centrala n 1 1... X X 1 2 X max X 2 min 1 X n
Ca măsuri sau indicatori de localizare sau amplasare se utilizează cvartilele unei serii de date, decilele şi percentilele (generalizări pentru împărţirea în 4, 10 sau 100 de grupuri). 25% 25% 25% 25% 0 250 500 750 1000
Astfel prima cvartilă sau cvartila de 25% este o valoare având proprietatea ca 25% dintre datele seriei sunt mai mici sau egale cu ea iar 75% mai mari sau egale cu prima cvartilă. A doua cvartilă sau cvartila de 50% este reprezentată de mediană. A treia cvartilă sau cvartila de 75% este o valoare având proprietatea ca 75% dintre datele seriei sunt mai mici sau egale cu ea iar 25% mai mari sau egale cu a treia cvartilă. 22
Percentila: a - percentila de ordinul a. - valoarea din seria de date cu proprietatea că o proporţie egală cu a din date sunt mai mici sau egale a, iar celelalte sunt mai mari -cvartilele sunt percentilele 0.25, 0.5, 0.75 -decilele sunt percentilele 0.1, 0.2,..., 0.9. 23
Excel Average, Geomean, Harmean, Percentile Descriptive statistics Epiinfo - Analysis Means SPSS - Analysis Descriptive Statistics Statistica Descriptive statistics