Indicatori ai formei distribuţiei Atunci când valorile unei serii sunt distribuite nesimetric în jurul mediei, acest fapt este imposibil de surprins cu ajutorul indicatorilor de dispersie. S-au introdus indicatori care să pună în evidenţă şi acest aspect al seriilor de valori: excentricitatea, sau asimetria și boltirea. 1. Asimetria 2. Boltirea
Excentricitate. Asimetria (Engl. Skew, Skweness).
Asimetria (excetricitatea) Skewness - indicator folosit în analiza distribuției unei serii de date pentru a indica deviația distribuției empirice în raport cu o distribuție simetrică in jurul mediei. ASIMETRIA reprezintă deplasarea pe orizontală a vîrfului curbei experimentale faţă de curba normală.
Interpretare: Skewness > 0 - distributia este inclinata spre stanga, avand mai multe valori extreme spre dreapta. Skewness < 0 - distributia este inclinata spre dreapta, avand mai multe valori extreme spre stanga. Skewness = 0 - media = mediana, distributia este simetrica in jurul mediei. Asimetria se calculează cu formula: 1 S = n 1 i=1 n x i x 3 σ 3 Funcția din Excel ce calculează asimetria este SKEW()
Puteți utiliza următoarele două reguli pentru a oferi unele informații despre asimetrie, chiar și atunci când nu se poate vedea un grafic linie de date (de exemplu, tot ce ai nevoie este media și mediana): Regula 1. Dacă media este mai mică decât valoarea mediană, datele sunt înclinate spre stânga. Regula 2. Dacă media este mai mare decât valoarea mediană, datele sunt înclinate spre dreapta.
ASIMETRIA distribuții unimodale distribuții bimodale
x i 2,5 1 2,55 1 2,6 1 2,65 1 2,7 4 2,75 6 2,8 10 2,85 12 2,9 20 2,95 35 3 80 3,05 90 3,1 115 3,15 172 3,2 235 3,25 337 3,3 373 3,35 451 3,4 497 3,45 534 3,5 547 3,55 563 3,6 571 3,65 462 3,7 425 3,75 317 3,8 260 3,85 258 3,9 198 3,95 104 4 85 4,05 25 4,1 20 4,15 18 4,2 16 4,25 10 4,3 3 4,35 2 4,4 2 4,45 2 total 6850 n i media 3,51 mo 3,60 mediana 3,50
Conceptul de curbă normală : distribuţie normală, care corespunde reprezentării grafice a unei caracteristici pentru care există un mare număr de măsurări, tinzând spre infinit. Are formă de clopot. Cea mai mare parte a valorilor se concentrează în zona centrală (medie) MEDIA, MEDIANA, MODUL au valori apropiate Rangul (amplitudinea) = xmax.- xmin. 6 DS. Este perfect simetrică pe ambele laturi ale sale Linia curbei se apropie la infinit de axa X, fără a o atinge vreodată În conformitate cu proprietatea 2, de fiecare parte a mediei se află exact jumătate dintre valorile distribuţiei
Curba normală Laplace Gauss Curba ideală de variaţie este simetrică faţă de ordonata maximă, notată cu M, corespunzând mediei aritmetice
Între [m-s, m+s] se află aproximativ 68% din indivizii unei populaţii repartizate normal Între [m-2s, m+2s] se află aproximativ 95% din indivizii unei populaţii repartizate normal Între [m-3s, m+3s] se află peste 99% din indivizii unei populaţii repartizate normal
Curba lui Gauss (curba normală) Simetrică faţă de medie Are un maxim în dreptul mediei Tinde asimptotic la 0 spre plus infinit şi spre minus infinit În intervalul [m s,m + s] se află aproximativ 68% din indivizii populaţiei În intervalul [m 2s,m + 2s] se află aproximativ 95% din indivizii populaţiei În intervalul [m 3s,m + 3s] se află aproximativ 99% din indivizii populaţiei
Kurtosis - indicator folosit in analiza distributiei unei serii de date pentru a indica gradul de aplatizare sau de ascutire a unei distributii. Interpretare: Kurtosis > 3 - distributie leptokurtica, mai ascutita decat o distibutie normala; avand mai multe valori concentrate in jurul mediei si cozi mai groase ceeea ce inseamna probabilitati ridicate pentru valorile extreme. Kurtosis < 3 - distributie platikurtica, mai plata decat o distibutie normal avand valori dispersate pe un interval mai mare in jurul mediei. Probabilitatea pentru valori extreme este mai mica decat in cazul unei distributii normale. Kurtosis = 3 - distributie mezokurtica - exemplu distributia normala.
Boltirea (excesul) EXCESUL sau boltirea (E) este acea proprietate a curbei modale de a fi mai mai turtită sau mai ascuţită decît curba normală corespunzătoare. Boltirea se caculează cu formula: K = 1 n 1 i=1 n x i x 4 σ 4-3 Funcția din Excel ce calculează boltirea este KURT():
Indicatori statistici fundamentali SERIILE DE VALORI DISTRIBUITE RELATIV SIMETRIC: SERIILE DISTRIBUITE ASIMETRIC: Media Deviaţia standard. Media Deviaţia standard, dar sunt mai utile mediana cuartilele.
Statistica descriptiva, abordarea practică Tabelul de efective (tabel de evidenta primară). HGB g/dl 14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6 14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3 12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6 14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2 15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6
Statistica descriptiva, abordarea practică Se ordonează (crescător) - funcţia SORT din meniul Data în scopul urmăririi frecvenţei de apariţia a fiecărei valori observate HGB g/dl 12 13,7 14,5 14,7 15,2 12 13,7 14,5 14,7 15,2 12 13,8 14,5 14,7 15,2 13,3 13,8 14,5 14,7 15,2 13,3 13,8 14,6 14,7 15,2 13,5 13,8 14,6 14,7 15,3 13,5 13,8 14,6 14,7 15,3 13,5 13,8 14,6 14,8 15,3 13,5 13,8 14,6 14,8 15,4 13,5 14,1 14,6 14,8 15,4 13,6 14,1 14,6 15 15,7 13,6 14,5 14,6 15 16,4
Statistica descriptiva, abordarea practică Se obţine repartiţia de frecvenţă HGB g/dl Frecventa Frecvenţa Frecvenţa cumulată relativă 12 3 3 0,05 13,3 2 5 0,03 13,5 5 10 0,08 13,6 2 12 0,03 13,7 2 14 0,03 13,8 7 21 0,12 14,1 2 23 0,03 14,5 5 28 0,08 14,6 8 36 0,13 14,7 7 43 0,12 14,8 3 46 0,05 15 2 48 0,03 15,2 5 53 0,08 15,3 3 56 0,05 15,4 2 58 0,03 15,7 1 59 0,02 16,4 1 60 0,02
Întocmirea histogramei 9 8 7 6 5 4 3 2 1 0 HGB g/dl histograma date observate 12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4 30 25 HGB g/dl histograma date grupate 20 15 10 5 0 <13 13-14 14-15 15-16 >16
9 8 7 6 5 4 3 2 1 0 HGB g/dl histograma date observate 12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4 70 60 50 40 30 20 10 0 Frecventa absoluta Frecvenţa cumulată HGB g/dl histograma date grupate 30 25 20 15 10 5 0 <13 13-14 14-15 15-16 >16 70 60 50 40 30 20 10 0 Frecventa absoluta Frecventa absoluta Frecvená cumulata
Calcularea parametrilor tendinţei de grupare (media, mediana şi modulul) şi parametri tendinţei de împrăştiere (varianţa, deviaţia standard şi coeficientul de variaţie) media =AVERAGE(C2:C61) 14,348 mediana =MEDIAN(C2:C61) 14,600 modulul =MODE(C2:C61) 14,600 varianţa =VAR(C2:C61) 0,747 deviaţia standard =STDEV(C2:C61) 0,864 coeficientul de variaţie =(B67/B63) % 0,060
Microsoft Excel permite calcularea automată a statisticilor descriptive folosind opţiunea Data Analysis din meniul Tools. HGB g/dl Mean 14,34833 Standard Error 0,111576 Median 14,6 Mode 14,6 Standard Deviation 0,864261 Sample Variance 0,746946 Kurtosis 1,115185 Skewness -0,71676 Range 4,4 Minimum 12 Maximum 16,4 Sum 860,9 Count 60 Largest(1) 16,4 Smallest(1) 12 Confidence Level(95,0%) 0,223262
Microsoft Excel permite trasarea automată a histogramei folosind opţiunea Data Analysis din meniul Tools.
Column1 Mean 14,34833 HGB g/dl 14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6 14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3 12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6 Standard Error 0,111576 Median 14,6 Mode 14,6 Standard Deviation 0,864261 Sample Variance 0,746946 Kurtosis 1,115185 Skewness -0,71676 Range 4,4 Minimum 12 Maximum 16,4 Sum 860,9 Count 60 Confidence Level(95,0%) 0,223262 14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2 15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6