(Caracteristici) variabile Serii (şiruri) statistice Populaţie statistică Eşantion statistic Randomizare Inferenţe statistice
Statistica studiază mulţimi de observaţii efectuate asupra unor obiecte denumite unităţi statistice care prezintă anumite caracteristici variabile. Trăsăturile sau proprietățile organismului viu sunt denumite în statistică caracteristici și sunt cuprinse în categoria generala de date. Unitatea statistică: CALUL Caracteristici variabile: vârsta, culoarea, greutatea, rasă, etc. Organismul viu, cel mai complex sistem existent în natură, nu poate fi descris exact prin cuvinte sau prin numere oricât de multe am folosi. Omul este capabil sa descrie numai anumite trăsături sau proprietăți ale organismului viu. Trebuie sa fim conștienți că deși numărul de trăsături ale organismului pe care le studiază anatomia, biochimia, biofizica, fiziologia și toate celelalte discipline este enorm, niciodata nu vom fi capabili să-l descriem exact. 1 DATE Reperezentări (codificări) ale informațiilor cu ajutorul unor simboluri sau semnale
Definiție: Caracteristica este o proprietate comună tuturor indivizilor dintr-o populație statistică data. Caracteristicile sunt ceea ce în limbajul obișnuit întelegem prin atribut, calitate. Unităţile statistice pot fi clasate, ordonate sau măsurate în raport cu caracteristicile respective.
Într-un spital clienţii (unităţile statistice) au următoarele caracteristici: grupa sanguină. - poate fi doar clasată (repartizată în clasele, variantele respective: A, B, 0, AB). nota sau calificativul pe care îl acorda calităţii asistenţei medicale primite. - poate fi clasată şi ordonată. greutatea la internare. - poate fi clasată, ordonată şi măsurată Din punctul de vedere al statisticii medicale, caracteristicile sunt de doua tipuri fundamentale: cantitative și calitative.
Cantitative (pot fi măsurate) greutatea, înălţimea, numărul de clienţi, timpul de spitalizare, durata de funcţionarea a unui aparat, costul unui tratament, numărul de zile de spitalizare. VALORI Ordinale (pot fi doar ordonate): nota sau calificativul acordat asistenţei medicale, ierarhia medicilor întrun spital, gravitatea unei patologii, starea de sănătate, performanţa unui cadru medical; RANGURI Calitative (pot fi doar clasate): grupa sanguină, RH-ul, sexul, diagnosticul medical, specialitatea medicala, patologia, tratamentul, tipul de serviciu medical, spitalul, medicul, județul; VARIANTE
Caracteristici Continue Discrete CONTINUE Nu sunt limitate la un număr precis de valori (numere întregi/categorii) Teoretic, pot lua un număr infinit de niveluri măsurate Permit utilizarea zecimalelor Exemple: greutatea, ănălțimea. DISCRETE Se prezintă în categorii disctinte Se exprimă prin numere întregi (nu suportă zecimale) Exemple: nr. de nașteri (fătări) valorile TAS sau TAD.
Mulţimile de observaţii se numesc serii statistice sau şiruri statistice. În funcţie de numărul de variabile studiate o serie poate fi: univariate, cînd se observă o singură variabilă bivariată cînd se observă două variabile; multivariată cînd se observă mai multe variabile.
F M M F F F M M F M Serie statistică UNIVARIATĂ TAS mmhg 140 110 120 160 130 150 140 TAD (mm Hg 60 80 70 80 90 75 60 Serie statistică BIVARIATĂ de volum 2 a tensiunii arteriale Sex f f m f m f f greutate 58 62 85 92 102 75 62 Înălțime 1,52 1,65 1,87 1,70 1,92 1,48 1,60 TAS mmhg 140 110 120 160 130 150 140 TAD (mm Hg 60 80 70 80 90 75 60 Serie statistică MULTIVARIATĂ de volum 5
Constanta O cantitate care își asumă doar o valoare se numește constantă. Constantele sunt notate, de obicei, cu primele litere ale alfabetului.? De exemplu: Valoarea = 3,1415 sau e= 2,7182 Constatntele nu sunt obiectul de studiu al statisticii.
Definitie: O caracteristică care se schimbă de la individ la individ sau la același individ în timp sau ca răspuns la condițile de mediu, de boală de medicatie, etc, se numeste variabilă. Definiție Caracteristică a realității care poate lua valori diferite Vârstă, greutate, stare de sănătate, etc.
Un atribut ce descrie o persoană sau obiect. Valori care pot varia de la persoană sau obiect. Valoarea pe care o ia variabila se numește DATĂ.
Exemple de variabile (caracteristici) Starea de sănătate Înălțime Variabile ce descriu persoane Unitatea statistică este persoana Vârstă Culoarea părului
Bolnav Sănătos Starea de sănătate Inălțime 170 cm 120 cm Variabile au valori 5 ani 4 luni Vârstă Culoarea părului Blond Roșcat Valorile variabilelor se numesc date. Date: bolnav, sănătos, blond, roșcat, 170 cm, 12 cm, 5 ani, 4 ani
Bolnav Sănătos Starea de sănătate Inălțime Variabile exprimate prin cuvinte Vârstă Culoarea părului Blond Roșcat Caracteristici calitative.
Starea de sănătate Inălțime 170 cm 120 cm Variabile exprimate prin numere 5 ani 4 luni Vârstă Culoarea părului Caracteristici cantitative
VARIABILE CALITATIVE CANTITATIVE Cuvinte Numere
Variabilă Calitativă Cantitativă Înălțimea Înalt Scund
Variabilă Calitativă Cantitativă Înălțimea 170 cm 120 cm
Variabilă Continue Dicrete Greutatea 120 kg 380kg 120 kg 400 kg 100 400
Variabilă Continue Discrete Nr. de nimale?
Exemple: numărul animalelor dintr-o gospodărie, nr. fătări, nr. de purcei la o fătare, etc.
Când două variabile au o legătură una cu cealaltă, ele se numesc variabile asociate sau dependente. Asocierea poate fi pozitivă sau negativă. Dacă două variabile nu sunt asociate, nu au leătura una cu cealaltă, ele se numesc independente.
Variabila independentă este variabila pe care o manipulează cercetătorul, care este definită explicit, măsurată sau măsurabilă. Variabila dependentă este răspunsul subiectului (subiectilor) observat şi înregistrat de către experimentator Variabila INDEPENDENTĂ este utilizată ca variabilă de influenţă, ale căror efecte posibile asupra variabilei dependente urmează să fie puse în evidenţă. Variabila DEPENDENTĂ (variază în funcţie de valorile altei sau altor variabile) face obiectul măsurării cu scopul de a fi supusă unor concluzii.
Unitatea statistică = elementul constitutiv al populației statistice Variabila = caracteristică care poate prezenta variaţie de la un element la altul al unei colectivităţi Datele statistice = valorile observate şi înregistrate ale unei variabile statistice Informaţiile statistice = rezultă din prelucrarea şi analiza datelor statistice Statistica descriptivă = ramura statisticii care se ocupa cu prezentarea unui set de date. Prin prezentare se permite înțelegerea facilă a caracteristicilor evenimentelor studiate.
Variabile Variabile Cantitative Calitative Independente Dependente Continue Discrete Variabilele sunt atribute ale lucrurilor Valorile variabilelor se numesc date Variabilele calitative sunt exprimate prin cuvinte Variabilele cantitative sunt exprimate prin numere Variabilele continue pot lua orice valoare de la o valoare minimă la una maximă Variabilele discrete au numai valori intregi între o valoare minimă și una maximă Variabilele pot fi independente sau dependente
1. Variabilele pot fi clasificate în variabile cantitative și variabile calitative. 2. Variabilele calitative pot fi variabile continue. 3. Variabilele cantitative pot fi variabile discrete. Răspunsul corect este: a. Numai 1. b. Doar 2. c. Numai 3. d. Corect 1 și 2. e. Corect 1 și 3.
înălţimea măsurată în centimetrii greutatea măsurată în kg numărul de zile lucrătoare dintr-o lună numărul de zile însorite culoarea părului sexul valoarea medie a temperaturii
Care dintre cele enumerate de mai jos sunt variabile dependente: a) boala cardiovasculara b) fumatul c) obezitatea d) sedetarismul, e) diabetul, f) hipercolesterolemia, g) hipertensiunea Care dintre cele enumerate de mai jos sunt variabile independente: a) boala cardiovasculara b) fumatul c) obezitatea d) sedetarismul, e) diabetul, f) hipercolesterolemia, g) hipertensiunea
Într-un studiu al efectului de dexterităţii asupra capacităţii atletice au fost constituite 3 grupe: dreptaci, stângaci şi ambiidexteri. Capacitatea atletică a fost măsurată pe o scară cu 12 nivele. Variabila independentă este.. şi numărul de nivele al variabilei independente este. Variabila dependentă este.. şi numărul de nivele al variabilei dependente este. a) capacitatea atletică; 3; b) capacitatea atletică; 12 c) dexteritatea; 3 d) dexteritatea; 12
Într-un studiu al efectului de dexterităţii asupra capacităţii atletice au fost constituite 3 grupe: dreptaci, stângaci şi ambiidexteri. Capacitatea atletică a fost măsurată pe o scară cu 12 nivele. Care afirmații sunt corecte? Variabila abilitatea atletică este: 1. Discreta 2. Calitativă 3. Continuă 4. Cantitativă 5. Variabilă dependentă 6. Variabilă independentă
Într-un experiment unde se urmărește efectul somnului asupra memoriei. Variabila independentă este: a) Numărul de ore de somn b) Rezultatul obținut la testul de memorie c) Genul subiecților d) Genul expereimentului
Într-un experiment unde se urmărește efectul somnului asupra memoriei. Variabila dependentă este: a) Numărul de ore de somn b) Rezultatul obținut la testul de memorie c) Genul subiecților d) Genul expereimentului
cantitative Sunt măsurate calitative Sunt observate
procesul de atribuire de numere calităților reprezentate (N.R. Campell, 1920-267) Valorile înregistrate ale variabilelor sunt rezultatul unei activități de măsurare. Măsurarea reprezintă un proces sistematic de cuantificare a aspectului unităţilor statistice. In procesul cuantificarii, se folosesc un set de reguli de atribuire a numerelor sau simbolurilor unitatilor statistice. Modul in care se face atribuirea acestor numere / simboluri se numeste nivel sau scală de măsurare.
Concurs de manechine (bonitare) Inălțime Bust Talie Șolduri Frumusețe Urâțele Drăguțe Frumușele Frumoase de pică
S.S. Stevens (1946) On thetheoryof scale of measurement a măsura înseamnă a atribui valori numerice obiectelor și fenomenelor, în conformitate cu anumite reguli nu toate măsurările au un caracter numeric caracteristica de gen (sex) poate fi simbolizată cu caracterele m și f o regulă de atribuire a numerelor are caracter de măsurare numai dacă ea instituie o anumită semnificație cu privire la caracteristica măsurată
Valorile înregistrate ale variabilelor sunt rezultatul unei activități de măsurare. Măsurarea reprezintă un proces sistematic de cuantificare a aspectului unităţilor statistice. In procesul cuantificarii, se folosesc un set de reguli de atribuire a numerelor sau simbolurilor unitatilor statistice. Modul in care se face atribuirea acestor numere / simboluri se numeste nivel sau scală de măsurare.
Nominal Ordinal Interval Raport Măsurare nenumerică Măsurare numerică Sunt ordonate ierarhic Scalele superioare includ proprietățile celor inferioare
O variabilă este un atribut ce descrie o persoană sau obiect. Variabilele au valori care pot varia de la persoană sau obiect. Valoarea pe care o ia variabila se numește DATĂ. Pentru înregistrarea datelor putem folosi: numere (spunem ca înregistram date numerice), simboluri consacrate sau convenite (spunem ca înregistram date nominale, sau date ordinale), simboluri amestecate cu numere (caz în care spunem ca înregistram date alfanumerice). Datele înregistrate ca numere sau prin simboluri consacrate sau convenite se numesc scalate, în timp ce restul le numim alfanumerice.
Scala interval Scalate Scala raport (ratio) DATE Scala ordinală Alfanumerice (literale) Scala nominală Scala interval permite celui care înregistreaza date să scrie numere reale sau întregi. Scala raport, permite înregistrarea tot prin numere reale sau întregi dar exprima rapoarte Scala ordinala si cea nominala, scale asemanatoare, permit înregistrarea dupa coduri si prescurtari De exemplu, grupa sanguina, stadiul evolutiv al unei afecttiuni maligne, tipul de afectiune, tipul de tumora, etc sunt de obicei standardizate prin convenții internaționale la scara continentală sau mondială
Caracteristici: cel mai redus nivel de măsurare codurile valorilor sunt arbitrare valorile au doar o semnificaţie calitativă nu suportă operaţii aritmetice, în afară de însumare Pot fi grupate sau rafinate
GRUPA SANGUINA, simbolurile 0, A, B, AB sunt categorii exhaustive (orice individ intră în exact una din ele) și mutual exclusive (un individ nu poate intra în doua categorii în același timp) și sunt date de tip nominal; Masuratorile nominale constau în asignarea pacienților la grupuri sau categorii. Exemplu: rasa, sexul, mod de alimentatie, tip de temperament, culoarea ochilor, a parului, etc
Descriu o caracteristică pentru înregistrarea căreia se folosesc tot simboluri ce definesc categorii exhaustive și mutual exclusive, dar care sunt ordonate gradat, de obicei crescător. Exemplu: stadiul evolutiv în anumite afectiuni ca cele maligne (stadiul 0, 1, 2, 3 si 4). Masuratorile pe scala ordinală sunt ordonate în sensul că numere mai mari reprezintă valori mai mari. Totusi, intervalele între numere nu sunt în mod necesar egale.
stadiul evolutiv în anumite afecțiuni ca cele maligne (stadiul 0, 1, 2, 3 si 4). este locul ocupat de cineva la o competitie anumita (primul, al doilea,, ultimul).
Caracteristici: -valorile au o semnificaţie cantitativă (mai mare/mai mic; mai mult/mai puţin), dar -precizează doar raportul de mărime dintre valori -intervalele dintre valori sunt neprecizate -cit înseamnă mai mare?, cit înseamnă mai mic? -primul admis=9.90; al doilea=9.70; al treilea=8.15! -codurile valorilor pot fi acordate și arbitrar, dar ele trebuie sa exprime ideea de ordine.
Scală numerică care utilizează niște constate ca unități de măsură, iar distanța dintre aceste constante (niveluri) sunt egale și care permite pe lângă ordonarea datelor și calcularea distanței între niveluri. Scala interval nu are un punct de origine unic. EXEMPLE: TEMPERATURA masurată în grade Celsius (intervalele dintre valori sunt egale, dar punctul 0 este convenţional ales ca fiind temperatura la care apa ingheaţă), COEFICIENTUL DE INTELIGENŢĂ - IQ - (daca două persoane au scoruri de 100 şi respectiv 150, putem spune ca diferenţa dintre cei doi este de 50 de puncte, dar nu putem spune că cel de-al doilea este cu 1/2 mai inteligent decât primul sau că scorul 0 semnifică absenţa inteligenţei).
Caracteristici: intervalele sunt egale, dar lipseşte zero absolut 0 C nu înseamnă absenţa temperaturii (0 K) -10 C faţă de 5 C este mai mare cu 5 -... dar nu şi de două ori mai cald! suportă toate transformările matematice posibile Exemplul tipic este scara pentru măsurarea temperaturii. Originea va fi diferită la scara Fahrenheit față de scara Celsius. De exemplu, 0 grade Celsius este egal cu 32 grade Fahrenheit, ceea ce înseamnă că temperatură nu are un punct unic de origine 0, fiind o scală de tip interval.
TEMPERATURA masurată în grade Celsius (intervalele dintre valori sunt egale, dar punctul 0 este convenţional ales ca fiind temperatura la care apa ingheaţă) COEFICIENTUL DE INTELIGENŢĂ - IQ - (daca două persoane au scoruri de 100 şi respectiv 150, putem spune ca diferenţa dintre cei doi este de 50 de puncte, dar nu putem spune că cel de-al doilea este cu 1/2 mai inteligent decât primul sau că scorul 0 semnifică absenţa inteligenţei).
Postualate: Intervalel pot fi adunate și scăzute: [(a-b)=(b-c), dup[ cum (5-3)=(3-1) Nu există un punct zero absolut care să exprime absența caracteristicii măsurate. Intervalele pot fi deplasate sau extinse Operați matematice: Operațía de multiplicare sau înmulțíre nu este permisă (temperatura de 30 C nu este dublul temperaturii de 15 C) Statistici parametrice : Corelația Regresia Teste de semnificație
Datele înregistrate pe scala raport descriu acele caracteristici ale pacientului care sunt prin excelență cantitative și se exprimă prin numere întregi sau zecimale. Masuratorile pe scala raport sunt de așa natură încât o unitate pe scala are aceeași magnitudine pe întreaga scala. De exemplu, înregistrarea greutății, presupune ca o greutate de 40 kg, este de doua ori mai mică decât una de 80 kg. Pe scala raport sunt reprezentate caracteristici cantitative continue și caracteristici cantitative discrete. De exemplu, numărul de nașteri sau numărul de avorturi la o pacientă se înregistrează numeric, discret, adica din 1 în 1, neavând sens valori zecimale. Majoritatea analizelor de laborator însă, se înregistreaza numeric, prin numere zecimale, de obicei cu una sau doua zecimale.
Caracteristici: -cel mai înalt nivel de măsurare (valorile au mai multă informaţie) -suportă toate transformările matematice posibile În practică, distincţia dintre datele măsurate pe scală numerică sau interval (ratio) nu este relevantă, ambele suportând aceleaşi proceduri statistice.
În rezumat despre nivele de măsurare: Cel mai mic nivel Cel mai mare nivel Scală Nominală Ordinală Interval Raport Caracteristici Denumire Ordonare a denumirii Intervale egale fără un zero absolut Intervale egale cu zero absolut
Denumirea scalei Nominală Ordinală Interval raport Caracteristicile scalei Absența relației de ordine Relație de ordine Relație de ordine Dierențe (intervale semnificative) Origine arbitrară Valoarea 0 nu înseamnă absență Relație de ordine Diferenţe (intervale) semnificative Origine fixă, valoarea 0 înseamnă absenţă Operaţii de multiplicare / divizare EXEMPLE DE UTILIZARE Sex, stare civilă, stagiul militar, profesia, culoarea părului, stadiul evolutiv în anumite afectiuni Temperatura Timpul calendaristic Punctajul obţinut la un test de verificare a cunoştinţelor Vârsta, greutatea corporală
O variabilă se numește categorială atunci când valorile acesteia descriu categorii. În mod obișnuit, variabilele măsurate pe scală nominală sunt categoriale. -Variabilele ordinale pot fi și ele categoriale. -Categoriile de vârstă: 1 (21-30 ani) 2 (31-40 ani) 3 (41-50 ani) -Variabilele cantitative pot fi și ele categoriale: Categoriile de motoare: 1100 cmc; 1400cmc; 1600 cmc -Există proceduri statistice speciale pentru variabile categoriale, motiv pentru care trebuie reținute!
a) Nominală b) Ordinală c) Interval d) Raport Identificaţi scala de măsurare pentru următoarele gradele militare: capitan, maior, colonel, general. a) Nominală b) Ordinală c) Interval d) Raport
Multimea pe care se realizează un studiu statistic se numește populație statistică. Definiție: POPULAŢIA statistică este o mulţime de elemente care: - prezintă un interes la un moment dat, - are un număr de însuşiri esenţiale comune - este supusă unei prelucrări statistice Studiul populație se face din punctul de vedere al unei caracteristici comune tuturor indivizilor, ceea ce ne interesează de fapt sunt nu indivizii în sine cât caracteristica ce le este comună și pe care o studiem. Când ne referim la populații ne referim de fapt la mulțimi de numere ce reprezintă măsuratori efectuate pe indivizi umani sau de alta natură, plante, obiecte, evenimente, etc. Se notează cu majusculele de la începutul alfabetului: A, B, C etc Poate fi finită sau infinită.
Definiție: Vom numi individ statistic un element al unei populații statistice indiferent de natura acesteia. Un individ statistic poate fi: Pacient (uman, animal, etc.) Un grup (un spital, un adăpost, o localitate, etc.) Un eveniment O măsuratoare, etc.
În practica statistică nu se lucrează direct cu populaţia deoarece aceasta cuprinde un număr mare de indivizi (elemente). În anumite cercetări dispunem de o cantitate limitată de material de analiză. Se extrage o subcolectivitate din populaţie, ea este cunoscută sub următoarele denumiri: selecţie, lot, probă sau eşantion
Eşantion Totalitatea unităţilor de informaţie care constituie obiectivul de interes al unei investigaţii. populaţie = extinderea maximă posibilă, sub aspectul volumului, a respectivei unităţi de informaţie. unităţile de informaţie selecţionate pentru a fi efectiv studiate. Cercetările bazate pe eşantioane, permit aprecieri asupra unei întregi populaţii, în anumite condiţii, doar pe baza caracteristicilor măsurate pe o parte a acesteia.
Atributele populației sunt numite parametri Atributele eșantionului sunt numite statistici Exemple: O caracteristică măsurabilă a unei populații, cum ar fi o abatere medie sau standard, se numește parametru; O caracteristică măsurabilă a unui eșantion este numită statistică. Notații: Pentru parametri: litere grecești (de exemplu, ) Pentru statistici: litere romane (de exemplu, s, m)
METODA SELECŢIEI: eştionare aleatoare (probabilistă); eşantionare nealeatoare (empirică, la întâmplare) sau pe bază de raţionament. Eșantionarea (selectie) = set de operații cu ajutorul cărora, din ansamblul populației vizate de cercetare, se alege o parte eșantion, ce va fi supusa investigației.
fiecare unitate a populaţiei cercetate are o anumită probabilitate de a fi inclusă în eşantion, probabilitate diferită de zero, care poate fi cunoscută a priori. fiecare unitate a populaţiei trebuie să aibe aceeaşi şansă ca toate celelalte de a figura în eşantion. Aceasta conduce la constituirea eşantionului prin tragere la sorţi.
Tehnică a stabilirii eşantionului care presupune necunoaşterea probabilităţii de includere în eşantion a indivizilor colectivităţii. Selecţia are deci un caracter arbitrar, subiectiv, şi se bazează, în primul rând, pe judecata personală a cercetătorului presupunând o "alegere rezonabilă".
Esantionul trebuie sa posede o calitate esențială = reprezentativitate (capacitatea de a reproduce cât mai fidel structurile și caracteristicile populației din care e extras. Un eșantion este reprezentativ când scorurile în eșantion au aceleași caracteristici ca și ale populației din care a fost extras.
Volumul eșantionului depinde de trei elemente: 1. Eroarea maximă admisă = Precizia (Dx); 2. Probabilitatea de garantare a rezultatelor = Coeficientul de încredere în răspunsuri (p); 3. Dispersia = Nivelul împrăștierii populației studiate (σ 2 ). Se citeste: "Cu o probabilitate p se garanteaza rezultatele cu o eroare maxima admisa de +/-e%". Se observa ca volumul esantionului nu depinde de volumul colectivități generale (N), atunci cand acesta ia valori mari. Volumul eşantionului trebuie stabilit apriori, şi nu în funcţie de posibilităţile de moment sau de constrângerile de timp şi spaţiu.
1. Principiul fundamental numărul de participanți considerat acceptabil pentru a forma un eșantiom reprezentativ depinde de tipul de cercetare. 2. Pentru cercetarile corelaționale sunt suficienți 30 de participanți pentru a forma un eșantion reprezentativ (se acceptă ca de la 30 de subiecti distributia este normala).
Eroarea maxima admisă Volum esantion 1 9604 1,5 4268 2,5 1537 3 1067 3,5 784 4 600 4,5 474 5 384 5,5 317 6 267 6,5 227 7 196 7,5 171 8 150 8,5 133 9 119 9,5 106 10 96
There are three kinds of lies: lies, damned lies, and statistics. Există trei felur de minciuni: minciuni. Minciuni sfruntate și statistici Benjamin Disraeli (1804-1881) Statistics: The only science that enables different experts using the same figures to draw different conclusions. Statistica: Este singura știință care permite experților să utilizeze aceleași cifre pentru a trage concluzii diferite. Evan Esar (1899-1995) Medical students may not like statistics, but as doctors they will.. Studenții de la medicină nu iubesc statistica dar ca doctori vor trebui să o facă. Martin Bland, Letter to the Editor, 1998. BMJ; 316:1674