Inferenţa statistică

Tudor Drugan 1

Avihu Boneh As for cholesterol, there have been many studies showing clear association between high cholesterol and coronary heart disease. Unfortunately, the correlation is and will be reduced thanks to many industry-sponsored studies, which led the American Academy of Cardiology to reduce the definition of 'high level' gradually over the years. I am sure that the correlation between the current recommendations and coronary heart disease is not as good as in the original studies, with much higher cholesterol level (that, not even taking into account the HDL/Total Cholesterol ratio). So we are now left with recommendations that are gradually turning away from good evidence. It may sound ridiculous but if this trajectory continues we will find that cholesterol levels in Smith Lemli Opitz are normal and all the rest is associated with coronary heart disease. I have recently read that the American Academy of Cardiology is considering a blood pressure of 130/80 in people who are 45 years of age and over as 'hypertension'. Is this a joke? can we trust these recommendations? (big pharma will certainly trust them). It diminishes the trust anyone can have in any 'guidelines' or 'recommendations' professional bodies produce, which is a shame. 2

Fenomen Experiment Concluzie medicală Descriere Inferență Concluzie statistică 5

Testarea ipotezelor statistice Formularea de noi ipoteze (sau model sau teorie) este una dintre cele mai importante aspecte ale cercetării ştiinţifice. Aceste ipoteze experimentale încercă să descrie sau să explice anumite fenomene reale. In multe cazuri există ipoteze anterioare (descrieri sau explicaţii) pe care oamenii de ştiinţă doresc să le înlocuiască cu altele noi. 6

Testarea ipotezelor statistice Este însă insuficient să se formuleze sau să fie prezentată numai o nouă ipoteză. O ipoteză nouă trebuie testată pentru a vedea că are temei (în concordanţă cu observaţiile) şi pentru a justifica că este mai bună decât alte ipoteze alternative. Aceasta conduce la scheme de experimente, eşantioane şi de observaţii în scopul obţinerii dovezii pentru susţinerea (sau respingerea) unei noi ipoteze. 7

Obiectivele cursului Testarea ipotezelor statistice Ipoteza nulă/ Ipoteza altenativă Concepte: Regiunea critică, direcţionalnondirecţional Erori în testarea ipotezelor statistice Nivel de semnificație Puterea testului 8

Metode pentru testarea ipotezelor Compararea a două ipoteze sau teorii concurente Aceste două teorii trebuie prima dată formulate ca modele. Aceste două modele în continuare vor fi denumite prin ipoteza nulă şi ipoteza alternativă. Ipoteza nulă H 0, reprezintă modelul pe care experimentatorul ar dori să-l înlocuiască. Ipoteza alternativă H 1 este noul model care de regulă reprezintă o negaţie a ipotezei nule. 9

Populație de studiu Eșantion A Eșantion A Eșantion B Eșantion B Tratament A Tratament B Eșantion A B Eșantion A Eșantion B 10

PAŞII UNUI TEST STATISTIC 12

Paşii unui test statistic (1) Formularea problemei în termenii ipotezelor statistice. Pentru aceasta se stabilesc: ipoteza alternativă H1 şi respectiv ipoteza nulă H0, reprezentând o negare a ipotezei nule. Ipoteza alternativă H1, este acea ipoteză care într-un sens sau altul contrazice ipoteza nulă. Această ipoteză se mai numeşte şi ipoteza de lucru. Ipoteza nulă H0, este ipoteza care trebuie testată, testul efectuându-se sub prezumţia că ipoteza nulă ar fi adevărată. 13

Cei 5 paşi ai unui test statistic Fenomen 1. Formularea problemei în termenii ipotezelor statistice 14

Paşii unui test statistic (1) Ipoteza alternativă Media valorilor în populaţia A este diferită de media valorilor în populaţia B H1 : A B sau H1 : A B 0 Ipoteza nulă Media valorilor în populaţia A nu este diferită de media valorilor în populaţia B H0 : A B sau H0 : A B 0 15

Paşii unui test statistic (1) Uneori se urmăreşte tocmai respingerea ipotezei alternative (comparaţia unui tratament cu unul standard, studii de bioechivalență) H0 : A B sau H0 : A B 0 Ipotezele anterioare stipulau diferenţa fără a o enunţa: ipoteze non-direcţionale H1 : A B sau H1 : A B H1 : A B sau H1 : A B 0 0 Ipoteze direcţionale 16

Paşii unui test statistic (2) Alegerea şi calcularea parametrului statistic al testului (Z, t, F...) Parametrul statistic al testului exprimă într-o anumită formă, diferenţa dintre elementele comparate, dintre care cel puţin unul intervine sub forma unei statistici a unui eşantion. Ţinând seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care fac obiectul testului, parametrul statistic este o variabilă aleatoare de selecţie, care urmează o anumită lege de probabilitate 17

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 18

Ipoteza nulă Regiunea critică. Ipoteza alternativă

Paşii unui test statistic (3) Alegerea regiunii critice. În funcţie de valoarea parametrului statistic calculat decidem care dintre ipoteze, cea nulă sau cea alternativă, este mai bună. Dacă valoarea parametrului statistic aparţine regiunii critice din distribuția teoretică, ipoteza nulă H0 va fi respinsă şi va fi considerată mai bună ipoteza alternativă H1. Dacă valoarea parametrului statistic nu aparţine regiunii critice, ipoteza nulă H0 nu va putea fi respinsă. 20

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 3. Alegerea regiunii critice 21

Test direcţional (cu o coadă) Nu mai încercăm localizarea regiunii critice în ambele cozi 22

Regiunea critică = regiunea de respingere, aria mărginită de Z=±1,96 23

Paşii unui test statistic (4) Alegerea dimensiunii regiunii critice Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care îl acceptăm. Pe scurt, definim nivelul de semnificaţie, notat cu (alfa), sau mărimea riscului pe care suntem dispuşi să ni-l asumăm în respingerea ipotezei nule H0 în cazul în care aceasta este mai «adevărată». De obicei se alege un nivel de semnificaţie de 1% sau 5%. 24

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 3. Alegerea regiunii critice 4. Alegerea dimensiunii regiunii critice 25

Paşii unui test statistic (5) Concluzia testului Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice. Regiunea critică trebuie astfel aleasă încât dacă ipoteza alternativă H1 este mai «adevărată», probabilitatea de respingere a ipotezei nule H0 să fie mai mare decât în cazul în care ipoteza nulă H0 ar fi mai «adevărată». 26

Cei 5 paşi ai unui test statistic Fenomen 1. Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 5. Concluzia testului 3. Alegerea regiunii critice 4. Alegerea dimensiunii regiunii critice 27

Metode pentru testarea ipotezelor Prin respingerea ipotezei nule cercetătorul afirmă că rezultatele observate nu sunt datorate întâmplării = efect semnificativ statistic Când ipoteza nulă nu este rejectată cercetătorul afirmă că diferenţele observate sunt datorate întâmplării şi rezultatele nu sunt semnificative ATENȚIE: Statistica nu verifică adevărul, nu dovedește afirmațiile, ci doar ne arată cu o probabilitate oarecare că rezultatele observate nu sunt datorate întâmplării 28

Relația dintre parametrul testului și probabilitatea testului (p) p este aria de sub distribuția de probabilitate mărginită de valorile parametrului statistic 29

Cum ne sunt furnizate rezultatele testelor t-test: Two-Sample Assuming Equal Variances z-test: Two Sample for Means occipital parietal temporal frontal Mean - 1,824 7,217 Mean 2,852-0,014 Variance 19,111 51,156 Known Variance 19,000 50,000 Observations 18,000 18,000 Observations 18,000 18,000 Pooled Variance 35,133 Hypothesized Mean Difference - Hypothesized Mean Difference - z 1,464 df 34,000 P(Z<=z) one-tail 0,072 t Stat - 4,576 z Critical one-tail 1,645 P(T<=t) one-tail 0,000 P(Z<=z) two-tail 0,143 t Critical one-tail 1,691 z Critical two-tail 1,960 P(T<=t) two-tail 0,000 t Critical two-tail 2,032 30

Decizia Stabilirea semnificaţiei testului pe baza valorii lui p se face frecvent cu următoarea regulă empirică: 1. Dacă 0,01 <= p<0,05, rezultatele sunt considerate semnificative. 2. Dacă 0,001 <= p<0,01, rezultatele sunt considerate înalt semnificative. 3. Dacă p<0,001, rezultatele sunt considerate foarte înalt semnificative. 4. Dacă p>=0,05, rezultatele sunt considerate nesemnificative statistic. 5. Dacă 0,05 <= p<0,1, se notează o oarecare tendinţă spre considerarea unei semnificaţii statistice. 31

Interpretarea p Valoarea p nu este probabilitatea ca ipoteza nulă să fie falsă. O valoare mică a lui p nu înseamnă că există o probabilitate mică ca ipoteza nulă să fie adevărată. Ipoteza de lucru nu poate fi inversată şi de exemplu pentru un p=0,02 nu se poate spune că avem o probabilitate de 98% ca diferenţa să existe. Valoarea lui p nu este un indicator al validităţii ipotezei statistice. p se utilizează doar pentru a evalua dacă decizia este semnificativă sau nu. 32

IMPORTANT! Testele statistice nu verifică valoarea de adevăr Un test semnificativ nu ne indică altceva decât că între eșantioanele studiate există o diferență semnificativă statistic Orice p al unui test statistic trebuie însoțit de o interpretare medicală (clinică) Calitatea concluziei medicale este dată de: Pertinența ipotezei testate Dimensiunea efectului evidențiat Corectitudinea efectuării studiului 33

Erori în testarea ipotezelor statistice Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge H 0 nu se respinge Eroare tip I (α) Corect Corect Eroare tip II (β) 35

Erori în testarea ipotezelor statistice Rezultat H 0 se respinge H 0 nu se respinge H 0 adevărată Eroare tip I (α) Corect Adevăr H 0 Falsă Corect Eroare tip II (β) alfa (α) = probabilitatea ca testul să respingă ipoteza nulă deși ipoteza alternativă nu se diferențiază statistic de aceasta beta (β) = probabilitatea ca testul să nu poată respinge ipoteza nulă deși ipoteza alternativă se diferențiază statistic de aceasta 36

Studiul 1: 263 cazuri, 1241 martori Regiunea critică. α β

Eroarea de tip I = H 0 este respinsă deși ipoteza alternativă nu se diferențiază statistic de aceasta Am concluzionat că există reale diferențe deși acestea sunt datorate șansei Concluzionăm că un tratament este eficient pe baza unei interpretări greșite Alfa (α) = nivelul de semnificație ales = mărimea riscului asumat Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge H 0 nu se respinge Eroare tip I (α) Corect Corect Eroare tip II (β) 38

Eroarea de tip II = H 0 este nu este respinsă deşi ipoteza alternativă se diferențiază statistic de aceasta Am concluzionat că există diferenţele observate sunt datorate şansei atunci când acestea apar datorită diferenţelor dintre eşantioane Am putea abandona un tratament pe care tocmai îl testăm sau o direcţie de cercetare Puterea unui test (1-β) = capacitatea testului statistic de a evidenția diferența Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge Eroare tip I (α) Corect H 0 nu se respinge Corect Eroare tip II (β) 39

Studiul 1: 263 cazuri, 1241 martori Ipoteza nulă: diferența=0. Regiunea critică. For 5% significance level, one-tail area=2.5% (Z /2 = 1.96) Ipoteza alternativă relevantă clinic: diferența =10%. Puterea= șansa de a avea parametrul în zona non-critică deși alternativa este viabilă = aria din dreapta liniei (în galben) 85%

Studiul 1: 50 cazuri, 50 martori Valoarea critică= 0+10*1.96=20 Puterea =15%

Valoarea critică= 0+0.52*1.96 = 1 Ipoteza alternativă relevantă clinic: diferența = 4 Puterea = 100%!