Inferenţa statistică

Documente similare
Laborator 6 - Statistică inferenţială I. Inferenţă asupra mediei - Testul Z pentru media unei populaţii cu dispersia cunoscută Se consideră o populaţi

PowerPoint Presentation

PowerPoint Presentation

TEZA de ABILITARE Corelatii intre biomateriale, proteze valvulare cardiace si tehnici chirurgicale folosite in protezarea valvulara aortica Horatiu Mo

IBR 8 iulie 2019

Laborator 10 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 17.dec

rrs_12_2012.indd

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Microsoft Word - Diplome_ doc

Introducere în statistică

Entrepreneurship and Technological Management

ALGORITMII ŞI REPREZENTAREA LOR Noţiunea de algoritm Noţiunea de algoritm este foarte veche. Ea a fost introdusă în secolele VIII-IX de către Abu Ja f

Microsoft Word - 2 Filtre neliniare.doc

Microsoft Word - Algoritmi genetici.docx

Manual de utilizare Set volan și pedale MG7402

POLITICA DE VECINĂTATE, VECTOR DE BAZĂ

UNIVERSITATEA DE ŞTIINŢE AGRICOLE ŞI MEDICINĂ VETERINARĂ CLUJ NAPOCA

Laborator 11 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 7.ian

STORY NAME: Being 20: Japanese culture and Game Development in Moldova COPYRIGHT HOLDER: COPYRIGHT NOTICE: Gabriel Encev / OPEN Media Hub Ownership of

Universitatea de Stat Alecu Russo din Bălți Facultatea de Ştiinţe ale Educaţiei, Psihologie şi Arte Catedra de psihologie CURRICULUM la unitatea de cu

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ Universitatea Babeş-Bolyai superior 1.2 Facultatea Psihologie şi Ştiinţe ale Educ

Assessment of patients' satisfaction in a public health service

CATEDRA DE STATISTICĂ ŞI ECONOMETRIE

ExamView Pro - Untitled.tst

FIŞA DISCIPLINEI 1. Date despre program 1.1. Instituţia de învăţământ superior Universitatea Spiru Haret 1.2. Facultatea Ştiinţe Economice Bucureşti 1

STORY NAME: Young musician COPYRIGHT HOLDER: COPYRIGHT NOTICE: Telefilm Chisinau / OPEN Media Hub Ownership of content belongs to Telefilm Chisinau /

Microsoft Word - TIC5

UNIVERSITATEA SPIRU HARET BUCUREŞTI FACULTATEA DE EDUCAŢIE FIZICĂ ŞI SPORT Şoseaua Berceni nr. 24, Bucureşti, sector 4 Tel./Fax E mail: ush

Microsoft Word - Revista_Universul_Juridic_nr_ _PAGINAT_.doc

ELABORARE PROIECTE

IR Update February 2014

PowerPoint Presentation

I. INTRODUCERE 1. Necesitatea studiului logicii Teodor DIMA În activitatea noastră zilnică, atunci când învăţăm, când încercăm să fundamentăm o părere

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

ANEXA 1 RECOMANDARI LICENTA

Microsoft Word - Revista_Universul_Juridic_nr_3-2019_PAGINAT_.doc

RS-1.3 LM.2

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

PowerPoint Presentation

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de

Matematici aplicate științelor biologie Lab09 MV

Introducere

1

Curs 3 Permutari cu repetitie. Combinari. Algoritmi de ordonare si generare

D.Rusu, Teoria măsurii şi integrala Lebesgue 6 MĂSURA LEBESGUE Cursul 5 Teorema 6.26 Există submulţimi ale lui R care nu sunt măsurabile Lebesgue. Dem

Calcul Numeric

PAS cap. 2: Reprezentări rare p. 1/35 Prelucrarea avansată a semnalelor Capitolul 2: Reprezentări rare Bogdan Dumitrescu Facultatea de Automatică şi C

CATEDRA DE STATISTICĂ ŞI ECONOMETRIE

Slide 1

Analiza modurilor de interpretare ale art. 30 din R1198/2006 şi efectele acestora asupra sectorului de piscicultură Cătălin PLATON

Parenting and Child Sexuality Questionnaire Va ruga m sa citit i fiecare afirmat ie s i sa bifat i un numa r de la 0 la 3 care indica i n ce ma sura a

Microsoft Word - 5_ _Eval_ ETC_master_ESI_AnI-II_completat.doc

rrs

Capitole Speciale de Informatică Curs 1: Extragerea informaţiilor. Modelul boolean şi modelul boolean extins 27 septembrie 2018 Extragerea informaţiil

Utilizarea Internetului in Afaceri FSEGA, UBB Lect.univ.dr. Daniel Mican LABORATOR 1. Google Drive, Google Calendar, WeTr

Dorel LUCHIAN Gabriel POPA Adrian ZANOSCHI Gheorghe IUREA algebră geometrie clasa a VIII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA

COMISIA EUROPEANĂ Bruxelles, C(2018) 2526 final REGULAMENTUL DELEGAT (UE) / AL COMISIEI din de completare a Regulamentului (UE) nr

Facultatea de Matematică Anul II Master, Geometrie Algebrică Mulţimi algebrice ireductibile. Dimensiune 1 Mulţimi ireductibile Propoziţia 1.1. Fie X u

Revistă ştiinţifico-practică Nr.1/2018 Institutul de Relaţii Internaţionale din Moldova IMPACTUL CREANȚELOR ȘI DATORIILOR CURENTE ASUPRA DEZVOLTĂRII E

Analiza Bayesiana - Fundamente Teoretice si Exemple

Microsoft Word - Probleme-PS.doc

PowerPoint Presentation

User guide

Anexa 2-RE-01

Neural Networks

PROGRAMA ANALITICĂ PENTRU CLASA A X-A, CURSURI DE EXCELENŢĂ ANUL ŞCOLAR Studiul fizicii în clasele de excelenţă are ca finalitate încheierea

Retele Petri si Aplicatii

PROIECT DIDACTIC LALEAUA ȘI ALTE PLANTE ÎNRUDITE CU EA Unitatea de învățământ: Profesor: Data: Clasa: Aria curriculară: Matematică și Ştiințe ale natu

Personal Scrisori Scrisori - Adresa Română Andreea Popescu Str. Reşiţa, nr. 4, bloc M6, sc. A, ap. 12. Turnu Măgurele Jud. Teleorman România. E

Web Social FSEGA, UBB Lect.univ.dr. Daniel Mican LABORATOR 2. Dezvoltarea blogurilor prin intermediul WordPress.com PREZE

Microsoft Word - Silion_Neo_Simina1.doc

Microsoft Word - Revista_Drept_penal_al_afacerilor_nr_1_2019.doc

Laborator 3 - Simulare. Metode de tip Monte Carlo. I. Estimarea ariilor şi a volumelor RStudio. Nu uitaţi să va setaţi directorul de lucru: Session Se

Microsoft Word - Mihalca.doc

O NOUA PROBLEMA DE CONCURS OLIMPIADA MUNICIPALA DE INFORMATICA, IASI 2019 V-am promis într-un articol mai vechi ca vom prezenta pe acest blog câteva p

PROIECT DIDACTIC

Microsoft Word - Curs_07.doc

Universitatea Lucian Blaga Sibiu Facultatea de inginerie-Departamentul de calculatoare şi Inginerie Electrică Titular curs: Şef lucrări dr.mat. Po

Microsoft Word - 11_Evaluare ETC_master_Master_ESI.doc

LOGICA MATEMATICA SI COMPUTATIONALA Sem. I,

1. Date despre program FIŞA DISCIPLINEI 1.1 Instituţia de învăţământ Universitatea Babeş-Bolyai Cluj-Napoca superior 1.2 Facultatea Facultatea de Psih

A TANTÁRGY ADATLAPJA

Managementul Resurselor Umane

BAREM PROFIL UMANIST Subiectul 1 (40 de puncte) Nr Itemul Variante acceptabile Specificări Punctaj total 1. Rescrie, din lista propusă, un sinonim con

PowerPoint Presentation

Retele Petri si Aplicatii

ESTIMAREA EVOLUŢIEI VALORILOR TERMICE ŞI A PRECIPITAŢIILOR

INTREBARI FRECVENTE SI MANUAL DE UTILIZARE hub.sendsms.ro

Microsoft Word TURISM - cty_pa_final.doc

C10: Teoria clasică a împrăștierii Considerăm un potențial infinit în interiorul unui domeniu sferic de rază a și o particulă incidentă (Figura 1) la

Spatii vectoriale

Microsoft Word - 76 Paunescu-Gherghel-Pascal-Paunescu.doc

Nr

Modelarea si Simularea Sistemelor de Calcul

Transcriere:

Tudor Drugan 1

Avihu Boneh As for cholesterol, there have been many studies showing clear association between high cholesterol and coronary heart disease. Unfortunately, the correlation is and will be reduced thanks to many industry-sponsored studies, which led the American Academy of Cardiology to reduce the definition of 'high level' gradually over the years. I am sure that the correlation between the current recommendations and coronary heart disease is not as good as in the original studies, with much higher cholesterol level (that, not even taking into account the HDL/Total Cholesterol ratio). So we are now left with recommendations that are gradually turning away from good evidence. It may sound ridiculous but if this trajectory continues we will find that cholesterol levels in Smith Lemli Opitz are normal and all the rest is associated with coronary heart disease. I have recently read that the American Academy of Cardiology is considering a blood pressure of 130/80 in people who are 45 years of age and over as 'hypertension'. Is this a joke? can we trust these recommendations? (big pharma will certainly trust them). It diminishes the trust anyone can have in any 'guidelines' or 'recommendations' professional bodies produce, which is a shame. 2

3

4

Fenomen Experiment Concluzie medicală Descriere Inferență Concluzie statistică 5

Testarea ipotezelor statistice Formularea de noi ipoteze (sau model sau teorie) este una dintre cele mai importante aspecte ale cercetării ştiinţifice. Aceste ipoteze experimentale încercă să descrie sau să explice anumite fenomene reale. In multe cazuri există ipoteze anterioare (descrieri sau explicaţii) pe care oamenii de ştiinţă doresc să le înlocuiască cu altele noi. 6

Testarea ipotezelor statistice Este însă insuficient să se formuleze sau să fie prezentată numai o nouă ipoteză. O ipoteză nouă trebuie testată pentru a vedea că are temei (în concordanţă cu observaţiile) şi pentru a justifica că este mai bună decât alte ipoteze alternative. Aceasta conduce la scheme de experimente, eşantioane şi de observaţii în scopul obţinerii dovezii pentru susţinerea (sau respingerea) unei noi ipoteze. 7

Obiectivele cursului Testarea ipotezelor statistice Ipoteza nulă/ Ipoteza altenativă Concepte: Regiunea critică, direcţionalnondirecţional Erori în testarea ipotezelor statistice Nivel de semnificație Puterea testului 8

Metode pentru testarea ipotezelor Compararea a două ipoteze sau teorii concurente Aceste două teorii trebuie prima dată formulate ca modele. Aceste două modele în continuare vor fi denumite prin ipoteza nulă şi ipoteza alternativă. Ipoteza nulă H 0, reprezintă modelul pe care experimentatorul ar dori să-l înlocuiască. Ipoteza alternativă H 1 este noul model care de regulă reprezintă o negaţie a ipotezei nule. 9

Populație de studiu Eșantion A Eșantion A Eșantion B Eșantion B Tratament A Tratament B Eșantion A B Eșantion A Eșantion B 10

11

PAŞII UNUI TEST STATISTIC 12

Paşii unui test statistic (1) Formularea problemei în termenii ipotezelor statistice. Pentru aceasta se stabilesc: ipoteza alternativă H1 şi respectiv ipoteza nulă H0, reprezentând o negare a ipotezei nule. Ipoteza alternativă H1, este acea ipoteză care într-un sens sau altul contrazice ipoteza nulă. Această ipoteză se mai numeşte şi ipoteza de lucru. Ipoteza nulă H0, este ipoteza care trebuie testată, testul efectuându-se sub prezumţia că ipoteza nulă ar fi adevărată. 13

Cei 5 paşi ai unui test statistic Fenomen 1. Formularea problemei în termenii ipotezelor statistice 14

Paşii unui test statistic (1) Ipoteza alternativă Media valorilor în populaţia A este diferită de media valorilor în populaţia B H1 : A B sau H1 : A B 0 Ipoteza nulă Media valorilor în populaţia A nu este diferită de media valorilor în populaţia B H0 : A B sau H0 : A B 0 15

Paşii unui test statistic (1) Uneori se urmăreşte tocmai respingerea ipotezei alternative (comparaţia unui tratament cu unul standard, studii de bioechivalență) H0 : A B sau H0 : A B 0 Ipotezele anterioare stipulau diferenţa fără a o enunţa: ipoteze non-direcţionale H1 : A B sau H1 : A B H1 : A B sau H1 : A B 0 0 Ipoteze direcţionale 16

Paşii unui test statistic (2) Alegerea şi calcularea parametrului statistic al testului (Z, t, F...) Parametrul statistic al testului exprimă într-o anumită formă, diferenţa dintre elementele comparate, dintre care cel puţin unul intervine sub forma unei statistici a unui eşantion. Ţinând seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care fac obiectul testului, parametrul statistic este o variabilă aleatoare de selecţie, care urmează o anumită lege de probabilitate 17

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 18

Ipoteza nulă Regiunea critică. Ipoteza alternativă

Paşii unui test statistic (3) Alegerea regiunii critice. În funcţie de valoarea parametrului statistic calculat decidem care dintre ipoteze, cea nulă sau cea alternativă, este mai bună. Dacă valoarea parametrului statistic aparţine regiunii critice din distribuția teoretică, ipoteza nulă H0 va fi respinsă şi va fi considerată mai bună ipoteza alternativă H1. Dacă valoarea parametrului statistic nu aparţine regiunii critice, ipoteza nulă H0 nu va putea fi respinsă. 20

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 3. Alegerea regiunii critice 21

Test direcţional (cu o coadă) Nu mai încercăm localizarea regiunii critice în ambele cozi 22

Regiunea critică = regiunea de respingere, aria mărginită de Z=±1,96 23

Paşii unui test statistic (4) Alegerea dimensiunii regiunii critice Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care îl acceptăm. Pe scurt, definim nivelul de semnificaţie, notat cu (alfa), sau mărimea riscului pe care suntem dispuşi să ni-l asumăm în respingerea ipotezei nule H0 în cazul în care aceasta este mai «adevărată». De obicei se alege un nivel de semnificaţie de 1% sau 5%. 24

Cei 5 paşi ai unui test statistic Fenomen Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 3. Alegerea regiunii critice 4. Alegerea dimensiunii regiunii critice 25

Paşii unui test statistic (5) Concluzia testului Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice. Regiunea critică trebuie astfel aleasă încât dacă ipoteza alternativă H1 este mai «adevărată», probabilitatea de respingere a ipotezei nule H0 să fie mai mare decât în cazul în care ipoteza nulă H0 ar fi mai «adevărată». 26

Cei 5 paşi ai unui test statistic Fenomen 1. Formularea problemei în termenii ipotezelor statistice 2. Alegerea şi calcularea parametrului statistic al testului 5. Concluzia testului 3. Alegerea regiunii critice 4. Alegerea dimensiunii regiunii critice 27

Metode pentru testarea ipotezelor Prin respingerea ipotezei nule cercetătorul afirmă că rezultatele observate nu sunt datorate întâmplării = efect semnificativ statistic Când ipoteza nulă nu este rejectată cercetătorul afirmă că diferenţele observate sunt datorate întâmplării şi rezultatele nu sunt semnificative ATENȚIE: Statistica nu verifică adevărul, nu dovedește afirmațiile, ci doar ne arată cu o probabilitate oarecare că rezultatele observate nu sunt datorate întâmplării 28

Relația dintre parametrul testului și probabilitatea testului (p) p este aria de sub distribuția de probabilitate mărginită de valorile parametrului statistic 29

Cum ne sunt furnizate rezultatele testelor t-test: Two-Sample Assuming Equal Variances z-test: Two Sample for Means occipital parietal temporal frontal Mean - 1,824 7,217 Mean 2,852-0,014 Variance 19,111 51,156 Known Variance 19,000 50,000 Observations 18,000 18,000 Observations 18,000 18,000 Pooled Variance 35,133 Hypothesized Mean Difference - Hypothesized Mean Difference - z 1,464 df 34,000 P(Z<=z) one-tail 0,072 t Stat - 4,576 z Critical one-tail 1,645 P(T<=t) one-tail 0,000 P(Z<=z) two-tail 0,143 t Critical one-tail 1,691 z Critical two-tail 1,960 P(T<=t) two-tail 0,000 t Critical two-tail 2,032 30

Decizia Stabilirea semnificaţiei testului pe baza valorii lui p se face frecvent cu următoarea regulă empirică: 1. Dacă 0,01 <= p<0,05, rezultatele sunt considerate semnificative. 2. Dacă 0,001 <= p<0,01, rezultatele sunt considerate înalt semnificative. 3. Dacă p<0,001, rezultatele sunt considerate foarte înalt semnificative. 4. Dacă p>=0,05, rezultatele sunt considerate nesemnificative statistic. 5. Dacă 0,05 <= p<0,1, se notează o oarecare tendinţă spre considerarea unei semnificaţii statistice. 31

Interpretarea p Valoarea p nu este probabilitatea ca ipoteza nulă să fie falsă. O valoare mică a lui p nu înseamnă că există o probabilitate mică ca ipoteza nulă să fie adevărată. Ipoteza de lucru nu poate fi inversată şi de exemplu pentru un p=0,02 nu se poate spune că avem o probabilitate de 98% ca diferenţa să existe. Valoarea lui p nu este un indicator al validităţii ipotezei statistice. p se utilizează doar pentru a evalua dacă decizia este semnificativă sau nu. 32

IMPORTANT! Testele statistice nu verifică valoarea de adevăr Un test semnificativ nu ne indică altceva decât că între eșantioanele studiate există o diferență semnificativă statistic Orice p al unui test statistic trebuie însoțit de o interpretare medicală (clinică) Calitatea concluziei medicale este dată de: Pertinența ipotezei testate Dimensiunea efectului evidențiat Corectitudinea efectuării studiului 33

34

Erori în testarea ipotezelor statistice Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge H 0 nu se respinge Eroare tip I (α) Corect Corect Eroare tip II (β) 35

Erori în testarea ipotezelor statistice Rezultat H 0 se respinge H 0 nu se respinge H 0 adevărată Eroare tip I (α) Corect Adevăr H 0 Falsă Corect Eroare tip II (β) alfa (α) = probabilitatea ca testul să respingă ipoteza nulă deși ipoteza alternativă nu se diferențiază statistic de aceasta beta (β) = probabilitatea ca testul să nu poată respinge ipoteza nulă deși ipoteza alternativă se diferențiază statistic de aceasta 36

Studiul 1: 263 cazuri, 1241 martori Regiunea critică. α β

Eroarea de tip I = H 0 este respinsă deși ipoteza alternativă nu se diferențiază statistic de aceasta Am concluzionat că există reale diferențe deși acestea sunt datorate șansei Concluzionăm că un tratament este eficient pe baza unei interpretări greșite Alfa (α) = nivelul de semnificație ales = mărimea riscului asumat Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge H 0 nu se respinge Eroare tip I (α) Corect Corect Eroare tip II (β) 38

Eroarea de tip II = H 0 este nu este respinsă deşi ipoteza alternativă se diferențiază statistic de aceasta Am concluzionat că există diferenţele observate sunt datorate şansei atunci când acestea apar datorită diferenţelor dintre eşantioane Am putea abandona un tratament pe care tocmai îl testăm sau o direcţie de cercetare Puterea unui test (1-β) = capacitatea testului statistic de a evidenția diferența Adevăr H 0 adevărată H 0 Falsă Rezultat H 0 se respinge Eroare tip I (α) Corect H 0 nu se respinge Corect Eroare tip II (β) 39

Studiul 1: 263 cazuri, 1241 martori Ipoteza nulă: diferența=0. Regiunea critică. For 5% significance level, one-tail area=2.5% (Z /2 = 1.96) Ipoteza alternativă relevantă clinic: diferența =10%. Puterea= șansa de a avea parametrul în zona non-critică deși alternativa este viabilă = aria din dreapta liniei (în galben) 85%

Studiul 1: 50 cazuri, 50 martori Valoarea critică= 0+10*1.96=20 Puterea =15%

Valoarea critică= 0+0.52*1.96 = 1 Ipoteza alternativă relevantă clinic: diferența = 4 Puterea = 100%!