Laborator 6 - Statistică inferenţială I. Inferenţă asupra mediei - Testul Z pentru media unei populaţii cu dispersia cunoscută Se consideră o populaţi

Documente similare
Inferenţa statistică

PowerPoint Presentation

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Neural Networks

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Laborator 3 - Simulare. Metode de tip Monte Carlo. I. Estimarea ariilor şi a volumelor RStudio. Nu uitaţi să va setaţi directorul de lucru: Session Se

Microsoft PowerPoint - curs5-DPT-2010V97 [Compatibility Mode]

Laborator 10 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 17.dec

Laborator 11 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 7.ian

1. Se masoara forta de presiune X (Kg/cm 3 ), la care un anumit material cedeaza. Se presupune ca X urmeaza o lege normala. Pentru 10 masuratori se ob

Introducere în statistică

Microsoft Word - BAC sociologie

PowerPoint Presentation

Paradigme de programare

Olimpiada republicană la disciplina Economie Aplicată, ediţia Clasa a X-a. Timp acordat: 180 min. I. Completați definiţiile categoriilor economi

DAN LASCU ADRIANA-LIGIA SPORIŞ ANDA OLTEANU PAUL VASILIU MATEMATICĂ. CULEGERE DE PROBLEME TIP GRILĂ PENTRU ADMITEREA ÎN ACADEMIA NAVALĂ MIRCEA CEL BĂT

Matematici aplicate științelor biologie Lab09 MV

REGULAMENTUL CAMPANIEI PROMOTIONALE

rrs_12_2012.indd

Concurs online de informatică Categoria PROGRAMARE Secţiunea 5-6 avansaţi PROBLEMA puncte DANS De 1 Iunie - Ziua Copilului se organizează un spe

I

Nr

DETERMINAREA CONSTANTEI RYDBERG

Microsoft Word - L25Ro_Studiul efectului Hall_f_RF

Nr

REGULAMENT DE PARTICIPARE I. Înscriere: Simpozionul Auxiliare curriculare şi portofolii ale elevilor se organizează pe două secţiuni: 1. Auxiliare cur

1

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ Universitatea Babeş-Bolyai superior 1.2 Facultatea Psihologie şi Ştiinţe ale Educ

CE TREBUIE SĂ ȘTII DESPRE PROFESIA DE ASISTENT MEDICAL

Microsoft Word - Ghid elaborare diploma ISER.docx

O NOUA PROBLEMA DE CONCURS OLIMPIADA MUNICIPALA DE INFORMATICA, IASI 2019 V-am promis într-un articol mai vechi ca vom prezenta pe acest blog câteva p

Str. Mihail Kogălniceanu nr. 1 Cluj-Napoca, RO Tel.: Fax: Reg

ALGORITMII ŞI REPREZENTAREA LOR Noţiunea de algoritm Noţiunea de algoritm este foarte veche. Ea a fost introdusă în secolele VIII-IX de către Abu Ja f

Microsoft Word - C05_Traductoare de deplasare de tip transformator

EDC_HRE_VOL_2_ROM.pdf

1. *Care din următoarele extensii le poate obține un fișier creat în Microsoft Word? a..doc b..pdf c..txt d..xls e..mdp f..docx 2. *Care din următoare

Limbaje de Programare Curs 6 – Functii de intrare-iesire

R E G U L A M E N T

Microsoft Word - decizie_2964_a.doc

C O M U N I C A T După cum știți, Asociația noastră (AORR) în cooperare cu alte Asociații au pus la dispozitia pensionarilor militari, în mod gratuit

Subiectul 1

I. Partea introductivă Proiectul unității de învățare CONCEPTUL DE MATRICE ŞCOALA: Colegiul Național Petru Rareș Suceava CLASA: a XI a- matematică / a

Proiect Hotărâre pentru modificarea și completarea unor acte normative în domeniul forței de muncă În temeiul art. 108 din Constituţia României, repub

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea de Vest din Timișoara 1.2 Facultatea Matematică și Informa

III. ECONOMISIREA ŞI INVESTIŢIILE De citit. Un bănuţ pus deoparte Nu-ţi trebuie cine ştie ce formule pentru investiţii, pentru a te bucura de dobânzil

R O M A N I A Ministerul Educaţiei, Cercetării, Tineretului şi Sportului UNIVERSITATEA DE MEDICINĂ ŞI FARMACIE din TÂRGU-MUREŞ Facultatea de Medicină

Your Presentation Name

Manual de proceduri

UNIVERSITATEA DIN BUCUREȘTI FACULTATEA DE ADMINSITRAȚIE ȘI AFACERI Bd. Regina Elisabeta, nr. 4-12, sector 3, București Tel: +4(021) ; +4(021)305

Str. Mihail Kogălniceanu nr. 1 Cluj-Napoca, RO Tel.: Fax: Reg

Capitole Speciale de Informatică Curs 4: Calculul scorurilor în un sistem complet de extragere a informaţiilor 18 octombrie 2018 Reamintim că în cursu

Matematici aplicate științelor biologie Lab05 MV

CAPITOLUL 1

PLAN DE ÎNVĂŢĂMÂNT

Folosirea mediilor. Interviuri cu elevi si profesori Metodologie: Cercetarea a fost realizata in 7 licee din Bucuresti, un liceu din Petrosani si unul

ALGORITMICĂ. Seminar 3: Analiza eficienţei algoritmilor - estimarea timpului de execuţie şi notaţii asimptotice. Problema 1 (L) Să se determine număru

Microsoft Word - Anexa_4_Conventie_Individuala_Practica_final

1. Găsiți k numerele cele mai apropiate într-un şir nesortat Dându-se un şir nesortat și două numere x și k, găsiți k cele mai apropiate valori de x.

Microsoft Word - Tsakiris Cristian - MECANICA FLUIDELOR

PLAN DE ÎNVĂŢĂMÂNT

OPERATII DE PRELUCRAREA IMAGINILOR 1

Microsoft Word - Matematika_kozep_irasbeli_javitasi_0911_roman.doc

Aggregating Data

BAREM PROFIL UMANIST Subiectul 1 (40 de puncte) Nr Itemul Variante acceptabile Specificări Punctaj total 1. Rescrie, din lista propusă, un sinonim con

Invitaţie - program

Laborator 1-Teoria probabilitatilor si statistica matematica Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 1 P

2013 Mituri despre abdomen Valentin Bosioc

Microsoft Word - TRECEREA PRAGULUI DE LA INVATAMANTUL PRIMAR LA GIMNAZIU

Probleme proiect TP BITPERM Implementați un algoritm care citește de la intrarea standard două numere naturale și scrie la ieșirea standard da

Microsoft Word - Algoritmi genetici.docx

A TANTÁRGY ADATLAPJA

MINISTERUL EDUCAŢIEI, CULTURII ŞI CERCETĂRII AL REPUBLICII MOLDOVA I.P. CENTRUL DE EXCELENŢĂ ÎN ENERGETICĂ ŞI ELECTRONICĂ REGULAMENTUL PRIVIND ORGANIZ

Strategia CEAC

Proiect de tehnologie didactică

Scoala Gimnaziala Merei Str. Principală, com. Merei, jud. Buzău Tel/ fax: GRAFICUL UNIC DE MONITORIZARE ȘI CO

Microsoft Word - Conventie_cadru_2016.doc

O teoremă de reprezentare (II) Marian TETIVA 1 Abstract. In this paper some (in general well-known) results on complete sequences are exposed, with ap

ROLUL EDUCAȚIEI NONFORMALE PRIVIND AS= ALIMENTAȚIE SĂNĂTOASĂ Corina Turcu, Colegiul Economic George Barițiu, Sibiu Educația nonformală este o nouă abo

Cum interacționează shopperii cu raftul din hypermarket

Microsoft Word - 11_Evaluare ETC_master_Master_ESI.doc

Consumatorul de dropsuri pentru improspatarea respiratiei este atent la beneficii

Grafice romana martie 2004.xls

Sesiunea de comunicări ştiinţifice studenţeşti – Ediţia 2019

Secţiunea 7-8 începători Concurs online de informatică Categoria PROGRAMARE PROBLEMA 1 ID 100 puncte Calculatoarele trebuie să se recunoască în rețeau

MergedFile

Nr

Pag. 1 PLAN DE ÎNVĂŢĂMÂNT valabil începând din anul universitar UNIVERSITATEA BABEŞ-BOLYAI CLUJ-NAPOCA FACULTATEA DE ŞTIINŢE ECONOMICE ŞI GE

MINISTERUL EDUCAŢIEI, CULTURII ŞI CERCETĂRII AL REPUBLICII MOLDOVA UNIVERSITATEA PEDAGOGICĂ DE STAT ION CREANGĂ DIN CHIŞINĂU FACULTATEA ŞTIINŢE ALE ED

COMENTARII FAZA JUDEŢEANĂ, 9 MARTIE 2013 Abstract. Personal comments on some of the problems presented at the District Round of the National Mathemati

Microsoft Word - proiect preambul.docx

FACULTATEA DE AUTOMATICA SI CALCULATOARE Regulamentul de organizare al examenelor de diplomă și de disertație pentru programele de studii din domeniul

Prezentul Raport ilustrează statistici comparative privind calitatea serviciilor de acces la internet, pentru anul 2014, din perspectiva parametrilor

Ce trebuie să ştiţi despre divorţ:

CNAS

Microsoft Word - II PANAET ANCA ELENA 841 tardiv.doc

MINISTERUL SĂNĂTĂŢII PUBLICATIE Privind organizarea şi desfăşurarea examenului pentru obţinerea titlului de medic specialist, medic stomatolog special

Republica Serbia MINISTERUL ÎNVĂŢĂMÂNTULUI, ŞTIINŢEI ŞI DEZVOLTĂRII TEHNOLOGICE INSTITUTUL PENTRU EVALUAREA CALITĂŢII ÎNVĂŢĂMÂNTULUI ŞI EDUCAŢIEI INST

Transcriere:

Laborator 6 - Statistică inferenţială I. Inferenţă asupra mediei - Testul Z pentru media unei populaţii cu dispersia cunoscută Se consideră o populaţie statistică căreia i se cunoaşte dispersia σ 2. Pentru un eşantion aleator simplu cu media de selecţie x n, dacă populaţia urmează o lege normală sau dimensiunea eşantionului este suficient de mare, scorul z = x n µ σ/ este distribuit normal standard: N(0, 1). n Testul Z decurge astfel: 1. se formulează ipoteza nulă, care susţine că media populaţiei ia o valoare particulară: H 0 : µ = µ 0 2. se formulează o ipoteză alternativă care poate fi de trei feluri: H a : µ < µ 0 H a : µ > µ 0 (ipoteză asimetrică la stânga) sau (ipoteză asimetrică la dreapta) sau H a : µ µ 0 (ipoteză simetrică) 3. se fixează nivelul de semnificaţie: α (care uzual poate fi 1% sau 5%); 4. se calculează scorul testului: z = x n µ 0 σ/ n 5. se determină valoarea critică z : z = qnorm(α, 0, 1) pentru ipoteză H a asimetrică la stânga (z < 0), z = qnorm(1 α, 0, 1) pentru ipoteză H a asimetrică la dreapta (z > 0), z = qnorm(α/2, 0, 1) = qnorm(1 α/2, 0, 1) pentru ipoteză H a simetrică (z > 0). 6. ipoteza nulă H 0 este respinsă dacă z < z z > z pentru ipoteză H a asimetrică la stânga sau pentru ipoteză H a asimetrică la dreapta sau z > z pentru ipoteză H a simetrică, dacă nu suntem într-una din aceste situaţii, atunci se spune că nu există suficiente dovezi pentru a respinge ipoteza nulă H 0 şi a accepta ipoteza alternativă H a. Exerciţiu rezolvat. Un producător de becuri doreşte sa testeze cu 5% nivel de semnificaţie afirmaţia că media de viaţă a acestora este de cel puţin 810 de ore (se ştie că deviaţia standard a populaţiei este σ = 50 de ore). Se alege un eşantion de 200 de becuri a căror medie de viata este gasita 816 ore. Poate fi acceptată ipoteza producătorului?

> alfa = 0.05 > population mean = 810 > sample mean = 816 > n = 200 > sigma = 50 > critical z = qnorm(1- alfa) > z score = (sample mean - population mean)/(sigma/sqrt(n)) > critical z > z score Scorul va fi z = 1.69705 > z = 1.64485 şi ipoteza nulă poate fi respinsă, se acceptă ipoteza că media populaţiei este mai mare decât 810. Exerciţii propuse (I.1 şi încă două dintre I.2-I.6) I.1 Scrieţi o funcţie (numită z test) care să calculeze şi să returneze valoarea critică şi scorul testului (parametrii funcţiei vor fi: tipul ipotezei alternative, n, µ 0, x n, α, σ etc). Funcţia aceasta va fi utilizată apoi la rezolvarea exerciţiilor de mai jos. I.2 Dintr-o populaţie normală cu dispersia σ 2 = 144 se selectează 49 de indivizi a căror medie este 88; să se testeze ipoteza că media populaţiei este mai mică decât 90. I.3 Din experienţă se ştie că rezultatele studenţilor la un test de matematică urmează o lege normală cu media 75 şi dispersia 17. Catedra de matematică doreşte să afle dacă studenţii din anul curent au un comportament atipic. Media rezultatelor unui grup de 36 studenţi este 85 de puncte. Cu 1% nivel de semnificaţie se poate trage concluzia că studenţii din anul curent sunt atipici? I.4 Pe cutiile de un anumit tip de detergent este indicată o greutate de 21oz. O agenţie de protecţie a consumatorilor doreşte să testeze această greutate cu 1% nivel de semnificaţie. Pentru 100 de cutii găseşte o greutate medie de 20.5oz. Dacă se ştie că deviaţia standard a greutăţii este 2.5oz, agenţia poate pretinde mărirea cantităţii de detergent dintr-o cutie? I.5 O firma producatoare de tuburi fluorescente doreste sa stie daca poate pretinde ca media de viata a acestora este 1000 de ore. Pentru aceasta fabrica 100 de tuburi si masoara pentru ele o medie de viata de 970 de ore. Firma respectiva cunoaste ca deviatia standard a vietii tuburilor este 85 de ore. Cu 5% nivel de semnificatie se poate trage concluzia ca media de viata este mai mica de 1000 de ore? Dar cu 1%? I.6 Se cere ca media de viaţă a unui tip de baterii sa fie 22 de ore. Se ştie (din procesul de fabricaţie) că durata de viaţă bateriilor urmează o lege normală cu deviaţia standard 3 ore. Un eşantion de 16 baterii are o medie de viaţă măsurată de 20 de ore. Se poate trage concluzia că media de viaţă a bateriilor este diferită de 22 de ore? II. Inferenţă asupra mediei - Testul t pentru media unei populaţii cu dispersia necunoscută Se consideră o populaţie statistică distribuită normal căreia nu i se cunoaşte dispersia. Pentru un eşantion aleator simplu cu media de selecţie x n şi deviaţia standard s, scorul t = x n µ s/ n este distribuit Student cu n 1 grade de libertate: t(n 1). Testul t decurge astfel:

1. se formulează ipoteza nulă, care susţine că media populaţiei ia o valoare particulară: H 0 : µ = µ 0 2. se formulează o ipoteză alternativă care poate fi de trei feluri: H a : µ < µ 0 H a : µ > µ 0 (ipoteză asimetrică la stânga) sau (ipoteză asimetrică la dreapta) sau H a : µ µ 0 (ipoteză simetrică) 3. se fixează nivelul de semnificaţie: α (care uzual poate fi 1% sau 5%); 4. se calculează scorul testului: t = x n µ 0 s/ n 5. se determină valoarea critică t : t = qt(α, n 1) pentru ipoteză H a asimetrică la stânga (t < 0), t = qt(1 α, n 1) pentru ipoteză H a asimetrică la dreapta (t > 0), t = qt(α/2, n 1) = qt(1 α/2, n 1) pentru ipoteză H a simetrică (t > 0). 6. ipoteza nulă H 0 este respinsă dacă t < t t > t pentru ipoteză H a asimetrică la stânga sau pentru ipoteză H a asimetrică la dreapta sau t > t pentru ipoteză H a simetrică, altfel se spune că nu există suficiente dovezi pentru a respinge ipoteza nulă H 0 şi a accepta ipoteza alternativă H a. Exerciţiu rezolvat. Pentru un experiment asupra metabolismului 5 insecte sunt hrănite cu zahăr. Valorile nivelului de glucoză (care urmează o lege normală) obţinute din măsurători sunt: 55.95 68.24 52.73 21.5 23.78 Sa se testeze cu 5% nivel de semnificaţie ipoteza că media nivelului de glucoză este mai mare de 40. > alfa = 0.05 > x = c(55.95, 68.24, 52.73, 21.5, 23.78) > population mean = 40 > sample mean = mean(x) > n = 5 > s = sd(x) > se = s/sqrt(n) > critical t = qt(1 - alfa, n - 1) > t score = (sample mean - population mean)/se > critical t > t score

Rezultatul va fi t = 2.13184 > t = 0.47867, ipoteza nulă nu poate fi respinsă. Exerciţii propuse (II.1 şi încă două dintre II.2-II.6) II.1 Scrieţi două funcţii (de tipul t test) care să calculeze şi să returneze valoarea critică şi scorul testului t: una dintre funcţii va trebui să citească eşantionul dintr-un fişier, iar cealaltă va primi ca argumente tipul ipotezei alternative, media de selecţie, deviaţia standard a eşantionului etc. Funcţiile acestea vor fi utilizate, după caz pentru rezolvarea exerciţiilor de mai jos. II.2 Se măsoară pentru un esantion provenit dintr-o populaţie normală următoarele valori 36 32 28 33 41 28 31 26 29 34 Cu 1% nivel de semnificaţie să se testeze ipoteza că media are o valoare diferită de 34. II.3 Pe pachetele unui tip de ţigări este trecută o concentraţie de nicotină (care urmează o lege normală) de 11.4 mg. Datorită unor reclamaţii, o agenţie neguvernamentală se hotărăşte să testeze această concentraţie. Pentru 100 de pachete de ţigări este găsită o medie a concentraţiei de 11.9 mg cu o deviaţie standard s = 0.25mg. Să se testeze cu 1% şi 5% nivel de semnificaţie dacă reclamaţiile primite sunt îndreptăţite. II.4 Media rezultatelor unui test la istorie este de 80 de puncte. Catedra de istorie doreste sa afle daca studentii actuali au un comportament tipic la acest test. Pentru un esantion aleator simplu rezultatele se găsesc în fişierul history.txt. Să se formuleze şi să se testeze ipoteza alternativă corespunzătoare (cu 1% si 5% nivel de semnificaţie). II.5 Se consideră un eşantion de dimensiune 64 cu media 52 şi dispersia s 2 = 89.5, care provine dintr-o populaţie distribuită normal. Să se testeze ipoteza că media populaţiei este 49 versus ipoteza că media este diferită de 49. II.6 Să se aplice unul dintre testele cunoscute pentru următoarele date obţinute dintr-un eşantion aleator simplu Media esantionului x n = 29 Dispersia esantionului s 2 = 5 Dimensiunea esantionului n = 40 Ipoteza nula µ 0 = 30 Ipoteza alternativă µ 0 < 30 Nivelul de semnificaţie α = 0.05 III. Inferenţă asupra mediei - Testul Z pentru diferenţa mediilor unor populaţii cu dispersii cunoscute Se consideră o două populaţii statistice cărora li se cunoasc dispersiile σ1 2 şi σ2 2. Se aleg două eşantioane aleatoare simple şi independente între ele cu mediile de selecţie x n1 şi x n2. Dacă populaţiile urmează o lege normală sau dimensiunea eşantioanelor este suficient de mare, scorul z = (x n 1 x n2 ) (µ 1 µ 2 ) σ1 2 + σ2 2 este distribuit (eventual cu aproximaţie) normal standard: N(0, 1). Testul Z decurge astfel:

1. se formulează ipoteza nulă, care susţine că diferenţa mediilor celor două populaţii ia o valoare particulară: H 0 : µ 1 µ 2 = m 0 2. se formulează o ipoteză alternativă care poate fi de trei feluri: H a : µ 1 µ 2 < m 0 (ipoteză asimetrică la stânga) sau H a : µ 1 µ 2 > m 0 (ipoteză asimetrică la dreapta) sau H a : µ 1 µ 2 m 0 (ipoteză simetrică) 3. se fixează nivelul de semnificaţie: α (care uzual poate fi 1% sau 5%); 4. se calculează scorul testului: 5. se determină valoarea critică z : z = qnorm(α, 0, 1) z = qnorm(1 α, 0, 1) (x n1 x n2 ) m 0 σ1 2 + σ2 2 pentru ipoteză H a asimetrică la stânga, pentru ipoteză H a asimetrică la dreapta, z = qnorm(1 α/2, 0, 1) pentru ipoteză H a simetrică. 6. ipoteza nulă H 0 este respinsă dacă z < z z > z pentru ipoteză H a asimetrică la stânga sau pentru ipoteză H a asimetrică la dreapta sau z > z pentru ipoteză H a simetrică, altfel se spune că nu există suficiente dovezi pentru a respinge ipoteza nulă H 0 şi a accepta ipoteza alternativă H a. Exerciţiu rezolvat. Se compara durata de viata a doua tipuri de baterii. Primul tip are o deviatie standard de 4 ore, al doilea tip are o deviatie standard de 3 ore. Se aleg doua esantioane fiecare de dimensiune de 100 de baterii. Pentru primul esantion media de viata este de 48 de ore, iar pentru cel de-al doilea de 47 de ore. Sa se testeze diferenta mediilor de viata cu 5% nivel de semnificaţie. Observaţie. Testarea diferenţei mediilor echivalează cu o ipoteză alternativă de tipul µ 1 µ 2 0 = m 0. > alfa = 0.05 > m0 = 0 > sample1 mean = 48 > sample2 mean = 47 > n1 = 100 > n2 = 100 > sigma1 = 4 > sigma2 = 3 > combined sigma = sqrt(sigma1 2/n1 + sigma2 2/n2) > critical z = qnorm(1 - alfa/2 > z score = (sample1 mean - sample2 mean - m0)/combined sigma > critical z > z score

Rezultatul va fi z = 1.95996 < z = 2.00, ipoteza nulă va fi respinsă şi se acceptă că mediile celor două populaţii sunt diferite. Exerciţii propuse III.1 Scrieţi o funcţie (numită, de exemplu, z test means) care să calculeze şi să returneze valoarea critică şi scorul testului Z pentru diferenţa mediilor (parametrii vor fi: tipul ipotezei alternative, α, n 1, n 2, σ 1, σ 2 etc.). Funcţia aceasta va fi utilizată, pentru rezolvarea exerciţiilor de mai jos. III.2 80 dintre angajaţii aleşi aleator ai unei firme foarte mari au un salariu mediu săptămânal de 160$ (deviaţia standard a întregii populaţii fiind 3.24$). 70 dintre angajaţii unei alte firme au în medie 155$ salariu pe săptămână (deviaţia standard a întregii populaţii fiind 2.25$). Să se testeze dacă salariul mediu săptămânal la cele doua firme diferă semnificativ (1% nivel de semnificaţie). III.3 Un raport recent arată ca absolvenţii de universitate fără diplomă se căsătoresc mai repede decât cei cu diplomă. Sunt aleşi câte 100 de indivizi din cele două populaţii; pentru aceste două eşantioane absolvenţii fără diplomă se căsătoresc în medie la 22.8 ani (deviaţia standerd cunoscută populaţiei fiind σ 1 = 1.3 ani) iar cei cu diplomă la 23.3 ani (deviaţia cunoscută a populaţiei este σ 2 = 1.9 ani). Cu 1% nivel de semnificaţie se poate trage concluzia că raportul este corect? IV. Inferenţă asupra dispersiilor a două populaţii - Testul F Se consideră două populaţii normale ; din cele două populaţii se extrag două eşantioane aleatoare simple (şi independente între ele) cărora li se calculează dispersiile s 2 1 şi s2 2. Scorul F = s2 1 s 2 2 este distribuit F (n 1 1, n 2 1). Testul F decurge astfel: 1. se formulează ipoteza nulă, care susţine că dispersiile celor două populaţii sunt egale: H 0 : σ1 2 σ2 2 = 1 2. se formulează ipoteza alternativă; putem avea două tipuri de ipoteză alternativă: H a : σ 1 σ 2 > 1 (asimetrică la dreapta) pentru un un test one-tailed H a : σ 1 σ 2 1 (simetrică) pentru un un test two-tailed. 3. se fixează nivelul de semnificaţie: α (care uzual poate fi 1% sau 5%); 4. se calculează scorul testului: F = s2 1 s 2 2 5. se determină valoarea critică (sau, după caz, valoarile critice) F = qf(1 α, n 1 1, n 2 1) pentru H a asimetrică la dreapta, F s = qf(α/2, n 1 1, n 2 1), F d = qf(1 α/2, n 1 1, n 2 1) pentru H a simetrică.

6. ipoteza nulă H 0 este respinsă şi se acceptă H a dacă F > F pentru H a asimetrică la stânga, F < F s sau F > F d pentru H a simetrică. altfel nu există suficiente dovezi pentru a respinge ipoteza nulă. Exerciţiu rezolvat. Rezultatele unui test psihologic efectuat pe două eşantioane, unul de femei şi unul de bărbaţi sunt următoarele: bărbaţi: n 1 = 120, s 1 = 5.05 femei: n 2 = 135, s 2 = 5.44 Se poate trage concluzia că dispersiile celor două populaţii diferă semnificativ (1%)? > alfa = 0.01 > n1= 120 > n2 = 135 > s1 = 5.05 > s2 = 5.44 > critical F s= qf(alfa/2, n1-1, n2-1) > critical F d= qf(1 - alfa/2, n1-1, n2-1) > critical F s > critical F d > F score Scorul este F = 0.86175, valorile critice sunt Fs = 0.62843 şi Fd = 1.58257; deoarece F [Fs, Fd ] ipoteza nulă nu poate fi respinsă. În acest caz putem considera că nu există dovezi semnificative pentru a afirma că dispersiile sunt diferite. Exerciţii propuse IV.1 Scrieţi o funcţie (numită F test) care să calculeze şi să returneze valoarile critice şi scorul testului F (parametrii funcţiei vor fi: tipul ipotezei alternative, α, n 1, n 2, s 1, s 2 etc., eşantioanele se pot extrage din fişier ca mai jos). Funcţia aceasta va fi utilizată apoi la rezolvarea exerciţiilor care urmează. > x1 = read.table( program.txt, header = TRUE)[[ A ]] > x2 = read.table( program.txt, header = TRUE)[[ B ]] > n1 = length(x1) > s1 = sd(x1) >... IV.2 Un profesor crede că un anumit program de lectură imbunătăţeşte abilităţile şi dorinţa copiilor de a citi. Pentru aceasta el alege două grupuri de elevi: unul de 22 de elevi care urmează programul prescris (A) şi unul de 22 de elevi care nu urmează acest program (B). Rezultatele sunt date în fişierul program.txt. Să se decidă cu 1% şi 5% nivel de semnificaţie dacă dispersiile celor două populaţii sunt diferite.

IV.3 Cercetătorii studiază amplitudinea mişcării obţinută prin stimularea nervoasă a şoarecilor. Pentru şoarecii drogaţi se obţin următoarele date: 12.512 12.869 19.098 15.350 13.297 15.589 Pentru şoarecii normali se obţin următoarele date: 11.074 9.686 12.164 8.351 12.182 11.489 Influenţa drogurilor este semnificativă în ceea ce priveşte cele doua dispersii (5% nivel de semnificaţie)? V. Inferenţă asupra mediilor a două populaţii - Testul T pentru diferenţa mediilor unor populaţii cu dispersii necunoscute Se consideră o două populaţii statistice cărora nu li se cunosc dispersiile. Se aleg două eşantioane aleatoare simple şi independente între ele cu mediile de selecţie x n1 şi x n2 şi dispersiile σ1 2 şi σ2 2. Înaintea efectuării testului T se foloseşte testul F pentru a decide dacă dispersiile celor două populaţii sunt diferite. Dacă dispersiile nu sunt diferite t = (x n 1 x n2 ) m 0 s 2 + s2 urmează o distribuţie Student 1 : t(n 1 +n 2 2). Dacă dispersiile sunt diferite, atunci t = (x n 1 x n2 ) m 0 s 2 1 + s2 2 urmează o distribuţie Student: t(min (n 1 1, n 2 1)). Testul T decurge astfel: 1. se formulează ipoteza nulă, care susţine că diferenţa mediilor celor două populaţii ia o valoare particulară (de cele mai multe ori zero): H 0 : µ 1 µ 2 = m 0 2. se formulează o ipoteză alternativă care poate fi de trei feluri: H a : µ 1 µ 2 < m 0 H a : µ 1 µ 2 > m 0 (ipoteză asimetrică la stânga) sau (ipoteză asimetrică la dreapta) sau H a : µ 1 µ 2 m 0 (ipoteză simetrică) 3. se fixează nivelul de semnificaţie: α (care uzual poate fi 1% sau 5%); 4. se calculează scorul testului: a) dacă dispersiile sunt diferite: t = (x n 1 x n2 ) m 0 s 2 1 + s2 2 iar numărul de grade de libertate este df = min (n 1 1, n 2 1). 1 (n 1 1)s În acest caz s = 2 1 + (n2 1)s2 2 n 1 + n 2 2

b) dacă dispersiile sunt egale t = (x n 1 x n2 ) m 0 s 2 + s2 unde s 2 = (n 1 1)s 2 1 + (n 2 1)s 2 2, iar numărul de grade de libertate este df = n 1 + n 2 2 n 1 + n 2 2. 5. se determină valoarea critică t : t = qt(α, df) pentru ipoteză H a asimetrică la stânga (t < 0), t = qt(1 α, df) pentru ipoteză H a asimetrică la dreapta (t > 0), t = qt(α/2, df) = qt(1 α/2, df) pentru ipoteză H a simetrică (t > 0). 6. ipoteza nulă H 0 este respinsă dacă t < t t > t pentru ipoteză H a asimetrică la stânga sau pentru ipoteză H a asimetrică la dreapta sau t > t pentru ipoteză H a imetrică, altfel se spune că nu există suficiente dovezi pentru a respinge ipoteza nulă H 0 şi a accepta ipoteza alternativă H a. Exerciţiu rezolvat. Rezultatele unui test psihologic efectuat pe două eşantioane, unul de femei şi unul de bărbaţi sunt următoarele: bărbaţi: n 1 = 110, x 1 = 25.84, s 1 = 4.25 femei: n 2 = 105, x 1 = 21.53, s 2 = 3.85 Se poate trage concluzia că mediile celor două populaţii diferă semnificativ (1%)? Observaţie. Testarea diferenţei mediilor echivalează cu o ipoteză alternativă de tipul µ 1 µ 2 0 = m 0.

> alfa = 0.01 > m0 = 0 > sample1 mean = 25.84 > sample2 mean = 21.53 > n1 = 110 > n2 = 105 > s1 = 4.25 > s2 = 3.85 > critical F s= qf(alfa/2, n1-1, n2-1) # testul F > critical F d= qf(1 - alfa/2, n1-1, n2-1) > F score = s1 2/ s2 2 > if(f score < critical F s F score > critical F d) { + df = min(n1-1, n2-1) + combined s = sqrt(s1 2/n1 + s2 2/n2) + } else { + df = n1 + n2-2 + combined s = sqrt(((n1-1)*s1 2 + (n2-1)*s2 2)/df)*sqrt(1/n1+1/n2) + } > critical t = qt(1 - alfa/2, df) > t score = (sample1 mean - sample2 mean - m0)/combined sigma > critical t > t score Rezultatul va fi t = 2.6239 > t = 7.7994, ipoteza nulă poate fi respinsă. Exerciţii propuse V.1 Scrieţi o funcţie (numită, de exemplu, T test means) care să calculeze şi să returneze valoarea critică şi scorul testului T pentru diferenţa mediilor; această funcţie va include şi testul F simetric (parametrii vor fi: tipul ipotezei alternative, α, n 1, n 2, s 1 etc.). Funcţia aceasta va fi utilizată, pentru rezolvarea exerciţiilor care urmează. V.2 Un profesor crede că un anumit program de lectură imbunătăţeşte abilităţile şi dorinţa copiilor de a citi. Pentru aceasta el alege două grupuri de elevi: unul de 22 de elevi care urmează programul prescris (A) şi unul de 22 de elevi care nu urmează acest program (B). Rezultatele sunt date în fişierul program.txt. Să se decidă cu 1% şi 5% nivel de semnificaţie dacă mediile celor două populaţii diferă semnificativ. V.3 Cercetătorii studiază amplitudinea mişcării obţinută prin stimularea nervoasă a şoarecilor. Pentru şoarecii drogaţi se obţin următoarele date: 12.512 12.869 19.098 15.350 13.297 15.589 Pentru şoarecii obişnuiţi se obţin următoarele date: 11.074 9.686 12.164 8.351 12.182 11.489 Influenţa drogurilor este semnificativă în ceea ce priveşte cele două medii (1% nivel de semnificaţie)?

Temă pentru acasă. 5 puncte [1p: E1 sau E2] + [1.5p: E3 sau E4] + [2.5p: E5 sau E6] E1. (1 punct) Se măsoară nivelul de magneziu (care urmează o lege normală) din sângele unui pacient: 1.64 1.54 1.56 1.57 1.44 1.48 1.56 (mg/dl) Putem trage concluzia că acest nivel este mai mic decât maximum posibil, 1.6 mg/dl? (1%) E2. (1 punct) Folosind un eşantion aleator simplu format din 36 de indivizi se proiectează un test de semnificaţie în ceea ce priveşte media unei populaţii normale: H 0 : µ = 4 H a : µ 4, şi se calculează un scor z = 2.35. Este acest scor statistic semnificativ pentru 1% nivel de semnificaţie? Aceeaşi întrebare pentru 5% nivel de semnificaţie. E3. (1.5 puncte) O firma producătoare de pastă de dinţi doreşte să ştie dacă introducerea unui nou compus chimic măreşte performanţele produsului său. Sunt alese doua eşantioane fiecare a câte 100 de indivizi. Pentru primul grup (care foloseste noul produs) se numără în medie 3 carii (deviaţia standard cunoscută este 0.6), pentru cel de-al doilea grup se numără în medie 3.5 carii (deviaţia standard este de 0.4). Cu 1% nivel de semnificaţie se poate trage concluzia că prin introducerea noului compus pasta de dinţi îşi îmbunătăţeşte performanţele? Dar cu 5%? E4. (1.5 puncte) Pentru două eşantioane provenind din două populaţii normale distincte A şi B se determină următoarele valori (A) σ 1 = 0.75, n 1 = 155, x n1 = 15 (B) σ 2 = 0.78, n 2 = 150, x n2 = 14.5 Să se testeze diferenţa mediilor celor două populaţii cu 1% si cu 5% nivel de semnificaţie. E5. (2 puncte) Pentru două eşantioane aleatoare simple provenind din două populaţii normale se obţin următoarele date n 1 = 66 x n1 = 21 s 1 = 1.2 n 2 = 68 x n2 = 20 s 2 = 1.1 Să se testeze diferenţa mediilor ceor două populaţii (5%). E6. (2 puncte) Pentru două eşantioane aleatoare simple provenind din două populaţii normale se obţin următoarele date n 1 = 210 x n1 = 3.5 σ 1 = 0.6 n 2 = 190 x n2 = 4 σ 2 = 0.7 Putem trage concluzia că media celei de-a doua populaţii este mai mare? (1%). Rezolvările acestor exerciţii (funcţiile R şi apelurile lor) vor fi redactate într-un script R.