STRUCTURA UNUI ARTICOL STIINTIFIC U articol stiitific icepe cu titlul articolului, dupa care se scriu umele autorilor, i ordiea cotributiei. Petru fiecare autor trebuie metioata afilierea, adica istitutia i care lucreaza. Urmeaza rezumatul articolului, i care se prezita, pe scurt, scopul lucrarii, rezultatele obtiute si cocluziile la care au ajus autorii. La sfarsitul rezumatului se adauga o lista de cuvite-cheie, care sut sugestive petru tema abordata si petru rezultatele obtiute. Articolul propriu-zis este costituit di urmatoarele parti: 1.Itroducere.Material si metoda 3.Rezultate 4.Discutii 5.Cocluzii 6.Bibliografie 1.Itroducerea - i acest capitol autorii prezita situatia cuoscuta i domeiul studiului, cu descoperirile importate si iformatiile relevate petru tema pe care o propu ei. Tot aici trebuie sa justifice importata cercetarii pe care o abordeaza si sa precizeze, clar, scopul lucrarii (ipoteza de lucru)..material si metoda - aici autorii trebuie sa descrie metodele de cercetare folosite, tehicile utilizate, aparatura cu care au lucrat, modul i care s-a facut selectarea participatilor, idicatorii si testele statistice folosite. 3.Rezultatele - reprezita partea i care autorii descriu lucrurile obtiute cocret i experimetele sau ivestigatiile efectuate de ei, cat mai complet si corect, fara a omite rezultatele cotrarii ipotezei de lucru. 4.Discutii - este partea i care se face iterpretarea rezultatelor si compararea lor cu rezultatelor altor cercetari sau cuostiite di domeiul abordat. 5.Cocluziile - reprezita iformatiile cele mai importate care au reiesit i urma experimetelor sau cercetarii efectuate, aratad daca au fost idetificate lucruri oi sau daca datele cofirma cercetarile aterioare. 6.Bibliografia reprzita lista tuturor materialelor utilizate petru documetarea cercetarii, a tehicilor folosite si a datelor comparative (carti, articole, pagii web etc.). 1
PRELUCRAREA STATISTICĂ A DATELOR Petru caracterizarea datelor umerice uzual se folosesc idicatorii statistici fudametali, media aritmetica si deviația stadard, precum si idicatorii de împraştiere: miim, maxim, mediaa, cuartile (percetilele). 1)Media aritmetică - este idicatorul care arată tediţa cetrală a seriei de valori şi, de obicei, reprezită valoarea î jurul căreia sut situate majoritate datelor. Se otează cu litera m sau, dacă seria de valori este otată cu o majusculă ca X sau Y, media se otează cu X sau Y. Formula este cea cuoscută: X = x1 + x +... x = m De cele mai multe ori, valorile di serie sut situate, î majoritate, î apropierea mediei, iar o mai mică parte di ele sut situate mult î stâga sau î dreapta mediei. )Deviaţia sau abaterea stadard este parametrul fudametal folosit petru caracterizarea împrăştierii uei serii de valori şi reprezită rădăcia pătrată a dispersiei. Se otează cu σ şi are formula: σ = D sauσ = ( x 1 X ) + ( x X ) +... + ( x 1 X ) Deviația stadard se exprimă cu aceeaşi uitate de măsură ca şi valorile di seria cosiderată şi este u idicator foarte fidel al împrăştierii seriei. Deviaţia stadard u are dezavatajele dispersiei, adică uitatea de măsură este aceeaşi cu a valorilor di serie şi are o valoare comparabilă cu abaterile idividuale de la medie. 3)Miimul şi maximul reprezită valorile extreme ditr-o serie de date. 4)Mediaa şi cuartilele Mediaa este valoarea ditr-o serie de valori, petru care jumătate di valorile seriei sut mai mici decât mediaa şi jumătate mai mari. Cuartila Q1 este valoarea ditr-o serie de valori, petru care u sfert di valorile seriei sut mai mici decât Q1 şi trei sferturi mai mari. Cuartila Q3 este valoarea ditr-o serie de valori, petru care trei sferturi di valorile seriei sut mai mici decât Q3 şi u sfert mai mari. Percetilele reprezită valori fata de care u aumit procet (5%, 10%, 90%, 95% etc.) di toate datele di serie sut mai mici.
Petru aplicarea corectă a aumitor teste statistice este ecesar ca datele studiate să aibă u aumit tip de distribuţie. Cele mai multe teste pri care se compara valorile medii ale rezultatelor, ecesită ca datele să fie distribuite ormal, gaussia. Verificarea distribuţiei gaussiee a valorilor ditr-o serie de date se poate efectua cu ajutorul testelor de ormalitate Aderso-Darlig, Shapiro-Wilks sau Kolmogorov-Smirov. Î cazul î care datele aalizate au o distribuţie gaussiaă, î mod curet, petru compararea valorilor medii ale datelor, se folosesc testul Studet sau testul ANOVA. Dacă datele u au o distribuţie ormală, gaussiaă, trebuie să apelăm la teste eparametrice, precum testul Ma- Whitey-Wilcoxo sau Kruskal-Wallis/Friedma. Testul t al lui Studet, de comparare a mediilor petru loturi, propue doua ipoteze statistice: -ipoteza H0 (sau ipoteza de ul): difereţa ître medii este îtâmplătoare -ipoteza H1: difereţa ître medii este semificativă statistic Rezultatul p al testului reprezită probabilitate de a face o eroare dacă se respige ipoteza H0 a testului, rezultat furizat ca u umăr ître 0 şi 1. Dacă p este mai mic decât 0.05 respigem ipoteza H0, de ul, şi admitem că este adevărată ipoteza H1. Iterpretarea valorilor lui p se face, ca la orice test statistic, astfel: -p < 0.05, difereţa ître cele două medii este semificativă (S, îcredere 95%). -p < 0.01, difereţa ître cele două medii este semificativă (S, îcredere 99%). -p < 0.001, difereţa ître cele două medii este îalt semificativă (HS, îcredere 99.9%). -p > 0.05, difereţa ître cele două medii este esemificativă (NS). Testul t al lui Studet poate fi aplicat doar petru date umerice care provi ditr-o populaţie cu distribuţie ormala, gaussiaă. Dacă această codiţie u este îdepliită, petru a compara datele celor două loturi pot fi folosite testul Wilcoxo (umăr de date egale, valori pereche) sau testul Ma-Whitey (umăr diferit de valori î cele doua loturi comparate). Rezultatele acestor teste pot fi şi ele exprimate sub forma uei probabilităţi, iterpretată la fel ca la testul Studet. 3
Testul ANOVA (Aalysis of Variace) este u procedeu de aaliză a dispersiei uei variabile umerice (eg.= variace ), sub iflueţa uei variabile care imparte datele i subloturi (variabila de grupare). Pri ANOVA se compară medii petru trei şi mai multe subpopulaţii defiite de variabila de grupare (variabila idepedetă). Metoda permite extesia aalizei realizate pri testul t Studet, aplicabil asupra a două medii, la situaţii î care variabila idepedetă (variabila de grupare) prezită trei sau mai multe categorii, verificâd astfel dacă sut difereţe semificative ître populaţiile di care s-au extras eşatioaele observate. Î aaliza variaţiei cosiderâd u sigur factor cauză se formulează următoarele ipoteze: -ipoteza ulă H0: x 1=x =...x k (toate mediile sut asemăătoare) ude x parametrul cosiderat, x - media -ipoteza alterativă H1: cel puţi valorile medii a doi parametri sut diferite ître ele Î cazul î care rezultatul testului ANOVA este semificativ statistic, putem cotiua aaliza pri testele post hoc Tuckey HSD sau Fisher LSD, petru a idetifica perechile de categorii ître care există diferețe semificative. Îtr-u mod oarecum asemăator testului t Studet se calculează, petru toate combiațiile posibile de câte categorii, valori p, al căror ivel critic este ajustat î fucție de umărul total de combiații, pragul găsit fiid, de cele mai multe ori, mai mic decât pragul obisuit, de 0,05. Iterpretarea valorilor lui p se va face ca la orice test statistic, astfel: p < 0.05, difereţa ître medii este semificativă (S, icredere 95%). p < 0.01, difereţa ître medii este semificativă (S, icredere 99%). p < 0.001, difereţa ître medii este îalt semificativă (HS, icredere 99.9%). p > 0.05, difereţa ître medii este esemificativă (NS). Testul Kruskal-Wallis este u test statistic eparametric care compară valorile datelor di trei sau mai multe grupuri. Fiid u test eparametric, deci care u ecesita distributia ormala, gaussiaa, a datelor comparate, el poate ilocui testul ANOVA cad acesta u poate fi aplicat. Daca dorim sa comparam datele distribuie e-gaussia di 3 sau mai multe serii-perechi (cu acelasi r. de valori, de obicei masuratori facute la mai multe momete de timp, pe u sigur lot) vom folsi testul Friedma. 4
Corelaţia Este u terme geeral folosit petru a defii iterdepedeţa sau legătura ditre variabilele observate î populaţii statistice. Apare ueori cu u îţeles foarte larg, acoperid orice legătură statistică fie ître variabile catitative, fie ître variabile calitative, fie ître ambele tipuri de variabile. Î ses restrâs îsă, este o măsură a gradului de legătură statistică ître variabilele catitative, sub umele de coeficiet de corelaţie. Cel mai des folosit este coeficietul de corelaţie al lui Pearso (coeficiet de corelaţie liiară), care măsoară gradul de legătură ître variabile. Coeficietul de corelaţie Petru două serii de date distribuie gaussia, coeficietul de corelaţie folosit este coeficietul lui Pearso. Deşi distribuţiile datelor u sut îtotdeaua de aşa atură ca rezultatele obţiute folosid acest coeficiet sa fie cele mai bue, totuşi am cosiderat ca este cel mai sitetic idicator al corelaţiei. Coeficietul de corelaţie r are valori cuprise ître -1 şi 1. Î cazul uui coeficiet de corelaţie pozitiv (ex. r = 0,5) avem o corelaţie directă - cele două variabile corelate variază î acelaşi ses (câd ua creşte, şi cealaltă creşte, respectiv câd ua scade, şi cealaltă scade). Î cazul uui coeficiet de corelaţie egativ (ex. r = -0,5) avem o corelaţie iversă, cele două variabile corelate variază î ses cotrar (câd ua creşte, cealaltă scade). Dacă valoarea absolută a coeficietului de corelaţie aproape de 0 corelatia liiara este aproape abseta. Nu trebuie să se cochidă eapărat că u există legătură statistică ître cele două variabile; legătura poate să existe, dar u este liiară (u poate fi descrisă de o liie dreaptă). Petru date care u au o distribuţie gaussiaa, dar care se pot ordoa, fără a avea u umăr mare de valori egale itre ele, putem folosi coeficietul Spearma, obţiut pri testul eparametric Spearma de corelaţie a ragurilor. Dreapta de regresie - petru a putea caracteriza evoluţia î timp a uui set de valori, aparţiâd uui umăr de observaţii, se poate folosi ecuaţia de regresie. 5
Ecuaţia de regresie (ecuaţia de estimare) este relaţia matematică care exprimă depedeţa ditre două sau mai multe variabile. Admiţâdu-se, fie umai ipotetic, depedeţa uei variabile de uul sau mai mulţi factori, trebuie aleasă ecuaţia de regresie care să descrie relaţia ditre variabila depedetă şi variabila idepedetă. Frecvet se foloseşte ecuaţia de regresie liiară, respectiv dreapta de regresie: y = a x +b, ude y este variabila depedetă, iar x este variabila idepedetă. Acest model presupue că variabila depedetă y este egală î medie cu o fucţie liiară de x, depizâd de parametrii ecuoscuţi a şi b. Această depedeţă liiară este u model determiist şi u reflectă exact legătura ditre x şi y. Valorile observate u se găsesc exact pe dreapta de mai sus. Dreapta trasată este îsă cea mai apropiată (statistic) de valorile observate. Estimarea parametrilor a şi b se face pri metoda celor mai mici pătrate sau î sesul celor mai mici pătrate (adică să se fie miimă suma pătratelor abaterilor ître puctele observate şi puctele corespuzătoare de pe dreapta de regresie). Parametrul a este valoarea tagetei petru ughiul format de dreapta de regresie şi orizotală, iar î ses geometric reprezită pata dreptei de regresie (slope). Pata dreptei de regresie (parametrul a) mai este deumită coeficiet de regresie. Î cazul corelaţiei directe sau pozitive ître variabila depedetă şi cea idepedetă, ia valoare pozitivă, iar î cazul corelaţiei iverse sau egative (variaţiile sut de ses cotrar), are valoare egativă. Parametrul b (itercept) este valoarea lui y câd x este egal cu 0 şi reprezită puctul de itersecţie cu abcisa. Relatii itre date impartite i categorii (date ordiale sau omiale) Î cazul parametrilor care u sut reprezetaţi pri date umerice, cotiue sau discrete, u putem calcula coeficieţii de corelaţie tradiţioali, eumeraţi aterior. Î cazul datelor ordiale sau omiale trebuie să apelăm la teste care aalizează tabelele de icideţă (cotigeţă) geerate pri aplicarea îcrucişata ( cross tabulatio ) a uor perechi de factori, petru a idetifica legăturile ditre categoriile acelor variabile. Testul Chi pătrat este u test statistic ce arata daca exista vreo legatura (iflueta reciproca) itre doi factori. El este folosit petru a iterpreta tabelele de icideţă geerate pri aplicarea îcrucişata ( cross tabulatio ) a perechilor de factori urmăriţi i cadrul studiului. 6
La testul Chi patrat de testare a depedetei ( χ ) se calculeaza rezultatul testului petru datele di tabelele de icideta, rezultat care se compara cu o valoarea prag care idica o depedeta semificativa (prag de 95% sau 99%) sau o depedeta ialt semificativa (prag de 99.9%) itre cei doi factori de clasificare. Valoarea lui χ se calculeaza pri formula: ( Oi Ei ) χ =, E i= 1 ude O - frecveta observata, E - frecveta teoretica Ipotezele testate sut: H 0 (ipoteza ula) cei doi factori sut idepedeti; H a (ipoteza alterativa) exista o asociere (depedeta) itre cei doi factori. Am folosit următoarea iterpretare a valorilor lui p, furizate direct de programul cu care se realizează prelucrarea statistica a datelor, pri aplicarea testului de mai sus: p < 0.05, rezultat semificativ (S, îcredere 95% că exista o asociere itre factori); p < 0.01, rezultat semificativ (S, îcredere 99% că exista o asociere itre factori); p < 0.001, rezultat îalt semificativ (HS, îcredere 99,9% că exista o asociere itre factori); p > 0.05, rezultat esemificativ (NS, îcrederea de a cosidera ca exista o depedeta itre factorii studiati este mai mica de 95%, deci eroarea de a respige ipoteza ca factorii sut idepedeti este mai mare de 5%, prag cosiderat prea mare). i 7