CAPITOLUL 1

Documente similare
STRUCTURA UNUI ARTICOL STIINTIFIC Un articol stiintific incepe cu titlul articolului, dupa care se scriu numele autorilor, in ordinea contributiei. Pe

Limite de funcţii reale

Matematici aplicate științelor biologie Lab10 MV

Microsoft Word - _Curs II_2_Mar17_2016out.doc

Calcul Numeric

1. Se masoara forta de presiune X (Kg/cm 3 ), la care un anumit material cedeaza. Se presupune ca X urmeaza o lege normala. Pentru 10 masuratori se ob

ETTI-AN1, , C. Ghiu Notițe de Adrian Manea Seminar 4 Serii Fourier și recapitulare 1 Serii Fourier Pentru dezvoltarea în serie Fourier (care

Ce este decibelul si Caracteristica BODE

Pagina 1 din 5 Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare Etapa județeană/a sectoarelor municipiului București a olimpia

Microsoft Word - 3 Transformata z.doc

Microsoft Word - subiecte

Preţ bază

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Dependenţă funcţională n Cursul 9 Fie funcţiile f : A R R, i 1, m. A mulțime nevidă. i Definiţia 1. Spunem că funcţia g: A R depinde de funcţiile f1,

Microsoft Word - LogaritmiBac2009.doc

Microsoft Word - SUBIECTE FAZA LOCALA FEBRUARIE 2007

Microsoft Word - LogaritmiBac2009.doc

Realizarea fizică a dispozitivelor optoeletronice

Universitatea Politehnica din Bucureşti Facultatea de Electronică, TelecomunicaŃii şi Tehnologia InformaŃiei Tehnici Avansate de Prelucrarea şi Analiz

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

CURS 8

SIMULARE EXAMEN DE BACALAUREAT LA MATEMATICA Toate subiectele (I, II, III) sunt obligatorii. Se acordă 10 puncte din oficiu. Timpul efectiv

Concursul Interjudeţean de Matematică Cristian S. Calude Galaţi, 26 noiembrie 2005 Inspectoratul Şcolar al Judeţului Galaţi, Societatea de Ştiinţe Mat

Calcul Numeric

Microsoft Word - pag_006.doc

Probleme rezolvate 1) Să se calculeze limitele următoarelor şiruri: 1 a) x n n = ( n+ 1)( n+ 2 )...( n+ n), n 2 n ( 1) 1 n n b) 2 3 n 5 n... ( 2

Microsoft Word - anmatcap1_3.doc

Programa olimpiadei de matematică

Slide 1

Programare Delphi Laborator 2 a. Serii. Elaboraţi câte un program pentru sumarea primilor 100 de termeni ai seriilor următoare şi verificaţi numeric e

Algebra: 1. Numere naturale. Operatii cu numere naturale. Ordinea operatiilor. Puteri si reguli de calcul cu puteri. Compararea puterilor. Multimea nu

Microsoft Word - MD.05.

Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare Etapa Națională a Olimpiadei de FIZICĂ 3-7 Mai 2019, Târgoviște Barem de eval

Modelarea si Simularea Sistemelor de Calcul

Microsoft Word - Documentatie_Finala_versiunea_IT

HNT_vol_Vorbire_v_7_hhh.PDF

PROGRAMA CONCURSULUI NAŢIONAL

Matematici aplicate științelor biologie Lab06 MV

COMUNA MIRCEA VODA MIRCEA VODA CONSTANTA SITUATIE PRIVIND MONITORIZAREA CHELTUIELILOR DE PERSONAL + PE LUNA...lULlE...ANUL CAP. 51 ADMINISTR

OPERATII DE PRELUCRAREA IMAGINILOR 1

Nr. 1 Septembrie/Octombrie pagini De la Ferme Adunate Proiecte: Programul Contract Grower Cum poţi deveni investitor cu

Soluţiile problemelor propuse în nr. 1 / 2006 Clasele primare P.104. Suma dintre predecesorul unui număr şi succesorul numărului următor lui este 29.

Microsoft Word - TIC5

Matematici aplicate științelor biologie Lab05 MV

OLIMPIADA DE MATEMATICĂ ETAPA LOCALĂ CLASA A V-A SOLUŢII ŞI BAREME ORIENTATIVE DE CORECTARE Subiectul I a) Calculaţi: 13 :

C10: Teoria clasică a împrăștierii Considerăm un potențial infinit în interiorul unui domeniu sferic de rază a și o particulă incidentă (Figura 1) la

ALGORITMICĂ. Seminar 3: Analiza eficienţei algoritmilor - estimarea timpului de execuţie şi notaţii asimptotice. Problema 1 (L) Să se determine număru

FIŞA NR

E_c_matematica_M_mate-info_2019_var_06_LRO

1

ALGORITMII ŞI REPREZENTAREA LOR Noţiunea de algoritm Noţiunea de algoritm este foarte veche. Ea a fost introdusă în secolele VIII-IX de către Abu Ja f

1 2 1

Slide 1

PowerPoint Presentation

Laborator 6 - Statistică inferenţială I. Inferenţă asupra mediei - Testul Z pentru media unei populaţii cu dispersia cunoscută Se consideră o populaţi

DAN LASCU ADRIANA-LIGIA SPORIŞ ANDA OLTEANU PAUL VASILIU MATEMATICĂ. CULEGERE DE PROBLEME TIP GRILĂ PENTRU ADMITEREA ÎN ACADEMIA NAVALĂ MIRCEA CEL BĂT

Microsoft Word - Programa finala olimpiadei matematica 2007 gimnaziu.doc

rrs_12_2012.indd

Examenul de bacalaureat 2012

Noțiuni matematice de bază

Logică și structuri discrete Logică propozițională Marius Minea marius/curs/lsd/ 3 noiembrie 2014

MINISTERUL NVźÅMÂNTULUI Program TEMPUS JEP 3801 SCIENCES DE L'EAU ET ENVIRONNEMENT Daniel SCRÅDEANU MODELE GEOSTATISTICE N HIDROLOGIE VOL. I Serie co

{ 3x + 3, x < 1 Exemple. 1) Fie f : R R, f(x) = 2x + 4, x 1. Funcţia f este derivabilă pe R\{1} (compunere de funcţii elementare), deci rămâne să stud

CAPITOLUL 1

I

Microsoft Word - Matematika_kozep_irasbeli_javitasi_0911_roman.doc

EVALUAREA AFACERILOR ÎN SCOPUL FUNDAMENTĂRII DECIZIEI DE FUZIUNE SAU ACHIZIŢIE: ASPECTE METODOLOGICO-PRACTICE

Cursul 12 (plan de curs) Integrale prime 1 Sisteme diferenţiale autonome. Spaţiul fazelor. Fie Ω R n o mulţime deschisă şi f : Ω R n R n o funcţie de

Curs 8 Variabile aleatoare continue 8.1 Funcţia caracteristică Definiţia Fie X o v. a. cu densitatea de probabilitate f. Funcţia ϕ X (t) = M [ e

CURBE BÉZIER În CAGD se utilizează adesea curbele polinomiale, adică acele curbe definite de o parametrizare polinomială: C : [a, b] R 3 C(t) = (x(t),

E_d_Informatica_sp_SN_2014_bar_10_LRO

Matematika román nyelven középszint Javítási-értékelési útmutató 1813 ÉRETTSÉGI VIZSGA május 7. MATEMATIKA ROMÁN NYELVEN KÖZÉPSZINTŰ ÍRÁSBELI VI

carteInvataturaEd_2.0_lectia5.pdf

Laborator 8- Statistica Descriptiva Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 22.nov

Şcoala ………

Laborator 3 - Simulare. Metode de tip Monte Carlo. I. Estimarea ariilor şi a volumelor RStudio. Nu uitaţi să va setaţi directorul de lucru: Session Se

MINISTERUL FINANTELOR PUBLICE Agenţia Naţională de Administrare Fiscală Directia Generală a Finantelor UL;. -+D Fax ;j: Publice a

GHERCĂ MAGDA CASA CORPULUI DIDACTIC BRĂILA PORTOFOLIU EVALUARE INFORMATICĂ ȘI TIC PENTRU GIMNAZIU CLASA A V-A Neamț SERIA 1 GRUPA 1 CURSANT: GHERCĂ G

Microsoft Word - Algoritmi genetici.docx

Procesarea Imaginilor Laborator 3: Histograma nivelurilor de intensitate 1 3. Histograma nivelurilor de intensitate 3.1. Introducere În această lucrar

Gheorghe IUREA Adrian ZANOSCHI algebră geometrie clasa a VII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA 45 Matematică. Clasa a VII-

Prelegerea 4 În această prelegere vom învăţa despre: Algebre booleene; Funcţii booleene; Mintermi şi cuburi n - dimensionale. 4.1 Definirea algebrelor

PowerPoint Presentation

D.Rusu, Teoria măsurii şi integrala Lebesgue 6 MĂSURA LEBESGUE Cursul 5 Teorema 6.26 Există submulţimi ale lui R care nu sunt măsurabile Lebesgue. Dem

Modelarea deciziei financiare şi monetare

Microsoft Word - Tema 06 - Convertoare analog-numerice.doc

Laborator 7- Distributii de probabilitate clasice Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 15.nov

UNIVERSITATEA BABEŞ-BOLYAI CLUJ-NAPOCA FACULTATEA DE MATEMATICĂ ŞI INFORMATICĂ Concurs MATE-INFO UBB 6 aprilie 2019 Proba scrisă la MATEMATICĂ NOTĂ IM

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea de Vest din Timișoara 1.2 Facultatea Matematică și Informa

OLM_2009_barem.pdf

Microsoft PowerPoint - curs5-DPT-2010V97 [Compatibility Mode]

Introducere în statistică

RecMat dvi

DETERMINAREA CONSTANTEI RYDBERG

Universitatea Lucian Blaga Sibiu Facultatea de inginerie-Departamentul de calculatoare şi Inginerie Electrică Titular curs: Şef lucrări dr.mat. Po

METODE NUMERICE ÎN INGINERIE

Dorel LUCHIAN Gabriel POPA Adrian ZANOSCHI Gheorghe IUREA algebră geometrie clasa a VIII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA

Pachete de lecţii disponibile pentru platforma AeL

Laborator 9- Estimarea parametrilor Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 29.nov

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

Transcriere:

3. CARACTERISTICI STATISTICE ALE UNEI SERII DE DATE 3.. INTRODUCERE Statistica matematică, mai precis metodele furizate de aceasta s-au implemetat puteric î metodologia de lucru a diferite domeii. Apelul la metodele specifice statisticii matematice s-a făcut î pricipal di două motive: eisteţa variabilităţii aturale a feomeelor, proceselor, caracteristicilor etc. aflate sub observaţie; ecesitatea luării uor decizii asupra acestor feomee, procese, caracteristici etc. Statistica matematică, sitetizâd o iformaţie, de cele mai multe ori parţială, asupra procesului ivestigat, poate furiza, cu riscuri cotrolate de operator, baza metodologică petru adoptarea aumitor decizii, chiar î codiţii specificate de icertitudie. Î acest scop, statistica şi-a dezvoltat direcţiile pricipale: pricipii, modele şi metode. La baza statisticii eistă două cocepte de bază: populaţia şi eşatioul. Populaţia statistică este obiectul de studiu şi poate fi reprezetat de mulţimea produselor ce pot rezulta ditr-u proces tehologic, de mulţimea valorilor pe care le poate lua o caracteristică de calitate a uui produs etc. Stadardele defiesc populaţia statistică drept o mulţime de obiecte sau feomee, calitativ omogee. Eşatioul reprezită acea parte a populaţiei asupra căreia eperimetatorul aplică metode statistice propriu-zise, petru a obţie cocluzii pe care le etrapolează asupra îtregii populaţii. Această operaţie de etrapolare se umeşte ifereţă statistică. Ifereţa statistică este acea ramură a metodelor ştiiţifice de ivestigare a uei populaţii, care cu margii specificate de icertitudie eprimată î termei probabilişti, face trecerea de la observaţii la cocluzii privid populaţia, [].

Ifereţa are două limite: iformaţia pe care se bazează decizia este de atură aleatoare, fiid costituită di observaţii supuse îtâmplării; se recuoaşte eplicit esiguraţa cocluziilor. Î cazurile practice, populaţiile luate î studiu u se pot ivestiga itegral, ci doar pri itermediul uuia sau mai multor eşatioae, ceea ce implică apariţia uor riscuri î luarea deciziei fiale asupra procesului ivestigat. Petru a putea aplica aumite metode catitative de etragere a iformaţiei dorite, este ecesar ca populaţia statistică aalizată să poată fi reprezetată matematic îtr-u mod coveabil, adică trebuie să se poată găsi u model statistic al populaţiei studiate, care să îcorporeze cât mai realist caracteristicile eseţiale ale populaţiei şi care să u fie prea complicat la maevrarea aalitică. Soluţia acestei probleme o costituie coceptul de variabilă aleatoare a cărei valoare se atribuie î fucţie de diferite circumstaţe sau eveimete ce se produc îtru eperimet. E.: timpul de buă fucţioare a uui produs, duritatea uor orgae de maşii, rezisteţa la rupere a uor epruvete, o aumită cotă reprezetativă a uei piese etc. Această variabilă aleatoare caracterizează de fapt populaţia respectivă. Comportarea variabilei aleatoare este descrisă, di puct de vedere matematic, de fucţia de repartiţie asociată. Fucţia de repartiţie are o epresie specifică depizâd de tipul variabilei aleatoare: discretă (umărul de impulsuri/uitatea de timp) sau cotiuă (cota uei piese). Repartiţia de probabilitate a uei variabile aleatoare discrete se eprimă, de regulă, sub forma uui tablou, î care prima liie coţie toate valorile posibile, iar a doua liie coţie probabilităţile cu care ia aceste valori: X p p p, (3.) cu codiţia p i [,] şi p i i, p i fiid probabilitatea ca X să ia valoarea i. Se adoptă otaţia: p i = P(X = i ). De obicei variabilele aleatoare discrete se asociază eperimetelor ce costau di umărare. Spre deosebire de variabilele discrete, cele cotiue pot lua orice valori îtr-u aumit iterval. Î coseciţă, u se vor mai asocia probabilităţi puctuale ca î cazul aterior, ci se va defii o fucţie pozitivă, f(), umită desitate de probabilitate, astfel îcât aria domeiului cupris ître graficul ei şi aa este egală cu. Probabilitatea ca variabila aleatoare să ia valori îtr-u iterval (;

+h +h) este f()d este probabilitatea ca variabila cosiderată să ia valori î itervalul (; +d) al dreptei reale (fig. 3.). Î timpul uui proces de măsurare pot itervei trei tipuri de erori: - erori aberate; - erori sistematice; - erori aleatoare. Erorile aberate apar ca urmare a îcălcării pricipiilor geerale de măsurare sau ca rezultat al eateţiei eperimetatorului. Rezultatele afectate de erori aberate diferă eseţial de restul valorilor şi î coseciţă se pot elimia. Erorile sistematice sut determiate de diferiţi factori, cum ar fi: reglarea ecorespuzătoare a mijlocului de măsurare, variaţia codiţiilor de mediu (temperatură, presiue, umiditate etc.). Erorile sistematice pot fi depistate şi îlăturate pe baza uor calcule ce pleacă de la pricipiile fizice ce stau la baza măsurării respective. Erorile aleatoare apar datorită uei mulţimi de factori, a căror iflueţă idividuală este eglijabilă şi u eistă posibilitatea îlăturării acestor iflueţe. Studiul iflueţelor erorilor aleatoare se bazează pe cuoaşterea legilor de repartiţie a acestor erori. Dacă o măsurare se repetă de ori, iar rezultatele se împart î clase (itervale) de lăţime, se poate calcula frecveţa relativă cu care rezultatele apar î fiecare clasă: i fi, (3.) ude i este umărul de rezultate aflat î clasa i. Reprezetarea grafică a frecveţei relative este o histogramă (Fig. 3.), care petru şi devie o fucţie cotiuă, umită fucţie desitate de repartiţie sau desitate de probabilitate, deoarece pri itegrarea ei pe u iterval se obţie probabilitatea cu care variabila ia valori î acest iterval. 3

y f = i i y f = i i A = i i A f d Fig. 3. Histograma şi desitatea de repartiţie Î mod atural se impue codiţia: f d, (3.3) atuci câd ia valori pe toată dreapta reală, adică probabilitatea ca variabila să ia valori reale este. Relativ la o variabilă aleatoare prezită iteres probabilităţile uor eveimete de tipul (X I) - se citeşte eveimetul X ia valori î itervalul I. Petru a calcula aceste probabilităţi, otate P(XI) este suficiet să cuoaştem fucţia de reparţiţie a variabilei aleatoare. Fucţia care asociază oricărui umăr real a, probabilitatea ca să ia valori mai mici sau egale cu a se umeşte fucţie de repartiţie a lui X: F a P a, (3.4) Legătura ditre desitate şi repartiţie este dată de relaţia: f () F. (3.5) Fucţia de repartiţie are următoarele proprietăţi, [7, 8, ]: valorile fucţiei de repartiţie F() aparţi itervalului [, ], coform (3.3); petru două umere reale şi, cu <, fucţia de repartiţie este edescrescătoare, adică F F ; Dacă desitatea este o fucţie cotiuă atuci: P P P P. (3.6) Dacă variabila aleatoare este discretă fucţia ei de repartiţie are epresia: 4

5 p p p p p p F 3. (3.7) Pe baza proprietăţilor fucţiei de repartiţie se deduc relaţiile:,, F P F F P (3.8) relaţii utile î practica idustrială: probabilitatea ca o variabilă să ia valori ître două limite date, probabilitatea ca o variabilă să fie mai mare decât o valoare dată sau îtr-o iterpretare şi mai particulară, câd variabila reprezită umărul de ore de buă fucţioare a uui dispozitiv, aparat atuci P( ) este probabilitatea ca acel dispozitiv, aparat să fucţioeze miimum ore. Î figura 3. sut prezetate fucţia desitate de probabilitate şi fucţia de repartiţie, fiid marcate ariile ce reprezită probabilitatea ca: variabila ia valori mai mici decât a; variabila ia valori mai mari decât b; variabila ia valori cuprise î itervalul [a, b].

6 Fig. 3. Fucţia desitate de repartiţie şi fucţia de probabilitate Probabilităţile reprezită u cocept eseţial î îţelegerea aalizei statistice, motiv petru care trebuie bie îţelese. Pricipalele aspecte ce vor fi subliiate se referă la: atribuirea probabilităţilor şi reguli ale acestora. Probabilitatea este o măsură umerică ce cuatifică şasa uui eveimet de a se produce îtr-u eperimet. Se măsoară pe o scală de la la, corespuzâd eveimetului imposibil, iar eveimetului sigur, adică eveimetul ce s-ar produce ori de câte ori s-ar repeta eperimetul î aceleaşi codiţii. Î plus, suma probabilităţilor tuturor eveimetelor posibile trebuie să fie egală cu ( P i ), î cazul câd eperimetul are u umăr fiit de eveimete ce se eclud reciproc. Eistă două modalităţi de atribuire a probabilităţilor uor eveimete, î fucţie de situaţie: metoda frecveţelor relative; metoda subiectivă. Metoda frecveţelor relative se bazează pe raţioamete, deoarece cu ajutorul logicii se pot determia probabilităţile de apariţie ale uor eveimete. Îtr-u eperimet cu u umăr fiit de realizări mutual eclusive şi echiprobabile, probabilitatea uui eveimet este umărul cazurilor favorabile/umărul cazurilor posibile. De e.: câd se dă cu baul, eistă două situaţii posibile, cap sau stemă, eveimete ce sut echiprobabile (au aceeaşi şasă de apariţie), de aceea P cap= P stemă= ½ =.5; sau se bazează pe efectuarea uor observaţii (evideţe empirice), situaţie câd:

7 P i N (3.9) ude i este umărul de eveimete favorabile, iar N umărul total de eveimete. E.: dacă se îregistrează umărul de ore de fucţioare a uui bec şi se costată că di de becuri testate, au fucţioat mai puţi de 5 ore, atuci probabilitatea ca u bec ales aleator să aibă o durată de viaţă mai mică de 5 h este: P,. Această metodă u poate fi aplicată î orice situaţie, iar petru eveimete viitoare se utilizează metoda subiectivă, coform căreia se atribuie probabilităţi pe baza propriilor cosiderete. Evidet, î acest caz diferite persoae vor atribui probabilităţi diferite uui acelaşi eveimet (probabilitatea de câştigare a uui cocurs). Eistă umeroase situaţii câd trebuie determiată probabilitatea uor eveimete legate. De eemplu, petru două eveimete, A şi B, e iteresează dacă se vor produce ambele sau dacă va avea loc uul ditre ele. Petru a putea răspude la acest tip de îtrebare trebuie itroduse două reguli fudametale ale probabilităţilor: regula de aduare a probabilităţilor; regula de îmulţire a probabilităţilor. Regula de aduare se aplică î situaţia câd eistă două eveimete şi se doreşte determiarea probabilităţii de apariţie a cel puţi uuia di cele două eveimete. Eistă două variate ale aduării, î fucţie de tipul eveimetelor; dacă ele se eclud reciproc sau u. Două eveimete se eclud reciproc, dacă u se pot produce simulta (cap sau stemă petru o sigură moedă). Dacă eveimetele se eclud reciproc, probabilitatea de apariţie a cel puţi uui eveimet di cele două este: P A B PA PB (3.) Dacă eveimetele u se eclud reciproc, atuci A sau B îseamă se produce A, se produce B sau se produc ambele. Î acest caz, di suma aterioară trebuie scăzută probabilitatea de producere simultaă, petru a evita îsumarea ei dublă (vezi fig. 3. 3): P A B PA PB PA B. (3.)

Eveimetul A A B Eveimetul(A ^B ^C) Eveimetul(A B) ^ C Eveimetul B P A B Fig. 3.3 Eveimetul Fig. 3.4 Eveimetul PA B C Această regulă poate fi geeralizată petru u umăr de mai multe eveimete. De eemplu, petru trei eveimete, ce se eclud reciproc, se obţie: 8 P A B C PA PB PC, (3.) iar petru eveimete ce u se eclud reciproc: P A B C PA PB PC PA B PB C PAC PA B C (3.3) Relaţia ître eveimetele implicate î (3.3) este ilustrată î fig. 3.4, ude se observă că zoa haşurată este aduată de trei ori (î P(A), P(B) şi P(C)), apoi scăzută de trei ori (î P(A B), P(B C) şi P(A C)), deci trebuie iclusă di ou la sfârşit. Regula de îmulţire se foloseşte la găsirea probabilităţii de producere simultaă a două sau mai multe eveimete (P(A B), P(A B C) etc.). Răspusul la astfel de probleme depide de tipul eveimetelor, dacă sut idepedete sau u. Două eveimete sut depedete câd apariţia uui eveimet iflueţează probabilitatea de apariţie a celuilalt. Regula de îmulţire se aplică diferit, î fucţie de tipul eveimetelor: petru eveimete depedete: P A B PA PB A, (3.4) ude P(BA) reprezită probabilitatea de producere a eveimetului B, ştiid că A s-a produs: A P A B PB A. (3.5) P

petru eveimete idepedete: P A B PA PB. (3.6) Epresia P(BA) reprezită o probabilitate codiţioată, adică probabilitatea ca B să fie afectat de apariţia lui A. Evidet, î cazul a două eveimete idepedete P(BA) = P(B). O etidere a acestei idei î cotetul mai multor eveimete secveţiale este cuoscută sub umele de regula lui Bayes. Î cazul a două eveimete formula are forma (3.5). Petru eveimete mutual eclusive B, B, B, câd A a apărut: P Bi A P PBi PA Bi B PA B PB PA B... PB PA B (3.7) 3.. STATISTICA DESCRIPTIVĂ Statistica descriptivă se ocupă, î pricipal, cu două probleme: prezetarea datelor sub formă tabelară şi vizualizarea lor sau a uor caracteristici pri tehici grafice; utilizarea uor idicatori umerici petru caracterizarea datelor. Petru a putea orgaiza u volum mare de date şi a le prezeta sub formă grafică sau tabelară este ecesar să se detecteze evetualele tediţe de distribuire a lor pe aa reală pri itermediul uor mijloace de aaliză. Cele mai utilizate metode grafice de reprezetare sut: tabele de distribuţie de frecveţe, pie-chart-uri, histograme, poligoae de frecveţă, curbe de frecveţă cumulată etc 3... ORGANIZAREA DATELOR Petru a putea reprezeta tabelele de frecveţă este ecesar ca datele să fie grupate î câteva clase sau itervale semificative (ici prea multe, ici prea puţie) şi să se cotorizeze umărul de valori di fiecare clasă, iar apoi să se calculeze frecveţele relative, adică umărul datelor di fiecare clasă raportat la umărul total. Î geeral, se recomadă ca umărul claselor să fie ître 5 5 (î fucţie de mărimea eşatioului avut la dispoziţie) şi cel mai adesea mărimea claselor este egală. De asemeea, trebuie ca fiecare valoare eistetă î şir să fie itrodusă o sigură dată (se stabileşte o coveţie petru 9

limitele itervalelor). Î tabelul 3. se prezită u set de date eperimetale orgaizat cu ajutorul tabelului de frecveţă. Date Date ordoate Tabelul.. Tabel de frecveţă.84.87.775.86.77.8.86.86.89.84.85.8.83.8.8.86.85.865.8.854.847.844.796.858.797.843.839.77.775.796.797.8.8.8.8.83.84.85.86.86.8.84.86.87.89.839.843.844.847.85.854.858.86.865 Clase Frecveţa absolută Frecveţa relativă [%].77.7867 7.4.7867 -.83 4 4.8.83 -.88 7 5.9.88 -.8337 5 8.5.8337 -.8493 4 4.8.8493 -.865 5 8.5 După costruirea tabelului de frecveţă, î geeral, pasul următor îl costituie reprezetarea sub o aumită formă grafică. U pie-chart este o reprezetare grafică sub forma uui cerc, ude frecveţele relative sut utilizate petru divizarea cercului î sectoare de cerc corespuzătoare fiecărei categorii de variabile. Acest tip de reprezetare se pretează î cazul câd datele sut grupate pe diverse categorii. E.: Totalul studeţilor di Facultatea de Mecaică clasificat î studeţi itegralişti, studeţi ce au acumulat îter 5 6 credite, 4 5 credite, mai puţi de 4 credite. Cel mai utilizat mod de reprezetare îl costituie histogramele. Î fig. 3.5 se prezită histograma aferetă datelor di tabelul 3.. Î cazul câd itervalele u sut echidistate trebuie ajustată îălţimea dreptughiurilor astfel îcât aria fiecărui dreptughi să fie proporţioală cu frecveţa corespuzătoare. Fucţiile di Matlab asociate cu histograma sut: N=hist() returează u vector liie, ce coţie umărul de date di vectorul, aflate î itervale echidistate;

N=hist(,m) returează u vector liie, ce coţie umărul de date di vectorul, aflate î m itervale echidistate; N=histc(,limite) cotorizează valorile lui aflate ître elemetele vectorului limite, ce trebuie sa fie u vector mooto crescător. N va avea dimesiuea cu o uitate mai mică decât vectorul limite, iar N(k) va umăra valorile (i) dacă limite(k)<=(i)<limite(k+). Ultimul iterval va cotabiliza şi valorile egale cu limita superioară; hist() trasează histograma utilizâd itervale sau clase; hist(,m) - trasează histograma utilizâd m clase. Fig. 3.5. Histograma datelor Fig. 3.6. Poligoul de frecveţe Poligoaele de frecveţă se utilizează mai ales î cazul câd se doreşte compararea a două distribuţii î aceeaşi reprezetare grafică. Ele se obţi pri reprezetarea frecveţelor î dreptul mijlocului fiecărei clase şi uirea acestor pucte pri liii drepte. Î plus, la etremităţi, primul, respectiv ultimul puct corespude valorii miime, respectiv maime di şirul de date. Î fig. 3.6. este prezetat poligoul de frecveţe al datelor cuprise î tabelul 3.. O altă variată de reprezetare este curba frecveţelor cumulate, ce permite aflarea răspusului la îtrebări de tipul: câte observaţii sut egale sau mai mici decât limita superioară a fiecărei clase, respectiv câte sut mai mari sau egale cu limita iferioară a fiecărei clase. După cum idică şi umele, curba frecveţelor cumulate se obţie pri reprezetarea frecveţelor cumulate ale claselor. Cumularea se poate face de la valoarea miimă spre maimă sau ivers. Î primul caz se obţie o curbă ascedetă, ce oferă iformaţii privid

umărul de observaţii mai mic cel mult egal cu limita superioară a fiecărei clase, iar î cazul al doilea, se obţie o curbă descedetă, pe baza căreia se pote determia umărul de observaţii mai mare cel mult egal cu limita iferioară a fiecărui iterval. Î fig. 3.7 se prezită curba frecveţelor cumulate corespuzătoare datelor prezetate î tabelul 3.. Fig. 3.7. Curba frecveţelor îsumate 3... INDICATORI NUMERICI DE CARACTERIZARE A DATELOR Eistă două caracteristici eseţiale ce se ivestighează î cazul seturilor de date: cetrarea sau localizarea; cocetrarea sau împrăştierea. Fie o serie de date X:,, obţiută î urma uui proces de măsurare. Tediţa cetrală a seriei poate fi caracterizată pri: medie, mediaă, modul. Cel mai utilizat idicator de cetrare este media. Media uei serii de date este media aritmetică a valorilor sale:. (3.8) i i Media reprezită cetrul de greutate al seriei de date. Î Matlab, media seriei

de date, stocate î vectorul, se calculează cu fucţia mea(). Mediaa este valoarea cetrală a uui set de date ordoate crescător. Ea se calculează cu formula: me me, k,. (3.9) k Prima formulă se aplică petru u umăr impar de elemete ale seriei de date, iar a doua câd volumul seriei este uj umăr par. Mediaa caracterizează mai bie valoarea cetrală uui serii de date î situaţia câd setul de date este asimetric, respectiv apare o cocetrare de date la ua di etremităţile seriei. Î Matlab mediaa seriei de date stocate î vectorul se calculează cu fucţia media(). Modulul este observaţia cu cea mai mare frecveţă de apariţie. Eistă seturi de date cu u sigur modul (uimodale) sau cu mai multe (multimodale). Modulul se calculează cu formula: mo 3. (3.) me Î cazul uor seturi de date simetrice, media, mediaa şi modulul coicid. La repartiţiile asimetrice se poate îtâli cazul me sau (fig. 3. 8). Petru caracterizarea variabilităţii datelor se utilizează o serie de idicatori de cocetrare sau împrăştiere. Pritre cei mai uzuali se umără: itervalul de variaţie, deviaţia stadard, variaţa, coeficietul de variaţie etc. mo mo me Fig. 3.8 Repartiţii asimetrice Itervalul de variaţie este difereţa ditre valoarea maimă şi miimă a seriei 3

de date. Deoarece acesta se bazează doar pe două valori aparţiătoare seriei de date, î multe situaţii se apelează la p-cvatile. P-cvatila (p (,)) seriei de date este u umăr real, q p, cu proprietatea că p% valori ale seriei sut mai mici sau egale decât q p, iar ( p)% valori sut mai mari sau egale decât q p. Numărul q p poate să aparţiă seriei sau u. Petru determiarea p-cvatilei uei serii de date se procedează î felul următor [4]: se ordoează crescător setul de date X :,, ; se calculează partea îtreagă a umărului *p +.5, care se otează i; p-cvatila este: q i i i, (3.) p p.5 ude {p +.5} este partea fracţioară a umărului p +.5. Î cazul câd p =.5, q.5 este chiar mediaa seriei de date, deoarece i = [.5+.5] = [ (+)/ ], care petru egal cu u umăr impar este (+)/, deci.5-cvatila este elemetul şirului ordoat (+)/, iar î cazul câd este u umăr par,.5-cvatila devie, deci se obţi chiar epresiile mediaei. Î cazul uor seturi de date de volum mai mare se utilizează procetilele. Procetila p, p (,), este valoarea reală, cu proprietatea că cel mult p% di valoriile seriei de date sut mai mici decât şi cel mult ( p)% sut mai mari. Dacă p(+) este o valoare îtreagă, procetila p este valoarea de rag p(+) di seria ordoată, iar î cazul câd p(+) u este umăr îtreg, procetila seriei este valoarea reală obţiută pri iterpolare di valoriile poziţiilor adiacete [4]. Î Matlab, eistă fucţia prctile(,p) ce calculează procetila serie de date, iar p (,). Petru seria de date prezetată î tabelul., procetila.3 este.86, iar procetila.5, adică mediaa, este.8. Pritre cei mai uzuali idicatori de cocetrare sau împrăştiere a valorilor seriei de date î jurul mediei se umără dispersia sau variaţa uei serii de date. Avâd o serie de date :,,... cu media, dispersia este: 4

S i i Petru o serie statistică: Y k k. (3.) k j j N (3.3) i idică de câte ori apare i î seria de date, este media seriei, dispersia este: S k Y N j j j. (3.4) Î Matlab, variaţa uei serii de date se poate calcula cu fucţiile var(), ce calculează dispersia seriei de date cu formula (3.), respectiv var(,) ce aplică formula: S i i Avâd o serie de date cu dispersia S (), valoarea. (3.5) S S se umeşte abatere stadard sau abatere medie pătratică a seriei. Î Matlab, abaterea stadard se calculează cu fucţiile std(), respectiv std(,). U idicator al cocetrării relative este coeficietul de variaţie. Avâd o serie de date, cu media şi abaterea stadard S, acesta are epresia: S CV ( ). (3.6) Cu cât coeficietul de variaţie este mai apropiat de, seria este mai omogeă şi media mai reprezetativă. Dacă valoarea coeficietului de variaţie tide spre, împrăştierea seriei este mare şi media este mai puţi reprezetativă. Ultimii idicatori meţioaţi sut coeficietul de asimetrie ( ) şi coeficietul de eces ( ): 5

m S m S 3, 3 4 4, (3.7) ude m 3 şi m 4 sut mometele cetrate de ordiul 3, respectiv 4. Mometul cetrat de ordiul k se calculează cu formula: m k i i k. (3.8) Asimetria şi ecesul ajută la idetificarea formei de repartiţie a datelor eperimetale. Etaloul la această comparaţie este repartiţia ormală, petru care = şi = 3. Ecesul mai poartă deumirea de kurtosis. Î fucţie de valoarea coeficietului de eces (pozitiv, egativ sau ul) se pot trage cocluzii asupra alurii curbei desităţii de repartiţie (Fig. 3.9). 6 Fig. 3.9 Variaţia formei de repartiţie faţă de coeficietul de eces Dacă =, repartiţia se umeşte mezokurtică, avâd o formă apropiată de repartiţia ormală. Dacă >, repartiţia este leptokurtică, fiid mai ascuţită decât cea ormală, iar dacă <, repartiţia este platokurtică, fiid mai aplatizată. Coeficietul de asimetrie caracterizează simetria repartiţiei. Repartiţiile simetrice au =. Î cazul >, repartiţia este pozitiv asimetrică, iar î cazul <, repartiţia este egativ asimetrică. Î Matlab, mometul cetrat de ordiul k al seriei de date stocate î vectorul

se calculează cu fucţia momet(,k), coeficietul de asimetrie se determiă cu fucţia skewess(), iar coeficietul de eces cu kurtosis(). 3..3. METODE DE AFIŞARE SAU REPREZENTARE GRAFICĂ ÎN ANALIZA PRIMARĂ A DATELOR O metodă de afişare şi aaliză primară a datelor este diagrama tulpiă fruze (stem ad leaf). Ea se pretează la serii mici de date ce au acelaşi ordi de mărime. A fost itrodusă de Tukey î 977 ca o metodă de afişare a datelor îtr-o listă structurată. Î cazul uui set de date ce coţie valori cu miim două cifre se poate costrui o astfelde diagramă. Se separă fiecare valoare a şirului de date î două părţi : tulpia şi fruza. Tulpia reprezită prima cifră a datelor, iar fruza cea de-a doua, respectiv ultima. Î cazul valorii 34, 3 este tulpia, iar 4 este fruza; î cazul valorii 6, tulpia este, iar fruza este 6. Fie seria de date : 54, 5, 43, 3, 8, 39, 78, 3, 54, 93, 7, 33,, 78, 75, 83, 6, 76, 77, 67, 77, 8, 4, 6, 8,, 34, 3, 36, 43, 78, 4, 4, 9, 9, 63, 87, 55, 6, 49, 37, 39, 5, 66,, 76, 34, 47, 5, 34. Se costată ca fiecare valoare este de ordiul zecilor sau al uităţilor. Î acest caz, tulpia este cifra zecilor, iar cifra uităţilor reprezită fruza. Se ordoează crescător seria. Diagrama tulpiă fruze este costituită di trei coloae. Pe coloaa a doua se trec î ordie crescătoare tulpiile, iar î ultima se îregistrează î ordie crescătoare toate fruzele aparţiătoare tulpiei respective (î acest caz cifrele uităţilor). Î prima coloaă se idică frecveţele cumulate de la prima clasă pâă la clasa mediaei, respectiv de la ultima clasă pâă la clasa mediaei. Frecveţa clasei mediaei se itroduce î parateză. Diagrama setului de date se prezită î fig. 3.. 7 Frecveţe cumulate Tulpia Fruze 34 6 58 45678 3 34446799 (5) 4 3379 3 5 445 9 6 367 4 7 56677888 6 8 37 3 9 3 Fig. 3. Diagrama tulpiă fruze

Acest tip de afişare se aseamăă cu histograma, dar pe lâgă distribuţia datelor sut idicate şi valorile respectivei serii. De asemeea, î urma uei astfel de afişări se poate decide modul de divizare a setului de date î clase, î sesul stabilirii mărimii şi umărului acestora. O metodă de reprezetare grafică este bo-plot-ul. El se costruieşte pe baza a 5 valori asociate seriei de date: miimul, cvatila iferioară q(.5), mediaa, cvatila superioară q(.75) şi maimul. Aceste valori pot fi reprezetate pe o aă verticală sau orizotală. Ambele sut ilustrate î fig. 3.. Se deseează u dreptughi avâd o latură egală cu difereţa ditre cvatila superioară şi cea iferioară. Î acest dreptughi se mai trasează o dreaptă paralelă cu latura meţioată, î dreptul valorii mediaei. Lugimea laturii dreptughiului, q(.75) q(.5), este cuoscută sub umele de iterval itercvatilic (IQR). Acest iterval se multiplică cu u coeficiet, de regulă.5 şi se determiă valoarea q(.5) -.5IQR şi q(.75) +.5IQR. Se trasează două segmete ce uesc mijloacele bazelor dreptughiului cu aceste valori. Aceste segmete se umesc mustăţi (whiskers). datele situate î afara itervalului [q(.5).5iqr; q(.75) +.5IQR] sut cosiderate aberate. Alegerea coeficietului.5 u este stadardizată, ea poate fi impusă de utilizator î fucţie de atura datelor şi a eperieţei precedete di aaliza datelor de u aumit tip. 8 Fig. 3. Bo-plot Î Matlab, u bo-plot se poate trasa cu comada boplot(,codbo,simbol,vertic,whisker), ude este setul de date, ce poate fi u vector sau o matrice. Î cazul câd este o matrice se va trasa câte u boplot petru fiecare coloaă. Cod-bo este o variabilă ce pote lua valoarea

sau, dacă este se va desea u dreptughi, dacă este se va desea u dreptughi di care se decupează u V. Simbol este caracterul cu care se marchează valoriile di eteriorul itervalului [q(.5).5iqr; q(.75) +.5IQR] şi este implicit +. vertic este o variabilă ce poate lua valoarea (trasarea se face pe orizotală) sau (trasarea se face pe verticală). whisker defieşte itervalul, este valoarea cu care se îmulţeşte IQR şi este implicit.5. Dacă whisker = se vor marca toate valoriile aflate î afara itervalului [q(.5), q(.75)]. Î Matlab, itervalul itercvatilic al uei serii de date se poate calcula cu fucţia iqr(). Acest tip de reprezetare permite idicarea prezumtivelor valori aberate ditro serie de date. 3.3. TIPURI DE REPARTIŢII Determiarea probabilităţilor asociate uor eveimete aleatoare poate fi mult simplificată dacă se costruieşte u model matematic ce descrie cu acurateţe situaţiile asociate cu aumite eveimete de iteres. U astfel de model utilizat la determiarea probabilităţilor de producere a uor eveimete este o distribuţie de probabilitate. Uui eperimet aleator î care se determiă (pri măsurare sau observare) aumite caracteristici ale uei populaţii, ce pot fi cuatificate umeric, i se asociază ua sau mai multe variabile, umite variabile aleatoare. O variabilă aleatoare ce poate lua valori îtr-o mulţime umărabilă se umeşte variabilă discretă, iar î situaţia câd poate lua orice valoare îtr-u iterval real se umeşte variabilă aleatoare cotiuă. Comportarea variabilei aleatoare este descrisă di puct de vedere matematic de distribuţia de probabilitate asociată. Distribuţia de probabilitate a uei variabile aleatoare discrete se eprimă sub forma uei matrice: p p p, (3.9) pe prima liie fiid îregistrate valorile variabilelor, iar pe a doua probabilităţile p i p i. de realizare, cu codiţiile:,, i Porid de la eveimete elemetare (X = i) ale uui eperimet se pot 9

determia probabilităţi ale eveimetelor de tipul: X a, X a, a X b, a X b etc. Aceste probabilităţi se obţi pri îsumarea probabilităţilor eveimetelor elemetare corespuzătoare, deoarece acestea se eclud reciproc. Eemplu: Fie variabila aleatoare ce idică umărul de restaţe îregistrate la sfârşitul uui semestru de studeţii uui a de studiu: 3 4 5 6 7.5.3.5.5..5.5.5. a) Să se determie probabilitatea ca u studet să aibă maimum 3 restaţe. b) Dacă u studet are miim 3 restaţe, care este probabilitatea ca el să aibă 4 restaţe. Eveimetul a cărui probabilitate se cere î cazul a) este: Deci: X 3 X X X X 3. X 3 PX PX PX PX 3.5.3.5. 5 P =.75. Î cazul b) se otează A = (X = 4), eveimetul ca studetul să aibă 4 restaţe şi B = (X 3), eveimetul ca studetul să aibă miim 3 restaţe. Î problemă se cere probabilitatea eveimetului A codiţioată de B: P A B PA B. P B P(B) = P(X=3) + P(X=4) + P(X=5) + P(X=6) + P(X=7) =.5 +. +.5 +.5 +.5 =.4 P(A B)=P(A)=. P(A B)=./.4=.5 Î cazul variabilelor aleatoare discrete fucţia de repartiţie defiită pri F(X) = P(X ) probabilitatea ca variabila aleatoare X să ia valori mai mici sau egale cu - este de forma:

p p p FX p p p X X X X X 3. (3.3) După cum se etrag iformaţii ditr-o serie de date pri asocierea uor idicatori umerici, î acelaşi mod se defiesc caracteristici petru variabile aleatoare. Valoarea medie a uei variabile aleatoare discretă, X, de valori i şi probabilităţile p i = P(X= i), i=, este umărul otat M(X): M X i i p i (3.3) Fie o variabilă aleatoare discretă X, ce are media m. Dispersia sau variaţa variabilei este: X M X m, (3.3) iar abaterea stadard X şi se otează (X). Calcularea acestor idicatori este eemplificată î eemplul următor [4]. Fie distribuţia vârstei populaţiei Româiei î 99 şi. Se raportează vârsta pe categorii, î itervale, reprezetate de mijloacele acestora. Petru fiecare iterval se idică procetul populaţiei ce are vârsta î acel iterval: Iterval Mijloc iterval 99 sub 5 ai 3 7.6 6.4 5-3 9.8.6 4-7 6 5.3 5. 8-4.8 9. 5-34 3 7.3.5 35-44 4 5.. 45-64 55 8.6.5 65-84 75 9.3 6. 85 9. 4.6 Iterpretâd procetele ca probabilităţi, distribuţia vârstei î 99 este:

X 3.76 9.8 6.53.8 3.73 4.5 55.86 75.93 9.. Vârsta medie a populaţiei Româiei î 99 era: M(X)=3(.76)+9(.8)+...+9(.)=34.455, iar abaterea stadard: X 3 34.455... 9 34.455. 87. Cosiderâd distribuţia de probabilitate a vârstei populaţiei î, se obţie media M(Y) = 4. şi abaterea stadard (Y) = 5.4. Comparâd valorile corespuzătoare se observă că media vâstei creşte, dar şi variabilitatea creşte. 3.3.. DISTRIBUŢIA BINOMIALĂ Distribuţia biomială caracterizează variabile discrete, ce se asociază uui proces Beroulli. Procesul Beroulli costă di îcercări ale uui eperimet, ce are rezultate ce se eclud reciproc (mutual eclusive): succes sau eşec. Îcercările sut idepedete, adică rezultatul ueia u iflueţează rezultatul celeilalte, iar petru fiecare îcercare probabilitatea succesului este aceeaşi, p. Îtr-u eperimet Beroulli prezită iteres umărul de succese şi eşecuri di îcercări. Dacă se otează X variabila aleatoare discretă ce reprezită umărul de reuşite di îcercări, atuci X va putea lua valorile discrete,,.... Probabilităţile asociate fiecărei valori i vor avea o distribuţie de frecveţe de tip biomial. Probabilitatea de a îregistra k succese di îcercări, cu probabilitatea de succes la o îcercare p şi de eşec p este [5,4]: ude C k P k X k C p p k, (3.33) k!, reprezită combiări de luate câte k. k! k! Eemple de eperimete ce pot fi modelate cu o repartiţie biomială: U medicamet are probabilitatea de 9% de a videca o aumită maladie. Medicametul se admiistrează la de pacieţi, iar î fial aceştia sut videcaţi sau u. Dacă X este umărul de pacieţi

videcaţi, X este o variabilă aleatoare biomială cu parametrii (;.9); adică =, p =.9. Istitutul Naţioal de Statistică estimează că eistă şasa ca % di adulţi să fie simpatizaţi al uui aumit partid. 5 de adulţi sut selectaţi aleator. Dacă X reprezită umărul adulţilor simpatizaţi ai respectivului partid, X va fi o variabilă aleatoare biomială cu parametrii (5;.). U producător de plăci de calculator are î medie 5% produse defecte. Petru a moitoriza procesul de producţie se etrage u eşatio de 75 de elemete. Dacă acest eşatio prezită mai mult de 5 uităţi de produs defecte, procesul de producţie se opreşte. Numărul de produse defecte se poate modela cu o variabilă aleatoare biomială cu parametrii (75;.5) Aplicaţie: mucitori lucrează la u atelier şi 6 di ei au categoria a 5-a. Care este probabilitatea ca îtr-u grup format di 3 mucitori să fie toţi de categoria a 5-a. P 3 6 4 3 3 X 3 C.6.64. 45 Eistă o probabilitate de 4.5% ca toţi cei trei mucitori să fie de categoria a cicea. Î umeroase situaţii practice, trebuie calculată probabilitatea de succes care să fie mai mare cel mult egală cu o valoare dată, respectiv mai mică sau egală decât o valoare dată: P( k), P( k). Î astfel de situaţii se îsumează probabilităţile corespuzătoare. Petru eemplul aterior să se determie probabilitatea ca u mai mult de doi mucitori selectaţi să fie de categoria a cicea. P 6 4 6 4 X PX PX PX C C 9 8 6 4 C..6.6.3. Î cazul distribuţiei biomiale media şi variaţa sut: 3

M p, (3.34) p p. Î Matlab eistă fucţia biocdf(a,,p) ce returează fucţia de repartiţie F(a) a uei variabile aleatoare biomiale de parametri cuoscuţi şi p. Petru eemplul aterior se putea calcula probabilitatea ca u mai mult de doi mucitori să fie de categoria a cicea, P( ), cu biocdf(,,.6), ce returează valoarea.3. Fucţia desitate de probabilitate petru repartiţia biomială este defiită de biopdf(,,p) care returează valoarea acestei fucţii î puctul. Rezultatul aterior putea fi obţiut şi pri îsumarea fucţiilor desitate de probabilitate petru valoriile:, şi ; prob=biocdf(:,,.6) returează aceeaşi valoare.3. 3.3.. DISTRIBUŢIA POISSON Este o distribuţie ce caracterizează variabile discrete. Ea tratează problema eveimetelor aleatoare ce au loc î uitatea de timp sau spaţiu. Ea poate îlocui distribuţia biomială î cazul câd umărul de eveimete total este foarte mare, iar şasa de realizare favorabilă foarte mică. Pricipala utilizare a distribuţiei Poisso este la probleme ce tratează eveimete rare, ce apar îtru iterval de timp specificat sau îtr-o regiue di spaţiu. E.: umărul de clieţi ditr-u magazi/oră, umărul de maşii ce itră îtr-o parcare/zi, umărul de scurgeri de-a lugul uei coducte de petrol, umărul de defecte/uitatea de suprafaţă la o tablă etc. Distribuţia Poisso este aplicabilă î aumite codiţii: eveimetele aleatoare au loc î uitatea de timp sau spaţiu; umărul de eveimete favorabile trebuie să fie teoretic ifiit; producerea uui eveimet este idepedetă de producerea eveimetelor aterioare sau posterioare. Dacă aceste codiţii sut îdepliite, variabila aleatoare ce cotorizează umărul de apariţii a eveimetului îtr-u iterval de timp este o variabilă aleatoare de tip Poisso. Î cazul câd eveimetele se produc astfel îcât î medie apar eveimete îtr-o perioadă de timp sau spaţiu, atuci 4

probabilitatea ca eveimetul să se producă de k ori este: 5 k e PX k. (3.35) k! Petru calcularea probabilităţii ca eveimetele să se producă de cel mult k ori, se procedează la fel ca î cazul distribuţiei biomiale: P X k PX PX PX k Dacă X este o variabilă aleatoare de tip Poisso, cu parametrul, atuci media sa este: M X iar dispersia: Aplicaţii: X, (3.36). (3.37). Îtr-u studiu la o spălătorie de maşii s-a costatat că umărul mediu de maşii ce sosesc lui dimieaţa ître ora 8 şi 9 este 5. Care este probabilitatea ca îtr-o aumită zi de lui să sosească eact 5 maşii? Dar care este probabilitatea să viă mai puţi de 3 maşii? 5 5 e 5 P X 5. 755. 5! Î primul caz probabilitatea este 7.55%. P X 3 PX PX PX.67.337.84. 46 Î cel de-al doilea caz, probabilitatea este de.46%.. La editarea uei cărţi se utilizează corectarea automată oferită de soft-ul de procesare a tetului, î plus la editare se face o ouă corectură. Cu toate acestea u aumit umăr de greşeli de editare rămâ. Se cosideră că umărul de erori tipografice per pagiă are o repartiţie Poisso cu parametrul =.5. Se doreşte calcularea probabilităţii ca pe o pagiă să apară cel puţi erori. P(X ) = P(X = ) P(X = ) = e.5.5e.5 =.65

Fucţia de repartiţie Poisso se poate apela î Matlab cu comada poisscdf. Sitaa este poisscdf(,lambda)- returează probabilitatea ca variabila să fie mai mică decât o valoare. Deci î cazul problemei aterioare, rezultatul se poate obţie cu: probabilitate=-poisscdf(,.5) 3. Îtr-o itersecţie s-a costatat că apar î medie accidete pe săptămâă ( = ). Să se determie care este probabilitatea ca î următoarele săptămâi să aibă loc 3 accidete. Î cazul distribuţiei Poisso umărul de eveimete ce au loc îtr-u iterval depid doar de lugimea itervalului şi sut idepedete de puctul de îceput. Numărul de eveimete ce apar î mai multe itervale de timp, k, este egal cu k. Î aceste codiţii se poate determia probabilitatea de apariţie a 3 accidete î săptămâi ca fiid: probabilitate=poisscdf(3,*) 3.3.3. DISTRIBUŢIA UNIFORMĂ Variabilele aleatoare discrete se asociază uor eperimete ce costau î cotorizarea aumitor rezultate. Variabilele cotiue se asociază, î geeral, uor eperimete ce costau di măsurare, deci au rezultate umere reale, valorile variabilei putâd fi oricare îtr-u iterval mărgiit sau u. E.: cota uei piese, îălţimea sau greutatea populaţiei, rata şomajului etc. După cum s-a arătat î paragraful 3., dacă se cuoaşte fucţia de repartiţie a variabilei aleatoare cotiue, X, se poate calcula probabilitatea de apariţie a oricărui eveimet: X < a, a < X < b, X > b, a X b etc. Fie X o variabilă aleatoare cotiuă, ce are desitatea de probabilitate f. valoarea medie se otează M(X) şi se calculează: 6 M X f d. (3.38) Dispersia sau variaţa uei variabile cu media m este: m f X M X m d, (3.39) iar abaterea stadard este:

X. (3.4) O variabilă aleatoare distribuită uiform pe itervalul (a, b) are fucţia desitate de probabilitate de forma: f(x; a, b) = ; a < X < b (3.4) b a Parametrii petru repartiţia uiformă sut capetele itervalului: a şi b. Media şi variaţa uei variabile repartizată uiform sut: M(X) = a+b σ (X) = (b a), (3.4) Fucţia de probabilitate a uei variabile distribuită uiform este: ; X a a F(X) = { ; a < X < b b a ; X b. (3.43) (3.44) Î Matlab eistă defiite fucţia desitate de probabilitate, f, (uifpdf) şi fucţia de repartiţie, F, (uifcdf) petru repartiţia uiformă. Fuctia desitate de probabibilitate PDF Fuctia de repartitie CDF..5.8.6 f(). F().4.5. 7 5 5

Fig. 3. Fucţia desitate de probabilitate şi fucţia de probabilitate petru o variabilă repartizată uiform î itervalul [, ] Î fig. 3. se prezită graficul fucţiei desitate de probabilitate şi fucţiei de probabilitate petru o variabilă distribuită uiform î itervalul [,]. Reprezetarea grafică a fost obţiută cu următoarea secveţă de program: =-:.:;%se divizează itervalul [-,] cu pasul h=. pdf=uifpdf(,,); cdf=uifcdf(,,); subplot(,,),plot(,pdf),title('fuctia desitate de probabibilitate PDF') label(''),ylabel('f()'),ais([-.]) subplot(,,),plot(,cdf),title('fuctia de repartitie CDF') label(''),ylabel('f()'),ais([-.]) 3.3.4. DISTRIBUŢIA NORMALĂ Distribuţia ormală este o distribuţie fudametală î statistică, fiid adecvată î modelarea a umeroase feomee di atură. De asemeea, ea stă la baza ifereţei statistice. Fucţia de desitate de probabilitate are epresia: f ep, (3.45) ude este media, iar abaterea stadard. Graficul acestei fucţii este u clopot. Cu cât este mai mic, cu atât repartiţia este mai cocetrată (clopotul este mai ascuţit). Î figura 3.3 se prezită câteva eemple de fucţii desitate de probabilitate petru repartiţii ormale. Se observă că pe măsură ce σ creşte îălţimea fucţiei scade, dar creşte avergura acesteia. 8

.9.8.7.6 µ = f().5.4.3 µ =.. -8-6 -4-4 6 Fig. 3.3 Eemple de fucţii desitate de probabilitate petru distribuţii ormale Localizarea şi forma repartiţiei depid de parametrii şi, î sesul că determiă localizarea repartiţiei pe aă, iar forma curbei (fig. 3. 4). Desitatea de probabilitate este cotiuă, are formă de clopot şi tide asimptotic spre petru. Notaţia X~N(μ, σ ) se utilizează petru a idica că o variabilă aleatoare X este distribuită ormal cu media µ şi variaţa σ..5.9.45.8.4.35.7.6 f().3.5..5 f().5.4.3..5.. 9-6 -4-4 6-6 -4-4 6 Fig. 3.4. Iflueţa parametrilor asupra repartiţiei ormale Petru orice distribuţie ormală, idiferet de valoarea parametrilor şi, proporţia de observaţii ce aparţi uui iterval cetrat î este aceeaşi (fig. 3.5):

68.6% di valorile lui [ - ; + ]; 95.44% di valorile lui [ - ; + ]; 99.73% di valorile lui [ - 3; + 3]. Orice variabilă aleatoare ormală poate fi trasformată î variabilă aleatoare ormală ormată pri schimbarea de variabilă: z = ( - )/, deci variabila aleatoare z are o distribuţie ormală cu media egală cu şi dispersia. Î acest mod se poate calcula aria îchisă sub curbă petru diferite valori ale lui, arie ce este egală cu probabilitatea ca variabila să aparţiă itervalului respectiv (delimitat de limitele de itegrare). Aceste valori sut icluse î tabele statistice (Aea ). De remarcat că î tabel sut îregistrate doar ariile petru valori pozitive. Î cazul câd se calculează probabilitatea ca z [-a, a], valoarea rezultată di tabel trebuie multiplicată cu. Fucţia de repartiţie a uei variabile repartizate ormal se defieşte cu relaţia: Φ(z) = π z ep ( y ) dy (3.46) Fucţia de probabilitate se poate calcula utilizâd fucţia eroare, otată cu erf. cca 68% cca 95% cca 99.7% Î Matlab sut defiite fucţiile: 3 Fig. 3.4. Repartiţia ormală - ormpdf ce returează valoriile fucţiei desitate de probabilitate cu sitaa: y = ormpdf(,miu,sigma) ude miu este valoarea mediei, iar sigma este deviaţia stadard; implicit miu este, iar sigma ;

- ormcdf, ce returează valoarea fucţiei de repartiţie. Sitaa este p=ormpdf(,miu,sigma) - ormspec este o fucţie ce permite calcularea probabilităţii ca o variabilă repartizată ormal cu media µ şi deviaţia stadard σ să aibă valori ître aumite limite. Fucţia reprezită grafic desitatea de probabilitate restricţioată la itervalul defiit de cele două limite. Limitele se idică sub forma uui vector. Î cazul câd u eistă limită iferioară, primul elemet al vectorului se itroduce -, iar î cazul ieisteţei limitei superioare, al doilea elemet al vectorului va fi. Acest lucru se realizează î Matlab cu If, respectiv If. U eemplu se prezită î cotiuare. Valorile implicite petru µ şi σ sut şi. - ormiv este o fucţie ce returează iversa fucţiei de repartiţie î puctul P. Sitaa este ormiv(p,miu,sigma), ude valorile implicite sut (petru miu) şi (petru sigma). Petru cazul uei variabile distribuită ormal, avâd media 4 şi deviaţia stadard egală cu.5, probabilitatea ca variabila să aparţiă itervalului [, 7] se poate calcula î felul următor: % se seteaza limitele itervalului i vectorul limite limite=[,7]; miu=4;sigma=.5; prob=ormspec(limite,miu,sigma).35 Probability Betwee Limits is.8864 Probability Less tha Upper Boud is.49 Desity.3.5..5..5 Desity.8.6.4..8.6.4. 3-4 6 8 Critical Value Fig. 3.5 Eemple petru fucţia ormspec..4.6.8..4.6.8 Critical Value Îtr-o firmă producătoare de alimete, produsele sut ambalate î cutii de kg. Î realitate masa cutiilor este ormal distribuită, cu medie.5 kg şi abatere stadard de.. Să se determie probabilitatea să eiste cutii sub greutatea

specificată. Î acest caz trebuie determiată probabilitatea ca variabila masă să ia valori î itervalul (, ). limite=(-if, ); miu=.5;sigma=.; prob=ormspec(limite,miu,sigma); 3.3.5. DISTRIBUŢIA T O altă distribuţie cu umeroase aplicaţii î statistică este distribuţia t sau Studet. Î cazul uei populaţii distribuită ormal, dacă se etrag eşatioae şi se calculează media acestora, variabila t calculată cu relaţia: t S /, (3.48) are repartiţia t. Distribuţia t este simetrică, are media şi o variaţă mai mare decât [5]. De fapt, variaţa distribuţiei creşte pe măsură ce, volumul eşatioului scade. Distribuţia admite ca parametru umărul gradelor de libertate, =. Pe măsură ce umărul gradelor de libertate creşte. distribuţia se apropie de cea ormală. La fel ca î cazul repartiţiei ormale stadard, eistă tabele petru distribuţia t ce permit etragerea valorilor t corespuzătoare uei aumite probabilităţi. Fiecare râd al tabelului corespude uui aumit umăr de grade de libertate. Probabilităţile sut calculate petru o sigură ramură a distribuţiei, P(t t ). t este -cvatila repartiţiei Studet, adică umărul cu proprietatea că P(t t ) =. Dacă se compară di tabele, distribuţia ormală stadard şi distribuţia t, se costată că petru valori ale mai mari ale lui cele două distribuţii sut aproape idetice. Pe baza acestui cosideret, î cazurile practice, câd 3 se îlocuieşte distribuţia t cu cea ormală stadard, iar distribuţia t se utilizează mai ales î cazurile câd < 3. Mai trebuie meţioat faptul că distribuţia t ecesită ca populaţia di care s-a etras eşatioul să u difere mult de repartiţia ormală. Î cazul eşatioaelor mici etrase di populaţii asimetrice, ici distribuţia z şi ici t u pot fi utilizate. 3

.4 Numar grade de libertate:.4 Numar grade de libertate: 5.35.35.3.3.5.5...5.5...5.5-4 -3 - - 3 4-4 -3 - - 3 4.4 Numar grade de libertate: 3.35.3.5..5..5 33-4 -3 - - 3 4 Fig. 3.6 Apropierea ditre repartiţia t şi repartiţia ormală pe măsură ce umărul gradelor de libertate creşte Î cocluzie se poate afirma că distribuţia t se utilizează î următoarele codiţii: deviaţia stadard a eşatioului, S, este utilizată petru estimarea lui ; volumul eşatioului este mic, < 3; populaţia este distribuită aproimativ ormal. Î Matlab sut defiite fucţiile tpdf, respectiv tcdf petru determiarea desităţii de probabilitate şi a probabilităţii uei variabile repartizată coform repartiţiei t. Sitaa este: y=tpdf(,v), respectiv P=tcdf(,v), ude v este umărul gradelor de libertate. Este defiită şi fucţia tiv(p,v), iversa fucţiei de repartiţie, ce returează cvatila repartiţiei t cu v grade de libertate î puctul P.

3.3.6. DISTRIBUŢIA EXPONENŢIALĂ O variabilă aleatoare ce are desitatea de probabilitate: f(; λ) = λe λ ; ; λ >. (3.49) Se umeşte variabilă aleatoare epoeţial distribuită de parametru. O variabilă aleatoare epoeţial distribuită modelează durata de viaţă a uui produs sau dispozitiv sau ligimea itervalelor de timp ître producerea a două eveimete cosecutive cotorizate de o variabilă aleatoare Poisso. E.: itervalelor de timp ître sosirea a doi clieţi la o bacă, timpul ditre apelurile telefoice, timpul pâă la căderea uei piese etc. Media şi variaţa uei populaţii repartizată epoeţial sut: M() = λ (3.5) 34 σ () = λ. (3.5) Fucţia de probabilitate este de forma: ; < F() = { e λ ;. (3.5) Repartiţia epoeţială prezită o proprietate iteresată şi aume itervalul de timp scurs pâă la apariţia uui eveimet u depide de timpul aterior []. Acest lucru se poate scrie: P(X > s + t X > s) = P(X > t) (3.53) Cu alte cuvite, acest lucru îseamă că probabilitatea ca o piesă sau dispozitiv să fie î stare de fucţioare după de s + t uităţi de timp, dacă ea a fucţioat bie deja de timpul s, este egală cu probabilitatea ca piesa să fucţioeze timpul t. Câd această distribuţie se utilizează la reprezetarea itervalelor de timp ître eveimete, parametrul reprezită umărul mediu de eveimete produs î uitatea de timp, adică frecveţa acestora. Eemplu: Itervalul de timp ître sosirea maşiilor îtr-o itersecţie este î medie de secude. Se cere probabilitatea ca itervalul de timp să fie cel mult egal cu secude. Î acest caz umărul mediu al maşiilor este egal cu /, iar probabilitatea cerută este egală cu:

( P( ) = e ) =.5654.8.6.4 f()..8.6.4. 35 Fig. 3.7 Repartiţia epoeţială petru diferite valori ale parametrului Î Matlab fucţia de repartiţie petru distribuţia epoeţială este epcdf(,/lambda) cu care se poate calcula probabilitatea ca X să ia valori mai mici sau egale cu. Trebuie meţioat faptul că î Matlab fucţia de probabilitate petru repartiţia epoeţială se defieşte cu relaţia: f(; μ) = μ e μ; ; μ >. (3.54) Î acest cotet rezultatul aplicaţiei aterioare se poate obţie pri simpla apelare a fucţiei epcdf(,), ce va retura.5654. De asemeea este defiită fucţia eppdf(, /lambda),ce implemetează calculul desităţii de probabilitate, respectiv epiv(p,/lambda)iversa fucţiei de repartiţie. 3.3.7. DISTRIBUŢIA GAMMA.5.5.5 3 Fucţia desitate de probabilitate a repartiţiei gamma are epresia: f(; λ, t) = λe λ (λ) t ;, (3.55) Γ(t) ude t este parametru de formă, iar este parametru de localizare. Fucţia gamma este defiită de:

Γ(t) = e y y t dy, (3.56) relaţie care î cazul valorilor îtregi ale parametrului t devie: Γ(t) = (t )! (3.57) De remarcat că petru t = distribuţia gamma devie epoeţială. Petru valori pozitive ale lui t, repartiţia gamma se poate utilize la modelarea itervalului de timp scurs pâă la producerea a t eveimete, dacă umărul eveimetelor rare are distribuţie Poisso. Media şi variaţa distribuţiei gamma sut date de relaţiile: M() = t λ (3.58) σ () = t λ. (3.59) Fucţia de repartiţie a acestei distribuţii are epresia []: ; F(; λ, t) = { Γ(t) λ yt e y. (3.6) dy; > Relaţia (3.6) se poate evalua î Matlab cu fucţia gammacdf(lambda*,t)..9 =t=.8.7.6 =t=.5.4.3 =t=3...5.5.5 3 Fig. 3.8 Eemple de fucţii desitate de probabilitate gamma 36

Alura desităţii de probabilitate gamma petru diverse valori ale parametrilor se poate observa î fig. 3.8. Graficul prezetat î figură se obţie cu secveţa de program: =:.:3; y=gampdf(,,); y=gampdf(,,/); y3=gampdf(,3,/3); plot(,y,,y,,y3) La fel ca î cazurile aterioare, î Matlab eistă defiite fucţiile gampdf, respectiv gamcdf, ce pot fi utilizate petru calcularea desităţii de probabilitate şi fucţiei de repartiţie a distribuţiei gamma. 3.3.8. DISTRIBUŢIA Distribuţia este u caz particular al distribuţiei gamma, avâd =.5 şi t = /, cu o valoare îtreagă pozitivă, ce reprezită umărul gradelor de libertate. Repartiţia are aplicaţii î testele de cocordaţă, cu ajutorul cărora se verifică ipoteza modelării eşatioului cu o aumită repartiţie. Fucţia desitate de probabilitate petru o variabilă aleatoare distribuită coform repartiţiei, cu grade de libertate este; 37 f(, ν) = Γ(ν ) ( )ν ν e ;. (3.6) Media şi variaţa distribuţiei se pot obţie pe baza repartiţiei gamma, avâd valorile: M() = ν (3.6) σ () = ν. (3.63) 3.4 INFERENŢA STATISTICĂ Ivestigările statistice costau î studiul uor caracteristici ale uei populaţii. Î acest scop, di populaţie (ce poate fi fiită sau ifiită) se etrag eşatioae de volum fiit. Î urma ivestigării eşatioului se obţi iformaţii ce se etrapolează la îtreaga populaţie. Ifereţa statistică dezvoltă metode de ivestigare a uei populaţii pri sodaj, adică metode şi tehici de aaliză a datelor obţiute pri eşatioae. Avâd î

vedere că populaţia este caracterizată de câţiva idicatori de iteres, statistica formulează ifereţe, adică predicţii, asupra parametrilor populaţiei cu diferite ivele de îcredere. Î practică ifereţa statistică se ocupă cu două mari categorii de probleme: estimarea valorilor parametrilor uei populaţii (media, dispersia); testarea ipotezelor referitoare la parametrii populaţiei. Spre deosebire de statistica descriptivă, î ifereţa statistică se asociază u model probabilist caracteristicii ivestigate, î sesul că valorile umerice asociate caracteristicii ivestigate au o aumită distribuţie de probabilitate, ce este defiită de o desitate de probabilitate, f. Această desitate de probabilitate depide de u parametru ecuoscut,, î cazurile cele mai frecvete fiid sau. R Pe baza tehicilor dezvoltate de ifereţa statistică se estimează parametrul pri: o valoare puctuală; u iterval de valori ce va coţie valoarea estimată cu o probabilitate prescrisă; o modalitate de testare a ipotezelor, ; ude este o valoare dată. 3.4.. EŞANTIONAREA Ditr-o populaţie de volum N se pot etrage eşatioae de volum, <N. Numărul de astfel de eşatioae este mare şi valoarea uei aumite statistici, de e. media, calculată petru fiecare eşatio va diferi de la u eşatio la altul. Frecveţa de distribuţie a tuturor acestor eşatioae dă iformaţii primare despre distribuţia uui eşatio. Coceptul de eşatioare al uei populaţii poate fi ilustrat pri următorul eemplu. Fie o populaţie î care variabila poate lua orice valoare îtreagă ître şi 4 (icideţa apariţiei a 4 defecte la u produs). Fie populaţia formată di 5 obiecte, fiecare avâd,,, 3 sau 4 defecte. Se etrag eşatioae formate di două eemplare. Eşatioarea se poate face cu sau fără returare. La eşatioarea cu returare, după etragerea uui elemet, acesta se itroduce di ou î cadrul populaţiei, putâd fi ulterior etras. Î tabelul. se prezită toate posibilităţile de eşatioae ce apar. Petru 38