Pattern Recognition Systems

Documente similare
Olimpiada de Astronomie şi Astrofizică Etapa Naţională 2015 Proba de Baraj Juniori Problema 1 O tehnică de determinare a magnitudinii stelelor o const

Spatii vectoriale

PAS cap. 2: Reprezentări rare p. 1/35 Prelucrarea avansată a semnalelor Capitolul 2: Reprezentări rare Bogdan Dumitrescu Facultatea de Automatică şi C

Seminar 6 1. Reprezentaţi printr-o integrală Fourier funcţia f : R R, f (x) = e x cos 2x. Soluţie: Funcţia dată satisface condiţiile teoremei de repre

Microsoft Word - SUBIECT 2017 anul I.doc

Microsoft Word - cap1p4.doc

METODE NUMERICE ÎN INGINERIE

Pagina 1 din 6 Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare Etapa județeană, a sectoarelor municipiului București, a Olimp

MasterEmaco T 2040

Calcul Numeric

Aproximarea functiilor prin metoda celor mai mici patrate

Procesarea Imaginilor Laborator 3: Histograma nivelurilor de intensitate 1 3. Histograma nivelurilor de intensitate 3.1. Introducere În această lucrar

Cursul 12 (plan de curs) Integrale prime 1 Sisteme diferenţiale autonome. Spaţiul fazelor. Fie Ω R n o mulţime deschisă şi f : Ω R n R n o funcţie de

Subiectul 1

Capitole Speciale de Informatică Curs 4: Calculul scorurilor în un sistem complet de extragere a informaţiilor 18 octombrie 2018 Reamintim că în cursu

Ecuatii si sisteme de ecuatii neliniare 1 Metoda lui Newton Algorithm 1 Metoda lui Newton pentru ecuaţia f(x) = 0. Date de intrare: - Funcţia f - Apro

1. Operatii cu matrici 1 Cerinte: Sa se realizeze functii pentru operatii cu matrici patratice (de dimensiune maxima 10x10). Operatiile cerute sunt: A

2

Microsoft Word - 2 Filtre neliniare.doc

I

Algebra si Geometri pentru Computer Science

Slide 1

Geometrie afină Conf. Univ. Dr. Cornel Pintea cpintea math.ubbcluj.ro Cuprins 1 Săptămâna Endomorfismele unui spaţiu afin Transla

Microsoft Word - D_ MT1_II_001.doc

Laborator 1-Teoria probabilitatilor si statistica matematica Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 1 P

Probleme proiect TP BITPERM Implementați un algoritm care citește de la intrarea standard două numere naturale și scrie la ieșirea standard da

Microsoft Word - PI-L8r

Cuantizare Vectoriala.doc

Calcul Numeric

Procesarea Imaginilor - Laborator 1: Introducere în utilizarea bibliotecii OpenCV 1 1. Introducere în utilizarea bibliotecii OpenCV 1.1. Introducere S

rrs_12_2012.indd

Matrici și vectori în VBA În VBA, o matrice este un grup de variabile de același tip. De ce ar trebui să utilizați o matrice? Presupunem că ați vrut s

Complemente de Fizica I Cursul 1

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de

Sistem de supraveghere video inteligent cu localizarea automata a evenimentelor de interes SCOUTER, cod proiect PN-II-IN-DPST , contract nr

Laborator 3

ALGORITMICĂ. Seminar 3: Analiza eficienţei algoritmilor - estimarea timpului de execuţie şi notaţii asimptotice. Problema 1 (L) Să se determine număru

Secţiunea 5-6 începători Concurs online de informatică Categoria PROGRAMARE PROBLEMA puncte PERIODIC Se citește un număr natural nenul N. Se ump

gaussx.dvi

Microsoft Word - Capitolul_07

LUCRAREA 8 PROGRAMAREA NELINIARĂ ÎN REZOLVAREA PROBLEMELOR DIN ENERGETICĂ. METODE DE ORDINUL Aspecte generale Programarea neliniară are o foart

I. Partea introductivă Proiectul unității de învățare CONCEPTUL DE MATRICE ŞCOALA: Colegiul Național Petru Rareș Suceava CLASA: a XI a- matematică / a

Clasa IX 1. O lăcustă face salturi, fiecare salt în linie dreaptă şi de două ori mai lung ca precedentul. Poate vreodată lăcusta să revină în punctul

Capitole Speciale de Informatică Curs 1: Extragerea informaţiilor. Modelul boolean şi modelul boolean extins 27 septembrie 2018 Extragerea informaţiil

ETTI-AM2, , M. Joița & A. Niță Notițe de Adrian Manea Seminar 11 Transformarea Laplace Aplicații Transformarea Z Ecuații și sisteme diferenți

Laborator 4 Modele sistemice liniare. Reprezentare numerică. Conversii. Conexiuni 4.1 Tema Formarea deprinderilor de utilizare a convenţiilor MATLAB d

Curs 6: Clasificarea surselor de informatii - Clasificarea Bayes Naiva. Modelul Bernoulli

EXCEL FĂRĂ SECRETE Grafice şi diagrame

PowerPoint Presentation

Probleme rezolvate de fizică traducere de Nicolae Coman după lucrarea

Microsoft Word - TIC5

COMISIA EUROPEANĂ Bruxelles, C(2018) 4352 final ANNEX 1 ANEXĂ la Regulamentul de punere în aplicare al Comisiei de modificare a Regulamentul

Fisa disciplinei_Utilizarea_Calc_CFDP_ _var2_

Capitole Speciale de Informatică Curs 2: Determinarea vocabularului de termeni şi a listelor de postări 4 octombrie 2018 Reamintim că listele de indec

CL2009R0976RO bi_cp 1..1

CONCURSUL NAŢIONAL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI Etapa locală, 24 februarie 2017 PROFIL TEHNIC ŞI SERVICII, RESURSE NATURALE, PROTECŢIA MEDIU

Slide 1

Microsoft Word - Laboratorul 2.docx

PROIECT DIDACTIC DATE DE IDENTIFICARE Data: Școala : Școala Gimnazială Grigore Moisil Ploiești Clasa: a VI-a Profesor: Ilie Oana Magdalena Disciplina:

Diapositive 1

Logică și structuri discrete Limbaje regulate și automate Marius Minea marius/curs/lsd/ 24 noiembrie 2014

Matematici aplicate științelor biologie Lab06 MV

PROGRAMA CONCURSULUI NAŢIONAL

Noțiuni matematice de bază

Fâciu N. Maria-Ema CASA CORPULUI DIDACTIC BRĂILA PROGRAM DE FORMARE INFORMATICĂ ȘI TIC PENTRU GIMNAZIU CLASA A V-A SERIA 1 GRUPA 2 CURSANT: Fâciu N. M

20 SUBIECTE DE EXAMEN - De fapt, în pofida acestor probleme, până la urmă tot vom logaritma, căci aceasta este tehnica naturală în context. Trebuie do

Microsoft Word - Curs_10.doc

Dorel LUCHIAN Gabriel POPA Adrian ZANOSCHI Gheorghe IUREA algebră geometrie clasa a VIII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA

E_d_Informatica_sp_MI_2015_bar_02_LRO

Slide 1

Matematici aplicate științelor biologie Lab05 MV

Examenul de bacalaureat 2012

Examenul de bacalaureat 2012

Examenul de bacalaureat 2012

OPERATII DE PRELUCRAREA IMAGINILOR 1

PowerPoint Presentation

proiectarea bazelor de date

Lecții de pregă,re la informa,că Admitere 2019 Tema: Discutarea problemelor date la ul,mele sesiuni de admitere Bogdan Alexe

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de

Addendum Syllabus 6 Microsoft Access 2016 REF Syllabus 6.0 Cunoașterea domeniilor în care se utilizează bazele de date Datorită potenţialului ma

Electricitate II

Bazele spectroscopiei si laserilor

1. Găsiți k numerele cele mai apropiate într-un şir nesortat Dându-se un şir nesortat și două numere x și k, găsiți k cele mai apropiate valori de x.

Aero-BCD, , Prof. L. Costache & M. Olteanu Notițe de Adrian Manea Seminar 5 Șiruri și serii de funcții. Serii de puteri 1 Șiruri de funcții D

CONCURSUL DE MATEMATICĂ APLICATĂ "ADOLF HAIMOVICI" ETAPA JUDEȚEANĂ 18 martie 2017 Filiera Tehnologică : profilul Tehnic Clasa a IX -a Problema 1. 2 Se

Microsoft Word - L_TI_4_C2_Tehnici_de_Analiza_a_Imaginilor_Brad_Remus.doc

Microsoft Word - Fisa DRS - ROMANA.docx

Gheorghe IUREA Adrian ZANOSCHI algebră geometrie clasa a VII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA 45 Matematică. Clasa a VII-

Microsoft Word - matem_aplicate in Economie aa FD Bala.doc

CURBE BÉZIER În CAGD se utilizează adesea curbele polinomiale, adică acele curbe definite de o parametrizare polinomială: C : [a, b] R 3 C(t) = (x(t),

Microsoft Word - fisa-Prelucrarea-Digitala_Imaginilor-RO-Anca-Ignat-2018

C:/Users/Lenovo/Dropbox/activitate matematica/cursuri/MS ETTI /msetti.dvi

Analiz¼a Matematic¼a - Curs 6 M¼ad¼alina Roxana Buneci

S.C. SEEKTRON S.R.L. Fişă de prezentare a produsului EYECAR B1 EYECAR B1 Observer Black Box Dispozitiv inteligent pentru înregistrarea evenimentelor r

Cadru general de analiză a datelor pentru promoțiile 2005 și 2009 CUPRINS Introducere I. Analiza procesului de contactare 1. Participare universități

Microsoft PowerPoint - curs5-DPT-2010V97 [Compatibility Mode]

Slide 1

Transcriere:

Sisteme e Recunoaștere a Formelor Lab 7 Analiza Componentelor Principale 1. Obiective În această lucrare e laborator se escrie metoa e Analiză a Componentelor Principale (Principal Component Analysis PCA). Această metoă se utilizează pentru reucerea imensionalității, compresia și vizualizarea atelor. Pentru realizarea acestei lucrări e laborator este necesară o librărie care să calculeze valorile și vectorii proprii ale unei matrice (escompunerea în valori proprii). 2. Funamente teoretice Se consieră un set e puncte e ate într-un spațiu e imensiune mare. Fiecare vector reprezintă trăsăturile unui exemplu e antrenare. Scopul acestei metoe este reucerea imensionalității punctelor în așa fel încât să se păstreze cât mai multă informație cu putință. Iniţial vom consiera un exemplu biimensional: se afișează atele colectate espre cât e mult apreciază anumite persoane niște activități și aptituinea lor în omeniul respectiv. Figura 1 ilustrează un exemplu simplificat. Să analizăm cei oi vectori u1 și u2. Dacă se proiectează punctele 2D pe vectorul u2 se obțin valori scalare cu o împrăștiere reusă (eviație stanar mică). În schimb, acă se proiectează punctele pe u1 punctele sunt mult mai împrăștiate. Dacă ar trebui să reucem atele la o singură imensiune, atunci ar fi preferabil să le proiectăm pe u1 întrucât atele sunt mai ușor separabile. Figura 1 Proiecţia punctului x pe vectorul u 1 Exprimat într-un mo mai formal, fiecare punct biimensional poate fi scris ca: x = x, u 1 u 1 u 1 + x, u 2 u 2 u 2

În ecuația e mai sus punctul x a fost proiectat pe fiecare vector și apoi rezultatele obținute au fost însumate. Prousul scalar x, u i efinește magnituinea proiecției și trebuie normalizat cu norma vectorului u i ; cei oi vectori efinesc irecțiile. Această exprimare este posibilă eoarece u1 și u2 sunt vectori perpeniculari. Dacă se pune coniția ca cei oi vectori să fie vectori unitare, atunci termenul e normalizare ispare. Pentru mai multe exemple e proiecţie vizualizaţi [4]. Ieea principală a reucerii imensionalității atelor este să se utilizeze cele mai mari proiecții. Întrucât proiecțiile pe u2 vor fi mai mici, x se poate aproxima folosin oar primul termen: x 1 = x, u 1 u 1 u 1 În general, fiin ată o bază ortonormală a unui spațiu vectorial cu imensiuni B cu vectorii e bază bi, orice vector se poate scrie ca: x = x, b i b i = (x b i ) Problema revine acum să eterminăm vectorii e bază pe care se vor realiza proiecțiile. Întrucât scopul principal este maximizarea varianței intre punctele rezultate în urma transformării, matricea e covarianță ne poate oferi informațiile necesare. Covarianța intre ouă trăsături este efinită ca: n C(x i, x j ) = 1 n 1 (x i μ i )(x j μ j ) une μ i este meia trăsăturii i. Matricea e covarianță stochează covarianțele pentru toate perechile e trăsături. Se poate emonstra că matricea e covarianță poate fi exprimată ca un simplu prous e matrice: C = 1 n 1 (X μ1 1xn) (X μ1 1xn ) une μ este un vector care conține valorile meii ale trăsăturilor și 1 1xn este un vector rân ce conține oar valori e 1. Dacă eliminăm meia in atele e intrare, întrun pas e preprocesare, ecuația se simplifică și mai mult: C = 1 n 1 X X Pasul următor este găsirea axelor e-a lungul cărora covarianța este maximă. Descompunerea în valori proprii ale unei matrice ne furnizează aceste informații. Intuitiv, (aproape) orice matrice poate fi vizualizată ca o rotație urmată e o scalare e-a lungul axelor și rotația inversă. Descompunerea în vectori și valorilor proprii calculează această escompunere a matricei: C = QΛQ = λ i Q i Q i une Q este o matrice e rotație e imensiune x (ortonormală) și Λ este o matrice iagonală ale cărei elemente reprezintă scalarea e-a lungul fiecărei axe. Elementele se numesc valori proprii și fiecare coloană corespunzătoare in Q este vectorul propriu corespunzător. Deoarece scopul principal este menținerea proiecțiilor cu b i

varianță maximă, valorile proprii se oronează escrescător în funcție e magnituinea lor și se aleg primele valori proprii. Astfel C poate fi aproximat ca: C = Q 1: Λ 1: Q 1: = λ i Q i Q i une Q 1: este o matrice e imensiune x cu primii vectori proprii și Λ 1: este o matrice iagonală e imensiune x ce conține primele valori proprii. Dacă este egal cu se obține matricea originală și, pe măsură ce valoarea lui scae, se obțin aproximări tot mai grosiere ale lui C. Astfel am eterminat axele e-a lungul cărora varianța proiecțiilor este maximizată. În cazul general un vector poate fi aproximat cu vectori astfel: x = x, Q i Q i = (x Q i ) une Q i este coloana i a matricei e rotație Q. Coeficienţii PCA pot fi calculaţi ca: X coef = XQ Aproximarea PCA poate fi calculată pentru toți vectorii e intrare simultan (acă ei sunt stocați ca rânuri în X ) utilizân formula: X = XQ i Q i t = X coefi Q i t Q i = XQ 1: Q 1: une Q 1: este matricea formată in primele coloane in Q. Este important să se facă istincția între aproximare și coeficienți: aproximarea este suma coeficienților înmulțite cu componentele principale. În finalul acestei prezentări teoretice vom trece în revistă mai multe exemple în care PCA se poate aplica cu succes: Reucerea imensionalității trăsăturilor: în unele cazuri, vectori e trăsături cu o imensionalitate mare pot să încetinească procesul e preicție Vizualizarea atelor atele pot fi analizate în 3D sau în 2D; pentru ate cu o imensionalitate mai mare este necesară proiecția atelor; Aproximarea vectorilor e ate; Detecția trăsăturilor reunante și a epenențelor liniare intre trăsături; Reucerea zgomotului acă zgomotul in ate are o varianță mai mică ecât atele, aică raportul intre semnal și zgomot (SNR) este mare, atunci PCA elimină zgomotul in atele e intrare. 3. Exemple e rezultate Pentru pca2 Prima valoare proprie este 8102.21 Eroarea meie absolută folosin o singură componentă: 142.8648 Pentru pca3 Prima valoare proprie este 5462.3301 Eroarea meie absolută folosin o singură componentă: 116.0689

Figura 2. Vizualizarea punctelor ce rezultă upă aplicarea metoei PCA pe atele in fişierul pca2.txt 4. Detalii e implementare Declararea și alocarea unei matrice e imensiune nx cu valori flotante exprimate în ublă precizie: Mat X(n,,CV_64FC1); Calculul matricei e covarianță upă ce meiile au fost scăzute in valorile e intrare: Mat C = X.t()*X/(n-1); Pentru a calcula escompunerea în valori proprii, Lamba va conține valorile proprii și Q va conține vectorii proprii. Este necesară transpunerea eoarece X conține atele e intrare e-a lungul rânurilor. Mat Lamba, Q; eigen(c, Lamba, Q); Q = Q.t(); Prousul scalar este implementat ca o simplă înmulțire. Atenție, atorită faptului că inexarea începe e la 0, primul rân este row(0). Prousul scalar intre rânul i in X și coloana i in Q este at e: Mat pro = X.row(i)*Q.col(i);

5. Activitate practică 1. Deschieți fișierul e intrare și citiți punctele e ate. Pe prima linie este stocat numărul e puncte n și imensionalitatea atelor e intrare. Liniile următoare in fișier conțin câte un punct cu cooronate. Calculați vectorul cu valorile meii și scăeți-l in punctele e intrare. 2. Calculați matricea e covarianță ca un prous e matrice. 3. Efectuați escompunerea în valori proprii a matricei e covarianță apelân funcţia in librărie. 4. Afișați valorile proprii. 5. Calculați coeficienții PCA și aproximarea X e orinul (folosin primele valori proprii) pentru atele e intrare. 6. Calculați valoarea meie a iferenței absolute intre punctele originale și aproximarea lor utilizân primele componente principale. 7. Găsiți minimele și maximele pe coloanele matricei e coeficienți. 8. Pentru atele e intrare in fișierul pca2.txt, afisati coeficienţii PCA in primele ouă coloane ca puncte negre 2D pe funal alb. Pentru a obține cooronate pozitive scăeți valorile minime. 9. Pentru atele e intrare in fișierul pca3.txt, afişaţi coeficienţii PCA in primele trei coloane sub forma unei imagini grayscale. Utilizați primele 2 componente ca și cooronatele x și y, iar cea e-a treia valoare ca intensitate în punctul (x, y). Pentru a obține cooronate pozitive trebuie să scăeți valoarea minimă in primele ouă cooronate. Normalizați a treia componentă astfel încât să ia valori între 0:255. 10. Determinați automat numărul e componente principale care trebuie să fie păstrate astfel încât să se reţină un anumit procent in varianța inițială. De exemplu, găsiți valoarea lui pentru care aproximarea e orinul reține 99% in varianța inițială. Procentajul varianței păstrate este at e λ i λ i. 6. Bibliografie [1] Wiipeia article PCA - https://en.wiipeia.org/wii/principal_component_analysis [2] Stanfor Machine Learning course notes - http://cs229.stanfor.eu/notes/cs229-notes10.pf [3] Linsay Smith - PCA tutorial - http://faculty.iiit.ac.in/~mrishna/principalcomponents.pf [4] PCA in R (animation of projection) - https://poissonisfish.worpress.com/2017/01/23/principal-component-analysis-in-r/