PAS cap. 2: Reprezentări rare p. 1/35 Prelucrarea avansată a semnalelor Capitolul 2: Reprezentări rare Bogdan Dumitrescu Facultatea de Automatică şi C

Documente similare
METODE NUMERICE ÎN INGINERIE

LUCRAREA 8 PROGRAMAREA NELINIARĂ ÎN REZOLVAREA PROBLEMELOR DIN ENERGETICĂ. METODE DE ORDINUL Aspecte generale Programarea neliniară are o foart

Aproximarea functiilor prin metoda celor mai mici patrate

Calcul Numeric

Ecuatii si sisteme de ecuatii neliniare 1 Metoda lui Newton Algorithm 1 Metoda lui Newton pentru ecuaţia f(x) = 0. Date de intrare: - Funcţia f - Apro

Modelarea si Simularea Sistemelor de Calcul

Microsoft Word - cap1p4.doc

Cursul 8 Funcţii analitice Vom studia acum comportarea şirurilor şi seriilor de funcţii olomorfe, cu scopul de a dezvălui o proprietate esenţială a ac

Microsoft Word - 2 Filtre neliniare.doc

Capitole Speciale de Informatică Curs 4: Calculul scorurilor în un sistem complet de extragere a informaţiilor 18 octombrie 2018 Reamintim că în cursu

ALGORITMICĂ. Seminar 3: Analiza eficienţei algoritmilor - estimarea timpului de execuţie şi notaţii asimptotice. Problema 1 (L) Să se determine număru

Cursul 12 (plan de curs) Integrale prime 1 Sisteme diferenţiale autonome. Spaţiul fazelor. Fie Ω R n o mulţime deschisă şi f : Ω R n R n o funcţie de

Microsoft Word - TIC5

Microsoft Word - Algoritmi genetici.docx

Dorel LUCHIAN Gabriel POPA Adrian ZANOSCHI Gheorghe IUREA algebră geometrie clasa a VIII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA

PROGRAMA CONCURSULUI NAŢIONAL

COMENTARII FAZA JUDEŢEANĂ, 9 MARTIE 2013 Abstract. Personal comments on some of the problems presented at the District Round of the National Mathemati

Spatii vectoriale

1

I

Diapositive 1

Fisa MMC IA

Gheorghe IUREA Adrian ZANOSCHI algebră geometrie clasa a VII-a ediţia a V-a, revizuită mate 2000 standard EDITURA PARALELA 45 Matematică. Clasa a VII-

Şiruri de numere reale Facultatea de Hidrotehnică Universitatea Tehnică Gheorghe Asachi Iaşi, 2015 Analiză Matematică Lucian Maticiuc 1 / 29

Universitatea Politehnica din Bucureşti 2019 Disciplina: Geometrie şi Trigonometrie G1 * Varianta A 1. Ştiind cos x = 3 2, atunci sin2 x

Calcul Numeric

Slide 1

CURBE BÉZIER În CAGD se utilizează adesea curbele polinomiale, adică acele curbe definite de o parametrizare polinomială: C : [a, b] R 3 C(t) = (x(t),

Cuantizare Vectoriala.doc

MD.09. Teoria stabilităţii 1

Laborator 4 Modele sistemice liniare. Reprezentare numerică. Conversii. Conexiuni 4.1 Tema Formarea deprinderilor de utilizare a convenţiilor MATLAB d

Microsoft Word - probleme_analiza_numerica_ses_ian09.rtf

gaussx.dvi

Tiberiu Trif Analiză matematică 2 Calcul diferențial și integral în R n

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de

Algebra si Geometri pentru Computer Science

Metode Numerice

Analiză de flux de date 29 octombrie 2012

Pattern Recognition Systems

Aero-BCD, , Prof. L. Costache & M. Olteanu Notițe de Adrian Manea Seminar 5 Șiruri și serii de funcții. Serii de puteri 1 Șiruri de funcții D

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Subiectul 1

carteInvataturaEd_2.0_lectia5.pdf

rrs_12_2012.indd

DAN LASCU ADRIANA-LIGIA SPORIŞ ANDA OLTEANU PAUL VASILIU MATEMATICĂ. CULEGERE DE PROBLEME TIP GRILĂ PENTRU ADMITEREA ÎN ACADEMIA NAVALĂ MIRCEA CEL BĂT

Analiză statică Analiza fluxului de date 23 octombrie 2014

1. Găsiți k numerele cele mai apropiate într-un şir nesortat Dându-se un şir nesortat și două numere x și k, găsiți k cele mai apropiate valori de x.

CONCURSUL NAŢIONAL DE MATEMATICA PANAITOPOL EDIŢIA a X-a, TULCEA, 21 aprilie 2018 Clasa a VII - a 1. Se consideră numerele reale x, y şi z, cel puţin

Clasa IX 1. O lăcustă face salturi, fiecare salt în linie dreaptă şi de două ori mai lung ca precedentul. Poate vreodată lăcusta să revină în punctul

E_d_Informatica_sp_MI_2015_bar_02_LRO

Examenul de bacalaureat 2012

BAC 2007 Pro Didactica Programa M1 2 Rezolvarea variantei 36 versiune finală Redactia Pro Didactica Suportul pe net:

E_d_Informatica_sp_SN_2014_bar_10_LRO

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

Microsoft Word - D_ MT1_II_001.doc

Retele Petri si Aplicatii

Examenul de bacalaureat 2012

Examenul de bacalaureat 2012

Microsoft Word - FiltrareaNyquist-rezumat.doc

Noțiuni matematice de bază

20 SUBIECTE DE EXAMEN - De fapt, în pofida acestor probleme, până la urmă tot vom logaritma, căci aceasta este tehnica naturală în context. Trebuie do

Pachete de lecţii disponibile pentru platforma AeL

Subiecte

ep0264

Logică și structuri discrete Limbaje regulate și automate Marius Minea marius/curs/lsd/ 24 noiembrie 2014

Microsoft Word - Tematica examen AIS.doc

Microsoft Word - C05_Traductoare de deplasare de tip transformator

PROBLEME PRIVIND INSTABILITATEA UNOR CALCULE ALE MECANISMELOR

Microsoft Word - Matematika_kozep_irasbeli_javitasi_0911_roman.doc

Slide 1

Microsoft Word - Tema 06 - Convertoare analog-numerice.doc

OPERATII DE PRELUCRAREA IMAGINILOR 1

Lecții de pregă,re la informa,că Admitere 2019 Tema: Discutarea problemelor date la ul,mele sesiuni de admitere Bogdan Alexe

Microsoft PowerPoint - Curs_SDA_9_RO_2019_v2.pptx

D.Rusu, Teoria măsurii şi integrala Lebesgue 6 MĂSURA LEBESGUE Cursul 5 Teorema 6.26 Există submulţimi ale lui R care nu sunt măsurabile Lebesgue. Dem

PowerPoint Presentation

ALGORITMII ŞI REPREZENTAREA LOR Noţiunea de algoritm Noţiunea de algoritm este foarte veche. Ea a fost introdusă în secolele VIII-IX de către Abu Ja f

CURRICULUM VITAE

Prelegerea 4 În această prelegere vom învăţa despre: Algebre booleene; Funcţii booleene; Mintermi şi cuburi n - dimensionale. 4.1 Definirea algebrelor

Calcul Numeric

Baze de date Anul 2 Teorie Examen 1. Diagrama entitate/relatie si diagrama conceptuala (curs 2-5) 2. Arbore algebric si expresie algebrica (curs 6-10)

Cursul 7 Formula integrală a lui Cauchy Am demonstrat în cursul precedent că, dacă D C un domeniu simplu conex şi f : D C o funcţie olomorfă cu f cont

2

Microsoft Word - matem_aplicate in Economie aa FD Bala.doc

OPTIMIZĂRI ÎN SISTEMELE ENERGETICE APLICAȚII PRACTICE

Slide 1

Logică și structuri discrete Logică propozițională Marius Minea marius/curs/lsd/ 3 noiembrie 2014

Laborator 1-Teoria probabilitatilor si statistica matematica Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 1 P

Electricitate II

Cursul 13 Mulţimi Julia Fie f : C C o funcţie complexă şi fie f n = f f f iterata de ordin n a lui f. Peste tot în continuare vom presupune că f este

Generarea semnalelor standard 1 Scopul lucrării Familiarizarea cu modul de generare şi reprezentare în mediul Matlab a semnalelor de test, considerate

Microsoft Word - Matematika_kozep_irasbeli_jav_utmut0513V28_roman.doc

C:/Users/Lenovo/Dropbox/activitate matematica/cursuri/MS ETTI /msetti.dvi

Metode de sortare - pregătire admitere - Conf.dr. Alexandru Popa Lect. dr. Andrei Pătraşcu Universitatea din Bucureşti 1

Microsoft Word - Lab1a.doc

SUBPROGRAME

BAC 2007 Pro Didactica Programa M1 2 Rezolvarea variantei 61 versiune finală Redactia Pro Didactica Suportul pe net:

C10: Teoria clasică a împrăștierii Considerăm un potențial infinit în interiorul unui domeniu sferic de rază a și o particulă incidentă (Figura 1) la

Secţiunea 5-6 începători Concurs online de informatică Categoria PROGRAMARE PROBLEMA puncte PERIODIC Se citește un număr natural nenul N. Se ump

Transcriere:

PAS cap. 2: Reprezentări rare p. 1/35 Prelucrarea avansată a semnalelor Capitolul 2: Reprezentări rare Bogdan Dumitrescu Facultatea de Automatică şi Calculatoare Universitatea Politehnica Bucureşti

PAS cap. 2: Reprezentări rare p. 2/35 Cuprins Soluţii rare ale sistemelor liniare: definiţii, unicitate Soluţii rare aproximative Algoritmi lacomi (greedy) Matching pursuit Algoritmi cu ortogonalizare Relaxări convexe (basis pursuit) CMMP reponderate iterativ Proiectarea dicţionarului (bazei) Exemple de aplicaţii

PAS cap. 2: Reprezentări rare p. 3/35 Problema Problema studiată în acest capitol: găsirea unei soluţii rare pentru sistemul liniar Ax = b Matricea A are dimensiune m N De obicei m < N, adică sistemul este subdeterminat şi, în general, are o infinitate de soluţii Soluţie rară: x are "puţine" elemente nenule Soluţia cea mai rară: cea cu cel mai mic număr de elemente nenule Orice sistem liniar subdeterminat are (cel puţin) o cea mai rară soluţie, dar ea nu este obligatoriu rară, adică poate avea multe elemente nenule

PAS cap. 2: Reprezentări rare p. 4/35 Interpretare Coloanele matricei A sunt vectori într-o bază supracompletă (numită şi dicţionar) Aici bază se foloseşte în sensul larg, de mulţime de vectori reprezentativi Căutăm reprezentarea vectorului b cu un număr cât mai mic de vectori din bază Motiv: în realitate, multe semnale utile, transformate în spaţii adecvate (de exemplu cu DCT sau DWT) au reprezentări (aproximativ) rare în cel puţin unul din acele spaţii Reprezentarea rară produce informaţie condensată asupra lui b, care poate fi folosită pentru compresie, eliminarea zgomotului, etc. Concatenând mai multe baze (DCT+DWT, de exemplu), se obţine un dicţionar care poate acoperi mai multe categorii de semnale

PAS cap. 2: Reprezentări rare p. 5/35 Comentarii Problema găsirii celei mai rare soluţii este NP-completă, deci în esenţă necesită căutare exhaustivă În practică, problema se relaxează (vom vedea mai târziu cum) la căutarea unei soluţii rare aproximative (Ax b) Cercetarea recentă (problema aproape că nu a fost studiată înainte de anul 1990) are două direcţii majore (Teorie:) formularea unor condiţii de unicitate a soluţiei celei mai rare (i.e. optimă) şi de evaluare a optimalităţii unei soluţii date (Implementare:) descrierea unor algoritmi rapizi (i.e. în timp polinomial) care să găsească soluţia cea mai rară suficient de des

PAS cap. 2: Reprezentări rare p. 6/35 Norma 0 "Norma" l 0, notată x 0, este numărul de elemente nenule ale vectorului x Nu este o normă pentru că nu satisface inegalitatea αx = α x, α 0 Într-adevăr, αx 0 = x 0 pentru α 0 (înmulţirea cu un scalar nu modifică numărul de elemente nenule ale unui vector) Altfel, inegalitatea triunghiului x + y 0 x 0 + y 0 este satisfăcută în general (suma a doi vectori nu poate avea mai multe elemente nenule decât fiecare vector în parte) Mai mult, funcţia 0 este discontinuă, deci nu este convexă

PAS cap. 2: Reprezentări rare p. 7/35 Unicitate rezultate teoretice spark(a): numărul minim de coloane liniar dependente ale matricei A Pentru multe baze (de exemplu generate aleator), spark(a) = m + 1 (adică orice n coloane sunt liniar independente) Teoremă: dacă o soluţie a sistemului Ax = b satisface x 0 < spark(a)/2, atunci este cea mai rară Demonstraţie: fie y o soluţie mai rară. Atunci x y 0 < spark(a). Dar A(x y) = 0, ceea ce contrazice definiţia spark(a) Utilitatea rezultatului este limitată: calcularea spark(a) este mai dificilă decât rezolvarea sistemului

PAS cap. 2: Reprezentări rare p. 8/35 Coerenţă mutuală Coerenţa mutuală a unei matrice A este µ(a) = max i j a T i a j a i a j E o măsură a celui mai mic unghi între două coloane ale matricei (cu atât mai aproape de 1 cu cât unghiul e mai mic) Cu cât N creşte (m fiind constant), µ(a) se apropie de 1 (spre deosebire de spark, care poate rămâne m + 1) Se poate demonstra că spark(a) 1 + 1 µ(a) Deşi dă margini mai pesimiste privind raritatea, coerenţa mutuală se poate calcula uşor

PAS cap. 2: Reprezentări rare p. 9/35 Problemă de optimizare Vectorul x R N este rar dacă x 0 N (pe noi ne interesează ca x 0 m) Găsirea soluţiei celei mai rare poate fi formulată ca o problemă de optimizare min x x 0 c.r. Ax = b (1) Asta nu simplifică problema, dar poate conduce la aproximarea ei Problema (1) nu este convexă Mai rău, funcţia x 0 este discontinuă

PAS cap. 2: Reprezentări rare p. 10/35 Normele p Norma 0 poate fi văzută ca o limită a normelor p x 0 = lim p 0 x p p = lim p 0 m x k p k=1 Pentru 0 < p < 1, norma p nu mai este o funcţie convexă, deci de fapt nu mai este o normă Graficul lui x p, pentru p = 2,1,0.5,0.1 (negru, albastru, magenta, roşu) 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 2 1.5 1 0.5 0 0.5 1 1.5 2

PAS cap. 2: Reprezentări rare p. 11/35 Soluţii aproximative În practică, datele sunt afectate de erori, deci, chiar dacă sistemul Ax = b ar avea o soluţie rară, ea n-ar putea fi găsită De aceea se modifică problema (1) în min x x 0 c.r. Ax b δ (2) De obicei, toleranţa δ este aleasă empiric Tipic se utilizează norma 2 în restricţia din (2) Problema nu se simplifică, adică e la fel de greu de rezolvat ca (1), şi este mai greu de caracterizat teoretic

PAS cap. 2: Reprezentări rare p. 12/35 Tipuri de algoritmi Două categorii mari de algoritmi pentru rezolvarea problemei (2), algoritmi lacomi şi aproximări (relaxări) convexe Algoritmii lacomi (greedy) selectează coloanele lui A (vectorii bazei) una câte una, de fiecare dată alegând-o pe cea mai "promiţătoare" Algoritmi: matching pursuit, orthogonal matching pursuit, greedy LS Relaxările convexe se obţin înlocuind norma 0 cu o funcţie convexă, de exemplu cu x 1 (care e cea mai apropiată normă convexă) Algoritmi: basis pursuit

PAS cap. 2: Reprezentări rare p. 13/35 Matching pursuit ideea Pentru simplitate (şi fără pierderea generalităţii), presupunem a i 2 = 1, adică vectorii din bază sunt normaţi Algoritmul matching pursuit (MP) a fost propus în 1993 de Mallat & Zhang, dar era cunoscut dinainte în alte domenii MP construieşte iterativ mulţimea indicilor I ai elementelor nenule, adăugând câte un indice la fiecare iteraţie Se porneşte de la soluţia nulă (I = ), pentru care reziduul sistemului Ax = b este r def = b Ax = b Ideea MP: coloana care aproximează cel mai bine reziduul este cea care face unghiul cel mai mic cu acesta, deci este coloana k pentru care a T k r = max i=1:n at i r

PAS cap. 2: Reprezentări rare p. 14/35 MP procesul iterativ Eroarea de aproximare este r x k a k şi e minimizată de x k = (a T k a k) 1 a T k r = at k r Se introduce k în I şi se calculează noul reziduu r r (a T k r)a k Se trece la iteraţia următoare, căutând din nou coloana cea mai apropiată de reziduu Criteriu de oprire: norma reziduului este mai mică decât δ, caz în care a fost găsită o soluţie pentru (2) Criteriu alternativ: numărul de coloane selectate atinge o valoare prestabilită (ne interesează mai mult numărul de elemente nenule din x decât eroarea)

PAS cap. 2: Reprezentări rare p. 15/35 MP algoritmul Intrare: matricea A R m N, vectorul b R m, toleranţa δ 1. l = 1, I =, r (0) = b, x = 0 2. Caută coloana cea mai aproape de reziduu 3. I I {k l } k l = arg max i=1:n at i r (l 1) (3) 4. Coeficientul curent al soluţiei: x kl = a T k l r (l 1) 5. Noul reziduu: r (l) r (l 1) (a T k l r (l 1) )a kl 6. Dacă r (l) 2 > δ, pune l l + 1 şi reia de la 2 Ieşire: soluţia x (cu l elemente nenule)

PAS cap. 2: Reprezentări rare p. 16/35 Comentarii Nu există nici o garanţie a optimalităţii algoritmului Reziduul r (l) este prin construcţie ortogonal pe vectorul a kl Totuşi, în general, nu este ortogonal pe vectorii selectaţi anterior (cum ar fi într-o soluţie CMMP) Deci nu se garantează optimalitate nici în sensul următor: dată o mulţime I de indici, algoritmul produce soluţia CMMP a sistemului A I x I = b, unde A I este submatricea lui A cu coloanele având indici din I Deci nu se minimizează A I x I b 2, chiar dacă mulţimea I este aleasă optim De fapt, algoritmul nici măcar nu garantează că o coloană nu este selectată de mai multe ori Număr de operaţii: O(mN) pe iteraţie, în (3)

PAS cap. 2: Reprezentări rare p. 17/35 Variantă de implementare Dacă o matrice A este folosită pentru rezolvarea multor sisteme, se pot precalcula produsele scalare între coloane a T i a j, 1 i < j N Costul este O(mN 2 ), dar apare o singură dată Produsele scalare între coloane şi reziduul curent se pot calcula la fiecare iteraţie prin a T i r (l) a T i r (l 1) (a T k l r (l 1) )(a T i a kl ), i = 1 : N Sunt necesare O(N) operaţii la fiecare iteraţie pentru calculul maximului (3), elementului x kl şi actualizării produselor scalare de mai sus La început sunt necesare O(mN) operaţii pentru iniţializarea produselor a T i r(l) = a T i b

PAS cap. 2: Reprezentări rare p. 18/35 Soluţia CMMP pentru suport dat Dacă suportul (indicii elementelor nenule) I este disponibil (printr-o metodă neprecizată), atunci soluţia sistemului A I x I = b (adică x I care minimizează A I x I b 2 ) se calculează folosind triangularizarea ortogonală Sistemul este supradeterminat fiindcă I < m (x e rar) Algoritmul are deci structura tipică (pres. I ordonată) 1. pentru l = 1 : I (k l este indicele l din I) 1. Calculează reflectorul Householder U l astfel încât U l a kl este zero în poziţiile l + 1 : m 2. Actualizează A I U l A I, b U l b 2. Rezolvă sistemul triunghiular A I x I = b Mulţimea I nu trebuie să fie disponibilă toată de la început, e suficient să apară un nou indice în fiecare iteraţie În acest caz, noua coloană trebuie actualizată cu reflectorii Householder anteriori

PAS cap. 2: Reprezentări rare p. 19/35 Soluţie CMMP cu selecţie separată a coloanelor Orice algoritm de selecţie a indicilor din I poate fi utilizat în acest context Structura algoritmului devine 0. Iniţializează l = 1, A I = [], r = b, b = b 1. cât timp r > δ 1. Selectează un nou indice k l 2. a kl U kl 1...U 1 a kl 3. A I [A I a kl ] 4. Calculează reflectorul Householder U l astfel încât U l a kl este zero în poziţiile l + 1 : m 5. Actualizează A I U l A I, b U l b 6. Rezolvă sistemul triunghiular A I x I = b 7. Calculează reziduul r = b Ax 8. l l + 1

PAS cap. 2: Reprezentări rare p. 20/35 Comentarii În 1.7, reziduul e calculat folosind datele iniţiale ale sistemului, adică A şi b A I şi b sunt actualizate cu transformările ortogonale Soluţia x de la pasul l are elementele nenule egale cu valorile din x I Calculele se pot eficientiza în funcţie de procedura de selecţie şi se pot organiza astfel încât să fie O(mN) operaţii pe iteraţie

PAS cap. 2: Reprezentări rare p. 21/35 Orthogonal Matching Pursuit OMP foloseşte aceeaşi procedură de selecţie a indicilor I ca MP În general, dă rezultate mult mai bune decât MP Calculul soluţiei CMMP permite micşorarea reziduului; la rândul lui, un reziduu mai mic permite selectarea unui suport mai adecvat Complexitatea OMP este de acelaşi ordin de mărime cu complexitatea MP Nu există garanţii generale de optimalitate Caz special: dacă soluţia sistemului Ax = b satisface x 0 1 2 ( 1 + 1 ) µ(a) atunci ea este găsită de OMP cu δ = 0

PAS cap. 2: Reprezentări rare p. 22/35 Greedy Least Squares În algoritmul GLS (numit şi optimized OMP sau orthgonal LS), la fiecare iteraţie se alege coloana care adăugată la I minimizează norma reziduului sistemului A I x I = b Deci, spre deosebire de OMP, care selectează coloana curentă considerând doar relaţia ei directă cu reziduul, GLS tine cont explicit de alegerile anterioare Algoritmul poate fi implementat eficient ca o factorizare QR cu pivotare, costul fiind O(mN) pe iteraţie Poate da rezultate mai bune decât OMP, din nou fără garanţii generale de optimalitate

PAS cap. 2: Reprezentări rare p. 23/35 Relaxări convexe Cea mai simplă relaxare convexă a problemei (2) se obţine prin utilizarea normei 1 în loc de "norma" 0 min x Wx 1 c.r. Ax b 2 δ (4) Matricea constantă W are rol de ponderare; W este diagonală, cu elementele diagonale pozitive; în lipsa unor informaţii care să permită o alegere adecvată, se ia W = I Problema (4) este convexă (criteriul se poate exprima cu restricţii liniare, restricţia este de tip con de ordinul doi) Tipic, soluţia problemei (4) nu este rară, dar are multe elemente foarte mici (în modul) Forţând aceste elemente la zero se obţine o soluţie rară fără a modifica semnificativ norma reziduului

PAS cap. 2: Reprezentări rare p. 24/35 Exemplu Figura: soluţia problemei (4) pentru date generate aleator, cu N = 40, m = 10, δ = 1 Coeficienţii lui x sunt ordonaţi în ordine descrescătoare a modulelor Sunt 6 coeficienţi semnificativi, restul neglijabili 10 0 10 2 10 4 10 6 10 8 10 10 10 12 0 5 10 15 20 25 30 35 40 Coeficienţi soluţie, sortaţi

PAS cap. 2: Reprezentări rare p. 25/35 Optimalitate În general, nu există garanţii de optimalitate; totuşi, soluţia sistemului Ax = b este şi soluţia problemei (4) cu δ = 0, dacă x 0 1 ( 1 + 1 ) 2 µ(a) Figura: soluţia (4) pentru date generate astfel încât x să aibă 3 elemente nenule (şi δ = 0) 10 2 10 0 10 2 10 4 10 6 10 8 10 10 10 12 0 5 10 15 20 25 30 35 40 Coeficienţi soluţie, sortaţi

PAS cap. 2: Reprezentări rare p. 26/35 Formulare alternativă O alternativă la (4) este problema min x Ax b 2 + λ Wx 1 (5) Ponderea λ corespunde unei alegeri a toleranţei δ (care depinde însă şi de A şi b) Practic, alegerea unor constante λ sau δ potrivite este o problemă destul de dificilă, rezolvată eminamente empiric Avantajul formulării (5) este lipsa restricţiilor Problemele (4) şi (5) sunt numite basis pursuit Atunci când matricea A este mare, metodele de optimizare convexă pot deveni lente şi sunt înlocuite cu metode (mai mult sau mai puţin) euristice

PAS cap. 2: Reprezentări rare p. 27/35 CMMP reponderate iterativ ideea de bază Problemele în care apar diverse norme p pot fi rezolvate iterativ prin probleme CMMP ponderate Motivul: problemele CMMP se rezolvă uşor numeric Pentru o problemă cu variabila x R n, se face aproximarea x p p = n x i p i=1 n x i p 2 x i 2 i=1 În procesul iterativ, x este variabila curentă, iar x este valoarea variabilei disponibilă de la pasul precedent Variabila x apare pătratic în aproximaţie Atunci când x = x, formula de mai sus este exactă. Un proces iterativ în care aproximaţia este folosită pentru optimizare, iar la sfarşitul fiecărei iteraţii se pune x = x, poate converge spre soluţie (fără garanţii generale)

PAS cap. 2: Reprezentări rare p. 28/35 Cazul normei 1 În cazul normei 1, formula de aproximare devine x 1 = n x i i=1 n x i 1 x i 2 = x T X 1 x i=1 Matricea X este diagonală, cu elementele diagonale egale cu x i Presupunând că dispunem de o soluţie aproximativă x pentru problema (5), o aproximaţie x (probabil) mai bună se obţine minimizând funcţia pătratică convexă (A x b) T (A x b) + λ x T WX 1 x (6) Anulând gradientul, minimul este soluţia sistemului (A T A + λwx 1 ) x = A T b

PAS cap. 2: Reprezentări rare p. 29/35 CMMP reponderate iterativ pentru basis pursuit Dacă x i 0 (ceea ce dorim pentru majoritatea elementelor!), atunci x i 1 devine foarte mare, ceea ce poate pune probleme numerice Soluţie posibilă: înlocuim x i 1 cu ( x i + η) 1, unde η este o constantă mică Algoritmul CMMP reponderate iterativ are forma 0. Date de intrare: A, b, λ, W, η, ε (toleranţă de oprire) 1. Iniţializează x 2. Pune X = diag( x + η) 3. Rezolvă sistemul (A T A + λwx 1 ) x = A T b 4. Dacă x x < ε, stop, soluţia este x 5. Altfel, pune x = x şi reia de la 2

PAS cap. 2: Reprezentări rare p. 30/35 Comentarii Convergenţa se atinge atunci când diferenţa dintre soluţiile calculate la iteraţii consecutive este mică Trebuie prevăzut un număr maxim de iteraţii, pentru cazul în care algoritmul nu converge (de obicei converge!) Sistemul de la pasul 3 poate fi rezolvat doar aproximativ, de exemplu folosind câţiva paşi ai unei metode iterative (e.g. gradient conjugat) În acest caz nu este necesară formarea matricei A T A, ci doar înmulţirea ei cu diverşi vectori

PAS cap. 2: Reprezentări rare p. 31/35 Alegerea dicţionarului Până acum am presupus că dicţionarul (baza supracompletă formată din coloanele matricei A) este dat Ne punem acum problema alegerii (proiectării) matricei A, astfel încât să fie adecvată reprezentării rare a semnalelor dintr-o anume clasă Alegerea cea mai simplă este prin concatenarea unor baze ortogonale, A = [Φ 1 Φ 2... ], cu Φ i R m m matrice ortogonale De exemplu, aceste baze pot fi cele standard: Φ 1 = I, adică baza temporală standard Φ 2 matricea de transformare DCT sau DFT Φ 3 o transformare wavelet, etc.

PAS cap. 2: Reprezentări rare p. 32/35 Proiectarea dicţionarului Alternativ, dicţionarul se poate obţine prin optimizare El poate fi structurat, în sensul că (de exemplu) este format din matrice ortogonale care depind de câţiva parametri În cazul extrem, vectorii dicţionarului sunt complet liberi Proiectarea se face având la dispoziţie un set de vectori de antrenare b l, l = 1 : L, cu L suficient de mare Se presupune implicit că există o bază supracompletă A în care soluţiile sistemelor Ax l = b l sunt rare (dacă nu toate, măcar o bună parte)

PAS cap. 2: Reprezentări rare p. 33/35 Problema de optimizare Inspirându-ne din (4), putem formula proiectarea dicţionarului ca problema de optimizare min A,x l L l=1 x l 0 c.r. Ax l b l 2 δ, l = 1 : L (7) Optimizarea dicţionarului este evident mai dificilă decât găsirea unei reprezentări rare, deci rezolvarea problemei (7) se poate face doar prin metode euristice Algoritmi de rezolvare: MOD (method of directions), K-SVD Discutăm doar principial algoritmul MOD

PAS cap. 2: Reprezentări rare p. 34/35 Algoritmul MOD ideea Dacă A ar fi fixat, atunci în (7) variabilele x l ar fi decuplate, deci pentru fiecare l, soluţia rară x l ar putea fi găsită prin metodele discutate anterior (matching pursuit, basis pursuit) Notăm X = [x l ] l=1:l, B = [b l ] l=1:l Dacă soluţiile x l ar fi cunoscute, atunci A ar putea fi găsit prin rezolvarea problemei CMMP AX = B (Se minimizează astfel AX B F ) Ideea de optimizare: se porneşte cu un dicţionar iniţial A 0 Presupunând A k 1 cunoscut (iniţial k = 1), se calculează X k în funcţie de A k 1 folosind algoritmi pentru reprezentări rare Se află A k minimizând A k X k B F Se pune k k + 1 şi se repetă operaţiile de mai sus până la convergenţă

PAS cap. 2: Reprezentări rare p. 35/35 Exemple de aplicaţii Mai târziu, eventual doar la tablă!