Capitoll 4 TRASFORMĂRI DE IMAGII 4. ITRODUCERE Termenl de transformări de imagini se referă la clasa matricilor nitare tilizate în reprezentarea imaginilor. La fel cm n semnal nidimensional poate fi reprezentat prin serii de fncţii ortogonale, o imagine se poate reprezenta printr-o serie de fncţii de bază ortogonale, în fncţie de n set de vectori de bază, nmit imagine de bază, set generat c ajtorl nor matrici nitare. Ca alternativă la reprezentarea sb formă matricială, o imagine de dimensini x poate fi considerată ăi ca vector de dimensine x. O transformare de imagini are ca rezltat n set de coordonate sa vectori de bază în acest spaţi vectorial. În cazl nidimensional, considerăm secvenţa: {(n), n } reprezentată de n vector de ordin. O transformare nitară a acesti vector se poate scrie ca: (4.) nde A - A *T este o matrice nitară. Rezltă, în acest caz: *T * A v sa (n) a (k,n)v(n), n (4.) n Coloanele li A *T, adică vectorii * * a {a (k,n), n }, k 63
Cap.4 Transformări de imagini se nmesc vectorii bazei li A. În figra 4. snt prezentaţi câţiva vectori de bază ai nor transformări ortogonale mai zale în prelcrările digitale de imagini. Seria coeficienţilor v(k) dă o reprezentare a secvenţei iniţiale (n) şi este tilă în filtrări, compresii de date, extragerea nor caracteristici şi alte tipri de analize de imagini. C o s i n s S i n s H a d a m a r d H a a r S l a n t K L T 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 Fig. 4. Vectori de bază ai nor transformări ortogonale 4. TRASFORMĂRI UITARE ORTOGOALE BIDIMESIOALE În prelcrarea digitală a imaginilor, se poate considera o pereche de transformări bidimensionale ortogonale, ca fiind dezvoltările în serii ortogonale ale imaginii x date de: şi v(k,l) a k,l(m,n) (m,n), k,l (4.3) m n 64
PRELUCRAREA DIGITALĂ A IMAGIILOR * (m,n) a k,l(m,n) v(k,l), k,l (4.4) l nde v(k,l) snt coeficienţii transformării, iar V{v(k,l)} se nmeşte imaginea transformată. Mlţimea {a k,l (m,n)} este nmită transformarea imaginii şi este n set de fncţii de bază discrete, ortogonale, care satisface rmătoarele proprietăţi: * ortonormalitate: a ( m, n) a ( m', n') δ( k k', l l') m n kl, k', l' (4.5) * completitdine: a ( m, n) a ( m', n') δ( m m', n n') l kl, kl, (4.6) Proprietatea de ortonormalitate asigră că orice dezvoltare în serie trnchiată de forma: P Q * P,Q (m,n) a k,l (m,n) v(k,l), P,Q (4.7) l minimizează sma erorilor medii pătratice: σ e [(m,n) P,Q(m,n)] (4.8) m n nde coeficienţii v(k,l) snt daţi de relaţia (4.3). Proprietatea de completitdine asigră că eroarea va fi nlă în cazl PQ: σ e Transformări nitare separabile dac` P Q mărl mltiplicărilor şi adnărilor necesare calclli coeficienţilor v(k,l) ai transformării este O( 4 ) ăi este prea mare pentr necesităţile practice. Acest nmăr se redce la O( 3 ) dacă se impne ca transformarea să fie separabilă, adică: akl, ( m, n) ak( m) b ( n) a( k, m) b( l, n) (4.9) nde {a k(m), k,..., } [i {b (n),l,..., } snt setrile complete ortonormale de vectori ai bazei. Impnând condiţiile anterioare (4.5) şi (4.6) rezltă matricile: A {(, a k m)} şi B {(, b l n)} care snt matrici nitare, adică: *T T * *T T * AA A A I, BB + B B I (4.) Dacă vom alege B identic c A (caz des întâlnit), atnci relaţiile (4.3) şi (4.4) se redc la: v(k,l) a(k,m) (m,n) a(l,n), sa V AUA T (4.) m n * * *T (m,n) a (k,m) v(k,l) a (l,m), sa U A VA n l (4.) Dacă imaginea n este pătratică, ci dreptnghilară de dimensini Mx, perechea de transformări de imagine devine: 65
Cap.4 Transformări de imagini 66 V A UA (4.3) M *T *T U A VA (4.4) nde A M şi A snt matrici nitare de dimensini MxM şi respectiv x. Transformările bidimensionale separabile snt cele mai frecvent tilizate. Relaţiile (4.) şi (4.) pot fi scrise: T T T V AUA, V A[AU] (4.5) ceea ce înseamnă că se transformă mai întâi fiecare coloană a matricii U şi aspra rezltatli obţint se face o transformare a fiecărei linii. 4.3 PROPRIETĂŢI ALE TRASFORMĂRILOR UITARE Conservarea energiei În transformări nitare de forma v A c v M, se poate dovedi şor că: *T *T *T *T v v(k) v v A A n ( ) (4.6) respectiv o transformare nitară conservă energia semnalli sa, ceea ce este echivalent, lngimea vectorli în spaţil vectorial n-dimensional rămâne constantă. Aceasta înseamnă că orice transformare nitară este, de fapt, o simplă rotaţie a vectorli în spaţil -dimensional. C alte cvinte, se poate spne că o transformare nitară realizează o rotaţie a coordonatelor de bază, iar componentele li v snt proiecţiile li în noa bază. În mod similar, pentr transformări bidimensionale de tipl celor prezentate în relaţiile (4.3) şi (4.4), respectiv (4.) şi (4.), este valabilă relaţia: mn, mn (, ) vkl (, ) kl, Compactarea energiei şi varianţa coeficienţilor n (4.7) Majoritatea transformărilor nitare a tendinţa de împachetare (compactare) a nei importante părţi a energiei imaginii într-n nmăr relativ mic de coeficienţi ai transformatei imaginii. Dat fiind că energia totală se conservă, rezltă că o mare parte a coeficienţilor vor conţine o cantitate foarte mică de energie. Dacă notăm c µ şi R valoarea medie şi covarianţa ni vector, mărimile corespnzătoare ale vectorli transformat v snt date de: µ E[ v] E[ A] AE[ ] A µ (4.8) adică: v * T * T * T * T R E[( v µ )( v µ ) ] A( E[( µ )( µ ) ]) A A R A (4.9) v v v Varianţele coeficienţilor transformatei snt date de elementele diagonalei li R v, * T σ v k v k, k ( ) [ R ] [ AR A ] (4.) Ţinând cont de faptl că A este o transformare nitară, rezltă că: W * T * T * T µ ( k) µ µ µ A A µ µ ( n) (4.) v v v kk, n
PRELUCRAREA DIGITALĂ A IMAGIILOR sa * T σ ( k) Tr[ AR A ] Tr[ R ] σ ( n) (4.) v [ ( ) ] E[ ( n) ] n E v k (4.3) Energia medie E[ vk ( ) ] a coeficienţilor v(k) tinde să fie inegal distribită, chiar în cazl în care este egal distribită în secvenţa de intrare (n). Pentr n câmp aleator bidimensional (m,n), a cări valoare medie este µ (m,n) iar covarianţa este r(m,n;m',n'), coeficienţii transformării v(k,l) satisfac proprietăţile: şi n µ v( kl, ) akm (, ) aln (, ) µ ( mn, ) (4.4) [ v ] σ ( kl, ) Evkl (, ) µ ( kl, ) v m n m' n' m n * * akm (, ) aln (, ) rmnm (, ; ', n') a( km, ') a( ln, ') În cazl în care covarianţa li (m,n) este separabilă, adică: (4.5) rmnm (, ; ', n') r( mm, ') r ( nn, ') (4.6) atnci varianţele coeficienţilor transformării pot fi scrise ca prodse separabile: nde R {r (m,m')} şi R {r (n,n')}. * T * T [ ] [ ] σ ( kl, ) σ ( k) σ ( l) AR A AR A (4.7) v kk, ll, Decorelarea În cazl în care elementele vectorli de intrare snt înalt corelate, coeficienţii transformării tind să fie necorelaţi, respectiv termenii din afara diagonalei matricii de covarianţă R v tind să devină foarte mici în comparaţie c elementele de pe diagonală. Referitor la ltimele doă proprietăţi, transformarea Karhnen-Loeve este optimală, adică împachetează maximm de energie într-n nmăr dat de coeficienţi ai transformării şi, în acelaşi timp, îi decorelează complet. Pentr exemplificarea compactării energiei şi decorelării, să considerăm n vector de dimensini x, c valoare medie nlă,, care este transformat nitar în: 3 v R < < 3, nde ρ, ρ ρ Parametrl ρ măsoară corelaţia între () şi (). Covarianţa li v se obţine ca: + 3ρ / ρ / R v ρ / + 3ρ / Din expresia li R rezltă σ ( ) σ ( ) adică energia medie totală, având valoarea, este egal distribită între () ăi (). C toate acestea, σ ( ) + 3 ρ /, iar v 67
Cap.4 Transformări de imagini σ v () - 3 ρ /. Energia totală are valoarea, dar energia medie a li v() este mai mare decât a li v(). Dacă ρ,95, atnci 9,% din energia totală medie va fi împachetată în priml eăantion. Corelaţia dintre v() ăi v() este dată de: Ev [ ( ) v( )] ρ ρ v (,) σ v( ) σ v( ) 3 ( ρ ) 4 ceea ce reprezintă, în valoare absoltă, mai pţin decât ρ (dacă ρ <). Pentr ρ,95, se obţine ρ v (,),83, deci corelaţia între coeficienţii transformării s-a reds. În cazl în care vom aplica aceeaăi procedră pentr o transformare de dimensini x: A se obţine σ v ( ) + ρ, σ v () -ρ şi ρ v (,). Pentr ρ,95, n procentaj de 97,5% din energie va fi împachetată în v(). Mai mlt decât atât, coeficienţii v() ăi v() devin necorelaţi. Fncţii şi imagini de bază Diferenţa principală între diferite transformări nitare este dată de alegerea fncţiilor de bază, respectiv a liniilor matricii transformării. Aceste linii formează n set de vectori de bază într-n spaţi -dimensional. În mod normal, deşi orice set de asemenea vectori ortonormali poate fi folosit pentr a realiza o transformare liniară, se folosesc setri care derivă din aceeaşi fncţie de bază. Transformarea Forier, de exempl, foloseşte fncţia exponenţială complexă ca fncţie de bază - prototip. Faţă de aceasta, fncţiile individale de bază diferă nmai în frecvenţă. Orice vector din spaţi poate fi exprimat ca smă ponderată de vectori de bază de lngime nitară. Orice transformare nitară nidimensională (x) va corespnde, în consecinţă, nei rotaţii a ni vector în apaţil vectorial -dimensional. Prin generalizare, având în vedere că matricea corespnzătoare nei imagini de dimensini x poate fi considerată ca n vector de dimensini x, orice transformare nitară, separabilă, simetrică, bidimensională va corespnde rotaţiei ni vector în spaţil vectorial de dimensine. Transformarea bidimensională inversă poate fi imaginată ca o însmare a ni set de imagini de bază, convenabil ponderate, în vederea reconstririi imaginii. Fiecare element al matricii transformării reprezintă coeficientl c care se înmlţeşte imaginea de bază corespnzătoare. O imagine de bază poate fi generată prin transformarea inversă a nei matrici de coeficienţi conţinând nmai n singr element nenl, care este considerat nitar. De fapt, există asemenea matrici, care vor genera imagini de bază. În fond, imaginile de bază pot fi considerate ca n set de componente în care poate fi descompsă o imagine şi, totodată, blocrile componente din care poate fi reconstrită. Transformarea directă realizează descompnerea, prin determinarea coeficienţilor, iar transformarea inversă realizează reconstrcţia prin însmarea imaginilor de bază, ponderate c aceşti coeficienţi. / 68
PRELUCRAREA DIGITALĂ A IMAGIILOR Deoarece există o infinitate de setri de imagini de bază, vor exista, de asemenea, o infinitate de transformări. C toate acestea, n anmit set de imagini de bază prezintă importanţă nmai în contextl nei anmite transformări. 4.4 TRASFORMĂRI SIUSOIDALE Transformata Forier discretă nidimensională (DFT) Transformarea Forier (DFT) discretă a nei secvenţe {(n), n,..., -} se defineşte ca: v(k) (n) W kn, k,,... - (4.8) n nde: W π exp j (4.9) Transformarea DFT inversă este: kn (n) v(k)w, n,,... (4.3) Perechea de ecaţii (4.9), (4.3) n reprezintă transformări nitare şi, ţinând cont de faptl că în prelcrarea imaginilor este mlt mai convenabil să lcrăm c transformări nitare, vom considera perechea transformărilor DFT nitare, definite astfel: kn v(k) (n) W, k,,... - (4.3) n kn (n) v(k) W, n,,... (4.3) Prin rmare matricea nitară a DFT este: Proprietăţile transformării Forier discrete F W kn, k,n (4.33) Prezentăm, sccint, proprietăţile mai importante ale transformării Forier discrete: Simetria: matricile transformărilor DFT şi DFT nitare snt simetrice. Extensii: extensiile transformărilor DFT ăi DFT nitare ale nei secvenţe şi transformările lor inverse snt periodice, c perioada. Dacă în definiţia (4.3) parametrl k ia toate valorile întregi, secvenţa v(k) se dovedeşte periodică, adică v(k)v(k+), pentr orice valoare a li k. Algoritmi rapizi: transformările DFT şi DFT nitare pot fi implementate folosind algoritmi rapizi, în log operaţii (fiecare operaţie fiind o mltiplicare şi o adnare), folosind o clasă de algoritmi nmită transformarea Forier rapidă. mărl real de operaţii necesare depinde de şi de alegerea particlară a algoritmli din clasa respectivă. Cei mai zali algoritmi FFT necesită p (c p nmăr întreg pozitiv) operaţii. 69
Cap.4 Transformări de imagini Simetria conjgată: transformarea Forier discretă a secvenţei reale {x(n), n,...,-} este conjgată simetric în raport c /. Din relaţia (4.3) se obţine: (4.34) de nde rezltă imediat: n n * * ( k)n kn v (n k) (n) W (n) W v(k) v k v k, k,..., * + (4.35) şi v k v k + (4.36) Deci frecvenţele DFT /+k,,...,/- snt pr şi simpl frecvenţele negative sitare la ω(π/)(-/+k) în spectrl Forier al secvenţei finite {(n), n -}. De asemenea, din relaţiile (4.7) şi (4.34) se poate observa că v() şi v(/) a valori reale, astfel încât secvenţa reală v(), {R e, {v(k)},,...,/ - }, {i m {v(k),,...,/ - }, v(/) (4.37) defineşte complet transformarea Forier discretă a secvenţei (n). De aceea se poate spne că transformarea DFT sa DFT nitară a nei secvenţe reale de dimensine x are grade de libertate ăi necesită aceeaşi capacitate de memorie ca şi secvenţa însăşi. Transformarea Forier discretă bidimensională Transformarea Forier discretă bidimensională a nei imagini {(m,n)} de dimensini x este transformarea separabilă definită prin: km ln v(k,l) (m,n) W W, k,l (4.38) m n iar transformarea inversă este: km ln (m,n) W W v(k,l), m,n (4.39) l Perechea nitară bidimensională este dată de relaţiile: km ln v(k,l) W W mn (, ), n, l (4.4) m n km ln (m,n) v(k,l) W W v(k,l), m,n (4.4) l Proprietăţile transformării DFT bidimensionale Proprietăţile transformării nitare DFT bidimensionale snt similare c cazl nidimensional şi snt sccint trecte în revistă în continare: T Simetrie: F F, F F Extensii periodice: * (4.4) 7
PRELUCRAREA DIGITALĂ A IMAGIILOR v( +, l+ ) v( k, l) k, l (4.43) m ( +, n+ ) mn (, ) mn, (4.44) Spectrl Forier eşantionat: Dacă ~ (m,n) (m,n), m,n si(m,n) ~ în rest, rezltă: ~ πk πl U, DFT{ ( m, n) } v( k, l) (4.45) nde U ~ ( w, w ) este transformata Forier a li (m,n). Transformată rapidă: deoarece transformarea DFT bidimensională este separabilă, relaţiile (4.4) şi (4.4) snt echivalente c transformări DFT nitare nidimensionale, fiecare realizabilă în log operaţii, prin FFT. Rezltă deci că nmărl total de operaţii necesare este de log. Simetrie conjgată: transformările DFT ăi DFT nitară ale nor imagini reale a simetrie conjgată: v k, * ± ± l v k, l, k,l (4.46) * sa v(k,l) v ( k, l), k,l (4.47) De aici se poate dedce foarte şor că v(k,l) are doar elemente reale independente. Spre exempl, eşantioanele din reginea haşrată în figra 4. determină complet transformarea DFT. l (/ -) / - k (/)- / Transformarea Cosins discretă - / Fig. 4. Simetria coeficienţilor DFT Transformarea cosins discretă se defineşte, în spaţil bidimensional, ca: (m + )kπ (n + )kπ v(k,l) α(k) α(l) (m,n) cos cos m n nde k, l,,... -, iar inversa ei ca: (m + )kπ (n + )lπ (m,n) α(k) α(l) v(k,l) cos cos l (4.47) (4.48) 7
Cap.4 Transformări de imagini nde m, n,... -, iar coneficienţii snt: α() [i α(k) pentr k (4.49) La fel ca şi transformarea DFT, transformarea cosins discretă poate fi exprimată ca operaţie c matrici nitare: V CC (4.5) nde coeficinţii transformării C snt: c k,m π(m + )kπ α(k) cos (4.5) Transformarea cosins discretă are, de asemenea, n algoritm rapid de implementare dar, spre deosebire de DFT, are nmai valori reale. Ca domenii de aplicabilitate, este cea mai folosită transformare în compresia de imagini (vezi cap.). Transformarea Sins discretă Transformarea sins discretă bidimensională, introdsă de A.Jain, este definită de relaţia: π(m + )(k + ) π(n + )(l + ) v(k,l) (m,n) sin sin + + + (4.5) iar transformarea inversă, de: (m,n) + m n l π(m + )(k + ) π(n + )(l + ) v(k,l) sin sin + + Transformarea sins discretă are elementele matricii nitare de forma: s m,k sin π(m + )(k + ) + + (4.53) (4.54) Spre deosebire de alte transformări de tip sinsoidal, transformarea DST este mai şor de implementat dacă p -, c p nmăr întreg. În acest caz, poate fi considerată ca partea imaginară a nei transformări Forier rapide de dimensine (+). Are, totodată, n algoritm rapid de implementare şi proprietăţile ei o impn pentr aplicaţii de tip compresie de imagini. Transformarea Hartley Transformarea Hartley este o transformare integrală contină, propsă de matematicianl c acelaşi nme, ca alternativă la transformarea Forier. Varianta discretă a acestei transformări (DHT) este dată de relaţiile: şi v(k,l) (m,n)cas π (mk + nl) m n (4.55) 7
identice şi folosind fncţia de bază: mn (, ) v(k,l)cas π + (mk nl) l PRELUCRAREA DIGITALĂ A IMAGIILOR (4.56) cas( θ) cos( θ) + sin( θ) cos( θ π / 4) (4.57) Elementele matricii nitare ale transformării Hartley snt de forma: h m,k cas π mk (4.58) Spre deosebire de DFT, care transformă nmere reale în nmere complexe c simetrie conjgată, transformarea Hartley discretă prodce nmere reale. Ea este strâns legată de transformarea Forier discretă, fiind pr şi simpl diferenţa dintre partea reală şi partea imaginară a transformării Forier corespondente. Analog, transformarea Forier este partea pară, mins de j ori partea impară a transformării Hartley. Din aceste motive, DHT constitie o alternativă din pnct de vedere al implementării pe calclator, a transformării DFT, având şi ea n algoritm rapid de implementare. Anmite aplicaţii de filtrare liniară de imagini, în special în cazl nor imagini simetrice, impn folosirea DHT datorită redcerii semnificative a volmli de calcle (se evită lcrl c nmere complexe). 4.5 TRASFORMĂRI RECTAGULARE Unele dintre transformările de interes din pnctl de vedere al prelcrărilor digitale de imagini folosesc fncţii de bază ce reprezintă variaţii ale nor nde dreptnghilare ăi n sinsoidale ca cele prezentate până acm. În general, aceste transformări se caracterizează prin rapiditate în calcl, având în vedere faptl că mlte dintre operaţiile de înmlţire pot fi evitate. În acest paragraf vor fi trecte în revistă transformările Hadamard, Walsh, Slant ăi Haar. Transformarea Haar diferă fndamental de primele trei ăi este disctată separat, în contextl transformărilor wavelet ce vor fi tratate într-n capitol separat (vezi cap.5). Transformarea Hadamard Transformarea Hadamard este simetrică, separabilă şi nitară şi se evidenţiază prin faptl că elementele matricii transformării ia valorile de + sa -. Transformarea are sens pentr n, nde n este n nmăr întreg. Pentr o transformare x, matricea corespnzătoare este: H (4.59) iar pentr dimensini mai mari, ea poate fi generată astfel: H H H H / / H / / (4.6) 73
Cap.4 Transformări de imagini Pentr orice dimensine n, matricea conţine doar elemente de forma ±, c condiţia ca factorl -/ să fie în afara matricii. Spre exempl, pentr 8 matricea Hadamard are forma prezentată în matricea (4.6), nde în coloana din dreapta matricii se evidenţiază nmărl schimbărilor de semn din linia respectivă. Se poate observa că nmărl diferă de la o linie la alta şi poartă nmele de secvenţa liniei. Reordonarea liniilor în aşa fel încât secvenţele corespnzătoare să fie crescătoare, în mod analog c creşterea frecvenţei la transformarea Forier, dce la o transformare mai şor de implementat, care se nmeşte transformare Hadamard ordonată dată de matricea (4.6): 7 3 H 4 8 6 5 (4. 6) H 8 - - - - -3 - - 4 - -5 - - 6 - - 7 (4. 6) Transformarea Walsh Fncţiile de bază ale transformării Hadamard snt, de fapt, fncţii Walsh. Din această cază ea este denmită neori ăi transformare Walsh. În nele referinţe se întâlneşte şi denmirea combinată de transformare Walsh - Hadamard. Transformarea Slant Transformarea Slant are fncţiile de bază de ordinl şi liniare, fapt ce face să fie tilă în nele aplicaţii de prelcrări digitale de imagini. Matricea nitară a transformării Slant se obţine pornind de la transformarea Haar sa Hadamard de dimensini x: S (4.63) şi iterând-o în conformitate c rmătorl algoritm: S n an bn an bn I I bn an bn an I I (n / ) (n / ) (n / ) (n / ) nde I este matricea identitate de ordinl /-, iar S n S n (4.64) 74
a 3 4 si b PRELUCRAREA DIGITALĂ A IMAGIILOR 4 (4.65) Fncţiile de bază ale transformării Slant apar în toate secvenţele, începând de la la -. Transformarea Haar Transformarea Haar este simetrică, nitară şi separabilă şi foloseşte ca fncţii de bază fncţiile Haar. Transformarea are sens pentr n, nde n este n nmăr întreg. Spre deosebire de transformarea Forier, nde fncţiile de bază diferă nmai în poziţie pe axa frecvenţelor, fncţiile Haar variază atât în modl cât şi în poziţie (scală). Această caracteristică particlarizează transformarea Haar faţă de celelalte tipri de transformări rectanglare şi face ca ea să constitie, totodată, n pnct de plecare pentr transformările de tip "wavelet" (ndişoare). Fncţiile Haar fiind variabile de doi parametri (scală şi poziţie), indexarea lor trebie făctă dpă o schemă dală. Ele se definesc pe intervall [,] dpă cm rmează: se consideră k n nmăr întreg, k - nic determinat de alţi doi întregi p şi q astfel: p k + q (4.66) De observat că, prin această modalitate de definire, n nmai k este o fncţie de p şi q, dar şi p şi q snt fncţii de k. Pentr orice valoare a li k>, p este cea mai mare ptere a li care îndeplineăte condiţia p k, iar q - este restl împărţirii. Fncţiile Haar se definesc astfel: h(x) şi, daca q p/ q / x p < p h(x), daca q / p/ q k x < (4.67) p p, in rest Dacă se va considera xi/, i,,..., -, va rezlta n set de fncţii de bază. Acestea variază atât ca modl (scală) cât şi în poziţie. Indicele p specifică scala iar q determină deplasarea. Din această cază, ordonarea coeficienţilor transformării dpă k n este la fel de edificatoare ca, spre exempl, ordonarea spaţili coeficienţilor obţint în rma nei transformări Forier. Pe de altă parte, dacă prespnem o caracteristică anmită a imaginii, de tip linie sa mchie, într-o anmită poziţie de-a lngl axei x, transformata Forier va codifica această poziţie în spectrl de fază, în conformitate c teorema deplasării. În timp ce poziţia contrli este nic specificată şi poate fi reconstrită exact c ajtorl transformării Forier inverse, ea n va fi extrem de observabilă în spectr. În contrast c aceasta, transformarea Haar evidenţiază clar liniile şi mchiile, dat fiind faptl că fncţiile sale de bază snt asemănătoare acestor caracteristici. De remarcat faptl că n semnal sa o componentă a acestia care se potriveşte c fncţia de bază a nei 75
Cap.4 Transformări de imagini transformări, va determina, prin transformare, n coeficient de valoare mare corespnzând acelei fncţii de bază. Având în vedere faptl că fncţiile de bază snt ortonormale, semnall va prodce în rest coeficienţi de valoare mlt mai mică. În acest mod, transformarea Haar poate evidenţia caracteristici de tip linie sa mchie prin mărimea şi poziţia lor. Matricea nitară 8x8 a transformării Haar este:prezentată în relaţia (4.68) şi topologia se păstrează pentr nmere mai mari. Datorită faptli că o mare parte dintre coeficienţii matricii snt constanţi sa nli, transformarea Haar este foarte rapidă. H r 8 (4.68) 4.6 TRASFORMĂRI BAZATE PE VECTORI PROPRII Fncţiile de bază folosite în doă dintre transformările de imagine importante din pnctl de vedere al aplicaţiilor snt derivate din analiza valorilor proprii. Reamintim că, pentr o matrice A de dimensini x, există nmere scalare λ k,,..., -, astfel încât: A λ k Γ (4.69) merele λ k se nmesc valori proprii ale matricii, iar setl de vectori v k, definit astfel încât: Av λ v (4.7) 76 k k k se nmesc vectori proprii ai matricii A. Aceşti vectori a dimensinea x şi fiecare corespnde nei valori proprii. Ei formează n set de bază ortonormal. Prespnând x n vector aleator de dimensini x, fiecare element x i a li x este o variabilă aleatoare. Valoarea medie a li x poate fi estimată dintr-n eăantion de L asemenea vectori prin: L m x x l (4.7) L l iar matricea sa de covarianţă poate fi estimată prin: L T t t C x E(k { m)(x x m) x } xl xl mx mx (4.7) L Această matrice de covarianţă are dimensini x, este reală şi simetrică. Elementele diagonalei snt varianţele variabilelor aleatoare individale, în timp ce elementele din afara diagonalei reprezintă covarianţele acestora. În cazl în care matricea A defineăte o transformare liniară care generează noii vectori y, pornind de la vectorii x, prin: y A( x m x ) (4.73) l
PRELUCRAREA DIGITALĂ A IMAGIILOR A este definită în aşa fel, încât liniile ei snt vectorii proprii ai li C x. Pentr şrinţa calclelor, liniile li A se pot ordona descrescător dpă mărimea valorilor proprii corespnzătoare. Vectorl transformat, y, este n vector aleator, c valoare medie nlă. Matricea sa de covarianţă este dependentă de cea corespnzătoare vectorli x prin relaţia: C y A C A T x (4.74) Având în vedere faptl că liniile matricii A snt vectori proprii ai matricii C x, C y va fi o matrice diagonală, având de-a lngl diagonalei principale valorile proprii ale li C x (consecinţă a relaţiei 4.7). De aici, C y λ λ (4.75) nde λ k snt şi valorile proprii ale li C y. Datorită faptli că elementele din afara diagonalei li C y snt nle, rezltă că elementele vectorli y vor fi necorelate, ceea ce înseamnă că transformarea A înlătră corelaţia între variabile, iar λ k reprezintă varianţa variabilei transformate de ordinl k, y k. Este de sbliniat, de asemenea, că relaţia (4.73) este reversibilă, adică vectorl x poate fi reconstrit din vectorl să transformat, y, prin: T x A y+ m A y+ m (4.76) Această proprietate rezltă din faptl că A este o matrice reală şi nitară şi, deci, ortonormală. Dimensinea vectorilor y poate fi redsă prin neglijarea nia sa mai mltor vectori proprii având valori proprii mici. Dacă vom considera matricea B, de dimensini Mx, obţintă prin eliminarea ltimelor -M linii ale matricii A şi vom prespne, pentr simplificare, că m, atnci vectorii transformaţi vor avea dimensini mai mici (Mx) şi se vor obţine folosind relaţia: ~ y Bx (4.77) Folosind vectorii ~ y se pot reconstri aproximativ vectorii x: c eroare medie pătratică de forma: σ ~ T x B ~ y (4.78) e M+ λ k (4.79) adică sma valorilor proprii corespnzătoare vectorilor proprii neglijaţi. În mod normal, varianţele valorilor proprii snt considerabile ca mărime, iar cele mici pot fi neglijate fără a se introdce erori semnificative. Transformarea Karhnen - Loeve Relaţia (4.73) defineşte o transformare discretă nidimensională, nmită în general, în literatra de specialitate transformarea Karhnen - Loeve (sa K-L) dar 77
Cap.4 Transformări de imagini şi transformarea Hotelling, transformarea vectorilor proprii, transformarea componentelor principale. Capacitatea acestei transformări de a redce dimensinile vectorilor transformaţi o face extrem de tilă în compresia de imagini. Imaginile mltispectrale, de exempl, conţin mai mlte nivele de gri pentr acelaşi pixel, fiecare nivel de gri corespnzând nei benzi spectrale diferite. Spre exempl, o imagine mltispectrală pe 4 benzi, având dimensinea de x, poate fi considerată ca n set de n milion de vectori având fiecare 4 elemente. Tehnica redcerii dimensinilor vectorilor prin transformarea Karhnen-Loeve (K-L) poate fi aplicată în acest caz, spre exempl, deoarece corelaţia între diferite benzi spectrale este, în general, destl de ridicată şi, în consecinţă, mlte dintre cele 4 valori proprii vor fi mici. Aceasta înseamnă că setl de 4 imagini monocrome poate fi reprezentat, c erori relativ mici, prin doar câteva imagini principale, fiecare dintre ele fiind calclată ca o smă ponderată a celor 4 iniţiale. De asemenea, fiecare dintre acestea poate fi reconstrită aproximativ, ca şi combinaţie liniară a celor câteva imagini principale. Metoda şrează foarte mlt stocarea şi transmisia imaginilor, spre exempl a celor prelate de la sateliţi. În general, imaginile de bază ale transformării K-L depind de statistica imaginii late în considerare ăi n pot fi scrise în mod explicit. Dacă imaginea poate fi considerată ca n proces Markov de ordinl întâi, la care corelaţia între pixeli scade liniar c distanţa care îi separă, imaginile de bază pot fi scrise explicit. Pentr imaginile întâlnite în mod obişnit în practică, încadrarea ca procese Markov este sficient de potrivită. Dacă corelaţia între pixelii adiacenţi este apropiată de nitate, fncţiile de bază K-L se apropie de cele ale transformării cosins discrete. Astfel, transformarea DCT, mlt mai rapidă şi mai şor de implementat, poate constiti o foarte bnă aproximare a transformării Karhnen-Loeve, pentr imaginile zale. Transformarea K-L rapidă Dificltăţile de implementare a transformării K-L snt legate de volml mare de calcle necesitate, mai ales în cazl imaginilor de dimensini mari. Transformarea K-L depinde şi de statistica imaginii şi, în general, se poate spne că vectorii de bază n a o reprezentare analitică, ca în cazl altor transformări. S-a demonstrat, totşi, că anmite modele statistice de imagini permit implementarea ni algoritm rapid pentr transformarea K-L. Acesta se bazează pe o descompnere stochastică a imaginii într-o smă de doă secvenţe aleatoare. Prima se alege în aşa fel, încât transformata ei K-L să fie o transformare rapidă iar a doa, nmită "răspnsl contrli", depinde nmai de informaţia conţintă în contrrile prezente în imagine. Transformarea SVD (descompnerea în valori singlare) O matrice x, A, poate fi exprimată ca: A U V T (4.8) 78
PRELUCRAREA DIGITALĂ A IMAGIILOR nde coloanele li şi v snt vectorii li AA T şi respectiv A T A, iar este o matrice diagonală conţinând valorile singlare ale li A pe diagonala principală. Dat fiind faptl că U şi V snt ortogonale, T U AV (4.8) Relaţia (4.79) defineşte o transformare nitară directă, iar (4.78) perechea sa inversă, nmită transformare "c descompnere ţn valori singlare" ( singlar vale decomposition - SVD). Dacă A este simetrică, atnci UV. Este de remarcat faptl că matricile transformărilor, U şi V, depind de imaginea A care trebie transformată. În general este necesară calclarea vectorilor proprii ai li AA T şi A T A pentr fiecare imagine care se transformă. De asemenea, deoarece A este o matrice diagonală, va avea cel mlt elemente nenle. Din această cază va rezlta o compresie fără pierderi c n factor de cel pţin, mai mare decât cel obţint dacă A are câteva valori nle sa neglijabile. Rezltă de aici faptl că efortl splimentar de calcl adce c sine îmbnătăţirea semnificativă a raportli de compresie. În mod normal, nele dintre valorile singlare snt sficient de mici pentr a ptea fi ignorate, c o eroare nesemnificativă, obţinând-se o compresie "c pierderi" prin eliminarea valorilor A i,i mici. Eroarea medie pătratică ce rezltă prin această trnchiere este pr şi simpl sma valorilor singlare eliminate. Trebie remarcat însă faptl că eficienţa în compresia imaginilor a transformării SVD este, într-n fel, înşelătoare. C toate că întreaga imagine poate fi comprimată în elementele diagonalei matricii A, matricile transformării, U ăi V, snt specifice fiecărei imagini. Ele vor trebi transmise împrenă c imaginea, în vederea reconstrcţiei la recepţie. E posibil, totăi, ca o pereche de asemenea matrici să fie folosite, c aproximaţie, pentr n grp de imagini similare. Pentr ilstrare, să lăm o imagine de dimensini 5x5: Rezltă că matricile AA T şi λ vor fi: 3 4 3 A 4 5 4 3 4 3 6 4 8 4 6 4 36 48 36 4 AA T 8 48 65 48 8 4 36 48 36 4 6 4 8 4 6 Matricea transformării SVD directe, U, va fi: Matricea valorilor singlare este: 47,7,87 ; λ,58,86,638,4,695,695,476,58,5,33,8 U,69,4,587,476,58,5,33,8,86,638,4,695,695 79
Cap.4 Transformări de imagini,58,4 T UAU,557 Transformarea SVD inversă, aplicată matricii ne dă: 3 4 3 A U U T 4 6 4 3 4 3 4.7 FILTRAREA Î DOMEIUL TRASFORMATEI Filtrarea liniară poate fi modelată ca o mltiplicare a spectrli Forier a nei imagini c o fncţie de transfer definită în domenil frecvenţă. Analog se pot defini algoritmi de filtrare şi pentr celelalte transformări de imagini. La fel ca şi transformarea Forier, transformările nitare în general realizează o expandare a imaginii ca smă ponderată a imaginilor de bază. Prin transformarea directă se determină, de fapt, coeficienţii de ponderare, iar în transformarea inversă se face reasamblarea imaginii din imaginile de bază. Filtrarea în domenil transformatei prespne o modificare a coeficienţilor de ponderare, înaintea reconstrcţiei imaginii prin transformarea inversă. În cazl filtrării liniare, transformarea va fi o transformare Forier, iar modificarea se face înmlţind spectrl c o fncţie de transfer. În cazl mai general al filtrării, matricea coeficienţilor este modificată (prin înmlţire sa prin alte metode) iar dpă transformarea inversă rezltă imaginea filtrată. În mod evident, natra vectorilor şi, implicit, a imaginilor de bază ce rezltă stabilesc comportarea diferitelor transformări din acest pnct de vedere. De exempl, zgomotl de tip sinsoidal ce afectează o imagine va apărea foarte compact în domenil transformării de tip sinsoidal şi, deci, va ptea fi înlătrat foarte ăor prin anlarea coeficienţilor respectivi. În cazl transformărilor rectanglare, problema eliminării ni asemenea tip de zgomot se complică, deoarece el n va ptea fi separat la fel de şor în domenil transformatei. În general, dacă fie componentele semnalli (tile), fie componentele zgomotli (nedorite) din imagine snt asemănătoare imaginilor de bază ale nei anmite transformări, atnci acea transformare este cea mai potrivită pentr separarea lor, deoarece acele componente vor fi reprezentate foarte compact în domenil transformatei. Transformarea Haar, spre exempl, este tilă în cazl detecţiei liniilor sa mchiilor verticale şi orizontale, deoarece nele dintre imaginile sale de bază se potrivesc c aceste caracteristici. Un exempl în acest sens este dat în cazl imaginii de dimensini 8x8 prezentate în matricea care rmează: 8
PRELUCRAREA DIGITALĂ A IMAGIILOR,83 Imagine Transformata Haar Dat fiint faptl că transformarea este separabilă, o caracteristică a acesteia de tipl nei linii sa mchii orizontale şi verticale va prodce coeficienţi diferiţi de zero nmai în prima linie şi, respectiv în prima coloană a imaginii transformate. mărl coeficienţilor diferiţi de zero va fi cel mlt /, iar poziţia mchiei în imagine determină care şi câţi dintre coeficienţi vor fi nenli. Datorită asocierii strânse c sistemele liniare, transformarea Forier prezintă cel mai bine ps la pnct fndament teoretic în ceea ce priveşte filtrarea imaginilor. Celelalte transformări snt mai dificil de interpretat din pnctl de vedere al filtrării şi, de aceea, folosirea lor se face adesea pe bază de experimente. Înţelegerea similarităţilor şi diferenţelor între aceste transformări este extrem de importantă în alegerea nor solţii potrivite pentr diferite tipri de aplicaţii. 4.8 COCLUZII Transformarea DFT: este o transformare rapidă, foarte tilizată în prelcrarea digitală a semnalelor, convolţie, filtrare digitală, analiză. Prezintă o foarte bnă împachetare a energiei imaginilor. ecesită, însă, calcle c valori complexe. Transformarea DCT: este o transformare rapidă, necesită operaţini reale şi este alternativă optimală a transformării K-L pentr imagini înalt corelate. Este tilizată în proiectarea codoarelor prin transformări şi a filtrelor Wiener. Prezintă, de asemenea, o compactare a energiei excelentă. Transformarea DST: este aproximativ de doă ori mai rapidă decât transformarea cosins rapidă, este simetrică şi necesită operaţini reale; permite implementarea ni algoritm rapid pentr transformarea K-L pentr codare, filtrare, ş.a.; se foloseşte, de asemenea, în estimarea performanţelor în mlte aplicaţii de prelcrare de imagini. Compactarea energiei este foarte bnă. Transformarea Hadamard: este mai rapidă decât transformările sinsoidale, având în vedere că n necesită operaţii de înmlţire; se foloseşte pentr implementarea hard a algoritmilor de prelcrare digitală a imaginilor. Se poate spne că este şor de simlat dar dificil de implementat şi se aplică în compresia de imagini, filtrare şi proiectarea de codoare. Prezintă şi ea o bnă compactare de energie. Transformarea Haar: este o transformare foarte rapidă; se foloseşte în extragerea de caracteristici, codarea de imagini şi în aplicaţii de analiză a imaginilor. Compactarea de energie este medie. 8
Cap.4 Transformări de imagini Transformarea Slant: este o transformare rapidă şi are o foarte bnă compactare a energiei imaginilor; se foloseşte la codarea imaginilor. Transformarea Karhnen-Loeve: este transformarea optimală din mai mlte pncte de vedere, dar n prezintă n algoritm rapid şi, de aceea, se foloseşte mai ales în cazl vectorilor de dimensini mici, cm ar fi vectorii corespnzători nor imagini mltispectrale, precm şi pentr evalarea performanţelor altor transformări. Are cea mai bnă compactare a energiei în sensl erorii pătratice medii minime. Transformarea SVD: prezintă cea mai mare eficienţă din pnctl de vedere a împachetării energiei nei imagini date. Din păcate, matricea transformării diferă esenţial de la o imagine la alta; n are n algoritm rapid sa o transformare rapidă care să o înlociască. Se foloseşte în proiectarea filtrelor separabile c răspns finit la impls, la găsirea rangrilor matricilor de dimensini mari, etc. Aplicaţii potenţiale ale transformării SVD ar ptea fi în restararea de imagini, estimarea spectrli energetic şi în compresia de date. 8