HNT_vol_Vorbire_v_7_hhh.PDF

Documente similare
STRUCTURA UNUI ARTICOL STIINTIFIC Un articol stiintific incepe cu titlul articolului, dupa care se scriu numele autorilor, in ordinea contributiei. Pe

Microsoft Word - _Curs II_2_Mar17_2016out.doc

Limite de funcţii reale

Matematici aplicate științelor biologie Lab10 MV

Calcul Numeric

1. Se masoara forta de presiune X (Kg/cm 3 ), la care un anumit material cedeaza. Se presupune ca X urmeaza o lege normala. Pentru 10 masuratori se ob

Ce este decibelul si Caracteristica BODE

CAPITOLUL 1

Realizarea fizică a dispozitivelor optoeletronice

Pagina 1 din 5 Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare Etapa județeană/a sectoarelor municipiului București a olimpia

Microsoft Word - subiecte

Preţ bază

Microsoft Word - 3 Transformata z.doc

Microsoft Word - Documentatie_Finala_versiunea_IT

Programare Delphi Laborator 2 a. Serii. Elaboraţi câte un program pentru sumarea primilor 100 de termeni ai seriilor următoare şi verificaţi numeric e

Dependenţă funcţională n Cursul 9 Fie funcţiile f : A R R, i 1, m. A mulțime nevidă. i Definiţia 1. Spunem că funcţia g: A R depinde de funcţiile f1,

Calcul Numeric

ETTI-AN1, , C. Ghiu Notițe de Adrian Manea Seminar 4 Serii Fourier și recapitulare 1 Serii Fourier Pentru dezvoltarea în serie Fourier (care

Microsoft Word - LogaritmiBac2009.doc

Microsoft Word - MD.05.

Slide 1

Algebra: 1. Numere naturale. Operatii cu numere naturale. Ordinea operatiilor. Puteri si reguli de calcul cu puteri. Compararea puterilor. Multimea nu

Universitatea Politehnica din Bucureşti Facultatea de Electronică, TelecomunicaŃii şi Tehnologia InformaŃiei Tehnici Avansate de Prelucrarea şi Analiz

Microsoft Word - SUBIECTE FAZA LOCALA FEBRUARIE 2007

Microsoft Word - LogaritmiBac2009.doc

CURS 8

Probleme rezolvate 1) Să se calculeze limitele următoarelor şiruri: 1 a) x n n = ( n+ 1)( n+ 2 )...( n+ n), n 2 n ( 1) 1 n n b) 2 3 n 5 n... ( 2

Microsoft Word - anmatcap1_3.doc

Concursul Interjudeţean de Matematică Cristian S. Calude Galaţi, 26 noiembrie 2005 Inspectoratul Şcolar al Judeţului Galaţi, Societatea de Ştiinţe Mat

Nr. 1 Septembrie/Octombrie pagini De la Ferme Adunate Proiecte: Programul Contract Grower Cum poţi deveni investitor cu

SIMULARE EXAMEN DE BACALAUREAT LA MATEMATICA Toate subiectele (I, II, III) sunt obligatorii. Se acordă 10 puncte din oficiu. Timpul efectiv

1

EVALUAREA AFACERILOR ÎN SCOPUL FUNDAMENTĂRII DECIZIEI DE FUZIUNE SAU ACHIZIŢIE: ASPECTE METODOLOGICO-PRACTICE

Microsoft Word - pag_006.doc

Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare Etapa Națională a Olimpiadei de FIZICĂ 3-7 Mai 2019, Târgoviște Barem de eval

Soluţiile problemelor propuse în nr. 1 / 2006 Clasele primare P.104. Suma dintre predecesorul unui număr şi succesorul numărului următor lui este 29.

OLIMPIADA DE MATEMATICĂ ETAPA LOCALĂ CLASA A V-A SOLUŢII ŞI BAREME ORIENTATIVE DE CORECTARE Subiectul I a) Calculaţi: 13 :

Programa olimpiadei de matematică

Microsoft Word - F.Paladi_TD_manual.doc

ep0126

E_c_matematica_M_mate-info_2019_var_06_LRO

013757_ABB (A Szocs)_ACS50_EN_revE_high_100812ENRODECRCG_f_1

VI. Achiziția datelor în LabVIEW

FIŞA NR

Microsoft Word - TIC5

2

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

Microsoft Word - 41IULIANA_CARMEN_BARBACIORU_Prel.doc

MINISTERUL NVźÅMÂNTULUI Program TEMPUS JEP 3801 SCIENCES DE L'EAU ET ENVIRONNEMENT Daniel SCRÅDEANU MODELE GEOSTATISTICE N HIDROLOGIE VOL. I Serie co

Microsoft Word - Curs_09.doc

Document2

Microsoft Word - IngineriF_A.DOC

Microsoft Word - fmnl06.doc

Logică și structuri discrete Logică propozițională Marius Minea marius/curs/lsd/ 3 noiembrie 2014

O teoremă de reprezentare (II) Marian TETIVA 1 Abstract. In this paper some (in general well-known) results on complete sequences are exposed, with ap

ANEXA 1 RECOMANDARI LICENTA

Curs 8 Variabile aleatoare continue 8.1 Funcţia caracteristică Definiţia Fie X o v. a. cu densitatea de probabilitate f. Funcţia ϕ X (t) = M [ e

Microsoft Word - Curs_07.doc

PowerPoint Presentation

Microsoft Word - FiltrareaNyquist-rezumat.doc

Microsoft Word - RECEPTOR CD 202E

COMUNA MIRCEA VODA MIRCEA VODA CONSTANTA SITUATIE PRIVIND MONITORIZAREA CHELTUIELILOR DE PERSONAL + PE LUNA...lULlE...ANUL CAP. 51 ADMINISTR

Facultatea de Științe Politice, Administrative și ale Comunicării Str. Traian Moșoiu nr. 71 Cluj-Napoca, RO Tel.: Fax:

Discipline aferente competenţelor Facultate: Facultatea de Electronică şi Telecomunicaţii Universitate: UNIVERSITATEA POLITEHNICA DIN TIMIȘOARA Domeni

Slide 1

2

Microsoft Word - Cap09_AutoorganizareSiEmergentaInSistemeleAdaptiveComplexe_grile.doc

MINISTERUL FINANTELOR PUBLICE Agenţia Naţională de Administrare Fiscală Directia Generală a Finantelor UL;. -+D Fax ;j: Publice a

..MINISTERUL EDUCAŢIEI NAȚIONALE ŞI CERCETARII STIINTIFICE UNIVERSITATEA DE VEST DIN TIMIȘOARA.I CENTRUL DE DEZVOLTARE ACADEMICĂ. FIȘA DISCIPLINEI 1.

UNIVERSITATEA DIN CRAIOVA FACULTATEA DE STIINTE EXACTE DEPARTAMENTUL DE INFORMATICA Pozitia postului: 23 Disciplina postului: Inteligenta artificială

LUCRAREA 8 PROGRAMAREA NELINIARĂ ÎN REZOLVAREA PROBLEMELOR DIN ENERGETICĂ. METODE DE ORDINUL Aspecte generale Programarea neliniară are o foart

Microsoft Word - 2 Filtre neliniare.doc

Microsoft Word - Diplome_ doc

PowerPoint Presentation

FILTRE DE REALIZARE CU CIRCUITE DE INTEGRARE

Lucrarea 10

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de

Anexă nr.5hsu nr. 80/2019 Ghidul Metodologic privind elaborarea şi prezentarea lucrării de certificare a competențelor PREAMBUL Prezentul ghid are dou

Lineamientos para la Evaluación

Capitole Speciale de Informatică Curs 4: Calculul scorurilor în un sistem complet de extragere a informaţiilor 18 octombrie 2018 Reamintim că în cursu

Cilindri.indd

Prezentul Raport ilustrează statistici comparative privind calitatea serviciilor de acces la internet, pentru anul 2014, din perspectiva parametrilor

carteInvataturaEd_2.0_lectia5.pdf

OPERATII DE PRELUCRAREA IMAGINILOR 1

Bazele spectroscopiei si laserilor

FIȘA DISCIPLINEI

Facultatea de Inginerie Departamentul de Inginerie Electrică, Electronică și Calculatoare As. drd. ing. Orha Ioan Teza de doctorat CENTRUL UNIVERSITAR

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior 1.2 Facultatea 1.3 Departamentul 1.4 Domeniul de studii 1.5 Ciclul de st

Microsoft Word - Analiza12BacRezolvate.doc

AUTORITATEA NAȚIONALĂ DE REGLEMENTARE ÎN DOMENIUL ENERGIEI Nota de prezentare a Proiectului de Normă Tehnică privind Cerinţele tehnice de racordare la

I

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Tehnică din Cluj-Napoca 1.2 Facultatea Mecanică 1.3 Depart

2 BAZE TEORETICE ALE REȚELELOR DE CALCULATOARE CAPITOLUL 2 BAZE TEORETICE ALE REŢELELOR DE CALCULATOARE 2.1. Necesitatea standardizării (referenţierii

Microsoft Word - matem_aplicate in Economie aa FD Bala.doc

REDRESOARE – simulare PSPICE

Universitatea “Dunarea de Jos” din Galati

TEZA de ABILITARE Corelatii intre biomateriale, proteze valvulare cardiace si tehnici chirurgicale folosite in protezarea valvulara aortica Horatiu Mo

Microsoft Word - 6 FD_Informatica SGBD II CIG 2017.doc

Transcriere:

Utilizarea tehicilor uatate (fuzzy) si de diamica eliiara petru siteza adaptiva a vorbirii Horia-Nicolai L. Teodorescu cademia Româa, Sectia Stiita si Tehologia Iformatiei, Calea Victoriei 25, Bucuresti E-mail: hteodor@etc.tuiasi.ro. Itroducere Î timp ce masia realizeaza tipic trasmisie de date, omul comuica. Difereta costa î participarea itelectuala si afectiva a persoaei la actul comuicarii, participare reflectata atât la ivelul limbajelor everbale (gestica, mimica etc.), cât si la ivelul vocal. ceasta participare afectiva da varietate, coloratura si sesuri suplimetare, u eaparat pe pla sematic, semalului vocal. Siteza vocii, î prezet, este limitata de lipsa afectului, varietatii si sesurilor suprapuse î plauri multiple. Vocea masiii ramâe astfel catoata îtr-o regiue moarta a comuicarii, este mootoa si obositoare pe terme lug. Î aceasta lucrare, reluâd uele idei di [-2], precum si î cotextul uor dezvoltari recete [3-27], î special legate de e-voice si VXML, prezetam si dezvoltam uele cocepte si tehici care ar putea permite masiii atigerea dezideratelor mai sus metioate. Realizarea uor masii capabile sa mimeze calitatile vocii umae si sa dialogheze cu oameii, sau macar sa comuice îtr-o maiera similara î care omul o face, este u deziderat î umeroase domeii, de la dialogul om-calculator, la sistemele auto si la sistemele de îvatare asistata de calculator [3-5]. Rezolvarea acestei probleme are implicatii semificative petru acceptarea sitezei vocii îtr-o varietate de aplicatii, de la robotica la realitate virtuala, la idustria de jocuri electroice si la protezare. Prozodia, adica structura acustica ce se extide pe mai multe segmete de semal vocal, chiar peste mai multe cuvite sau propozitii, implica ritm, accet, itoatie, timbru, afect si alte caracteristici ale vocii îca isuficiet îtelese sau vag defiite î literatura. Iformatia paraligvistica ce este cotiuta de prozodie u este icaieri regasita la ivelul spus pri cuvite, dar asa cum am subliiat î [2] aceasta iformatie poate fi chiar mai importata petru ascultator decât iformatia ligvistica propriu-zisa. Icapacitatea sistemelor actuale de siteza vocala de a reda prozodia aturala este evidetiata chiar de marii producatori de aplicatii [25] si este bie cuoscuta î mediul cercetatorilor î domeiul sitezei vorbirii: Oe of the most difficult problems i speech to date is prosodic modelig [25]. 2. Solutii petru siteza adaptiva si varietala Cele doua calitati ale vocii aturale, adaptivitatea î ses larg si variabilitatea se pot realiza, cu costuri u eaparat mari, la ivelul sitetizoarelor actuale, cu adaptari miimale (sau deloc) la ivel hardware si cu îmbuatatiri ale programelor de cotrol. Siteza adaptiva se refera la adaptarea la: Coditiile soore ambietale [, 4]; Cotextul sematic-afectiv al cuvitelor si frazelor sitetizate [2, 3]. Iterlocutorul sistemului de siteza automata, atuci câd acesta este recuoscut [2]. Siteza varietala se refera la modificarile iter-proutie, la repetarea uor fraze, chiar si î cazul î care coditiile ambietale si cotextul (si iterlocutorul) ramâ eschimbate. ceasta

variabilitate elimia mootoia si persoalizeaza vocea (aturala sau sitetizata), î masura î care variabilitatea se face dupa reguli adesea proprii idividului (cum este cazul î realitate) si u doar aleatoare. Variabilitatea itriseca a vorbirii deriva di mecaismele fizice de producere a semalului vocal (curgere turbuleta a aerului pri orgaul foator), precum si di mecaismele eurologice de cotrol al producerii semalului vocal (cotrolul euroal este cuoscut ca avâd o diamica cu o importata compoeta eliiara). ceste caracteristici au fost documetate de mai multe grupuri de cercetare, iclusiv de oi si colaboratorii [5-9]. daptabilitatea si variabilitatea î sesurile de mai sus vor fi prezetate sumar î sectiuile urmatoare, sitetizâd lucrarile citate si uele cercetari mai oi, epublicate îca. 3. daptabilitate la mediu Ua ditre cele mai elemetare adaptari ale semalului vocal geerat de om este cea de adaptare la coditiile de mediu. daptarea la u mediu real, cu fod de zgomot, se realizeaza pe patru cai pricipale: pri modificarea amplitudiii semalului (mai mare î mediul de zgomot ridicat), pri modificarea spectrului (creste cotributia frecvetelor îalte), pri modificarea ritmului (scaderea ritmului, cresterea duratei vocalelor), si pri cresterea duratei ditre cuvite, care devi separate, segmetate î timp. daptarile realizate istictiv de u vorbitor uma se opereaza deci la u ivel relativ elemetar, cu modificari de prozodie miimale. Realizarea acestei adaptari este esetiala î multe aplicatii de siteza a vocii, icluzâd siteza vocala petru aplicatii î medii idustriale si î mijloace de trasport, sau siteza vocala petru proteze larigiee. Este remarcabil ca aceasta adaptare se poate realiza, la pretetii reduse, cu foarte puti hard suplimetar si/sau cu u soft miimal, aducâd îsa o îmbuatatire esetiala î utilizare. Î privita hardului, este ecesar uul sau mai multe caale de culegere a semalului de zgomot (semal soor ambietal). Procesarea semalului de zgomot, î vederea realizarii cotrolului sistemului de siteza automata, presupue determiarea puterii zgomotului ambietal îtr-o fereastra temporala si determiarea compoetei spectrale a semalului ambietal. Primul parametru de caracterizare a zgomotului se obtie ca medie aritmetica a patratului semalului s, îtr-o fereastra data, de largime de W esatioae si caracterizata de mometul actual de timp, : P t W 2 s k k () Caracterizarea spectrala se poate realiza sumar pri raportul HL ditre puterea la frecvete îalte (frecvetele îalte corespuzâd î mare bezii de frecveta ce iclude formatii r. 2, 3, 4 si 5 di spectrul vocal) si puterea la frecvetele joase (pâa la aproximativ al doilea format, deci pâa la frecveta de cca. 4 5 Hz, tiâd cot si de vorbitorii femiii): 5 2 d S 2 HL S d (2) 5 Deoarece parametrii respectivi sut relatioati cu impactul pe care îl au asupra iteligibilitatii vorbirii, deci sut dati de calitati subiective, este atural sa abordam o defiire probabilista sau fuzzy a lor. Data fiid simplitatea cotrolului uatat (fuzzy), vom prefera a doua variata. U exemplu de Desi u este larg acceptat si are o traducere mai dificila î alte limbi, vom utiliza aici termeul uatat, propus de Grigore C. Moisil, î locul eglezescului fuzzy. 2

defiire 2 a fuctiilor de aparteeta respective este prezetat î Figura. Este de presupus ca aceasta defiire sa costituie doar u puct de plecare, îmbuatatirea calitatii sitezei realizâdu-se si pri modificarea fuctiilor de aparteeta. (p) putere mica putere medie putere mare (q) mic mediu mare 4 db 55 db 7 db ivel p [db].5.5 q raport H/L (a) (b) Figura. Fuctiile de aparteeta ale premiselor regulilor folosite petru determiarea modificarilor parametrilor de cotrol ai sitetizorului Dupa cum s-a precizat deja, ca rezultat al aprecierii coditiilor de mediu, se cotroleaza patru parametri ai semalului sitetizat: cresterea amplitudiii (parametru otat I) cresterea cotiutului î frecvete îalte (HFCI) cresterea duratei vocalelor (VLI) cresterea duratei ditre cuvite (accetuarea segmetarii pe cuvite a frazei), otat IDBBW. Cotrolul se realizeaza pe baza de reguli si poate fi rezumat î Tabelele -4 de mai jos. Tabelul. Cresterea amplitudiii (I mplitude Icrease) HL/P mic mediu mare mic,,,4 mediu,,3,5 mare,4,5,6 Tabelul 2. Cresterea cotiutului de frecvete îalte (HFCI High Frequecy Cotet Icrease F3 icrease) HL/P mic mediu mare mic,,,4 mediu,,3,5 mare,4,5,6 Tabelul 3. Cresterea duratei vocalelor (Vowel Legth Icrease VLH) HL/P mic mediu Mare mic,,,4 mediu,,3,5 mare,4,5,6 2 Petru a u îcarca prezetarea, ecuatiile fuctiilor respective sut date î exa. 3

Tabelul 4. Cresterea duratei ditre cuvite (Icrease of the Duratio of the Break Betwee Words DBBW) HL/P Mic mediu mare mic,,,.4 mediu,,3,5 mare,4,5,6 Tabelele sut iterpretate î sesul uzual petru sistemele uatate. Preferam sistemele de tip Sugeo de ordi (vezi exa ), deoarece furizeaza ca rezultat, direct, valori umerice, care vor fi iterpretate ca si coeficieti de multiplicare ai valorilor omiale ale sitezei. De exemplu, prima liie si prima coloaa di Tabelul spu ca: DC TUNCI Puterea (zgomotului) este medie si parametrul LH este mediu mplitudiea creste cu.3 ori. Toate regulile di Tabelul si toate celelalte tabele se iterpreteaza îtr-u mod similar. Rezultatul fial se obtie pri agregarea rezultatelor partiale, date de regulile respective. De exemplu, daca valoarea itesitatii soore este de 45 db, iar raportul HL este de,7, pri aplicarea fuzzificarii 3 se obtie gradul de adevar al premisei (combiate) di regula respectiva, pri mi P LH putere mica, LH mic P iar LH, 7 ude 45 putere mica, 67, LH, 6 P LH. Folosid expresiile fuctiilor (v. exa ), se obti valorile mic, deci valoarea miima este,6 si reprezita gradul de îcredere î faptul ca amplitudiea creste de, ori. ceasta este valoarea de adevar petru sigletoul (de la iesirea sistemului) ce corespude regulii respective,,. Î total, sut 9 reguli per tabel, deci exista 9 valori de sigletoi. Îtr-adevar, î acelasi timp, valorile de itrare corespud fuctiilor de aparteeta mediu petru putere si LH, deci regulii: DC Puterea (zgomotului) este mica si parametrul LH este mic TUNCI mplitudiea creste cu. ori. cu gradul de îcredere î rezultat: mi precum si regulilor: P LH putere medie, LH medie respectiv: DC TUNCI Puterea (zgomotului) este mica si parametrul LH este mediu mplitudiea creste cu, ori. 3 Termeul echivalet româesc ar fi uatare 4

DC TUNCI cu gradele de îcredere Puterea (zgomotului) este medie si parametrul LH este mic mplitudiea creste cu, ori. mi si respectiv mi P LH putere mica, LH medie P LH putere medie, LH mic Celelalte cici reguli di Tabelul au gradele de îcredere î rezultat ule, deoarece valorile fuctiilor de aparteeta mare ale premiselor ( puterea este mare si LH este mare ) sut ule, petru valorile date, P 57 si LH, 7. Pri agregare (defuzzificare), cosiderata aici coform formulei uzuale: 9 k k x k y 9 (3) k x k se obtie valoarea de iesire (amplitudiea, cresterea cotiutului de frecvete îalte, cresterea lugimii vocalelor, respectiv cresterea duratei pauzei ditre cuvite). Î relatia de mai sus, reprezita abscisele sigletoilor de iesire di sistemele tip Sugeo respective, k X reprezita gradele de îcredere î cocluzia regulilor respective, iar y reprezita valoarea agregata (defuzzificata) de iesire a sistemului Sugeo. Sumarea se face petru toti sigletoii de iesire (otati de la la 9). Idicele arata ca e referim la parametrul cotrolat amplitudie, cotrolul fiid desigur diferetiat petru cei patru parametri discutati. Valorile astfel obtiute sut folosite, cum s-a precizat, ca factori de multiplicare ai parametrilor omiali 4. De exemplu, daca amplitudiea omiala este, atuci, pri aplicarea cotrolului, amplitudiea efectiva a semalului va fi: X k 9 k 9 k k k k x x (4) Sistemul de cotrol este istataeu, î sesul ca u tie cot decât de valorile recete (di fereastra prezeta, de largime W) ale zgomotului, u si de valorile aterioare. Cotrolul de 4 Nomiali, î sesul ca sut valorile stadard petru sistemul de siteza automata respectiv si petru suetul respectiv produs î coditiile cotextuale date. 5

amplitudie si frecveta se poate exercita î afara sitetizorului propriu-zis, asupra uui amplificator si a uui filtru plasate la iesirea sitetizorului. ceste doua cotroale se pot prevedea de altfel si î alte aplicatii, precum sisteme de soorizare mari (evetual distribuite, ca î cazul soorizarii uor spatii mari, ge piete sau stadioae), sau a uor sisteme de soorizare locale (de exemplu, sisteme de iterfoie). Cotrolul pauzelor ditre cuvite si u cotrol fi al spectrului vocalelor ecesita comada directa a sitetizorului. Sitetizor Filtru FTJ Cotrol fuzzy Figura 2. Schema bloc a uui sistem audio adaptiv la zgomotul ambietal I cazul î care se utilizeaza doar primele doua tipuri de adaptare, î amplitudie si spectral, adaptarea se poate realiza si cu mijloace hardware extere sitetizorului, putâd, de altfel, fi utilizata î orice aplicatie audio (de soorizare etc.). Schema uui asemeea sistem de adaptare este cea prezetata î Figura 2, o variata fiid iitial propusa î [4]. 4. daptare si variabilitate cotextual-iterpretativa Iterlocutorul uma raspude cu afect, dupa cum cosidera aormala, epotrivita, sau oricum î alt fel departe de asteptari îtrebarea sau afirmatia facuta de parteerul la dialog. De asemeea, raspusul este diferit atuci câd vorbitorul uma este esigur de raspus, are u iteres special î raspus sau î topica discutiei, sau, di cotra, este deziteresat. I plus, situarea iterlocutorului fata de parteerul sau parteerii de dialog, î cotext social sau afectiv, toalizeaza discursul verbal si îi imprima specificitate relativa. Toate aceste caracterisitici participative, precum si altele asemeea, dau comportametul verbal al omului, sut traduse î mare masura la ivelul semalului vocal pri prozodie, dar î prezet u se regasesc la ivelul masiii. Privitor la elemetele de baza privid prozodia, vezi [26]. Petru a implemeta u comportamet verbal, masia trebuie sa dispua de o baza de cuostite miimala pri care sa geereze acest comportamet. De exemplu, este ecesar sa se iterpreteze departe de ormal îtr-o asertiue sau îtrebare a iterlocutorului uma. Deci, vom presupue ca exista o baza de cuostite care permite o asemeea iterpretare. Costructia acestei baze de cuostite depide de domeiul î care se poarta dialogul. Î aceste coditii, accetul va fi mai puteric pe aumite parti ale frazei, sau raspusul va depide de asertiue sau îtrebare. Modul de raspus va fi dirijat de asemeea de o baza de cuostite, care iclude regulile ecesare modificarii sitezei (vezi Figura 3). Baza de cuostite - iterpretor Baza de cuostite - cotroler Sitetizor Figura 3. Schema de pricipiu a cotrolului cotextual-iterpretativ 6

Baza de cuostite-cotroler poate de asemeea fi implemetata cu reguli Daca tuci, de exemplu, de forma: DC oferta / raspusul iterlocutorului este easteptat (egasit î baza de cuostite baza de asteptare/ baza de cazuri), ori DC cuostite), TUNCI afectul sitezei este mirare / eîcredere/ / etc. oferta / raspusul iterlocutorului este easteptat egativ (coform bazei de TUNCI afectul sitezei este mirare si/sau furie. Folosid rezultatele regulilor de acest fel, se pot seta parametrii ierarhic iferiori, de toalitate, ai vocii sitetizate, pe baza acestora geerâdu-se parametrii efectivi de cotrol ai sitezei (amplitudie, frecvete formati etc.). Desi acest ge de cotrol poate parea complicat, sut situatii destul de geerale î care el se poate implemeta cu u efort relativ redus. De exemplu, atuci câd se determia (pritr-o masuratoare relativ simpla, de frecveta medie î spectrul vocal, sau de fudametala) ca iterlocutorul este u copil sau o persoaa de ge femii, se poate selecta ua sau ambele ditre alterativele: sistemul de siteza automata se seteaza pe o voce de acelasi tip (copil/femii) sistemul de siteza automata se seteaza pe voce calda si vorbire clara. Utilitatea si modalitatea de realizare a primei setari u ecesita explicatii. doua setare (care poate fi simultaa cu prima) se justifica î cazul iterlocutorului copil pri ecesitatea de a îi crea u mediu afectiv propice si liistit de dialog (voce calda ) si pri ecesitatea uei comuicari cât mai iformative, usor de urmarit. Petru a obtie o voce calda, se pot folosi trasee melodice cu variatii lete precum si frecvete mai joase ale formatilor si largimi mai mari (î zoa spre frecvete joase) a spectrelor formatilor. Claritatea vocii se poate traduce pri segmetarea mai proutata pe cuvite, precum si vocale mai lugi (cu sau fara accetuari ale spectrelor formatilor). Utilizarea uor asemeea adaptari ce ramâ î mare masura sa fie cocepute î detaliu, implemetate si testate este eîdoielic mare la siteza petru procese educative [5, 26], î aplicatii medicale (raspus sitetic destiat pacietilor), precum si î umeroase aplicatii geerale (de exemplu, sitetizoare utilizate î muzee, petru prezetarea expoatelor). lte modalitati de persoalizare afectiva sut colorarea frecvetiala si î amplitudie a aumitor parti di fraza sau î cadrul uui cuvât, aceste modificari locale fiid larg documetate î literatura, de ex. [6-8] si fiid relativ usor de implemetat. 5. Variabilitate pri metoda modularii de catre u sistem diamic eliiar Variabilitatea semalului vocal uma este bie cuoscuta [5-9], [9-26]. Variabilitatea de tip atural a semalului vocal sitetizat se poate obtie pri modularea diverselor cotroale (al amplitudiii, lugimii vocalelor, accetului, pitch-ului etc.) sau semale let variable, geerate de sisteme care prezita diamica eliiara (haos). Parametrii sistemului haotic respectiv pot modela u aume subiect; cosideram aici ca acesti parametri reprezita idividul vorbitor si persoalitatea lui. ceasta metoda, propusa de oi iitial î 992 ([28] s.a.), dar epublicata î forma extisa, credem ca reprezita o metoda promitatoare de persoalizare a vocii. Cosideram u sistem diamic eliiar, depedet de parametri; semalul î timp geerat de acesta este de forma x t x t,,...,, 2 q, ude h reprezita parametrii sistemului haotic si permit modelarea specificitatii vorbitorului. Semalul x poate fi folosit î modularea amplitudiii, 7

frecvetei fudametale, sau spectrului semalului vocal sitetizat. De exemplu, spectrul poate fi modificat folosid o lege de variatie a frecvetei cetrale a formatilor de forma: f f t t x t (5) j j j ude f j t este frecveta formatului umarul j la mometul t, t x j t, iar t f j este frecveta omiala a formatului respectiv. x j este semalul haotic respectiv U exemplu simplu de sistem haotic ce poate fi folosit î acest scop este dat de ecuatiile: 3 r 3 u u r 4 5 2 u 2 u (6),..., ude setul de coeficieti 6, R se alege î domeiul de valori ce corespude uui 5 comportamet haotic al sistemului (vezi exa 2). Setul de coeficieti, se poate seta,..., specific petru fiecare sistem de siteza automata, persoalizâd sistemul. Valorile de iesire ale geeratorului se scaleaza corespuzator si se folosesc la modularea uuia ditre parametrii de siteza. Petru exemplul di sectiuea 3, amplitudiea semalului soor devie, pri utilizarea modulatiei haotice: 5 9 k k x k r (7) 9 k x k ude este u coeficiet de scalare a seriei de timp r. Coeficietul se alege astfel îcât cotributia termeului r sa fie de ordiul procetelor ( r, ). Desigur, scara de timp a procesului de geerare de esatioae de semal vocal difera de scara de timp a proceselor haotice folosite î modulatie, ceasul celui de al doilea proces fiid mult mai let (de ordiul /) decât al primului proces. Petru evitarea trazitiilor bruste ale parametrului cotrolat, valorile geerate pot fi iterpolate si se poate realiza o variatie leta ître doua valori succesive. Cosiderâd ca u esatio al seriei haotice r este geerat la fiecare Q esatioae de semal vocal, seria r se poate îlocui cu seria (mai fia, dupa ceasul de geerare a esatioaelor semalului vocal): r r rk r k, k,,..., Q (8) Q Î scopul modularii haotice a mai multor parametri de siteza (amplitudie, frecveta cetrala a formatilor, largimea formatilor, elemete prozodice etc.), sut ecesare mai multe geeratoare haotice, câte uul petru fiecare parametru cotrolat. lterativ, se poate folosi u sistem uatat (fuzzy) haotic, aceste sisteme geerâd simulta u umar mare de iesiri ecorelate sau slab corelate [28]. 8

6. Cocluzii si discutii daptabilitatea si variabilitatea sistemelor de siteza a vocii si ale celor audio, î geeral, se pot asigura pri modificari relativ simple hard si soft ale sistemelor actuale. daptabilitate se poate maifesta atât î raport cu mediul soor, cât si î raport cu cotextul sau cu iterlocutorul. Ideea de adaptabilitate si metodele respective au fost itroduse de oi î urma cu peste 2 de ai si dezvoltate cotiuu î lucrarile citate, atât petru aplicatii de uz geeral, cât si petru aplicatii medicale. O aplicatie de iteres medical-educatioal este utilizarea uor sisteme de îvatare a uei limbi petru copii de vârste mici ( lua 3 ai) care sufera de deficiete de auz. Utilizarea uor sitetizoare cu spectru si amplitudie cotrolate, astfel îcât sa fie optim adaptate auzului (curbei de sesibilitate audiometrica) a fiecarui copil î parte ar ajuta asemeea copii sa îvete limba la aceasta vârsta. Este, îtr-adevar, demostrat ca îvatarea primelor elemete ale uei limbi la aceste vârste asigura o sasa mult mai mare de îvatare a limbii ulterior si de iserare sociala [24]. Lucrarea prezeta se situeaza îtr-u cotext mai larg, î cadrul cercetarilor realizate de diverse colective care cauta solutii petru a face vocea sitetica purtatoare de iformatie emotioala. stfel, î [3] se descrie o metoda de siteza a vocii emotioale, capabila sa trasmita trei emotii (suparare-furie, bucurie, tristete) folosid elemete de prozodie si segmete de tip vocala-cosoaavocala (specifice limbii japoeze). Î [32], starea ( mood ) si persoalitatea sut vazute ca elemete esetiale aparâd î subsidiar î voce si ecesar a fi itroduse si î vocea sitetizata. lti autori [33] vorbesc de ivelul de placere al auditiei (pleasatess) dicolo de iteligibilitate si vad aturaletea vocii sitetizate pri aceasta prisma, a utilizarii la ivel semificativ, a prozodiei ( we eed to kow more about how prosody could be utilized i huma-computer iteractio. We believe that we could borrow a lot from professioal huma speakers. Furthermore, speech applicatios should be built i a way that makes it possible to use prosodic features efficietly. ). Credem ca, î viitor, o metoda comoda de a geera automat prozodia, petru o voce artificiala data si petru o aumita stare, ar putea fi costituita de o procedura iversa celei descrise î [34]. Icheiem cu u citat di [35]: i spite of the log history of speech sythesis, o oe speech sythesis system available today is able to produce speech that could be characterized as atural or completely pleasat. I order to improve the speech quality of curret text-to-speech (TTS) systems i terms of aturaless, three areas must be addressed 5 : ) improved liguistic aalyses, 2) improved prosody modelig, ad 3) improved speech sythesis models. Multumiri. ceasta lucrare a fost realizata cu sprijiul material al cademiei Româe Istitutul de Iformatica Teoretica Iasi precum si cu sprijiul material partial al Societatii Tehici si Tehologii s.r.l. Iasi. utorul multumeste colegilor Dragos Burileau, Bogda Brazila si Oaa Gema petru sugestii si corectii la o forma prelimiara a lucrarii. Referite bibliografice []. Teodorescu H.N., Chelaru M., Sofro E., dascalitei.: daptive speech sythesis. I vol. Digitale Sprachverarbeitug - Prizipie ud weduge. VDE Verlag, Berli (W), pp. 83-88, 988 [2]. Teodorescu H.N.: Iterrelatioship, Commuicatio, Semiotics, ad rtificial Cosciousess. I: Kitamura, T. (Ed.): What Should be Computed to Uderstad ad Model Brai Fuctios FLSI Book Series, vol. 3, World Scietific, 2 [3]. Teodorescu H.N.: Computer semiotics: uderstadig meaigs ad parallel laguages (Refereed ivited paper), Proc. It. Cof. IIZUK 98, Japa, 998 [4]. Teodorescu H.N.: Makig speech sythesisers oise-adaptabile. Electroic Egieerig (UK), July 987, p. 23 [5]. Rodriguez, W., Teodorescu H.N., Grigoras Fl., Kadel., Buke H.: Fuzzy iformatio space approach to speech sigal oliear aalysis. J. of Itelliget Systems (Wiley), Dec. 999 [6]. Grigoras Fl., Teodorescu H.N., popei V.: Noliear alysis ad Sythesis of Speech. Studies i Iformatics ad Cotrol, vol. 7, o., March 998, pp. 57-72 5 ici, autorul citat face referire la L. R. Rabier, pplicatios of Voice Processig to Telecommuicatios, Proc. IEEE, vol. 82, pp. 99 228, February 994. 9

[7]. Teodorescu H.N., Grigoras Fl., popei V.: Noliear processes i speech productio. It. J. Chaos Theory ad pplicatios, vol. 2, o. 2 (997), pp. 35-52 [8]. Teodorescu H.N., Grigoras Fl.: Noliear Techiques i Speech Sigal alysis. Proc. Iteratioal Coferece o Itelliget Techologies i Huma-Related Scieces, ITHURS'96. July 5-7, Leo, Spai. Vol. 2, pp. 293-298, 996 [9]. Grigoras Fl., Teodorescu H.N., popei V.: alysis of oliear ad ostatioary processes i speech productio, IEEE 997 Workshop o pplicatios of Processig to udio ad coustics. Mohok Moutai House New Paltz, New York, October 9-22, 997 (IEEE Catalog # 97 TH 8278) []. Burlui V., Teodorescu H.N., Morarasu C.S.: La foctio phoatoire chez l'edete total. alyse e frequece. Les Cahiers de Prothese (Frace), No. 88, Decembre 994, pp. 63-68 994 []. Teodorescu H.N. et al.: Fuzzy models i speech aalysis ad medical applicatio, i Book of Summaries It. Cof Modellig ad Simulatio, Istabul, Turkey, July 988, vol., p. 62 (Summary) [2]. Teodorescu H.N., L. Buchholtzer, Chelaru M., Teodorescu L.: larygeal prosthesis based o perilarygea reflexes, Proc. 9th It. EMBS Cof. IEEE, Bosto. Vol. 4, IEEE, pp. 24-25, 987 [3]. oymous utomotive Idustry OEM/Supplier: Talkig to computers vs. talkig to humas 7/2/2. http://www-rd.htsa.dot.gov/departmets/rd-3/driver-distractio/topics34293.htm#293 [4]. e-marie Derouault, The Future of Speech Recogitio. Evolvig speech recogitio techology is drivig trasparet computig, makig it easier for people to iteract with computers. http://www.advisor.com/rticles.sf/id/o7.dero [5]. House D., Bell L., Gustafso K. & Johasso L. Child-directed speech sythesis: evaluatio of prosodic variatio for a educatioal computer program. Proc of Eurospeech 99, pp. 843-846, 999 [6]. Helder M., Stragert E. & Deschamps T.: Focus detectio usig overall itesity ad high frequecy emphasis. I: dersso R, beli Å, llwood J & Lidblad P, eds. Proc of Foetik 99; pp. 73-76, 999. [7]. Helder M., Stragert E. & Deschamps T.: focus detector usig overall itesity ad high frequecy emphasis. Proc of ICPhS-99, pp. 49-494, 999. [8]. Helder M.: O the o-liear legtheig of focally acceted Swedish words. I: W. va Dommele & T Fretheim, eds. Nordic Prosody: Proc of the VIIIth Coferece, Trodheim 2. Frakfurt am Mai: Peter Lag. 2 [9]. Karlsso I., Baziger T., Dakovicová J., Johstoe T., Lidberg J., Meli H., Nola F. & Scherer K.: Withi-speaker variability due to speakig maers. Maell RH & Robert-Ribes J, eds. Proc of ICSLP98, 2379-2382. 998 [2]. Karlsso I.: Withi-speaker variability i the VeriVox database. I: dersso R, beli Å, llwood J & Lidblad P, eds. Proc. of Foetik 99, pp. 93-96, 999. [2]. Karlsso I, Baziger T, Dakovicova J, Johstoe T, Lidberg J, Meli H, Nola F, Scherer K (998), Withi speaker variatio due to iduced stress, Proc Foetik-98, 5-53. www.lig.su.se/ fo/publicatios/foetik98/ [22]. Gustafso-Capkova S & Megyesi B.: Comparative Study of Pauses i Dialogues ad Read Speech. Proc of Eurospeech 2, pp. 93-935, 2 [23]. Beskow J.: tool for teachig ad developmet of parametric speech sythesis. I: Braderud P & Traumüller H (eds). Proc of Foetik -98, pp. 62-65. -98, 998 [24]. Rachel I. Mayberry, Elizabeth Lock, Hea Kazmi: Liguistic ability ad early laguage exposure. NTURE, Vol. 47, 2 May 22, p. 38, 22 [25]. Mircrosoft Co.: Platform SDK: get. Characters. http://msd.microsoft.com/library/default.aspurl=/library/e-us/msaget/deschar_86.asp [26]. Mauricio Lumbreras, Gustavo Rossi: Metaphor for the Visually Impaired: Browsig Iformatio i a 3D uditory Eviromet. CHI 95 Proc., www.acm.org/sigchi/chi95/proceedigs/shortppr/ml_bdy.htm [27]. Christophe d'lessadro & Jea-Sylvai Liéard: 5.2 Sythetic Speech Geeratio. I: Survey of the State of the rt i Huma Laguage Techology. http://cslu.cse.ogi.edu/hltsurvey/ch5ode4.html#section52 [28]. Teodorescu H.N.: Chaos i fuzzy systems ad sigals. Vol. Proceedigs of the 2d It. Cof. o Fuzzy Logic ad Neural Networks. Vol.., pp. 2-5 (Joo Pritig Co., 992, Iizuka, Japa) [29]. Teodorescu H.N., Kadel., Jai L. C. (Eds.), Fuzzy ad Neuro-Fuzzy Systems i Medicie (Iteratioal Series o Computatioal Itelligece). CRC Press, Boca Rato, US, 998. [3]. Teodorescu H.N., Mlyek D., Kadel. (Eds.): Itelliget Systems ad Iterfaces (The Kluwer Iteratioal Series I Itelliget Systems). Kluwer Publ., Bosto, 2.

[3]. Yasuhisa Niimi, Masaori Kasamatu, Takuya Nishimoto ad Masahiro raki: Sythesis of Emotioal Speech Usig Prosodically Balaced VCV Segmets. http://www.ssw4.org/papers/33.pdf. [32]. Nick Campbell: WHERE IS THE INFORMTION IN SPEECH (ad to what extet ca it be modelled i sythesis) www.slt.atr.co.jp/cocosda/jeola/proc/r82/r82.pdf. [33]. Hakulie J., Turue, M.: Prosodic Features for Speech User Iterfaces. www.cs.uta.fi/hci/spi/reports/prosodic_features_for_speech_user_iterfaces.pdf. [34]. sgar Rischeid: Voice Coversio Based O Topological Feature Maps ad Time-Variat Filterig. www.asel.udel.edu/icslp/cdrom/vol3/235/a235.pdf. [35]. Syrdal., Styliaou Y., Garriso L.+, Cokie. Schroeter J.: Td-Psola Vs. Harmoic Plus Noise model i Diphoe Based Speech Sythesis. www.research.att.com/projects/tts/papers/998_icssp/papersyn.ps. exa : Sisteme uatate de tip Sugeo, de ordi. Fuctii de aparteeta Reamitim ca o multime (clasica) de o fuctie caracteristica, de forma: : X, x daca x daca x X, ude X oteaza uiversul de discurs, este defiita Pri geeralizarea coceptelor de multime si de fuctie caracteristica, se defiesc multimile uatate (fuzzy) si fuctiile de aparteeta corespuzatoare astfel: o multime uatata, otata ~, peste uiversul de discurs X, este caracterizata uic de o fuctie de aparteeta: : [, ] X I particular, fuctia de aparteeta poate fi de forma: x petru petru x a x a X caz î care se umeste sigleto. U sistem de tip Sugeo, de ordi, este descris de reguli de forma: DC itrarea (premisa) # SI premisa # 2 SI Si premisa # TUNCI cocluzia ude premisele sut de forma: x i este ~ ij, iar ~ ~ ij sut valoari uatate (fuzzy), de exemplu i = ~ mare, i2 = mediu, atributelor ligvistice mare, mic etc. fiidu-le atasate câte o fuctie de aparteeta. Specific sistemelor Sugeo este faptul ca î cocluzie apar valori umerice si u valori uatate, cocluzia fiid deci de forma y =,3 (sigleto). Defiitiile fuctiilor de aparteeta petru itesitatea soora di Figura.a sut: Putere mica p p 4 5 petru petru petru p 4 p 55 db p 4 db 55 db

Putere medie p p 4 5 p 55 5 petru petru petru petru p 4 p 55 db 55 p 7 db p 4 db 7 db Putere mare p p 55 5 petru petru petru p 55 p 7 db p 55 db 7 db Defiitiile fuctiilor de aparteeta petru raportul HL (Figura b) sut: HL mica HL medie q q q.5.5 q.5.5 q..5 petru q.5 petru.5 q. petru p. petru q.5 petru.5 q. petru. q.5 petru p.5 HL mare q q..5 petru petru petru q.. q q.5.5 Petru detalii asupra maipularii fuctiilor de aparteeta si a regulilor î sistemele uatate, a se vedea orice maual î domeiul sistemelor fuzzy, sau volume precum [29, 3] î care se pot gasi si aplicatii specifice legate de îtelegerea vorbirii, sau alte aplicatii medicale. exa 2: Procesul haotic Procesul reprezetat de ecuatiile (7) are o diamica haotica doar petru aumite subitervale relativ îguste di 6 R. Î restul spatiului, comportametul este asimptotic istabil (peste tot petru 3 valori ale coeficietilor lui r mai mari ca, î modul, daca si coeficietul lui u este mai mare ca î 6 modul); comportametul este stabil sau periodic petru alte zoe, relativ reduse di R. Diagrama de bifurcatie a procesului, asa cum apare î Figura, este obtiuta petru: valorile coeficietilor [Q]={., -.7, -.8,.}; coeff_4 =.; coeff_5= -.5; coditie iitiala r[]=.3; umar total de pucte î diagrama de bufurcatie: 5 (puctele de la 5 la ); regimul trazitoriu elimiat: primele 5 pucte; precizia tuturor coeficietilor si variabilelor: double. 2

Figura 2-. Diagrama de bifurcatie a procesului Legile folosite (coform codului, scris î limbajul C) sut: u[]= (coeff_4)*r[]+coeff_5 -.5*(float)k; x=u[]; r[+]=poly(x, Q, coeff); (Q este umarul de valori î vectorul coeficietilor, Q=4) Figura 2-2 Semalul î domeiul amplitudie-timp di Figura 2 a fost obtiut petru ecuatiile (cod C): u[]= coeff_4*r[]+coeff_5-.5*2.; x=u[]; r[+]=poly(x, Q, coeff); Semalul obtiut petru valoarea u[]= coeff_4*r[]+coeff_5-.5*2. (restul programului fiid idetic ca petru cazul aterior) este ilustrat î Figura 3. Figura 2-3 iar semalul obtiut cu u[]= coeff_4*r[]+coeff_5-.5*2.7, precum si la o scara dubla de timp, este ilustrat î Figura 4: Figura 2-4 Regiuile spatiului parametrilor î care sistemul este stabil, dupa cum s-a spus deja, sut relativ îguste. Petru parametrii coeff_-coeff_4 fixati si coeficietul coeff_5 variabil ître 25.5 si + 4.85 (6 de pasi, cu pas,5), doar zoa îgusta di Figura 2-5 este stabila, oscilata sau 3

haotica, î rest sistemul fiid asimptotic istabil. Petru usurita urmaririi scarii, liia di partea de jos a figurii reprezita itervalul metioat, [ 25.5, + 4.85]), î care s-a testat sistemul. Figura 2-5 Î figura, se poate remarca diagrama de bifurcatie a sistemului, cu zoele de stabilitate, oscilatie si haos. Petru restul itervalului, pri program, calculele sut abadoate, deoarece valorile de iesire ale sistemului depasesc, î valoare absoluta,. 4