Transmisia datelor multimedia in retele de calculatoare <Titlu Lucrare>

Documente similare
Microsoft Word - Fisa DRS - ROMANA.docx

S.C. SEEKTRON S.R.L. Fişă de prezentare a produsului EYECAR B1 EYECAR B1 Observer Black Box Dispozitiv inteligent pentru înregistrarea evenimentelor r

Slide 1

Sistem de supraveghere video inteligent cu localizarea automata a evenimentelor de interes SCOUTER, cod proiect PN-II-IN-DPST , contract nr

PowerPoint Presentation

Kein Folientitel

Microsoft Word - 2 Filtre neliniare.doc

Capitole Speciale de Informatică Curs 2: Determinarea vocabularului de termeni şi a listelor de postări 4 octombrie 2018 Reamintim că listele de indec

Emoji Planet Video Slot™

OPERATII DE PRELUCRAREA IMAGINILOR 1

Guardian2012_RO3

carteInvataturaEd_2.0_lectia5.pdf

PowerPoint Presentation

Universitatea Tehnică Gheorghe Asachi, Iași Facultatea de Electronică, Telecomunicații și Tehnologia Informației Triangulaţia și aplicații (referat) P

Fâciu N. Maria-Ema CASA CORPULUI DIDACTIC BRĂILA PROGRAM DE FORMARE INFORMATICĂ ȘI TIC PENTRU GIMNAZIU CLASA A V-A SERIA 1 GRUPA 2 CURSANT: Fâciu N. M

Introducere

MergedFile

CASA CORPULUI DIDACTIC BRAILA PROGRAM DE FORMARE INFORMATICA SI TIC PENTRU GIMNAZIU CLASA A V-A SERIA 1 GRUPA 2 CURSANT: TIMOFTI V. AFRODITA COLEGIUL

Noțiuni matematice de bază

WorkCentre M123/M128, WorkCentre Pro 123/128, CopyCentre C123/128 Ghid de Configurare Rapidă pentru Reţea

Vostro 3500 Fişă tehnică informativă privind configurarea şi funcţiile

Înregistrator de temperatură şi umiditate AX-DT100 Instrucţiuni de utilizare

Politica N21 privind modulele Cookie mobile Network TwentyOne se angajează să vă protejeze pe dumneavoastră și orice date (anonime sau de altă natură)

Concepte de bază ale Tehnologiei Informației

Întrebări frecvente pentru candidaţi proiecte de parteneriat strategic 1.Aceeaşi instituţie poate depune două candidaturi de parteneriat strategic la

Utilizare Internet

e-learning Agronomie Platforma de e-learning Versiunea: Ghid de utilizare Beneficiar: UNIVERSITATEA DE STIINTE AGRONOMICE SI MEDICINA VETERINARA

AdVision este un software de narrowcasting, destinat tuturor celor care administrează conţinut pe o reţea de monitoare. Fie că este vo

Lucrarea 10

FAE 1718 Fixed Wing REBEL Rebel 1718 este o drona profesionala tip avion pentrutopografie si agricultura pe suprafete foarte mari martie 2019 Acoperir

manual_ARACIS_evaluare_experti_v5

CL2009R0976RO bi_cp 1..1

Constanta, Bd. Mamaia nr. 85;tel NOTĂ DE INFORMARE CU PRIVIRE LA PRELUCRAREA DATELOR CU CARACTER PERSONAL Conform R

Capitole Speciale de Informatică Curs 4: Calculul scorurilor în un sistem complet de extragere a informaţiilor 18 octombrie 2018 Reamintim că în cursu

UNIVERSITATEA „HYPERION” DIN BUCUREŞTI


MENȚIUNI LEGALE Acest site stabilește instrucţiunile pentru utilizatorii de internet care vor vizita acest website. Fiecare utilizator îşi asumă răspu

Discipline aferente competenţelor Facultate: Facultatea de Electronică şi Telecomunicaţii Universitate: UNIVERSITATEA POLITEHNICA DIN TIMIȘOARA Domeni

PowerPoint Presentation

Facultatea de Științe Politice, Administrative și ale Comunicării Str. Traian Moșoiu nr. 71 Cluj-Napoca, RO Tel.: Fax:

Microsoft Word - FLIR - camere portabile de securitate si supraveghere.doc

ThemeGallery PowerTemplate

INFORMATICĂ ŞI MARKETING

4_Prigoreanu

ÎS CENTRUL DE TELECOMUNICAȚII SPECIALE CENTRUL DE CERTIFICARE A CHEILOR PUBLICE POLITICA de utilizare a certificatelor SSL Iunie 2013 Chişinău 2013

Sisteme de calcul în timp real

Elemente principale în determinarea profitului impozabil

Organizãm cursuri de limbi strãine: 1. Online 2. Faþã în faþã 3. Prin corespondenþã 4. La telefon

metro-privacy

CV-Europass Chicioreanu-RO.doc

Anexa Invitație de participare (CO-B) Proiectul privind Învățământul Secundar (ROSE) Schema de Granturi pentru Licee Beneficiar:Liceul Teoretic

POLITICA DE CONFIDENȚIALITATE CHILL FM valabilă la data de Website-ul și aplicația Chill FM (denumite în continuare în mod c

Sesiunea de comunicări ştiinţifice studenţeşti – Ediţia 2019

Instrumentul UE de stabilire a profilului de competențe al resortisanților din țările terțe MANUAL DE UTILIZARE Versiunea 1: 6 noiembrie 2017 Europa s

Modelarea si Simularea Sistemelor de Calcul

FD Informatica

Microsoft Word - Curs_08.doc

manual_ARACIS_evaluare_experti_v4

Admitere

Inserarea culorilor in tabele

Cuantizare Vectoriala.doc

Microsoft Word - SAP Ariba Privacy Statement for Cloud Services-for May-2018Release-CLEANtyposfixed( )_ro_RO.docx

Microsoft Word - TIC5

Inspiron Specificaţii (Battery)

DCS-2330L_A1_QIG_v1.00(EU).indd

Lanțul de aprovizionare E.ON Ghidul furnizorului Instrucțiuni pas cu pas

PowerPoint Presentation

SRS-BTS50_QSG_ro

Număr Raport 2017SYI029RNG343_1 Data 20 iulie 2018 Tip Raport: Evaluare și Certificare GLI GLI Europe BV Diakenhuisweg AP Haarlem The Nethe

COMISIA EUROPEANĂ DIRECȚIA GENERALĂ INFORMATICĂ Componenta de aplicare a politicii WiFi4EU Ghid de implementare v1.0 Cuprins 1. Introducere Br

Ghid Web connect DCP-J4120DW MFC-J4420DW MFC-J4620DW MFC-J5320DW MFC-J5620DW MFC-J5720DW

Informație și comunicare

Creational design patterns

SSC-Impartire

rptFisa

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

Instructiuni pt. depunerea declaratiei A4200 Declaratia A4200 se construieste pornind de la o colectie de fisiere XML, reprezentand fiecare o zi fisca

PREZENTAREA BIBLIOTECII U

Ghid de conectare la web MFC-J825DW MFC-J835DW DCP-J925DW Versiunea 0 ROM

Procesarea Imaginilor Laborator 3: Histograma nivelurilor de intensitate 1 3. Histograma nivelurilor de intensitate 3.1. Introducere În această lucrar

Update firmware aparat foto Mac Mulţumim că aţi ales un produs Nikon. Acest ghid descrie cum să efectuaţi acest update de firmware. Dacă nu aveţi încr

PowerPoint Presentation

EDC_HRE_VOL_2_ROM.pdf

BMW Plăcerea de a conduce BMW X1 xdrive18d BMW online: a2m7e7o5 Data imprimare 08/14/2017 Pagina 1/11

Volumele Conferintei vor aparea cu ISBN si ISSN, in conformitate cu uzantele internationale, ceea va facilita includerea lor in cea mai favorabila cat

Slide 1

SRI vrea să cumpere softul Big Brother. Pentru eguvernare. Explicațiile unui caiet de sarcini tehnic de pe SEAP (nr. anunț de participare /17.07

BOXA PORTABILA cu Bluetooth si FM-radio MANUALUL UTILIZATORULUI PS-460 PS-470

PROIECT AUTORITATEA ELECTORALĂ PERMANENTĂ HOTĂRÂRE privind unele măsuri pentru buna organizare și desfășurare a alegerilor pentru membrii din România

AHU Cel mai avansat produs de climatizare: alimentat direct şi indirect Mark a dezvoltat o gamă de unităţi de tratare a aerului cu mai multe opţiuni p

UNIUNEA EUROPEANA GUVERNUL ROMÂNIEI Instrumente Structurale PROGRAMUL OPERAŢIONAL SECTORIAL CREŞTEREA COMPETITIVITĂŢII ECONOMICE - co-finanţ

Avenir Telecom isi consolideaza activitatea in Romania cu ajutorul Microsoft Dynamics NAV Despre organizatie Avenir Telecom are peste 3000 de angajati

Microsoft Word - Curs_09.doc

seb26_bk_manual_md.ai

ORIGINAL VERSION

Slide 1

Microsoft Word - SKS 502x_M7_RO.docx

Addendum Syllabus 6 Microsoft Word 2016 REF Syllabus 6.0 Crearea unui document nou pe baza unor șabloane disponibile local sau online Microsoft

Inspiron Specificaţii

Combinăm inovația de generație viitoare cu un design compact, fiabilitate și ușurință în utilizare. Lansăm gama de imprimante edding, în două variante

Transcriere:

UNIVERSITY POLITEHNICA of BUCHAREST DEPARTMENT OF COMPUTER SCIENCE Analiza şi extragerea automată a conţinutului documentelor Paper-Based Augmented Reality Căţoiu Laurenţiu-Cătălin catoiulaurentiu@yahoo.com documentelor 1

Cuprins Realitatea augmentată Aplicații AR Paper Based AR Descrierea algoritmului Text Patch Recognition Detalii implementare Aplicații Concluzii documentelor 2

Realitate augmentată (AR) Realitatea augmentată oferă o perspectivă în timp real, directă sau indirectă, asupra unui mediu fizic existent, ale cărui elemente sunt augmentate folosind senzori şi instrumente multimedia. Spre deosebire de realitatea virtuală, nu este creată o simulare a realităţii. Utilizatorului ii este permis să vadă lumea reală, împreună cu elemente suprapuse sau compuse cu cele din realitate. documentelor 3

Aplicaţii AR Jocuri sportive televizate Expoziţii muzee Jocuri FPS (Head Mounted Display) Aviaţie, automobile (Head-Up Display) Medicina Cinematografie Publicitate Arhitectură documentelor 4

Paper-based AR Recunoaşterea de imagini este folosită pentru obţinerea de informaţii conexe, folosind markere explicite sau implicite într-o scenă Se pot declanşa procese, cum ar fi extragerea de informaţie dintr-un web site. Metoda propusă nu modifică formatul documentului de pe hârtie, nefiind introduse coduri de bare sau markere. Porţiuni dreptunghiulare de text pot conţine destulă informaţie pentru a le face unice asemenea unor amprente. Porţiuni aleatoare de text pot deveni markere pentru AR, făcând legătura cu datele electronice de pe un site web. Se foloseşte o cameră de telefon mobil drept instrument de recunoaştere. documentelor 5

Descrierea algoritmului Documentele ce permit PBAR (Paper-Based Augmented Reality) sunt inițial scanate și indexate pentru recunoașterea porțiunilor de text. Datele electronice sunt asociate cu regiuni hot spots ce reprezintă porțiuni dreptunghiulare de text. documentelor 6

Descrierea algoritmului (2) Indexarea și datele hot spot sunt stocate în baza de date PBAR. Un exemplu de date asociate cu un hot spot este un URL către pagină web, dar ar putea fi și un fișier video sau audio sau chiar versiunea electronică a documentului însuși. Utilizatorul fotografiază o porțiune din document cu ajutorul camerei de la telefon, iar sistemul aplică același algoritm de recunoaștere a porțiunilor de text folosit la faza de indexare, determinând dacă imaginea se află în baza de date. Este returnat un identificator al paginii, precum și coordonatele porțiunii curente de text și regiunile hot spot din apropiere. Datele asociate unui hot spot pot fi transmise telefonului si redate cu ajutorul unei aplicații corespunzătoare, cum ar fi un web browser pentru date de tip URL. documentelor 7

Text Patch Recognition Obiectivul acestui algoritm este determinarea corectă a identității paginii și coordonatele porțiunii de text fotografiate. Imaginile tipice produse de camerele telefoanelor au o calitate redusă, caracterele fiind atât de încețoșate încât OCR este greu de aplicat. Se pot identifica însă bounding box-urile din jurul cuvintelor, din moment ce spațiile dintre cuvinte și linii se pot distinge. O metodă anterioară pentru potrivirea imaginilor folosea numărul de caractere din N cuvinte adiacente orizontal (denumite n-grame), pe post de caracteristică sau descriptor și identifica imaginea de intrare pe baza porțiunii ce conținea cei mai mulți descriptori. Valorile tipice pentru N erau 4,5 sau 6 și aveau o precizie îmbunătățită când se aplica pentru date sintetice. documentelor 8

Text Patch Recognition (2) În prezența zgomotului se obține o precizie mai slabă, deoarece procentajul de n-grame incorecte crește cu procentajul cuvintelor cu lungimea determinată imprecis. Această metodă poate fi îmbunătățită prin folosirea aranjamentului vertical al cuvintelor pe lângă cel orizontal. documentelor 9

Text Patch Recognition (3) Trigramele verticale sunt generate exhaustiv din toate cuvintele aflate sub sau deasupra unui cuvânt dat, unde sub și deasupra sunt bazate pe suprapunerea bounding box-urilor. Documentele ce conțin atât trigrame orizontale cât și trigrame verticale sunt căutate în bazele de date organizate să suporte astfel de interogări. Sunt furnizate și două liste de voturi. Algoritmul care combină listele de voturi de la potrivirea n-gramelor orizontale și verticale folosesc informație despre localizarea fizică a n-gramelor în cadrul documentelor originale. documentelor 10

Text Patch Recognition (4) Pentru fiecare document în comun din primele M alegeri făcute de fiecare clasificator, locația fiecărei n-grame orizontale ce a votat pentru documentul respectiv este comparată cu fiecare n-gramă verticală ce a votat pentru același document. Performanța metodei de combinare a n-gramelor de lungimi de cuvinte, orizontale și verticale, a fost testată cu date extrase din 738 fișiere Word, conținând 5699 de pagini, downloadate de pe Internet. Fișierele au fost convertite la o reprezentare XML ce include toate caracterele. documentelor 11

Text Patch Recognition (5) Fiecare cuvânt, cum ar fi solutions, este caracterizat prin numărul de document 3075 și numărul paginii în care a apărut. Sunt date și coordonatele bounding box, precum și lungimea cuvântului. Un simulator de zgomot a fost dezvoltat pentru a alege aleator un procentaj dat de cuvinte cărora le modifica lungimea prin adunarea sau scăderea cu 1. Un experiment a fost realizat și consta în combinarea primele 10 alegeri de la ambele clasificatoare folosind criteriul suprapunerii. Dacă o porțiune nu era comună rejectată de sistem. documentelor 12

Text Patch Recognition (5) Adaptarea clasificatorului pe bază de bounding box la imagini de slabă calitate obținute cu o cameră de mobil a dus la creearea unor descriptori ce reprezentau lungimea cuvintelor în unități denumite nubs, determinate prin raportul dintre lățimea unui cuvânt în pixeli și înălțimea lui. Descriptorii unei porțiuni de text combină informația orizontală și verticală utilizând unghiurile dintre grupuri de bounding boxes adiacente orizontal și vertical. Hash table-ul este organizat pe porțiuni de text și nu pe pagini complete. Rezultatul identificatorului de porțiuni este o listă de porțiuni (incluzând și paginile în care apar și coordonatele lor) sortate după numărul de descriptori în comun cu imaginea de intrare. documentelor 13

Detalii implementare Implementarea a fost realizată folosind un telefon Treo 700w cu un procesor PXA272 312Mhz având 4 cadre pe secundă și o bază de date cu 250 de documente. Au fost realizate experimente pentru testarea preciziei sistemului în timp real (rulând pe un PC) cu o bază de date de 5000 de imagini de dimensiunea 176x144, generate de un sistem ce simula ieșirea video a unui telefon Treo ca și cum se deplasa pe deasupra documentului. Rezultatele au arătat că o rată corectă de 55% poate fi obținută cu imagini ce conțin 8 linii de text. În practică este un rezultat adecvat, deoarece un sistem PBAR rulează în timp real pe un stream video în timp ce utilizatorul deplasează camera pe deasupra documentului, cooperând în mod esențial cu identificatorul pentru a îmbunătăți performanța. documentelor 14

Aplicații Sunt multe aplicații posibile bazate pe PBAR, ele fiind diferențiate în funcție de baza de date, care se poate afla pe telefon sau pe un server și dacă baza de date este creată ca un efect secundar al printării unui document pe PC. O primă aplicație este un ghid pentru călătorii, în care de exemplu se poate afla orarul unui loc pe care utilizatorul vrea să îl viziteze. documentelor 15

Aplicații (2) Clickable Paper documentelor 16

Concluzii A fost prezentată o metodă prin care se poate asocia conținut electronic unor documente pe hârtie fără a schimba formatul lor. Se bazează pe ideea esențială că semnătura unui document poate fi obținută dintr-o porțiune de text și acea semnătură poate fi linkată cu date electronice. A fost descrisă o metodă de recunoaștere a porțiunilor de text și au fost prezentate rezultate experimentale ce au demonstrat identificarea unei porțiuni dintr-o colecție de imagini. Există și o altă abordare pentru documente și prelucrarea lor cu ajutorul AR și anume PADD (Paper Augmented Digital Document) ce ajută ca modificările făcute pe documentul original să fie vizibile și în documentul electronic PapierCraft PaperProof documentelor 17

Vă mulțumesc! Întrebări? documentelor 18