RO127932B1 - Metodă pentru detectarea cadrelor cu conţinut compatibil 3d - Google Patents

Metodă pentru detectarea cadrelor cu conţinut compatibil 3d Download PDF

Info

Publication number
RO127932B1
RO127932B1 ROA201200376A RO201200376A RO127932B1 RO 127932 B1 RO127932 B1 RO 127932B1 RO A201200376 A ROA201200376 A RO A201200376A RO 201200376 A RO201200376 A RO 201200376A RO 127932 B1 RO127932 B1 RO 127932B1
Authority
RO
Romania
Prior art keywords
frames
content
image
edge
projections
Prior art date
Application number
ROA201200376A
Other languages
English (en)
Other versions
RO127932A0 (ro
Inventor
Cristian-Gavril Olar
Andrei-Claudiu Cosma
Demis Diaconescu
Cormac Brick
Mihai Micea
Valentin Mureşan
Original Assignee
Movidius S.R.L.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Movidius S.R.L. filed Critical Movidius S.R.L.
Priority to ROA201200376A priority Critical patent/RO127932B1/ro
Publication of RO127932A0 publication Critical patent/RO127932A0/ro
Publication of RO127932B1 publication Critical patent/RO127932B1/ro

Links

Landscapes

  • Image Analysis (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

Invenția se referă la o metodă pentru detectarea cadrelor cu conținut compatibil 3D, folosită pentru analizarea cadrelor video, în vederea îmbunătățirii imaginii stereografice și a procesării video utilizate cel mai mult în televiziune și dispozitive 3D.
Semnalul video provine din diverse surse, precum: transmițătoare TV 3D, aparate de redare BluRay, console multimedia (multimedia box) sau orice alte dispozitive de generare a semnalului video. Definim imaginile vizionabile ca fiind imagini percepute cu un înțeles de mintea umană. Imaginile 2D sunt întotdeauna vizionabile, în timp ce imaginile 3D le solicită sistemelor de afișare să aplice diferite tehnici stereografice pentru a crea imagini vizionabile.
în domeniul procesării video 3D există invenții aflate în diverse stadii de evaluare, care tratează concepte similare.
Invenția US20120038744 utilizează o combinație de metode constând din analizarea vectorilor de mișcare și potrivirea de histograme pentru a obține rezultatul informației 3D, lucrând pe un șir de cadre succesive.
Invenția WO2011098936A2 prezintă un sistem și metodă care folosește hărți de adâncime computerizate, bazate pe factorul de neasemănare dintre imaginile obținute din cadrele receptate, pentru a detecta conținutul 3D compatibil la nivel de cadru.
Invenția KR20090025934A determină conținutul 3D compatibil la nivel de cadru, prin comparație cu o imagine 3D de referință.
Invenția US2010053306A1 folosește vectorii de mișcare din cadre multiple, pentru a detecta conținutul 3D compatibil la nivel de cadru.
Invenția US2011267360A1 propune o metodă de detectare a conținutului 3D compatibil la nivel de cadru, dar nu descrie modul specific de funcționare a metodei. în schimb, folosește generic numai un bloc de „colecții de algoritmi de detectare 3D.
Invenția WO2011071467A1 descrie o soluție care detectează caracteristicile imaginii pentru a determina dacă este vorba despre un conținut 3D compatibil la nivel de cadru. Este important să menționăm că, deși se folosește termenul „muchie, această cerere de brevet îl definește clar într-un mod diferit de termenul canonic de „muchie a imaginii, așa că nu prezintă similarități cu metoda descrisă în prezenta invenție, chiar dacă se folosesc termeni similari.
Invenția W02011071473A1 descrie o soluție care generează o hartă a diferențelor dintre suprafețele imaginilor comparate, pentru a detecta conținutul 3D compatibil la nivel de cadru. Metoda se bazează pe observația că hărțile obținute vor avea regiuni de diferențe care, în cazul conținutului 3D compatibil la nivel de cadru, arată ca niște muchii subțiri, în timp ce la conținutul 2D „muchiile ar fi mult mai groase dacă ar fi prezente. Posibil ca pe harta diferențelor să apară pete în loc de linii. Analiza grosimii „muchiilor determină natura conținutului din punct de vedere 3D.
Invenția WO2011162737A1 utilizează vectorii de mișcare din cadre multiple, pentru a testa și determina conținutul 3D compatibil la nivel de cadru.
în general, dezavantajul tehnologiei de ultimă generație prezentată pe scurt mai sus este că toate abordările analizează problema clasificării conținutului într-o manieră mai degrabă teoretică, la modul general, fără să încerce să elimine cazuri specifice de introducere a deciziilor de detectare prezente în fluxurile reale.
Problema tehnică pe care o rezolvă invenția constă în detectarea automată a conținutului 3D dintr-o secvență video, ca răspuns precis privind natura imaginii procesate, și de a oferi informații despre cele trei formate posibile 3D TAB, 3D SBS, 2D.
Metoda pentru detectarea cadrelor cu conținut compatibil 3D, ce utilizează un circuit receptor de cadre, un modul de memorie destinat stocării cadrelor video, un modul de memorie destinat stocării datelor procesate, reprezentate de imaginea de muchii și imaginea eșantionată, și un modul ce conține o unitate centrală de procesare, înlătură dezavantajele de mai sus prin aceea că parcurge următoarea succesiune de pași cu ajutorul unității centrale de procesare:
RO 127932 Β1
- generează o imagine de muchii din informațiile din cadrele capturate de către 1 circuitul receptor de cadre, pentru a elimina erorile datorate diverselor variații cromatice ale imaginilor reale obișnuite; 3
- calculează seriile de proiecții pe baza valorilor aferente imaginii de muchii, înlăturând informațiile din cadrele inducătoare în eroare, detectate pe marginea cadrelor și 5 având praguri identice, pentru a determina un factor de similaritate;
- ia decizia de clasificare a conținutului drept 3D Alăturat, 3D Suprapus sau 2D 7 folosind o tehnică de ieșire devreme din execuție, în cazul detectării unei condiții favorabile, folosind un minim necesar de comparații al factorilor de similaritate obținuți pentru conținut 9 3D Alăturat, cât și pentru 3D Suprapus.
Avantajele invenției sunt următoarele:11
- permite detectarea automată a conținutului 3D dintr-o secvență video, și afișarea în format 3D stereografic vizibil;13
- permite detectarea muchiilor și normalizarea proiecțiilor, filtrând deciziile false;
- minimizează consumul de memorie în timpul aplicării;15
- înlătură liniile și coloanele posibil inducătoare în eroare din jurul bordurii cadrului, focalizând analiza doar pe partea semnificativă a conținutului real;17
- folosește praguri alese în mod autoadaptiv, permițând îmbunătățirea facilă a acestora atunci când sunt aplicate unor noi secvențe video;19
- utilizează ieșirea devreme din execuție, în cazul detectării unor condiții favorabile (tehnica „early exit, de cascadare);21
- poate fi aplicată generic oricărui tip de conținut video, și anume, 3D SBS, 3D TAB sau 2D.23
Se dă, în continuare, un exemplu de realizare a invenției, în legătură cu fig. 1...11, ce reprezintă:25
- fig. 1 este o schemă funcțională a sistemului și a asocierii metodei de detectare a conținutului 3D compatibil la nivel de cadru cu sistemul de hardware care asigură platforma 27 operațională;
- fig. 2 este o schemă-bloc a circuitului receptor de cadre, utilizat pentru a direcționa 29 cadrele video în sistemul de memorie a cadrelor;
- fig. 3 este o imagine explicativă a tipului de transmisie a cadrelor 3D tratate de 31 invenție;
- fig. 4 este o imagine explicativă a tipului de transmisie a cadrelor 3D netratate de 33 invenție;
- fig. 5 este o imagine explicativă a comparației dintre imaginea primită și cea 35 eșantionată;
- fig. 6 este o schemă funcțională a modului în care se obține imaginea de muchii din 37 imaginea eșantionată, și o explicație vizuală a rezultatului;
- fig. 7 este o imagine explicativă a modului în care seria de proiecții se suprapune 39 cu cadrele procesate;
- fig. 8 este o reprezentare grafică a diferențelor absolute dintre seriile de proiecții 41 corespondente;
- fig. 9 este o reprezentare grafică a subpasului de corelare executat pentru a 43 minimiza diferențele;
- fig. 10 este o schemă logică de program a metodei care descrie subpașii de 45 comparare a seriilor de proiecții;
- fig. 11 este o schemă logică de program a metodei care ilustrează subpașii urmați 47 pentru a determina dacă acest conținut este 3D SBS, 3D TAB sau 2D.
RO 127932 Β1
Metoda pentru detectarea cadrelor cu conținut compatibil 3D, conform invenției, realizează efecte tehnice de detectare automată a conținuturilor 3D dintr-o secvență video, afișarea în format 3D stereografic vizibil, și posibilitatea reglării unor proceduri de detectare pe baza execuției unor decizii, învățând din fluxurile reale și utilizând praguri autoadaptive în special în cazurile greu de detectat, folosind un microsistem digital și o metodă printr-un software implementat.
Invenția utilizează o platformă hardware, prezentată în fig. 1, constituită dintr-un circuit 1 receptor de cadre, ce direcționează cadrele video înspre sistem, fără să încalce puterea de procesare a celorlalte elemente ale sistemului, un modul 2 de memorie, destinat stocării cadrelor video, cerut de platforma hardware, ce reprezintă suportul de stocare a cadrelor de care este nevoie în momentul procesării, un modul 3 de memorie, pentru stocarea procesării de date, folosit pentru a păstra imaginea de muchii și imaginea eșantionată. în circuitele modulelor 2 și 3 nu trebuie să existe circuite separate, dacă operațiunile acestora sunt executate în mod corespunzător. Un alt modul al platformei este modulul 4 UCP, ce reprezintă Unitatea Centrală de Procesare și care constă într-un microprocesor capabil să ruleze metoda de determinare a cadrelor compatibile 3D. Un modul 5, reprezentând blocul de procesare a muchiilor, asigură realizarea pasului de metodă prin care se obține imaginea de muchii din cadrele de intrare. Un modul 6 de circuite pentru determinarea proiecțiilor asigură pasul de metodă care se ocupă cu proiecțiile extrase din imaginea de muchii explicată anterior. Metoda parcurge un pas final în cadrul unui modul 7 de comparare a factorilor de similaritate obținuți atât pentru conținut 3D Alăturat (SBS), cât și pentru 3D Suprapus (TAB), și prezintă decizia de clasificare a conținutului drept 3D SBS, 3D TAB sau 2D.
Sursele video furnizează conținut într-un format de spațiu de culoare, de obicei RGB sau YUV. Oricare componentă de culoare poate fi folosită pentru procesare. Metoda este exemplificată pe componenta de luminozitate a imaginilor, și folosește spațiul de culoare YUYV 4:2:2.
Cadrele sunt direcționate în memoria de stocare a cadrelor a sistemului prin intermediul circuitului receptor de cadre, detaliat în fig. 2. Circuitul receptor de cadre poate accepta semnale de sincronizare pe orizontală și verticală, definite ca HSYNC și, respectiv, VSYNC, și este prevăzut cu un generator 8 de tact, necesar pentru procesarea datelor de intrare pentru pixeli. Aceste semnale sunt ulterior conectate printr-o interfață de intrare la un controler 9 de acces direct la memorie (DMA), specializat, care poate accepta diverse locații de memorie ca ieșire, conform specificărilor blocului de registre de configurare. Folosind registrele de configurare, se implementează o tehnică de double buffering, astfel încât cadrul tocmai direcționat în sistem să rămână neatins pe o durată de timp necesară pentru ca sistemul să captureze datele sale relevante, ce urmează a fi procesate. Datele unui cadru sunt capturate copiind pur și simplu partea care conține datele relevante, într-o locație de memorie sigură. Partea care conține datele relevante poate fi formată din cadrul complet sau din versiunea eșantionată a cadrului. Conținutul 3D compatibil la nivel de cadru poate fi prezentat drept conținut SBS, TAB sau FP (împachetat), așa cum se arată în fig. 3 și 4. în timp ce conținutul FP este de obicei foarte specific, și poate fi detectat prin folosirea metodelor intrinsece specifice dispozitivelor compatibile FP, conținuturile SBS și TAB nu sunt. în anumite cazuri, s-ar putea să fie necesar ca acestea să fie detectate pe baza analizei de conținut.
Metoda descrisă în această invenție oferă o modalitate de detectare a conținutului SBS și TAB pe baza conținuturilor 3D compatibile la nivel de cadru. Se folosește un set de secvențe video de test, pentru a alege parametrii de detectare.
RO 127932 Β1
Metoda furnizează o modalitate de a detecta dacă un clip este în format 2D, 3D SBS 1 sau 3D TAB. Realizează acest lucru în pași multiplii, fiecare dintre pași filtrând diverse cauze ale apariției rezultatelor incorecte detectate ca fiind corecte, în încercarea de a realiza 3 detectarea 3D. Rezultatul final al analizei este rulat pe cadre multiple, de-a lungul unei perioade de timp, și un rezultat mediu acordă decizia finală. Experimentele efectuate au 5 demonstrat că 3 s sunt suficiente pentru a obține rezultate robuste.
Pasul 1 - Eșantionarea7
Metoda funcționează fără să utilizeze cadre eșantionate, dar există avantaje în folosirea eșantionării.9
Eșantionarea este utilă din două motive: nevoia de a captura un cadru în timpul procesării algoritmului, și nevoia de a minimiza spațiul de memorie folosit. Un alt beneficiu 11 al utilizării eșantionării este viteza mărită în timpul aplicării filtrelor pentru detectarea muchiilor, așa cum se explică în continuare.13
Se poate folosi orice metodă de eșantionare. în exemplul dat în această descriere se folosește extragerea simplă a liniilor și coloanelor. S-a ales o valoare de salt („skipfactor) 15 și liniile și coloanele au fost extrase folosind factorul respectiv. Fig. 5 ilustrează modul în care rezultatul păstrează același raport. 17
Suprafața inițială a unei imagini este A și suprafața imaginii eșantionate este A'.
A
Atunci relația dintre cele doua va fi: A =------------— . 19 skipfactor
Prin urmare, pentru un skipfactor 4, doar a șaisprezecea parte din suprafața inițială rămâne să fie procesată (după cum se poate observa și în fig. 5). Pentru orice microsistem digital, acest lucru este un avantaj, datorită memoriei necesare pentru implementarea acestui tip de algoritmi.
Algoritmul de eșantionare trebuie să fie rapid, să ruleze într-un timp mai scurt decât cel necesar pentru procesarea unui cadru. Imaginea rezultată poate fi procesată ulterior independent de rata de cadre a secvenței.
Pasul 2 - Generarea unei imagini de muchii
Majoritatea problemelor privind detectarea fluxurilor 3D provin din faptul că cele două cadre, fiind filmate cu camere neideale, pot avea variații cromatice diferite, care nu sunt perceptibile pentru ochiul uman, dar sunt foarte observabile atunci când se folosesc comparații la nivelul pixelilor. Pentru a depăși aceste obstacole, invenția va lucra cu o imagine de muchii. Imaginea de muchii este creată cu ajutorul unui operator care aplică filtrul de muchii. în filtrul pentru detectarea muchiilor exemplificat, invenția folosește un operator Sobei atât pentru muchiile verticale, cât și pentru cele orizontale. Valoarea de muchie folosită în exemplul nostru este magnitudinea Sobei.
Fig. 6 explică pașii folosiți pentru a obține o imagine de muchii în exemplul nostru.
r-i 0 n
Operatorul Sobei vertical este -2 0 2 , iar operatorul Sobei orizontal folosit este
0
-1 —2 -1>
0 0 0
<1 2
RO 127932 Β1
Se face o convoluție cu acest operator și toți pixelii din imagine.
Rezultatele sunt normalizate, așa cum se poate observa în fig. 6. Normalizarea valorilor de muchii este obligatorie, indiferent de operatorul Sobei utilizat. Pentru a putea lucra în domeniul numerelor întregi (byte/octet), care este mai rapid pentru microsisteme digitale, valoarea de muchii normalizată se multiplică de 250 de ori, și rezultatele sunt stocate. Prin urmare, imaginea de muchii poate fi reprezentată folosind doar biți, nu numere în virgulă mobilă (floating point-IEEE754), ceea ce reduce spațiul de memorie folosit, aspect foarte important (doar o pătrime din memoria necesară pentru reprezentarea cu numere în virgulă mobilă (floating point-IEEE754) este folosită în cazul numerelor întregi pe octet).
O arhitectură SI MD de procesor este platforma favorită pentru a calcula rapid valorile de muchii, deoarece așa se poate obține un nivel înalt de paralelism în operații.
Pasul 3 - Determinarea valorilor SBS și TAB
Se știe că un conținut prezintă în general similarități cu 3D SBS sau 3D TAB. De exemplu, dacă se filmează un clip cu doi copaci în fața camerei, ar exista o imagine asemănătoare 3D SBS. Problema constă în plasarea de praguri suficiente pentru a filtra rezultatele incorecte detectate ca fiind corecte. Metoda funcționează pe bază de proiecții făcute pe imagine, atât pentru TAB, cât și pentru SBS, și calculează dacă imaginea este suficient de asemănătoare cu 3D SBS sau 3D TAB, astfel încât să o detecteze drept conținut 3D SBS, 3D TAB sau 2D. Valorile pragurilor plasate au fost determinate în mod autoadaptiv. Metoda a fost rulată pe mai multe secvențe, și au fost determinate cele mai bune valori pentru parametri.
Factorii de similaritate cu SBS și TAB sunt determinați prin intermediul proiecțiilor. Modul în care sunt calculate proiecțiile este descris în fig. 7.
„Proiecția Y este definită drept seria calculată folosind valorile de muchii de pe axa Y. Un element al unei proiecții Y se definește ca suma tuturor valorilor de muchii aflate pe coloana corespondentă elementului respectiv.
„Proiecția X este definită ca seria calculată folosind valorile de muchii de pe axa X. Un element al unei proiecții X se definește ca suma tuturor valorilor de muchii găsite pe linia corespondentă elementului respectiv.
Pasul 3 constă în mai mulți subpași detaliați în următoarele paragrafe. în plus, sunt definite proiecțiile principale și cele secundare.
Proiecția principală este cea mai reprezentativă proiecție pentru tipul de conținut 3D (SBS/TAB) analizat, iar proiecția secundară este cea mai puțin reprezentativă. S-a constatat că numeroase șiruri de cadre din mediul real, și nu din condiții de laborator, conțin informații care induc în eroare unele dintre liniile sau coloanele de început sau sfârșit. Definim parametrul DISCARDED_LIMIT (ZONĂ_OMISĂ) ca fiind numărul de linii sau coloane, în funcție de caz, care nu sunt folosite la calcularea valorii proiecțiilor normalizate. în schimb, liniile sau coloanele respective sunt pur și simplu copiate din cea mai apropiată linie sau coloană considerată validă. Pentru exemplul dat în fig. 7:
- Proiecțiile SBS Xsunt proiecții principale pentru testarea 3D SBS, și Proiecțiile SBS Y sunt proiecții secundare. Proiecțiile SBS sunt calculate prin duplicarea primei coloane neinducătoare în eroare peste primele coloane de tip DISCARDED_LIMIT, așa cum indică marcajele A și C din fig. 7. Ultimele coloane inducătoare în eroare din proiecțiile SBS sunt înlocuite cu cele mai apropiate coloane neinducătoare în eroare, după cum indică marcajele B și D din fig. 7;
- Proiecțiile TAB Y sunt proiecții principale pentru testarea 3D TAB, iar Proiecțiile TAB X sunt proiecții secundare. Proiecțiile TAB sunt calculate prin duplicarea primei linii neinducătoare în eroare peste primele linii de tip DISCARDED_LIMIT, așa cum indică marcajele E și G din fig. 7. Ultimele linii inducătoare în eroare din proiecțiile TAB sunt înlocuite de cele mai apropiate linii neinducătoare în eroare, după cum indică marcajele F și H din fig. 7.
RO 127932 Β1
Pasul 3.1 - Normalizarea proiecțiilor principale 1
După calcularea seriilor de proiecții principale, acestea sunt normalizate în funcție de valoarea maximă din serie. Acest lucru elimină și mai mult deciziile eronate generate de 3 imagini bogate în conținut, care s-ar putea să producă valori de muchii diferite, chiar dacă se detectează aceleași muchii. Folosind normalizarea seriilor, se evită această sursă de 5 decizii eronate.
Pasul 3.2 - Compararea seriilor principale 7
Un exemplu de comparație între două proiecții principale poate fi văzut în fig. 7. Se observă că uneori există puncte de maxim local în diferența absolută dintre cele două 9 proiecții comparate, așa cum se observă în jurul valorii 42 a graficului din fig. 8. în acest grafic se poate observa că proiecțiile demonstrează o ușoară valoare de deplasare între o 11 proiecție și cealaltă. Pentru a obține cea mai bună suprapunere posibilă a celor două proiecții, se execută o corelare a celor două serii de proiecții folosind un parametru numit 13 SEARCH_RANGE (CĂUTARE). Acesta este definit ca fiind valoarea de deplasare maximă aplicată pentru a obține cea mai bună corelare între seriile de proiecții principale. De 15 exemplu, în fig. 9, proiecția stângă este derulată peste proiecția dreaptă. Cea mai bună potrivire este considerată a fi cea în care suma diferențelor absolute dintre valorile seriilor17 de proiecție este minimă în comparație cu restul.
După determinarea semnalelor cel mai bine corelate, se obțin următoarele informații:19
- suma de diferențe absolute (SDA), în urma comparării seriilor de proiecții principale, denumită mincorr;21
- diferența absolută maximă, constatată între două mostre corespondente, denumită maxDiff;23
- numărul de mostre corespondente, din serii cu o diferență absolută mai mică decât un prag intitulat PROJECTION_3D_THRESHOLD (pragul de proiecție 3D). Acestea se25 numesc valori mostră Definite3D, deoarece indică o asemănare 3D ridicată;
- numărul de valori mostră corespondente cu o diferență absolută mai ridicată decât 27 un prag intitulat PROJECTION_2D_THRESHOLD (prag de proiecție 2D). Acestea se numesc valori Definite2D, pentru că indică mai degrabă o asemănare ridicată cu 2D, și nu 29 cu 3D;
- numărul de valori mostră corespondente, care nu se potrivesc sub pragul 31 PROJECTION_3D_THRESHOLD sau peste PROJECTION_2D_THRESHOLD. Acestea au fost numite UnsureVals (valori cu rezultat nesigur);33
- numărul de valori mostră corespondente, care prezintă o diferență absolută mai ridicată decât un prag numit PROJECTION_2D_DEALBREAKER (prag de trecere forțată în 35 decizie 2D). Numărul de mostre cu această proprietate sunt stocate ca DeaIBreakers (valori decisive).37
Parametrii introduși folosiți pentru comparațiile descrise mai sus sunt:
PROJECTION_2D_DEALBREAKER, PROJECTION_3D_THRESHOLD și39
PROJECTION_2D_THRESHOLD.
Aceștia sunt aleși în mod autoadaptiv, de-a lungul numărului extins de secvențe de 41 test.
Se introduce un alt prag, DEFINITE_3D_ACCEPTED_THRESHOLD (prag de valori 43 decisive pentru acceptarea 3D). Și acesta este ales în mod autoadaptiv și se referă la un număr de valori Definite3D, considerate suficiente pentru a forța o concluzie de similaritate 45 3D.
Tabelul prezintă intervalul de valori recomandate pentru parametrii definiți în această 47 secțiune, precum și în alte secțiuni.
RO 127932 Β1
Pasul 3.3 - Interpretarea rezultatului comparației
Metoda interpretează rezultatele folosind o tehnică de cascadare, utilizând tehnica „early exit (conceptul de ieșire devreme din execuție). Adică atunci când se obține suficientă încredere în decizie, nu mai există niciun motiv pentru a continua cu ceilalți pași de rafinare a deciziei (fig. 10).
Mai jos sunt descrise alte câteva variabile necesare pentru a înțelege diagrama care prezintă metoda:
- MainSeriesLength fiind lungimea unei proiecții principale comparate;
- SecSeriesLength fiind lungimea unei serii de proiecții secundare comparate;
- DealBreaker2D fiind variabila care oprește o decizie să treacă forțat în 2D datorită DeaIBreakerVals definite anterior;
- UnsureGo2D fiind o variabilă care decide dacă ar trebui să se treacă la 2D datorită valorii ridicate a UnsureVals. Numărul valorilor nesigure se decide a fi prea ridicat pe baza comparației cu pragul UNSUREVALUES_ACCEPTED_THRESHOLD;
- seria de proiecții secundare este comparată cu o valoare de prag 3D secundară, cu mult mai mică decât pragul PROJECTION_3D_THRESHOLD, deoarece metoda caută un indiciu în cazul acesta, nu un răspuns final. Acest prag este definit ca PROJECTION_3D_THRESHOLD;
- GlobalThreshold (prag global), ca variabilă calculată în funcție de numărul seriilor de valori de proiecție și pragul PROJECTION_3D_THRESHOLD ales.
Un alt parametru utilizat în fig. 10, care descrie metoda aplicată, este FRACTIONAL_3D_THRESHOLD_INCREASE. Acesta se definește ca o creștere mică fracționară pe care o aduce pragului GlobalThreshold în cazul în care avem un rezultat indicat drept 3D, ca în fig. 10. Acest parametru este determinat în mod autoadaptiv, similar cu celelalte praguri. Pentru implementarea detaliată a metodei, este indicat a se urmări schema logică de program din fig. 10. Tabelul conține valorile recomandate pentru parametrii definiți în această secțiune, precum și în alte secțiuni.
Pasul 4 - Folosirea valorilor SBS și TAB la nivelul secvenței
Folosind metodele descrise până în acest punct, există o valoare TAB și SBS pentru fiecare cadru individual. Cadrele nu au, de obicei, aceeași lățime și înălțime; așadar, valorii TAB îi este aplicat un factor fracționar înainte să ia parte la orice comparații. Prin urmare:
TABfactor — odo ° ° projectionserieslength value
TAB projectionserieslength
Factorul SBS este definit ca: SBSfactor = SBSvalue
Ulterior, se determină dacă o imagine este SBS sau TAB folosind programul descris în schema logică de program din cadrul fig.i 11.
Metoda folosită este accelerată de o arhitectură SI MD capabilă să ruleze această metodă pe fiecare al cincilea cadru. De asemenea, este de preferat o arhitectură multiprocesor (multicore), deoarece acest algoritm trebuie rulat în paralel cu cadrele care intră în memoria arhitecturii, proces executat de un procesor sau circuit diferit.
Potrivirea 3D este rulată pentru o perioadă de timp autoadaptivă. S-a constatat în mod experimental că o perioadă de timp prea scurtă poate genera decizii cu un grad scăzut de încredere, în timp ce o perioadă prea lungă poate include evenimente de conținut (schimbări de scenă, tranziții etc.) irelevante pentru clasificarea conținutului.
RO 127932 Β1
Tabel 1
Denumire parametru Valoare minimă recomandată Valoare tipică Valoare maximă recomandată
PROJECTION _3D_THRESHOLD 0,18 0,22 0,25
PR0JECTI0N_2D_THRESH0LD 0,4 0,5 0,75
PR0JECTI0N_2D_DEALBREAKER 0,65 0,75 0,9
DEFINITE_3D_ACCEPTED_THRESH0LD 0,92 0,95 0,97
FRACTIONAL_3D_THRESHOLD_INCREASE 0,1 0,16 0,2
UNSUREVALUES_ACCEPTED_THRESHOLD 0,12 0,18 0,22
PROJECTION_3D_UNSURE_THRESHOLD 0,009 0,011 0,0125
DISCARDED LIMIT 1,000 2,000 10,0000
Tabelul enumeră intervalele de valori recomandate ale parametrilor necesari pentru rularea metodei pe sistem. 15

Claims (3)

  1. Revendicări
    1. Metodă pentru detectarea cadrelor cu conținut compatibil 3D, ce utilizează un circuit (1) receptor de cadre, un modul (2) de memorie destinat stocării cadrelor video, un modul (3) de memorie destinat stocării datelor procesate, reprezentate de imaginea de muchii și imaginea eșantionată, și un modul (4) ce conține o unitate centrală de procesare, caracterizată prin aceea că parcurge următoarea succesiune de pași, cu ajutorul unității centrale de procesare:
    - generează (5) o imagine de muchii din informațiile din cadrele capturate de către circuitul (1) receptor de cadre, pentru a elimina erorile datorate diverselor variații cromatice ale imaginilor reale obișnuite;
    - calculează (6) seriile de proiecții pe baza valorilor aferente imaginii de muchii, înlăturând informațiile din cadrele inducătoare în eroare, detectate pe marginea cadrelor și având praguri identice, pentru a determina un factor de similaritate;
    - ia decizia de clasificare a conținutului drept 3D Alăturat, 3D Suprapus sau 2D folosind o tehnică de ieșire devreme din execuție, în cazul detectării unei condiții favorabile, folosind un minim necesar de comparații (7) al factorilor de similaritate obținuți atât pentru conținut 3D Alăturat, cât și pentru 3D Suprapus.
  2. 2. Metodă conform revendicării 1, caracterizată prin aceea că generarea (5) imaginii de muchii elimină variațiile cromatice diferite din secvențele video ce pot introduce decizii eronate, prin utilizarea unui filtru de muchii ce aplică un operator de tip Sobei, cu ajutorul căruia se face o convoluție împreună cu toți pixelii din imagine, valorile de muchii astfel obținute fiind normalizate.
  3. 3. Metodă conform revendicării 1, caracterizată prin aceea că etapa de calcul (6) a seriilor de proiecții pe baza valorilor aferente imaginii de muchii utilizează niște valori ale pragurilor determinate în mod adaptiv, și calculează factori de similaritate pentru conținutul 3D Alăturat și 3D Suprapus, pe baza proiecțiilor determinate care sunt în final normalizate în funcție de valoarea maximă din serie, eliminând astfel și mai mult deciziile eronate generate de imagini bogate în conținut, care ar putea produce valori de muchii diferite.
ROA201200376A 2012-05-29 2012-05-29 Metodă pentru detectarea cadrelor cu conţinut compatibil 3d RO127932B1 (ro)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ROA201200376A RO127932B1 (ro) 2012-05-29 2012-05-29 Metodă pentru detectarea cadrelor cu conţinut compatibil 3d

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ROA201200376A RO127932B1 (ro) 2012-05-29 2012-05-29 Metodă pentru detectarea cadrelor cu conţinut compatibil 3d

Publications (2)

Publication Number Publication Date
RO127932A0 RO127932A0 (ro) 2012-10-30
RO127932B1 true RO127932B1 (ro) 2014-12-30

Family

ID=47073149

Family Applications (1)

Application Number Title Priority Date Filing Date
ROA201200376A RO127932B1 (ro) 2012-05-29 2012-05-29 Metodă pentru detectarea cadrelor cu conţinut compatibil 3d

Country Status (1)

Country Link
RO (1) RO127932B1 (ro)

Also Published As

Publication number Publication date
RO127932A0 (ro) 2012-10-30

Similar Documents

Publication Publication Date Title
US9070042B2 (en) Image processing apparatus, image processing method, and program thereof
EP2509326A2 (en) Analysis of 3D video
WO2010084791A1 (ja) 画像処理装置、画像処理方法およびプログラム
EP2728887B1 (en) Image processing apparatus and image processing method thereof
TWI469623B (zh) 用於區別3維影像與2維影像以及藉由特徵對應決定來識別3維影像格式之存在的方法
US8989481B2 (en) Stereo matching device and method for determining concave block and convex block
US9990738B2 (en) Image processing method and apparatus for determining depth within an image
US9591281B2 (en) Apparatus and method for determining a disparity estimate
US9948913B2 (en) Image processing method and apparatus for processing an image pair
EP2510702A1 (en) Method and apparatus for distinguishing a 3d image from a 2d image and for identifying the presence of a 3d image format by image difference determination
US20140098201A1 (en) Image processing apparatus and method for performing image rendering based on orientation of display
US20130050413A1 (en) Video signal processing apparatus, video signal processing method, and computer program
WO2015168893A1 (zh) 一种视频质量检测的方法及装置
CN109194944B (zh) 图像处理方法、装置及系统、显示装置
JP2015035799A (ja) 情報処理装置、撮像装置、情報処理システム、情報処理方法およびプログラム
RO127932B1 (ro) Metodă pentru detectarea cadrelor cu conţinut compatibil 3d
CN109146916A (zh) 一种运动物体跟踪方法及装置
US20130169627A1 (en) Display apparatus and method for providing three dimensional (3d) image
JP2011239172A (ja) 映像処理装置
WO2015080321A1 (ko) 과도시차 객체 검출방법
US20110097000A1 (en) Face-detection Processing Methods, Image Processing Devices, And Articles Of Manufacture
US9578315B2 (en) Method and system for judging in a 3D imaging environment
KR101278636B1 (ko) 2차원 영상을 스테레오스코픽 입체 영상으로 변환하기 위한 객체 검출 방법
JP2014534665A (ja) 視差マップをフィルタリングする方法及び装置
Jung et al. Detection of the Single Image from DIBR Based on 3D Warping Trace and Edge Matching