ITTO20120208A1

ITTO20120208A1 - Metodo di generazione, trasporto e ricostruzione di un flusso video stereoscopico

Info

Publication number: ITTO20120208A1
Application number: IT000208A
Authority: IT
Inventors: Amato Damato Paolo D
Original assignee: Sisvel Technology Srl
Priority date: 2012-03-09
Filing date: 2012-03-09
Publication date: 2013-09-10
Also published as: WO2013132469A1; EP2823640A1; CN104205824A; US20150130897A1

Description

Descrizione dell'Invenzione Industriale dal titolo:

â€œMETODO DI GENERAZIONE, TRASPORTO E RICOSTRUZIONE DI UN FLUSSO VIDEO STEREOSCOPICOâ€

DESCRIZIONE

La presente invenzione si riferisce ad un metodo di generazione, trasporto e ricostruzione di un flusso video stereoscopico.

Per la trasmissione di segnali video in 3D sono comunemente usati i formati cosiddetti â€œframe compatibleâ€ . Tali formati consentono di inserire in un frame Full HD, usato come contenitore, le due immagini che compongono la coppia stereoscopica. In questo modo il segnale 3D, costituito da due flussi video (quello per lâ€™occhio sinistro e quello per lâ€™occhio destro) diventa un segnale costituito da un solo flusso video e puÃ² quindi transitare nelle infrastrutture di produzione e distribuzione usate per la TV 2D, e soprattutto puÃ² essere fruito dai ricevitori 2D o 3D attualmente presenti sul mercato, in particolare per la TV ad Alta Definizione.

Nelle Figure 1a e 1b vengono riprodotti schematicamente due frame HD composti da 1920 colonne per 1080 righe di pixel (detto 1080p), appartenenti rispettivamente al flusso video dellâ€™occhio sinistro L e destro R. Le due immagini sinistra L (Left) e destra R (Right) possono essere inserite in un frame composito lâ€™una a fianco dellâ€™altra, selezionandone i rispettivi pixel, dando luogo al formato cosiddetto â€œside by sideâ€ , oppure lâ€™una sopra lâ€™altra, dando luogo al formato cosiddetto â€œtop and bottomâ€ , ovvero â€œover-underâ€ (si vedano le Figure 2a e 2b). Entrambi questi formati hanno lâ€™inconveniente di dimezzare la risoluzione in una delle due direzioni, quella orizzontale nel caso del side by side e quella verticale nel caso del top and bottom.

Ãˆ stato anche proposto un terzo formato, detto â€œtile formatâ€ , in cui due immagini 720p (1280x720 pixel a scansione progressiva) vengono inserite in un frame contenitore 1080p. Secondo tale formato, una delle due immagini viene inserita nel contenitore invariata, mentre lâ€™altra viene divisa in tre parti che vengono a loro volta inserite nello spazio lasciato libero dalla prima immagine (vedi Figura 2c).

Queste operazioni di inserimento vengono compiute con la frequenza di scorrimento dei frame del flusso video interessato, che tipicamente assume i valori di circa 24, 50 o 60 Hz (o fps, frames per second) a seconda dello standard adottato.

Usualmente le immagini del flusso vengono quindi compresse mediante una opportuna codifica ed eventualmente sottoposte ad altri trattamenti (multiplazione, codifica di canale, e cosÃ¬ via) per adattarle a essere memorizzate o trasmesse per una loro successiva riproduzione.

Tutti e tre questi formati possono essere usati, come si Ã ̈ detto, per la generazione e per il trasporto (trasmissione o memorizzazione su un supporto fisico), mentre per la visualizzazione si usano altri formati, inadatti al trasporto, e precisamente i formati cosiddetti â€œline alternateâ€ e â€œframe alternateâ€ .

Nel formato â€œline alternateâ€ le due immagini L ed R sono interlacciate (interleaved), ad esempio, facendo riferimento alla Figura 3, lâ€™immagine L 320 occupa tutte le righe dispari e lâ€™immagine R 330 le righe pari del frame composito 350. Questo formato Ã ̈ usato nei display ad occhiali passivi, in cui le due lenti sono polarizzate in modo diverso. Se davanti allo schermo viene posto un filtro polarizzato a righe alternate, accade che lâ€™occhio sinistro vede solo le righe corrispondenti allâ€™immagine L e lâ€™occhio destro solo le righe corrispondenti allâ€™immagine R. Ãˆ ovvio che in questo modo si dimezza la risoluzione verticale di entrambe le immagini, ma il sistema visivo umano puÃ² in parte compensare questa perdita mettendo assieme nellâ€™immagine tridimensionale i dettagli appartenenti allâ€™immagine L e quelli appartenenti allâ€™immagine R.

Al contrario, nel sistema di visualizzazione â€œframe alternateâ€ , vengono visualizzate sullo schermo alternativamente lâ€™immagine L e lâ€™immagine R (si veda la Figura 4, ove la sequenza 450 Ã ̈ costituita da unâ€™alternanza di frame L 420 ed R 430). Per effettuare la separazione, cioÃ ̈ per inviare a ciascun occhio lâ€™immagine corrispondente, si deve fare uso di occhiali ad otturatore, cosiddetti â€œattiviâ€ : lâ€™otturatore oscura alternativamente una delle due lenti, sulla base di un segnale di sincronismo trasmesso agli occhiali, ad esempio mediante raggi infrarossi, dal televisore.

Il motivo per cui i segnali 3D non vengono trasmessi direttamente con i due formati usati comunemente per la visualizzazione risiede nel fatto che tali formati non consentono una efficace compressione del segnale video, in quanto distruggono la correlazione fra righe adiacenti ovvero fra frame consecutivi. Di conseguenza, per ottenere una qualitÃ soddisfacente, occorrerebbe un bit rate notevolmente piÃ¹ elevato di quello necessario per trasmettere il segnale HD che funge da contenitore. In conclusione, pertanto, i formati di trasmissione e quelli di visualizzazione sono diversi e trattati come se fossero indipendenti fra loro. Tuttavia, questa indipendenza di trattamento non consente di ottimizzare la qualitÃ delle immagini. In altri termini, se si usa per la visualizzazione il formato frame alternate, il formato ottimale per il trasporto Ã ̈ diverso da quello che sarebbe ottimale nel caso di display line alternate e viceversa. Questo fatto viene generalmente ignorato, con la conseguenza che o non si sfrutta al meglio la banda disponibile, oppure si introducono nellâ€™immagine stereoscopica delle alterazioni. In altre parole, gli attuali formati di frame packing utilizzati per il trasporto dei flussi video non sono ottimizzati ai fini della loro visualizzazione sugli apparati di riproduzione.

In caso di display di tipo frame alternate tutti e tre i suddetti formati frame compatible sono utilizzabili per il trasporto del segnale video, ed il migliore Ã ̈ il tile format, in quanto preserva il bilanciamento tra risoluzione orizzontale e verticale. Tuttavia, tutti e tre i formati soffrono di un inconveniente, vale a dire le due immagini L ed R inserite nello stesso frame composito si riferiscono allo stesso istante temporale (in quanto le due telecamere sono sincronizzate, in termine tecnico inglese â€œgen-lockedâ€ , dallo stesso segnale di sincronismo detto gen-lock, contrazione di generator lock), ma sono visualizzate in successione temporale.

Se si hanno a disposizione telecamere 1080p le due immagini in questione vengono riprese simultaneamente a intervalli temporali prefissati âˆ†t, mentre invece vengono visualizzate in modo ritardato e alternato a intervalli dimezzati âˆ†t/2. Se per esempio il sistema televisivo utilizzato Ã ̈ quello europeo a 50 Hz (una coppia di fotogrammi L-R ogni 20 ms), il display mostra una successione di immagini a 100 Hz (un fotogramma L o R ogni 10 ms), con lâ€™alternanza L,R,L,R, e cosÃ¬ via. La Figura 5a mostra schematicamente come verrebbero catturati secondo lâ€™arte nota i fotogrammi L ed R temporalmente successivi comprendenti un oggetto rettangolare che si muove orizzontalmente rispetto al punto di vista delle telecamere. La Figura 6a mostra invece come gli stessi fotogrammi verrebbero visualizzati su un display frame alternate tradizionale. Lâ€™oggetto rettangolare viene mostrato ai due occhi nella stessa posizione in coppie di istanti temporali differenti, invece che nelle posizioni in cui esso si troverebbe a causa del suo movimento orizzontale. Si crea unâ€™alterazione della successione temporale delle immagini, che il sistema visivo umano traduce in errori di profonditÃ .

Tali errori sono simili a quelli prodotti dal cosiddetto â€œeffetto Pulfrichâ€ , che risulta visibile su immagini di prova contenenti oggetti che si muovono orizzontalmente, ad esempio un pendolo oscillante in un piano perpendicolare alla congiungente occhi-pendolo (si faccia riferimento alla Figura 7). Se un osservatore indossa uno speciale paio di occhiali che contiene una lente parzialmente oscurata, lâ€™immagine dellâ€™occhio oscurato ha una latenza superiore a quella dellâ€™occhio non oscurato, e quindi il cervello vede con un certo ritardo la relativa immagine. Il sistema visivo umano converte questo ritardo di percezione in un â€œerrore di disparitÃ â€ (o di profonditÃ ), per cui lâ€™osservatore vede il pendolo muoversi non sul piano q su cui effettivamente oscilla, ma secondo una traiettoria ellittica giacente sul piano r perpendicolare a q, per cui il pendolo, se si muove in una direzione, sembra sporgere dallo schermo, mentre quando si muove nellâ€™altra direzione sembra andare dietro lo schermo.

Il senso di rotazione apparente del pendolo dipende da quale occhio viene oscurato; nel caso di Figura 7 si suppone che sia stato parzialmente oscurato lâ€™occhio destro, il che produce una rotazione apparente antioraria.

Lâ€™effetto Pulfrich Ã ̈ molto suggestivo in quanto fa vedere immagini tridimensionali sullo schermo di un normale televisore 2D che visualizza una normale immagine 2D. Si tratta di unâ€™illusione ottica, che qualcuno ha pensato di utilizzare per creare volutamente effetti tridimensionali, ma che in pratica Ã ̈ poco sfruttabile perchÃ© lâ€™effetto tridimensionale si manifesta in modo incontrollato e solo in presenza di oggetti che si muovono orizzontalmente rispetto allâ€™osservatore.

Scopo della presente invenzione Ã ̈ pertanto quello di indicare un metodo di generazione, trasporto e ricostruzione di un flusso video stereoscopico che, riprodotto su un display di tipo frame alternate, sia privo di errori di profonditÃ .

In sintesi, per eliminare lâ€™illusione ottica sopra descritta, occorre che le due immagini L ed R inserite nello stesso frame composito non siano catturate simultaneamente, ma ritardate lâ€ ̃una rispetto allâ€™altra di mezzo frame (nel caso di formati progressivi) o di mezzo field (nel caso di formati interlacciati), e cioÃ ̈ di 10 ms se si usa il sistema televisivo europeo a 50 Hz, in cui Ã ̈ catturato un frame o un field ogni 20 ms. CiÃ² vale per tutti e tre i formati frame compatible (per esempio: side by side, top and bottom, tile format). Si vedano le figure 5b e 6b e le si confrontino con le figure 5a e 6a, in cui queste ultime si riferiscono al caso in cui le due immagini sono riprese simultaneamente e visualizzate con ritardo di mezzo frame o field.

Naturalmente, se viene effettuato questo shift temporale in fase di cattura, Ã ̈ opportuno che ci sia nel segnale video unâ€™apposita segnalazione che specifichi quale delle due viste Ã ̈ stata catturata prima dellâ€™altra nellâ€™ambito di una coppia stereoscopica. Infatti se tali coppie vengono visualizzate in ordine invertito rispetto alla cattura, per cui per esempio le immagini sinistre vengono visualizzate alternativamente sullo schermo dopo quelle destre, essendo perÃ² state catturate prima, si produce nella visione dello spettatore una esaltazione dellâ€™errore di profonditÃ , anzichÃ© la sua eliminazione.

Questa segnalazione Ã ̈ particolarmente semplice poichÃ© esistono solo due possibilitÃ : Ã ̈ stata catturata prima lâ€™immagine sinistra L oppure Ã ̈ stata catturata prima lâ€™immagine destra R. Quindi, a titolo esemplificativo, si potrebbe assegnare un solo bit a questa segnalazione il cui valore 0 (zero) indica che si Ã ̈ verificato il primo dei casi suddetti, mentre il valore 1 (uno) indica che si Ã ̈ verificato il secondo.

Se si vuole, perÃ², segnalare anche il caso in cui le due immagini sono riprese contemporaneamente, cioÃ ̈ il caso in cui la presente invenzione non viene utilizzata (ad esempio perchÃ© si prevede lâ€™esistenza di display del tipo line alternate), Ã ̈ chiaro che la segnalazione deve comprendere almeno due bit, uno dei quali puÃ² indicare, ad esempio, la contemporaneitÃ o non contemporaneitÃ delle due immagini, e lâ€™altro bit quale delle due immagini Ã ̈ anticipata rispetto allâ€™altra immagine. Il primo bit puÃ² essere utilizzato dal ricevitore per comprendere se il segnale trasmesso Ã ̈ ottimizzato per il tipo di display adottato: si ricorda che la trasmissione di immagini riprese non contemporaneamente Ã ̈ ottimale per i display del tipo frame alternate, mentre per i display del tipo line alternate Ã ̈ ottimale la trasmissione di immagini riprese contemporaneamente. Nel caso di trasmissione non ottimale, il ricevitore puÃ² fare varie cose: ad esempio puÃ² segnalare allâ€™utente, mediante un messaggio che appare sullo schermo, la probabile presenza di errori di profonditÃ e/o puÃ² consigliare allâ€™utente la visione 2D oppure puÃ² addirittura commutare automaticamente sulla visione 2D. Unâ€™altra possibilitÃ per il ricevitore Ã ̈ quella di tentare di correggere gli errori di profonditÃ mediante unâ€™elaborazione in locale delle immagini L ed R ricevute: si ritiene che questa elaborazione sia piuttosto pesante dal punto di vista del lavoro computazionale necessario, ed inoltre la correzione non potrÃ mai essere perfetta.

Ulteriori caratteristiche e scopi dellâ€™invenzione sono oggetto delle allegate rivendicazioni che si intendono parte integrante della presente descrizione, i cui insegnamenti risulteranno maggiormente chiari dalla descrizione dettagliata di una forma preferita di realizzazione fatta a titolo esemplificativo, ma non limitativo, con riferimento alle Figure allegate in cui:

- la Figura 1 rappresenta due frame HD in formato 1080p appartenenti rispettivamente ad un flusso video di un occhio sinistro e ad un flusso video di un occhio destro di un flusso video stereoscopico;

- le Figure 2a, 2b e 2c rappresentano una coppia di immagini stereoscopiche rispettivamente in formato side by side, over-under e tile;

- le Figure 3 e 4 rappresentano un formato di visualizzazione di un flusso video stereoscopico rispettivamente di tipo line alternate e frame alternate;

- le Figure 5a e 6a mostrano schematicamente un procedimento di cattura e di visualizzazione secondo lâ€™arte nota di fotogrammi sinistro e destro temporalmente successivi comprendenti un oggetto rettangolare che si muove orizzontalmente rispetto al punto di vista di telecamere che lo riprendono;

- le Figure 5b e 6b mostrano schematicamente un procedimento di cattura e di visualizzazione secondo lâ€™invenzione dei fotogrammi sinistro e destro temporalmente successivi delle Figure 5a e 5b;

- la Figura 7 rappresenta una schematizzazione dellâ€™effetto Pulfrich;

- le Figure 8 e 9 rappresentano rispettivamente un sistema di produzione ed un sistema di elaborazione di flussi video stereoscopici secondo lâ€™invenzione.

In Figura 8 Ã ̈ rappresentato un possibile sistema di produzione 800 di flussi video stereoscopici secondo lâ€™invenzione, realizzata mediante componenti discreti interconnessi, per esempio in uno studio di produzione televisiva o in un set cinematografico. Una coppia di telecamere 2D 830â€™ e 830â€™â€™ riprende la scena da due diversi punti di vista in modo simile a quanto avviene nel sistema visivo umano. Una prima telecamera 830â€™ riprende la scena corrispondente allâ€™occhio sinistro L e una seconda telecamera 830â€™â€™ riprende la scena corrispondente allâ€™occhio destro R.

Un apparato di generazione del sincronismo di ripresa genlock 810 genera un segnale di sincronizzazione comune per le due telecamere per dettare i tempi di cattura delle immagini video, che tipicamente avviene nel sistema video europeo a una frequenza 1/âˆ†t di 50 Hz ovvero di una immagine ogni 20 ms, pari allâ€™intervallo âˆ†t intercorrente tra la cattura di due immagini stereoscopiche appartenenti a coppie L-R successive. Uno di questi due segnali di genlock, per esempio quello fornito alla seconda telecamera 830â€™â€™, viene ritardato di un intervallo di tempo sostanzialmente pari a âˆ†t/2, ovvero 10 ms nel caso di standard video a 50 Hz, da un dispositivo ritardatore 820 interposto tra lâ€™apparato genlock 810 e la seconda telecamera 830â€™â€™. Nel caso in cui il dispositivo ritardatore 820 sia di tipo multistandard, cioÃ ̈ funzionante sia con lo standard europeo a 50 Hz che con lo standard statunitense a 60 Hz, Ã ̈ possibile prevedere che tale di intervallo di tempo sia regolabile o programmabile mediante opportuni mezzi di regolazione o programmazione.

Di conseguenza le immagini sinistre L vengono catturate con la stessa frequenza 1/âˆ†t (tipicamente 50 o 60 Hz) di quelle destre, ma con un anticipo di âˆ†t/2 rispetto alle immagini R della medesima coppia stereoscopica (si veda Figura 5b). Il ritardo introdotto dal dispositivo ritardatore 820 Ã ̈ preferibilmente pari, a meno delle incertezze indesiderate dovute a ineliminabili fenomeni intrinseci dei componenti elettronici, alla metÃ del reciproco della frequenza di cattura delle telecamere, in modo da garantire lâ€™uniformitÃ degli intervalli temporali intercorrenti tra la cattura dellâ€™immagine per un certo occhio e quella successiva per lâ€™altro; tale uniformitÃ si traduce in una percezione piÃ¹ fluida e piÃ¹ aderente alla realtÃ dei movimenti presenti nella scena inquadrata dalle telecamere 830â€™ e 830â€™â€™.

La presente invenzione puÃ² essere applicata indifferentemente a qualsiasi tipo di telecamera. In particolare, essa puÃ² essere in grado di funzionare a diverse risoluzioni video, per esempio a risoluzione Full HD ovvero 1920x1080 pixel (risoluzione detta brevemente 1080) oppure a 1280x720 pixel (denominata brevemente 720). Essa inoltre puÃ² fornire in uscita un segnale video di tipo progressivo (p) o interallacciato (i), a 50 o 60 Hz o fps. In particolare, essa puÃ² essere applicata per esempio a una coppia di telecamere 2D in grado di catturare un flusso video secondo almeno una delle seguenti modalitÃ : 1080p@50Hz, 1080p@60Hz, 720p@50Hz, 720p@60Hz, 1080i@50Hz e 1080i@60Hz. Altri formati notevoli utilizzati per le riprese e le proiezioni cinematografiche prevedono 24 immagini al secondo.

Nel caso di formati di tipo interlacciato 1080i, le telecamere 830â€™ e 830â€™â€™ forniscono flussi video costituiti da una alternanza di semiquadri dispari e pari a dimensioni 1920x540 pixel costituiti rispettivamente dalle 540 righe dispari e 540 righe pari di uno stesso frame Full HD 1080p. Sulle due linee 83â€™ e 83â€™â€™ sono quindi presenti i semiquadri dispari e pari alternati nel tempo rispettivamente delle viste L ed R appartenenti a una coppia stereoscopica, in cui la cattura di una delle due viste avviene in modo ritardato nel tempo.

In caso di applicazione dellâ€™invenzione a uno studio di produzione TV le telecamere 830â€™ e 830â€™â€™ forniscono in uscita due segnali video formattati secondo uno degli standard della famiglia SDI (Serial Digital Interface), normati dallâ€™ente SMPTE (Society of Motion Picture and Television Engineers).

Le immagini generate dalle telecamere 830â€™ e 830â€™â€™ vengono successivamente impacchettate da un frame packer 840, o impacchettatore, in uno dei formati precedentemente citati, e cioÃ ̈ side by side, top and bottom o tile. Il flusso video stereoscopico cosÃ¬ ottenuto viene compresso da un codificatore 850, che eventualmente aggiunge anche la segnalazione, sulla base di unâ€™informazione proveniente ad esempio dallâ€™apparato genlock 810 (si veda nella Figura 8 il collegamento tratteggiato 81) che indica quale delle due immagini presenti nel frame composito Ã ̈ stata ripresa prima.

In alternativa, la segnalazione puÃ² essere inserita da una delle telecamere 830â€™ o 830â€™â€™ in un campo dati del flusso video 83â€™ o 83â€™â€™, per esempio un campo dati del flusso SDI. In unâ€™altra forma di realizzazione, essa puÃ² essere inserita dallâ€™impacchettatore 840 o, alternativamente, da una apposita unitÃ di inserimento della segnalazione non mostrata in Figura 8. In questo caso il codificatore 850 puÃ² leggere la segnalazione presente nel flusso video entrante 84 e, a seconda della particolare scelta implementativa, lasciarla immutata dove si trova oppure reinserirla opportunamente in base alle modalitÃ previste dallo standard di compressione che lo governa. Nel caso dello standard di compressione MPEG AVC, detto anche ITU-T H.264, la segnalazione in questione puÃ² vantaggiosamente far parte della cosiddetta SEI (Supplemental Enhancement Information) che Ã ̈ giÃ in grado di trasportare informazioni relative al formato frame packing utilizzato in sede di generazione del flusso video stereoscopico frame compatible.

La Figura 8 Ã ̈ del tutto esemplificativa di un sistema di produzione di un flusso stereoscopico secondo lâ€™invenzione: in essa si sono evidenziati i diversi blocchi funzionali che compiono una o piÃ¹ operazioni del sistema. In realtÃ alcuni o anche tutti i blocchi funzionali possono essere accorpati tra loro in un singolo apparato che esegue le operazioni descritte per ciascun blocco della figura.

Esistono giÃ dispositivi di ripresa, sia consumer che professionali, che incorporano in un unico contenitore le due telecamere necessarie per una ripresa stereoscopica. In questo caso il dispositivo ritardatore del genlock 810 puÃ² vantaggiosamente essere anchâ€™esso incorporato nel dispositivo di ripresa in questione.

La presente invenzione, come si Ã ̈ detto, Ã ̈ adatta a essere utilizzata in combinazione con dispositivi di visualizzazione funzionanti secondo la tecnica cosiddetta frame alternate, in cui le immagini sinistre e destre di ciascuna coppia stereoscopica vengono visualizzate alternativamente nel tempo sullo schermo. Se il dispositivo di visualizzazione funziona secondo la tecnica line alternate, la presente invenzione non si applica.

La segnalazione inserita nel flusso video trasmesso, indicante quale delle due immagini presente in un determinato frame composito Ã ̈ posticipata rispetto allâ€™altra, deve essere utilizzata dal dispositivo di visualizzazione al fine di ricostituire la corretta sequenza frame alternate. Infatti, se la sequenza Ã ̈ ricostruita nel modo sbagliato, cioÃ ̈ se viene visualizzata prima lâ€™immagine che in ripresa era ritardata, lâ€™errore di profonditÃ invece di annullarsi viene esaltato. La Figura 9 illustra una possibile forma di realizzazione di un sistema di elaborazione video 900 secondo lâ€™invenzione. Esso puÃ² in generale far parte di un sistema di ricezione e/o riproduzione video comprendente opzionalmente altre unitÃ operative anchâ€™esse almeno parzialmente raffigurate in Figura 9, quali un processore video 960 e uno schermo 970.

Il sistema di riproduzione e/o ricezione puÃ² comprendere per esempio un sintonizzatore televisivo 910 (di tipo DVB-T/T2, DVB-S/S2 o DVB-C/C2, ATSC, e cosÃ¬ via) in grado di sintonizzare un segnale televisivo comprendente un flusso video stereoscopico generato da un sistema di generazione di flussi stereoscopici secondo lâ€™invenzione (per esempio puÃ² trattarsi di un sistema come quello rappresentato in Figura 8), flusso video che Ã ̈ stato successivamente opportunamente elaborato (tramite per esempio codifica di canale, multiplazione, e cosÃ¬ via) per essere trasmesso a distanza su un qualsiasi canale di telecomunicazione, per esempio radiodiffuso tramite una unitÃ di radio trasmissione 860 (Figura 8). In questo caso il sintonizzatore 910 compie le operazioni inverse a quelle effettuate dallâ€™unitÃ 860 per ottenere in uscita un flusso video 92, che Ã ̈ molto simile a quello entrante nellâ€™unitÃ 860, dal quale differisce solo per alterazioni indesiderate dovute a errori di ricezione, interferenze e/o disturbi.

Alternativamente o in aggiunta, il flusso video 92 puÃ² provenire da una unitÃ di lettura (non mostrata in Figura 9) di un qualsiasi supporto di memorizzazione 870 (hard disk, DVD, disco blu-ray, memoria flash a semiconduttore, e cosÃ¬ via) in grado di leggere un flusso video precedentemente memorizzato su di esso tramite per esempio una unitÃ di memorizzazione o registrazione facente parte di un sistema di generazione di un flusso video stereoscopico secondo Figura 8. Il flusso video a cattura stereoscopica ritardata 92 viene inviato a un decodificatore 930, per esempio di tipo MPEG4-AVC (H.264), che provvede a effettuare lâ€™operazione di decompressione inversa a quella effettuata in sede di produzione dal codificatore 850. Inoltre esso provvede a leggere la segnalazione inserita dal codificatore 850 indicante quale tra le immagini L ed R presenti in un frame composito C Ã ̈ stata catturata prima dellâ€™altra.

Successivamente il flusso video decodificato 93 viene sottoposto a una eventuale operazione di deinterlacciamento nel caso in cui il flusso video di ingresso provenga da sistemi di ripresa che funzionano con il sistema di cattura interlacciato. Questa operazione puÃ² essere effettuata da una apposita unitÃ 940 che riceve il flusso decodificato 93 interlacciato e produce un flusso video progressivo 94 a cattura stereoscopica ritardata. Se le immagini del flusso provengono da sistemi di cattura progressiva lâ€™operazione di deinterlacciamento non Ã ̈ necessaria e il flusso decodificato 93, che Ã ̈ giÃ in forma progressiva, puÃ² essere fornito direttamente allâ€™unitÃ spacchettatrice 950 che compie lâ€™operazione inversa a quella eseguita dallâ€™unitÃ di impacchettamento 840.

Il flusso video stereoscopico decodificato e progressivo 93, o rispettivamente 94, viene scomposto nei due flussi video a immagine singola 95â€™ L ed 95â€™â€™ R, estraendo da ciascun frame composito C le relative immagini sinistre L e destre R. I due flussi video per lâ€™occhio sinistro e lâ€™occhio destro non devono necessariamente essere forniti allo stadio successivo 960 su due linee di collegamento separate in forma di flussi video distinti, come mostrato in via esemplificativa in Figura 9, ma possono essere anche trasmessi in un unico flusso multiplato 95 (non mostrato in Figura 9) comprendente entrambi i flussi componenti secondo un qualsiasi formato che lo stadio successivo Ã ̈ in grado di distinguere ed elaborare.

Lo stadio successivo 960 comprende un processore video in grado di creare la sequenza frame alternate ove le due immagini destra e sinistra sono nellâ€™ordine giusto, deducibile dalla segnalazione ricevuta dal decodificatore 930, che in qualche modo deve essere trasmessa al dispositivo 960. A puro titolo di esempio, in figura 9 Ã ̈ indicata una linea di comunicazione 98 su cui detta segnalazione di ordine di cattura viene trasmessa dal decodificatore 930 al processore video 960.

In modo alternativo a quanto mostrato in Figura 9 Ã ̈ possibile che nel sistema di riproduzione e ricezione 900 sia presente una unitÃ a microprocessore (non mostrata) che coordina e controlla il funzionamento delle operazioni del sistema 900, fungendo anche da centrale di raccolta delle segnalazioni nonchÃ© di tutti segnali di controllo. In questa forma di realizzazione dellâ€™invenzione lâ€™unitÃ a microprocessore riceve dal decodificatore 930 la segnalazione indicante lâ€™ordine di cattura e istruisce il processore video 960 a visualizzare il flusso video sullo schermo alternando le immagini L ed R nellâ€™ordine corrispondente mediante appositi segnali di controllo trasmessi su una linea di collegamento dati.

Si noti che il sistema di elaborazione video 900 puÃ² essere incorporato per esempio in un ricevitore di segnali televisivi, sia esso dotato o meno di uno schermo incorporato 970; puÃ² quindi essere utilizzato per esempio allâ€™interno di un set-top-box o di un televisore.

Allo stesso modo il sistema 900 puÃ² essere incorporato allâ€™interno di un qualsiasi apparato riproduttore multimediale in grado di visualizzare contenuti video tridimensionali, quali per esempio un lettore di dischi DVD o bluâ€“ray, un tablet, eccetera, sia esso dotato o meno di uno schermo incorporato per la visualizzazione delle immagini.

Si rileva che la presente invenzione puÃ² essere impiegata anche per la generazione e la riproduzione di immagini virtuali con lâ€™ausilio di mezzi software e hardware in grado di simulare in tutto e per tutto la ripresa dal vero di scene stereoscopiche tridimensionali (computer graphics). Queste riprese virtuali sono di comune impiego per la realizzazione di video o film di animazione che basano lâ€™effetto di tridimensionalitÃ sugli stessi principi generali di riprendere una stessa scena da due punti di vista in modo da simulare il sistema visivo umano.

Dunque Ã ̈ facilmente comprensibile che quanto precedentemente descritto Ã ̈ passibile di varie modificazioni, perfezionamenti, sostituzioni di parti ed elementi equivalenti senza perÃ² allontanarsi dallâ€™idea dellâ€™invenzione, cosÃ¬ come Ã ̈ precisato meglio nelle seguenti rivendicazioni.

Claims

RIVENDICAZIONI 1. Metodo per generare un flusso video stereoscopico (84) comprendente frame compositi (C), detti frame compositi comprendendo informazioni relative a una immagine sinistra (L) e una immagine destra (R) per la visualizzazione tridimensionale di una scena, in cui si selezionano i pixel di dette immagini sinistra (L) e destra (R) e si inseriscono detti pixel selezionati allâ€™interno del frame composito (C) di detto flusso video stereoscopico, caratterizzato dal fatto che una di dette immagini (L,R) Ã ̈ ripresa in istanti temporali che sono ritardati rispetto allâ€™altra immagine (R,L) di un intervallo (60) sostanzialmente costante e predeterminato.
2. Metodo secondo la rivendicazione 1, in cui detto intervallo (60) Ã ̈ regolabile o programmabile.
3. Metodo secondo la rivendicazione 1, in cui Ã ̈ possibile rendere detto intervallo (60) sostanzialmente pari alla metÃ del tempo (65) intercorrente tra la ripresa di due immagini sinistre (L) o destre (R) successive.
4. Metodo secondo la rivendicazione 1, in cui viene inserito nel flusso video stereoscopico (84) un primo dato di segnalazione indicante quale di dette due immagini (L,R) Ã ̈ ripresa in istanti temporali ritardati rispetto allâ€™altra immagine (R,L).
5. Metodo secondo la rivendicazione 1, in cui viene inserito nel flusso video stereoscopico (84) un secondo dato di segnalazione indicante la contemporaneitÃ o non contemporaneitÃ della ripresa di dette immagini (L,R).
6. Dispositivo per la generazione di un flusso video stereoscopico (84) comprendente frame compositi (C), detti frame compositi comprendendo informazioni relative a una immagine sinistra (L) e una immagine destra (R) per la visualizzazione tridimensionale di una scena, comprendente mezzi atti a selezionare i pixel di dette immagini sinistra (L) e destra (R) e a inserire detti pixel selezionati allâ€™interno del frame composito (C) di detto flusso video stereoscopico, detto dispositivo essendo caratterizzato dal fatto di comprendere mezzi atti a fare in modo che una di dette immagini (L,R) sia ripresa a istanti temporali ritardati di un intervallo (60) sostanzialmente costante e predeterminato rispetto allâ€™altra immagine (R,L).
7. Dispositivo secondo la rivendicazione 6, in cui sono previsti mezzi per regolare o programmare detto intervallo (60).
8. Dispositivo secondo la rivendicazione 6, comprendente mezzi atti a fare in modo che sia possibile rendere detto intervallo (60) sostanzialmente pari alla metÃ del tempo (65) intercorrente tra la ripresa di due immagini sinistre (L) o destre (R) successive.
9. Dispositivo secondo la rivendicazione 6, comprendente mezzi in grado di inserire in detto flusso video stereoscopico (84) un primo dato di segnalazione indicante quale di dette due immagini (L,R) Ã ̈ ripresa in istanti temporali ritardati rispetto allâ€™altra immagine destra (R,L).
10. Dispositivo secondo la rivendicazione 6, in cui sono previsti mezzi per inserire nel flusso video un secondo dato di segnalazione indicante la contemporaneitÃ o non contemporaneitÃ della ripresa di dette immagini (L,R).
11. Metodo per riprodurre un flusso video stereoscopico (92) comprendente frame compositi (C), detti frame compositi comprendendo informazioni relative a una immagine sinistra (L) e una immagine destra (R) per la visualizzazione tridimensionale di una scena, caratterizzato dal fatto di estrarre dette immagini sinistra (L) e destra (R) da uno di detti frame compositi (C) e rendere visibile una di dette immagini (L,R) in istanti temporali ritardati rispetto allâ€™altra immagine (R,L) di un intervallo (70) sostanzialmente costante e predeterminato, nonchÃ© nello stesso ordine temporale nel quale dette due immagini (L,R; R,L) sono state riprese.
12. Metodo secondo la rivendicazione 11, in cui detto intervallo (70) Ã ̈ sostanzialmente uguale allâ€™intervallo (60) con il quale sono ritardate le riprese di dette due immagini sinistra (L) e destra (R).
13. Metodo secondo la rivendicazione 11, in cui detto intervallo (70) Ã ̈ sostanzialmente pari alla metÃ del tempo (65) intercorrente tra la ripresa di due immagini sinistre (L) o destre (R) successive.
14. Metodo secondo la rivendicazione 11, in cui viene letto da detto flusso video stereoscopico (92) un primo dato di segnalazione indicante quale di dette due immagini (L,R), Ã ̈ ripresa in istanti temporali ritardati rispetto allâ€™altra immagine (R,L), e in cui dette due immagini sinistra (L) e destra (R) sono rese visibili nello stesso ordine temporale nel quale dette due immagini (L,R; R,L) sono state riprese.
15. Metodo secondo la rivendicazione 11, in cui viene letto da detto flusso video stereoscopico (92) un secondo dato di segnalazione indicante la contemporaneitÃ o non contemporaneitÃ della ripresa di dette immagini (L,R), detto secondo dato di segnalazione essendo utilizzato per determinare se detto flusso video stereoscopico (92) Ã ̈ ottimizzato per un dispositivo associato ad un display che visualizza detto flusso (92).
16. Metodo secondo la rivendicazione 15, in cui, se detto secondo dato di segnalazione indica che detto flusso video stereoscopico (92) non Ã ̈ ottimizzato per il display che visualizza detto flusso (92), detto dispositivo svolge una o piÃ¹ delle seguenti procedure: segnala allâ€™utente la probabile presenza di errori di profonditÃ ; consiglia allâ€™utente di visualizzare detto flusso video stereoscopico (92) in modalitÃ 2D e/o commuta automaticamente in modalitÃ 2D; corregge errori di profonditÃ tramite unâ€™elaborazione locale di dette immagini (L,R).
17. Dispositivo per riprodurre un flusso video stereoscopico comprendente frame compositi (C), detti frame compositi comprendendo informazioni relative a una immagine sinistra (L) e una immagine destra (R) per la visualizzazione tridimensionale di una scena, caratterizzato dal fatto di comprendere mezzi atti a estrarre dette immagini sinistra (L) e destra (R) da uno di detti frame compositi (C) e a rendere visibile una di dette immagini (L,R) in istanti temporali ritardati rispetto allâ€™altra immagine (R,L) di un intervallo (70) sostanzialmente costante e predeterminato, nonchÃ© nello stesso ordine temporale nel quale dette due immagini (L,R; R,L) sono state riprese.
18. Dispositivo secondo la rivendicazione 17, comprendente mezzi per fare in modo che detto intervallo (70) sia sostanzialmente uguale allâ€™intervallo (60) con il quale sono ritardate le riprese di dette due immagini sinistra (L) e destra (R).
19. Dispositivo secondo la rivendicazione 17, comprendente mezzi atti a fare in modo che detto intervallo (70) sia sostanzialmente pari alla metÃ del tempo (65) intercorrente tra la ripresa di due immagini sinistre (L) o destre (R) successive.
20. Dispositivo secondo la rivendicazione 17, comprendente mezzi atti a leggere un primo dato di segnalazione presente in detto flusso video stereoscopico (92) indicante quale di dette due immagini (L,R) Ã ̈ ripresa in istanti temporali ritardati rispetto allâ€™altra immagine (R,L) e atti a rendere visibili dette immagini sinistra (L) e destra (R) in un ordine temporale che dipende da detto dato di segnalazione letto.
21. Dispositivo secondo la rivendicazione 17, comprendente mezzi atti a leggere un secondo dato di segnalazione presente in detto flusso video stereoscopico (92) indicante la contemporaneitÃ o non contemporaneitÃ della ripresa di dette immagini (L,R), e mezzi per determinare se detto flusso video stereoscopico (92) Ã ̈ ottimizzato per un display, associato a detto dispositivo, che visualizza detto flusso (92).
22. Dispositivo secondo la rivendicazione 21, in cui, se detto secondo dato di segnalazione indica che detto flusso video stereoscopico (92) non Ã ̈ ottimizzato per il display che visualizza detto flusso (92), detto dispositivo svolge una o piÃ¹ delle seguenti procedure: segnala allâ€™utente la probabile presenza di errori di profonditÃ ; consiglia allâ€™utente di visualizzare detto flusso video stereoscopico (92) in modalitÃ 2D e/o commuta automaticamente in modalitÃ 2D; corregge errori di profonditÃ tramite unâ€™elaborazione locale di dette immagini (L,R).
23. Flusso video stereoscopico comprendente frame compositi (C), detti frame compositi comprendendo informazioni relative a una immagine sinistra (L) e una immagine destra (R) per la visualizzazione tridimensionale di una scena, caratterizzato dal fatto di comprendere un dato di segnalazione indicante quale di dette due immagini (L,R) Ã ̈ ripresa in istanti temporali ritardati rispetto allâ€™altra immagine (R,L).