ITTO20110414A1 - Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi - Google Patents

Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi Download PDF

Info

Publication number
ITTO20110414A1
ITTO20110414A1 IT000414A ITTO20110414A ITTO20110414A1 IT TO20110414 A1 ITTO20110414 A1 IT TO20110414A1 IT 000414 A IT000414 A IT 000414A IT TO20110414 A ITTO20110414 A IT TO20110414A IT TO20110414 A1 ITTO20110414 A1 IT TO20110414A1
Authority
IT
Italy
Prior art keywords
digital
video sequence
sequence
video
representative
Prior art date
Application number
IT000414A
Other languages
English (en)
Inventor
Davide Aliprandi
Pasqualina Fragneto
Srijib Narayan Maiti
Emiliano Mario Piccinelli
Beatrice Rossi
Original Assignee
St Microelectronics Pvt Ltd
St Microelectronics Srl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St Microelectronics Pvt Ltd, St Microelectronics Srl filed Critical St Microelectronics Pvt Ltd
Priority to IT000414A priority Critical patent/ITTO20110414A1/it
Priority to US13/469,873 priority patent/US20120287237A1/en
Publication of ITTO20110414A1 publication Critical patent/ITTO20110414A1/it

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Description

DESCRIZIONE
“Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativiâ€
TESTO DELLA DESCRIZIONE
Campo tecnico
La descrizione si riferisce all’elaborazione di segnali video. Certe forme di attuazione possono riferirsi a tecniche per unire una fondere (merge) una terza dimensione in segnali video 2D (cioà ̈, bidimensionali o a due dimensioni).
Sfondo
Un modo semplice per rappresentare tre dimensioni con un'immagine bidimensionale à ̈ un procedimento stereo. Un'immagine stereo viene configurata con delle immagini destra e sinistra, il che à ̈ intrinsecamente svantaggioso considerando la rilevante quantità di dati coinvolti. In parole semplici, se si applica direttamente un procedimento di codifica video con vista mono la quantità di dati da memorizzare e trasmettere per applicazioni video con visione stereo può essere doppia rispetto alle applicazioni video convenzionali con vista “mono†.
Gli inventori hanno notato che, sebbene non destinati alla la codifica video con visione stereo, gli strumenti o tool di codifica video quali, per esempio, gli strumenti di codifica H.264 possono essere configurati per trarre vantaggio delle correlazioni tra le due viste di un video con visione stereo, e fornire una prestazione di compressione affidabile ed efficace così come una scalabilità stereo/mono.
Gli schemi a blocchi delle Figure 1 e 2 sono schematicamente rappresentativi della struttura e del funzionamento di un codificatore (Figura 1) e decodificatore (Figura 2) funzionanti su immagini video (mono), per esempio in conformità con lo standard H.264. In varie forme di attuazione, il codificatore della Figura 1 può comprendere i seguenti moduli/fasi di elaborazione: 100: Nodo di sottrazione (genera un segnale di differenza tra un blocco di immagine immesso ed emesso dal Mux 118) 102: Trasformata Coseno Discreta (DCT)
104: Quantizzazione con passo Q
105: Codifica RLC (Run Length Coding)
106: Quantizzazione Inversa, preceduta dalla RLC Inversa (IRLC) 107
108: Trasformata Coseno Discreta Inversa (IDCT)
110: Nodo di somma (genera la somma dei segnali emessi dall'IDCT 108 e dal Mux 118)
112: Filtro di anello
114: Buffer (Memoria di frame)
116: Compensazione del moto
118: Mux (per selezionare tra predizione intra ed inter predizione)
120: Codifica a Lunghezza Variabile (VLC) – Codifica Entropica
122: Bitrate variabile (VB)
124: Controllo del passo di quantizzazione in funzione del Bitrate Variabile
126: Codifica a blocchi per produrre un flusso di bit (codifica del flusso di bit) di uscita codificato (per esempio codificato H.264)
In varie forme di attuazione, il decodificatore della Figura 2 può comprendere i seguenti moduli/fasi di elaborazione:
200: Decodifica a blocchi del flusso di bit codificato (per esempio codificato H.264)
202: Bitrate Variabile (VB)
204: Decodifica a lunghezza variabile (VLD)
205: Run Length Coding inversa (IRLC)
206: Quantizzazione inversa
208: Controllo del passo di quantizzazione inversa in funzione del bitrate variabile
210: Trasformata Coseno Discreta Inversa (IDCT)
212: Nodo di somma (genera la somma di segnali emessi dall’IDCT 210 ed emessi dal Mux 220 per produrre Dati Decodificati)
214: Filtro di anello
216: Buffer (Memoria di frame)
218: Compensazione del moto
220: Mux (per selezionare tra predizione intra ed inter sulla base di informazioni ricavate dal flusso di bit codificato).
Le soluzioni esemplificate nelle Figure 1 e 2 sono peraltro convenzionali nella tecnica, il che rende superfluo fornire qui una descrizione più dettagliata. Queste soluzioni possono essere configurate per funzionare su immagini organizzate in blocchi ad esempio blocchi comprendenti per esempio pixel 4×4 o 16×16.
Gli inventori hanno notato che la compressione per immagini stereo può essere conseguita traendo vantaggio da ridondanze nei dati sorgente, per esempio ridondanze spaziali e temporali relative ad immagini e video monoculari. La soluzione più semplice per comprimere i due canali consiste nell’utilizzare una codifica indipendente per ciascuna immagine/video con standard di compressione esistenti (Codifica Multicast H.264).
Gli inventori hanno notato che una sequenza video stereoscopica contiene una grande quantità di dipendenze statistiche inter-vista, poiché le due camere catturano la stessa scena da due diversi punti di vista. Quindi, una predizione temporale ed inter-vista combinata può essere una chiave per un’efficace codifica stereoscopica. Un frame di una data camera può essere predetto non solo da frame temporalmente correlati dalla stessa camera, ma anche da frame di una qualsiasi camera vicina. Queste interdipendenze possono essere utilizzate per un’efficace predizione (Codifica Multi Video o MVC).
Un’architettura di codifica esemplificativa per un video stereoscopico può essere così come rappresentata nelle Figure da 3 a 5.
Specificatamente, le Figure 3 e 4 mostrano che, nell’ambito della struttura di un generico schema “simulcast†H.264 così come illustrato nella Figura 3, esiste la possibilità di utilizzare una stessa immagine codificata-I di una delle due sequenze - per esempio la sequenza sinistra per scopi di predizione (immagini codificate-P) anche per l’altra sequenza – per esempio la sequenza destra. La Figura 5 à ̈ un modo di visualizzare una sequenza stereo esemplificativa creata secondo le Figure 3 e 4.
A titolo di ulteriore riferimento, la Figura 6 à ̈ rappresentativa di uno schema di codifica di immagine stereo “diretto†basato sul concetto di duplicare semplicemente lo schema di codifica di base della Figura 1 - distintamente – rispettivamente per le sequenze sinistra e destra, L e R, per produrre corrispondenti sequenze codificate “sinistra†e “destra†(per esempio H.264).
Gli stessi riferimenti numerici che appaiono nella Figura 1 sono stati riprodotti nella Figura 6 per indicare elementi, parti o componenti identici o equivalenti nelle due figure: quindi, una descrizione dettagliata di questi elementi, parti o componenti non verrà qui ripetuta.
La Figura 7 esemplifica la possibilità di implementare una Codifica Multi Video o schema MVC di esempio lasciando che i due codificatori distinti della Figura 6 condividano qualche tipo di informazione di predizione, facendo sì di conseguenza che i dati in arrivo da una delle sequenze (per esempio la sequenza sinistra) siano resi disponibili al nodo 118 del codificatore relativo alla seconda sequenza (per esempio la sequenza destra). Specificatamente, l’esempio di forma di attuazione illustrato nella Figura 7 prevede che i dati del buffer 114 nella catena di elaborazione della sequenza sinistra siano resi disponibili al nodo mux 118 nella catena di elaborazione della sequenza destra, mentre un possibile ulteriore valore “Intervisione†viene contemplato per il funzionamento del nodo mux 118.
Si apprezzerà che disposizioni di elaborazione duali rispetto agli schemi di codifica delle figure 6 e 7 possono essere concepite per schemi di decodifica complementari.
Scopo e sintesi
Gli inventori hanno notato che gli schemi di Codifica Multi Video o MVC possono essere ulteriormente migliorati sotto almeno due aspetti:
- ridurre la quantità complessiva di dati trasmessi per convogliare un segnale video con visione stereo; e
- ridurre la presenza di blocchi di moduli/fasi di elaborazione inutilmente ridondanti presenti in entrambe le catene di elaborazione (codifica e decodifica) per le sequenze sinistra e destra.
Uno scopo dell'invenzione consiste nel fornire un tale miglioramento.
Secondo l'invenzione, tale scopo viene conseguito per mezzo di un procedimento avente le caratteristiche richiamate nelle rivendicazioni che seguono.
L'invenzione si riferisce anche ad una corrispondente apparecchiatura (codificatore e decodificatore) e ad un prodotto informatico, caricabile nella memoria di almeno un computer e comprendente porzioni di codice software sucettibili di implementare le fasi del procedimento quando il prodotto viene eseguito su almeno un computer, così come un segnale video codificato secondo l'invenzione.
Le rivendicazioni formano una parte integrante della rivelazione tecnica qui fornita in relazione all'invenzione.
L'idea alla base di certe forme di attuazione consiste nel fondere (merge) completamente il flusso di bit generato codificando la seconda vista (per esempio la vista destra) nel flusso di bit generato codificando la prima vista (per esempio la vista sinistra), senza aggiungere bit supplementari rispetto al flusso di bit della prima vista. Ciò porta a produrre come risultato ciò che sembra sostanzialmente un flusso di bit video codificato a “vistamono†, anche se esso di fatto incorpora una seconda vista. In varie forme di attuazione, il flusso di bit relativo alla seconda vista può essere generato o dalla seconda vista stereoscopica in quanto tale, o da detta vista presentata sotto forma di una “sequenza di mappa di profondità†, vale a dire una sequenza di immagini nella scala dei grigi, con valori tra bianco e nero, che rappresentano la distanza tra gli oggetti mostrati all'interno dei frame e la camera che ha acquisito la scena. In varie forme di attuazione, la seconda vista può essere o codificata mediante predizione dalla prima (predizione inter-vista simile alla MVC) o codificata in modo indipendente (simulcast).
Breve descrizione delle figure
Verranno ora descritte varie forme di attuazione, a puro titolo di esempio, facendo riferimento alle figure allegate, in cui:
- Figure da 1 a 7 sono già state descritte precedentemente; - Figure da 8 a 11 sono rappresentative di varie fasi nelle forme di attuazione;
- Figure 12 e 13 sono rappresentative di forme di attuazione di un codificatore; e
- Figure 14 e 15 sono rappresentative di forme di attuazione di un decodificatore.
Descrizione particolareggiata
Nella seguente descrizione sono illustrati vari dettagli specifici finalizzati ad un’approfondita comprensione delle forme di attuazione. Le forme di attuazione possono essere realizzate senza uno o più dei dettagli specifici, o con altri metodi componenti materiali, etc. In altri casi, strutture, materiali o operazioni noti non sono mostrati o descritti in dettaglio per evitare di rendere oscuri i vari aspetti delle forme di attuazione.
Il riferimento ad “una forma di attuazione†nell’ambito di questa descrizione sta ad indicare che una particolare configurazione, struttura o caratteristica descritta in relazione alla forma di attuazione à ̈ compresa in almeno una forma di attuazione. Quindi, frasi come “in una forma di attuazione†, eventualmente presenti in diversi luoghi di questa descrizione non sono necessariamente riferite alla stessa forma di attuazione. Inoltre, particolari conformazioni, strutture o caratteristiche possono essere combinate in ogni modo adeguato in una o più forme di attuazione.
I riferimenti qui utilizzati sono soltanto per comodità e non definiscono dunque l’ambito di tutela o la portata delle forme di attuazione.
Parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in abbinamento a qualsiasi delle figure da 1 a 7 verranno indicati nelle Figure da 8 a 15 con gli stessi riferimenti già utilizzati nelle Figure da 1 a 7; onde evitare di rendere questa descrizione eccessivamente lunga la corrispondente descrizione non verrà ripetuta.
Inoltre, si apprezzerà che in tutta questa descrizione i ruoli giocati dalle due sequenze in un segnale video stereo (cioà ̈ sinistra e destra) possono essere scambiati: per esempio, mentre gli esempi di forme di attuazione descritte di seguito fanno riferimento alla sequenza “destra†che viene fusa nella sequenza “sinistra†, varie forme di attuazione possono prevedere che la sequenza “sinistra†venga fusa nella sequenza “destra†.
Il diagramma della Figura 8 à ̈ rappresentativo della possibilità di assoggettare una delle sequenze in un segnale video stereo (per esempio la sequenza destra) ad una sequenza di moduli/fasi di codifica per mezzo dei quali la sequenza può essere predetta (100, sulla base del segnale prodotto nei moduli/fasi da 106 a 118), trasformata, quantizzata (moduli/fasi da 102 a 105) e codificata (moduli/fasi da 122 a 126) come al solito, per ottenere una sequenza di bit indicata nel suo complesso come MESSAGGIO, quale per esempio una stringa di bit su 8-bit “01100010†.
Secondo la dimensione di blocco variabile, si può ipotizzare che la lunghezza del messaggio sia o inferiore a 1/128 della dimensione di frame se la dimensione del blocco nel codificatore viene impostata piccola quanto 4×4 o inferiore a 1/2048 se la dimensione del blocco viene impostata grande quanto 16×16. Come rappresentato schematicamente nella Figura 9, l'altra sequenza nel segnale video stereo (per esempio la sequenza sinistra, nell'esempio di attuazione qui considerato) può essere similmente assoggettata ad una sequenza di fasi in cui, in ciascun frame, i blocchi (per esempio 4x4) vengono estratti (fase/modulo 302), trasformati (fase/modulo 102), quantizzati (fase/modulo 104) e codificati utilizzando la run-length coding (fase/modulo 105) ottenendo di conseguenza una sequenza codificata in cui i livelli risultanti dalla quantizzazione, per esempio
…7, 5, 4, 4, 3, 0, 0, 0, 0, …
vengono codificati come entità a due numeri in cui in ciascun blocco il livello non nullo viene preceduto da un valore di “run†, che indica il numero di zeri prima del livello e terminato da un indicatore (flag) di Fine Blocco (EOB), vale a dire:
[07] [05] [04] [04] [03] [EOB]
in cui [03] Ã ̈ rappresentativo dell'ultimo livello (non nullo).
La Figura 10 à ̈ rappresentativa di una forma di attuazione in cui la prima sequenza (qui, la sequenza “destra†) viene fusa nella seconda sequenza (qui, la sequenza “sinistra†) sostituendo ciascun bit meno significativo (LSB) di uno dei livelli (per esempio l'ultimo livello) di ciascun blocco (per esempio 4x4) correlato alla sequenza rappresentativa della sequenza video sinistra con un bit del “messaggio†rappresentativo della sequenza video destra.
Nel caso dell’esempio delle Figure 9 e 10:
- la sequenza di “messaggi†ottenuta per il segnale video a destra à ̈ “01100010†; e
- l'ultimo livello della sequenza rappresentativa della sequenza video sinistra à ̈ “3†, vale a dire “00000011†nella codifica binaria a 8-bit.
Come rappresentato schematicamente nelle Figure 10 e 11, ciascun singolo bit (per esempio l'ultimo bit nella Figura 10, cioà ̈ “0†), della sequenza di “messaggio†ottenuta dal segnale video a destra viene sostituito con il bit meno significativo (LSB) dell'ultimo livello del blocco attuale (per esempio 4x4) correlato alla sequenza rappresentativa del segnale video a destra, producendo di conseguenza “00000010†, vale a dire “2†in forma binaria a 8-bit, invece di “00000011†, vale a dire “3†come era stato originalmente ottenuto dalla codifica della vista a sinistra da sola.
La sequenza così modificata (cioà ̈ con l'ultimo livello modificato da “3†a “2†, cioà ̈ con [02] sostituito con [03]) viene codificata come al solito utilizzando la codifica entropica (VLC) nel modulo/fase 120.
Questa procedura viene ripetuta per ciascun blocco sino a che tutti i bit del messaggio non vengono inseriti nella codifica a sinistra, in modo che i dati relativi al segnale video a destra vengano nascosti nel “rumore†dell'immagine, producendo un segnale codificato, che può sembrare apparentemente come un segnale con “vista-mono†ma che di fatto convoglia l’informazione di un segnale con “vistastereo†. In varie forme di attuazione, il flusso di bit generato codificando la sequenza a destra può essere considerato come il messaggio da unire nel flusso di bit della prima vista o nella sua interezza o solo parzialmente. Nell'ultimo caso, le parti relative alle informazioni legate alla struttura dello stesso flusso di bit (per esempio intestazioni o header, campi dei parametri di sequenza impostati, campi dei parametri di immagine impostati, ecc., cioà ̈ quelle parti che non contengono dati direttamente legati alle immagini) sono le stesse di quelle convogliate dal flusso di bit per l'altra vista (cioà ̈ a sinistra); queste parti possono essere di conseguenza ricavate dal flusso di bit della vista sinistra quando si ricostruisce il flusso di bit della vista destra come descritto di seguito.
Le Figure 12 e 13 sono una rappresentazione schematica di codificatori che funzionano secondo i criteri esemplificativi di “fusione†descritti precedentemente (cioà ̈ la Figura 12 rappresenta un approccio simulcast, mentre la Figura 13 mostra una predizione inter-vista (simile alla MVC) della vista destra da quella sinistra). Ancora una volta, parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in unione a qualsiasi delle precedenti figure vengono indicati nelle Figure 12 e 13 con gli stessi riferimenti già utilizzati per le precedenti figure; la corrispondente descrizione non verrà ripetuta.
Tramite confronto diretto con la Figura 7, si apprezzerà inoltre che nei diagrammi delle Figure 12 e 13 la soluzione di elaborazione per la sequenza video sinistra à ̈ sostanzialmente la stessa, mentre la soluzione di elaborazione per la sequenza video destra può essere semplificata.
In effetti, la generazione del segnale del messaggio per il segnale video a destra da fondere (per esempio al livello del codificatore run-length 105 della sequenza a sinistra) nella sequenza video sinistra può fare a meno di moduli/fasi di elaborazione separati a valle della codifica entropica (VLC), vale a dire dei moduli/fasi 122 e 126, e anche del modulo/fase di controllo del passo di quantizzazione 124.
La Figura 14 à ̈ una rappresentazione schematica di un decodificatore configurato per decodificare il segnale “di fusione†prodotto secondo i criteri esemplificativi di “fusione†descritti in precedenza in relazione alle Figure da 8 a 13.
Ancora una volta, parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in abbinamento a qualsiasi delle precedenti figure (per esempio la Figura 2) vengono indicati nella Figura 14 con gli stessi riferimenti già utilizzati nelle precedenti figure e la corrispondente descrizione non viene ripetuta. Nella disposizione esemplificativa di decodificatore della Figura 14, il segnale video a sinistra viene ricuperato (come nel caso della disposizione della Figura 2) all'uscita del sommatore 212.
Nella disposizione esemplificativa del decodificatore della Figura 14, Ã ̈ previsto un modulo/fase di estrazione 304 localizzato a valle del modulo/fase 204 dove viene eseguita la Decodifica a Lunghezza Variabile (VLD) ottenendo la corrispondente sequenza codificata.
Nel modulo/fase 304, il bit meno significativo di ciascun ultimo livello della sequenza viene identificato e raccolto per ricostruire il messaggio rappresentativo del segnale video a destra come meglio descritto nel dettaglio di seguito.
La decodifica del segnale video a sinistra procede altrimenti come al solito.
La lunghezza del messaggio rappresentativo per l'immagine video destra sarà in modo atteso inferiore al numero di blocchi di trasformata della vista sinistra (principale); altrimenti al lato del decodificatore si potrebbe verificare un errore mentre si ricostruisce il messaggio. In quel caso, in certe forme di attuazione, al fine di assicurare la compatibilità a ritroso, la fase di fusione può operare a livello di frame, vale a dire fondendo un frame a destra nel corrispondente a sinistra. Quindi, conoscendo la dimensione dell’immagine, il decodificatore può completare l’estrazione quando il frame a sinistra à ̈ completamente costruito.
Il caso in cui la lunghezza del messaggio rappresentativo dell’immagine video destra sia superiore al numero di blocchi di trasformata della vista sinistra (principale) à ̈ assai improbabile.
In certe forme di attuazione, per essere sicuri che la lunghezza sia adeguatamente ridotta, nella vista destra si potrebbe impostare un Bit Rate Costante (CBR).
L’estrazione dei dati per il segnale video a destra fuso nel segnale video a sinistra ha luogo sul segnale estratto in corrispondenza del modulo/fase 304.
Qui, il bit meno significativo di ciascun ultimo livello della sequenza viene identificato e raccolto per ricostruire il messaggio.
In certe forme di attuazione, l’intero flusso di bit corrispondente alla vista codificata destra può essere ottenuto o semplicemente ricostruendo il messaggio dal flusso di bit per la vista sinistra come raffigurato schematicamente nella Figura 15 (cioà ̈ estraendo gli LSB dagli ultimi livelli in ciascun blocco prima della EOB), o fondendo in modo appropriato lo stesso messaggio estratto con alcuni elementi di informazione comuni con il flusso di bit per la vista sinistra (per esempio intestazione, campi dei parametri di sequenza impostati, campi dei parametri di immagine impostati, ecc…) che vengono presi e copiati dal flusso di bit legato alla vista sinistra.
La Decodifica a Lunghezza Variabile (VLD) può essere eseguita sul messaggio ricostruito dalla vista sinistra e la decodifica continua come al solito.
Si apprezzerà che certe forme di attuazione possono permettere di conseguire i seguenti vantaggi:
- la quantità di dati codificati trasmessa per un segnale video con vista stereo à ̈ sostanzialmente la stessa rispetto ad un segnale codificato con vista mono, vale a dire metà dei corrispondenti dati trasmessi utilizzando per esempio la modalità multicast H.264, e – in qualsiasi caso meno dei corrispondenti dati trasmessi quando si usa la MVC;
- un effettivo cambiamento nella codifica risultante per il canale “principale†(negli esempi qui considerati, la vista a sinistra in cui viene fusa la vista destra) interviene statisticamente solo nel 50% dei casi, ed un cambiamento nel LSB dell’ultimo livello della sequenza ottenuta dopo la codifica Run-Length introduce solo una piccola quantità di rumore nel canale principale, che à ̈ quasi invisibile per la vista;
- il flusso di bit codificato à ̈ conforme al decoder 2D.
Fermo restando il principio dell'invenzione, i particolari di realizzazione e le forme di attuazione potranno variare, anche in modo significativo, rispetto a quanto qui illustrato a puro titolo di esempio non limitativo, senza per questo uscire dall'ambito dell'invenzione così come definito dalle rivendicazioni annesse. Specificatamente, si apprezzerà che, pur se fornita a titolo di esempio in relazione al caso della codifica H.264, la presente descrizione non à ̈ limitata alla codifica H.264 ma à ̈ generalmente applicabile a qualsiasi segnale video digitale comprendente una prima sequenza video ed una seconda sequenza video formanti congiuntamente un segnale video digitale con vista stereo, ed in cui la prima sequenza video viene assoggettata a trasformata coseno discreta, quantizzazione e run-length coding per produrre una sequenza di blocchi di livelli digitali non nulli rappresentativi della prima sequenza video, mentre la seconda sequenza video viene assoggettata a trasformata coseno discreta, quantizzazione, run-length coding e codifica a lunghezza variabile per produrre messaggi digitali rappresentativi della seconda sequenza video.
L’applicazione della descrizione può essere rilevata anche l livello del risultante segnale video digitale codificato confrontando tale segnale, che à ̈ rappresentativo di una prima sequenza video e di una seconda sequenza video formanti congiuntamente un segnale video digitale con vista stereo, con un segnale di test prodotto basandosi sulla presente descrizione partendo dalle stesse sequenze video. Il segnale codificato comprenderà una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video quando assoggettata a trasformata coseno discreta, quantizzazione e run-length coding, in cui i bit meno significativi di uno dei livelli digitali nei blocchi rappresentativi della prima sequenza video hanno in sostituzione i bit di messaggi digitali rappresentativi della seconda sequenza video quando assoggettata a trasformata coseno discreta, quantizzazione, run-length coding e codifica a lunghezza variabile, per cui i bit dei messaggi digitali sono fusi nella sequenza di blocchi di livelli digitali.

Claims (11)

  1. RIVENDICAZIONI 1. Procedimento di codifica di un segnale video digitale comprendente una prima sequenza video (L) ed una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il procedimento comprendendo: - assoggettare detta prima sequenza video (L) a trasformata coseno discreta (102), quantizzazione (104) e run-length coding (105) per produrre una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L), - assoggettare detta seconda sequenza video (R) a trasformata coseno discreta (102), quantizzazione (104), run-length coding (105) e codifica a lunghezza variabile (120) per produrre messaggi digitali rappresentativi di detta seconda sequenza video (R), - fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo i bit di detti messaggi digitali al posto di rispettivi bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) per produrre un segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
  2. 2. Procedimento secondo la rivendicazione 1, comprendente fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo ciascun bit di detti messaggi digitali con il bit meno significativo dell’ultimo livello digitale di detti blocchi rappresentativi di detta prima sequenza video (L).
  3. 3. Procedimento secondo la rivendicazione 1 o rivendicazione 2, comprendente assoggettare a codifica a lunghezza variabile (120) detto segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
  4. 4. Procedimento secondo qualsiasi della rivendicazioni precedenti, in cui detta prima sequenza video (L) e detta seconda sequenza video (R) sono organizzate in blocchi di immagine, preferibilmente blocchi di immagine 4x4 o 16x16.
  5. 5. Procedimento secondo la rivendicazione 4, comprendente controllare la lunghezza di detti messaggi digitali, preferibilmente forzando un bit rate costante in detta seconda sequenza video (R), assicurando che detta lunghezza non sia superiore al numero di blocchi di trasformata per detta prima sequenza video (L).
  6. 6. Procedimento secondo qualsiasi delle rivendicazioni precedenti, in cui la quantizzazione (104) di detta prima sequenza video (L) e quantizzazione (104) di detta seconda sequenza video (R) sono controllabili rispettivamente con passo di quantizzazione variabile e passo di quantizzazione fisso (122, 124).
  7. 7. Codificatore per codificare con il procedimento secondo qualsiasi delle rivendicazioni da 1 a 5 un segnale video digitale comprendente una prima sequenza video (L) ed una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il codificatore comprendendo: - un trasformatore coseno discreto (102), un quantizzatore (104) ed un codificatore run-length (105) per assoggettare detta prima sequenza video (L) a trasformata coseno discreta, quantizzazione (104) e run-length coding per produrre detta sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L), - un trasformatore coseno discreto (102), un quantizzatore (104), un codificatore run-length (105) ed un codificatore a lunghezza variabile (120) per assoggettare detta seconda sequenza video (R) a trasformata coseno discreta, quantizzazione, run-length coding (105) e codifica a lunghezza variabile per produrre detti messaggi digitali rappresentativi di detta seconda sequenza video (R), - un dispositivo di fusione (merger) (105) per fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo i bit di detti messaggi digitali al posto di rispettivi bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) per produrre un segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
  8. 8. Decodificatore per decodificare un segnale video digitale codificato con il procedimento secondo qualsiasi delle rivendicazioni da 1 a 5, detto segnale video digitale codificato essendo rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il decodificatore comprendendo un estrattore (304) per rimuovere i bit di detti messaggi digitali rappresentativi di detta seconda sequenza video (R) dai bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L).
  9. 9. Decodificatore secondo la rivendicazione 8, comprendente un decodificatore a lunghezza variabile (204) disposto a monte di detto estrattore (304) per assoggettare a codifica a lunghezza variabile inversa detto segnale video digitale codificato rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R).
  10. 10. Prodotto informatico caricabile nella memoria di almeno un computer e comprendente porzioni di codice software per eseguire le fasi del procedimento secondo qualsiasi delle rivendicazioni da 1 a 5.
  11. 11. Segnale video digitale codificato rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il segnale codificato comprendendo una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L) quando assoggettata a trasformata coseno discreta (102), quantizzazione (104) e run-length coding (105), in cui i bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) hanno sostituiti al loro posto i bit di messaggi digitali rappresentativi di detta seconda sequenza video (R) quando assoggettata a trasformata coseno discreta (102), quantizzazione (104), run-length coding (105) e codifica a lunghezza variabile (120), per cui i bit di detti messaggi digitali sono fusi in detta sequenza di blocchi di livelli digitali.
IT000414A 2011-05-11 2011-05-11 Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi ITTO20110414A1 (it)

Priority Applications (2)

Application Number Priority Date Filing Date Title
IT000414A ITTO20110414A1 (it) 2011-05-11 2011-05-11 Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi
US13/469,873 US20120287237A1 (en) 2011-05-11 2012-05-11 Method and apparatus for processing video signals, related computer program product, and encoded signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000414A ITTO20110414A1 (it) 2011-05-11 2011-05-11 Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi

Publications (1)

Publication Number Publication Date
ITTO20110414A1 true ITTO20110414A1 (it) 2012-11-12

Family

ID=44554545

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000414A ITTO20110414A1 (it) 2011-05-11 2011-05-11 Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi

Country Status (2)

Country Link
US (1) US20120287237A1 (it)
IT (1) ITTO20110414A1 (it)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122020024986B1 (pt) 2011-06-16 2022-02-22 Ge Video Compression, Llc Codificação de entropia das diferenças do vetor de movimento
US10229250B2 (en) * 2015-02-16 2019-03-12 Arebus, LLC System, method and application for transcoding data into media files
US12375459B2 (en) 2015-02-16 2025-07-29 Arebus Llc Systems, methods, and applications for transcoding data into media files
US11582202B2 (en) 2015-02-16 2023-02-14 Arebus, LLC System, method and application for transcoding data into media files
WO2018180579A1 (ja) * 2017-03-31 2018-10-04 ソニーセミコンダクタソリューションズ株式会社 撮像制御装置、および撮像制御装置の制御方法、並びに移動体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9022326D0 (en) * 1990-10-15 1990-11-28 British Telecomm Signal coding
KR0134177B1 (ko) * 1992-03-24 1998-04-22 Toshiba Kk 가변장 부호의 기록 재생 장치
US5652616A (en) * 1996-08-06 1997-07-29 General Instrument Corporation Of Delaware Optimal disparity estimation for stereoscopic video coding
JP2001502504A (ja) * 1996-10-11 2001-02-20 サーノフ コーポレイション 立体視ビデオを符号化及び複号する装置及び方法
CN101248453B (zh) * 2005-07-04 2011-11-16 联邦科学和工业研究组织 对图像加水印以及对加水印的图像解码的方法和装置
US8503568B1 (en) * 2006-09-07 2013-08-06 The Boeing Company Differential encoding for multiplexed data streams
MY162861A (en) * 2007-09-24 2017-07-31 Koninl Philips Electronics Nv Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal
US20120027091A1 (en) * 2010-07-28 2012-02-02 Wei-Lien Hsu Method and System for Encoding Video Frames Using a Plurality of Processors

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
CELIK M U ET AL: "Lossless Generalized-LSB Data Embedding", IEEE TRANSACTIONS ON IMAGE PROCESSING, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 14, no. 2, 1 February 2005 (2005-02-01), pages 253 - 266, XP011124986, ISSN: 1057-7149, DOI: 10.1109/TIP.2004.840686 *
CHANG C-C ET AL: "A STEGANOGRAPHIC METHOD BASED UPON JPEG AND QUANTIZATION TABLE MODIFICATION", INFORMATION SCIENCES, AMSTERDAM, NL, vol. 141, 1 January 2002 (2002-01-01), pages 123 - 138, XP001091528, ISSN: 0020-0255, DOI: 10.1016/S0020-0255(01)00194-3 *
COLTUC D ET AL: "Stereo embedding by reversible watermarking: Further results", PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON SIGNALS, CIRCUITS AND SYSTEMS, 2009 (ISSCS 2009), IASI, ROMANIA, 9-10 JULY 2009, 9 July 2009 (2009-07-09), IEEE, PISCATAWAY, NJ, USA, pages 1 - 4, XP031513910, ISBN: 978-1-4244-3785-6 *
DINU COLTUC ET AL: "Color stereo embedding by reversible watermarking", PROCEEDINGS OF THE 3RD INTERNATIONAL SYMPOSIUM ON ELECTRICAL AND ELECTRONICS ENGINEERING (ISEEE), 2010, GALATI, ROMANIA, 16-18 SEPTEMBER 2010, 16 September 2010 (2010-09-16), IEEE, PISCATAWAY, NJ, USA, pages 256 - 259, XP031795432, ISBN: 978-1-4244-8406-5 *
DINU COLTUC: "On Stereo Embedding by Reversible Watermarking", PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON SIGNALS, CIRCUITS AND SYSTEMS, 2007. ISSCS 2007, IASI, ROMANIA, 12-13 JULY 2007, 12 July 2007 (2007-07-12), IEEE, Piscataway, NJ, USA, pages 1 - 4, XP031128629, ISBN: 978-1-4244-0968-6 *
KHAN A ET AL: "Hiding depth map of an object in its 2D image: Reversible watermarking for 3D cameras", DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 2009 (ICCE '09), LAS VEGAS, NV, USA, 10-14 JANUARY 2009, 10 January 2009 (2009-01-10), IEEE, PISCATAWAY, NJ, USA, pages 1 - 2, XP031466966, ISBN: 978-1-4244-4701-5 *
NEIL F JOHNSON ET AL: "Exploring steganography: Seeing the unseen", COMPUTER, IEEE SERVICE CENTER, LOS ALAMITOS, CA, US, vol. 31, no. 2, 1 February 1998 (1998-02-01), pages 26 - 34, XP011236628, ISSN: 0018-9162, DOI: 10.1109/MC.1998.4655281 *

Also Published As

Publication number Publication date
US20120287237A1 (en) 2012-11-15

Similar Documents

Publication Publication Date Title
CA2893011C (en) Method and apparatus for efficient coding of depth lookup table
CN102308585B (zh) 多视点视频编码/解码方法和设备
US9942550B2 (en) Image encoding device, image encoding method and program, image decoding device, and image decoding method and program
KR102848783B1 (ko) 인트라 프레임 스킵 모드 정보의 부호화 방법 및 장치, 복호화 방법 및 장치
EP3399746B1 (en) Decoder and encoder for coding of a video sequence
US9143797B2 (en) Lossy data compression with conditional reconstruction refinement
CN102308583B (zh) 对多视角图像进行编码和解码的设备和方法
EP2816805A1 (en) Lossy data compression with conditional reconstruction reinfinement
KR20120118779A (ko) 전처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 부호화 방법 및 그 장치, 후처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 복호화 방법 및 그 장치
ITTO20110414A1 (it) Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi
JP7291753B2 (ja) メディアファイルのためのブランド
JP7431827B2 (ja) 画像デコーディング方法、デコーダ及びコンピューター記憶媒体
TW201505424A (zh) 將影像序列的可調串流表示解碼之方法及裝置與對應之編碼方法及裝置
KR102284107B1 (ko) 영상을 부호화/복호화하기 위한 파라미터 세트 생성 방법 및 장치
JP2023508665A (ja) ビデオコーディングにおける復号パラメータセット
WO2014050057A1 (en) Systems and methods for reference picture set extension
TR201002451A2 (tr) Süper çözünürlük tabanlı N-bakışlı + N-derinlikli çok bakışlı video kodlama.
Adikari et al. A H. 264 compliant stereoscopic video codec
JP2011244025A (ja) 画像処理装置および画像処理方法
KR20140127400A (ko) 비디오 부호화 및 복호화 방법, 그를 이용한 장치
KR20120084628A (ko) 다시점 영상 부호화/복호화 장치 및 방법
WO2024037574A1 (en) System and method for end-to-end lossless stereo image compression
KR20110118744A (ko) 쓰리디 티브이 동영상 부호화 방법, 복호화 방법
WO2025212408A1 (en) Extension mechanisms for jpeg ai sub-streams
WO2025193684A1 (en) Carriage of sub-streams in a jpeg ai codestream