ITTO20110414A1 - Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi - Google Patents
Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi Download PDFInfo
- Publication number
- ITTO20110414A1 ITTO20110414A1 IT000414A ITTO20110414A ITTO20110414A1 IT TO20110414 A1 ITTO20110414 A1 IT TO20110414A1 IT 000414 A IT000414 A IT 000414A IT TO20110414 A ITTO20110414 A IT TO20110414A IT TO20110414 A1 ITTO20110414 A1 IT TO20110414A1
- Authority
- IT
- Italy
- Prior art keywords
- digital
- video sequence
- sequence
- video
- representative
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000008569 process Effects 0.000 title claims description 8
- 230000011664 signaling Effects 0.000 title 1
- 238000013139 quantization Methods 0.000 claims description 21
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/93—Run-length coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Description
DESCRIZIONE
“Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativiâ€
TESTO DELLA DESCRIZIONE
Campo tecnico
La descrizione si riferisce all’elaborazione di segnali video. Certe forme di attuazione possono riferirsi a tecniche per unire una fondere (merge) una terza dimensione in segnali video 2D (cioà ̈, bidimensionali o a due dimensioni).
Sfondo
Un modo semplice per rappresentare tre dimensioni con un'immagine bidimensionale à ̈ un procedimento stereo. Un'immagine stereo viene configurata con delle immagini destra e sinistra, il che à ̈ intrinsecamente svantaggioso considerando la rilevante quantità di dati coinvolti. In parole semplici, se si applica direttamente un procedimento di codifica video con vista mono la quantità di dati da memorizzare e trasmettere per applicazioni video con visione stereo può essere doppia rispetto alle applicazioni video convenzionali con vista “mono†.
Gli inventori hanno notato che, sebbene non destinati alla la codifica video con visione stereo, gli strumenti o tool di codifica video quali, per esempio, gli strumenti di codifica H.264 possono essere configurati per trarre vantaggio delle correlazioni tra le due viste di un video con visione stereo, e fornire una prestazione di compressione affidabile ed efficace così come una scalabilità stereo/mono.
Gli schemi a blocchi delle Figure 1 e 2 sono schematicamente rappresentativi della struttura e del funzionamento di un codificatore (Figura 1) e decodificatore (Figura 2) funzionanti su immagini video (mono), per esempio in conformità con lo standard H.264. In varie forme di attuazione, il codificatore della Figura 1 può comprendere i seguenti moduli/fasi di elaborazione: 100: Nodo di sottrazione (genera un segnale di differenza tra un blocco di immagine immesso ed emesso dal Mux 118) 102: Trasformata Coseno Discreta (DCT)
104: Quantizzazione con passo Q
105: Codifica RLC (Run Length Coding)
106: Quantizzazione Inversa, preceduta dalla RLC Inversa (IRLC) 107
108: Trasformata Coseno Discreta Inversa (IDCT)
110: Nodo di somma (genera la somma dei segnali emessi dall'IDCT 108 e dal Mux 118)
112: Filtro di anello
114: Buffer (Memoria di frame)
116: Compensazione del moto
118: Mux (per selezionare tra predizione intra ed inter predizione)
120: Codifica a Lunghezza Variabile (VLC) – Codifica Entropica
122: Bitrate variabile (VB)
124: Controllo del passo di quantizzazione in funzione del Bitrate Variabile
126: Codifica a blocchi per produrre un flusso di bit (codifica del flusso di bit) di uscita codificato (per esempio codificato H.264)
In varie forme di attuazione, il decodificatore della Figura 2 può comprendere i seguenti moduli/fasi di elaborazione:
200: Decodifica a blocchi del flusso di bit codificato (per esempio codificato H.264)
202: Bitrate Variabile (VB)
204: Decodifica a lunghezza variabile (VLD)
205: Run Length Coding inversa (IRLC)
206: Quantizzazione inversa
208: Controllo del passo di quantizzazione inversa in funzione del bitrate variabile
210: Trasformata Coseno Discreta Inversa (IDCT)
212: Nodo di somma (genera la somma di segnali emessi dall’IDCT 210 ed emessi dal Mux 220 per produrre Dati Decodificati)
214: Filtro di anello
216: Buffer (Memoria di frame)
218: Compensazione del moto
220: Mux (per selezionare tra predizione intra ed inter sulla base di informazioni ricavate dal flusso di bit codificato).
Le soluzioni esemplificate nelle Figure 1 e 2 sono peraltro convenzionali nella tecnica, il che rende superfluo fornire qui una descrizione più dettagliata. Queste soluzioni possono essere configurate per funzionare su immagini organizzate in blocchi ad esempio blocchi comprendenti per esempio pixel 4×4 o 16×16.
Gli inventori hanno notato che la compressione per immagini stereo può essere conseguita traendo vantaggio da ridondanze nei dati sorgente, per esempio ridondanze spaziali e temporali relative ad immagini e video monoculari. La soluzione più semplice per comprimere i due canali consiste nell’utilizzare una codifica indipendente per ciascuna immagine/video con standard di compressione esistenti (Codifica Multicast H.264).
Gli inventori hanno notato che una sequenza video stereoscopica contiene una grande quantità di dipendenze statistiche inter-vista, poiché le due camere catturano la stessa scena da due diversi punti di vista. Quindi, una predizione temporale ed inter-vista combinata può essere una chiave per un’efficace codifica stereoscopica. Un frame di una data camera può essere predetto non solo da frame temporalmente correlati dalla stessa camera, ma anche da frame di una qualsiasi camera vicina. Queste interdipendenze possono essere utilizzate per un’efficace predizione (Codifica Multi Video o MVC).
Un’architettura di codifica esemplificativa per un video stereoscopico può essere così come rappresentata nelle Figure da 3 a 5.
Specificatamente, le Figure 3 e 4 mostrano che, nell’ambito della struttura di un generico schema “simulcast†H.264 così come illustrato nella Figura 3, esiste la possibilità di utilizzare una stessa immagine codificata-I di una delle due sequenze - per esempio la sequenza sinistra per scopi di predizione (immagini codificate-P) anche per l’altra sequenza – per esempio la sequenza destra. La Figura 5 à ̈ un modo di visualizzare una sequenza stereo esemplificativa creata secondo le Figure 3 e 4.
A titolo di ulteriore riferimento, la Figura 6 à ̈ rappresentativa di uno schema di codifica di immagine stereo “diretto†basato sul concetto di duplicare semplicemente lo schema di codifica di base della Figura 1 - distintamente – rispettivamente per le sequenze sinistra e destra, L e R, per produrre corrispondenti sequenze codificate “sinistra†e “destra†(per esempio H.264).
Gli stessi riferimenti numerici che appaiono nella Figura 1 sono stati riprodotti nella Figura 6 per indicare elementi, parti o componenti identici o equivalenti nelle due figure: quindi, una descrizione dettagliata di questi elementi, parti o componenti non verrà qui ripetuta.
La Figura 7 esemplifica la possibilità di implementare una Codifica Multi Video o schema MVC di esempio lasciando che i due codificatori distinti della Figura 6 condividano qualche tipo di informazione di predizione, facendo sì di conseguenza che i dati in arrivo da una delle sequenze (per esempio la sequenza sinistra) siano resi disponibili al nodo 118 del codificatore relativo alla seconda sequenza (per esempio la sequenza destra). Specificatamente, l’esempio di forma di attuazione illustrato nella Figura 7 prevede che i dati del buffer 114 nella catena di elaborazione della sequenza sinistra siano resi disponibili al nodo mux 118 nella catena di elaborazione della sequenza destra, mentre un possibile ulteriore valore “Intervisione†viene contemplato per il funzionamento del nodo mux 118.
Si apprezzerà che disposizioni di elaborazione duali rispetto agli schemi di codifica delle figure 6 e 7 possono essere concepite per schemi di decodifica complementari.
Scopo e sintesi
Gli inventori hanno notato che gli schemi di Codifica Multi Video o MVC possono essere ulteriormente migliorati sotto almeno due aspetti:
- ridurre la quantità complessiva di dati trasmessi per convogliare un segnale video con visione stereo; e
- ridurre la presenza di blocchi di moduli/fasi di elaborazione inutilmente ridondanti presenti in entrambe le catene di elaborazione (codifica e decodifica) per le sequenze sinistra e destra.
Uno scopo dell'invenzione consiste nel fornire un tale miglioramento.
Secondo l'invenzione, tale scopo viene conseguito per mezzo di un procedimento avente le caratteristiche richiamate nelle rivendicazioni che seguono.
L'invenzione si riferisce anche ad una corrispondente apparecchiatura (codificatore e decodificatore) e ad un prodotto informatico, caricabile nella memoria di almeno un computer e comprendente porzioni di codice software sucettibili di implementare le fasi del procedimento quando il prodotto viene eseguito su almeno un computer, così come un segnale video codificato secondo l'invenzione.
Le rivendicazioni formano una parte integrante della rivelazione tecnica qui fornita in relazione all'invenzione.
L'idea alla base di certe forme di attuazione consiste nel fondere (merge) completamente il flusso di bit generato codificando la seconda vista (per esempio la vista destra) nel flusso di bit generato codificando la prima vista (per esempio la vista sinistra), senza aggiungere bit supplementari rispetto al flusso di bit della prima vista. Ciò porta a produrre come risultato ciò che sembra sostanzialmente un flusso di bit video codificato a “vistamono†, anche se esso di fatto incorpora una seconda vista. In varie forme di attuazione, il flusso di bit relativo alla seconda vista può essere generato o dalla seconda vista stereoscopica in quanto tale, o da detta vista presentata sotto forma di una “sequenza di mappa di profondità †, vale a dire una sequenza di immagini nella scala dei grigi, con valori tra bianco e nero, che rappresentano la distanza tra gli oggetti mostrati all'interno dei frame e la camera che ha acquisito la scena. In varie forme di attuazione, la seconda vista può essere o codificata mediante predizione dalla prima (predizione inter-vista simile alla MVC) o codificata in modo indipendente (simulcast).
Breve descrizione delle figure
Verranno ora descritte varie forme di attuazione, a puro titolo di esempio, facendo riferimento alle figure allegate, in cui:
- Figure da 1 a 7 sono già state descritte precedentemente; - Figure da 8 a 11 sono rappresentative di varie fasi nelle forme di attuazione;
- Figure 12 e 13 sono rappresentative di forme di attuazione di un codificatore; e
- Figure 14 e 15 sono rappresentative di forme di attuazione di un decodificatore.
Descrizione particolareggiata
Nella seguente descrizione sono illustrati vari dettagli specifici finalizzati ad un’approfondita comprensione delle forme di attuazione. Le forme di attuazione possono essere realizzate senza uno o più dei dettagli specifici, o con altri metodi componenti materiali, etc. In altri casi, strutture, materiali o operazioni noti non sono mostrati o descritti in dettaglio per evitare di rendere oscuri i vari aspetti delle forme di attuazione.
Il riferimento ad “una forma di attuazione†nell’ambito di questa descrizione sta ad indicare che una particolare configurazione, struttura o caratteristica descritta in relazione alla forma di attuazione à ̈ compresa in almeno una forma di attuazione. Quindi, frasi come “in una forma di attuazione†, eventualmente presenti in diversi luoghi di questa descrizione non sono necessariamente riferite alla stessa forma di attuazione. Inoltre, particolari conformazioni, strutture o caratteristiche possono essere combinate in ogni modo adeguato in una o più forme di attuazione.
I riferimenti qui utilizzati sono soltanto per comodità e non definiscono dunque l’ambito di tutela o la portata delle forme di attuazione.
Parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in abbinamento a qualsiasi delle figure da 1 a 7 verranno indicati nelle Figure da 8 a 15 con gli stessi riferimenti già utilizzati nelle Figure da 1 a 7; onde evitare di rendere questa descrizione eccessivamente lunga la corrispondente descrizione non verrà ripetuta.
Inoltre, si apprezzerà che in tutta questa descrizione i ruoli giocati dalle due sequenze in un segnale video stereo (cioà ̈ sinistra e destra) possono essere scambiati: per esempio, mentre gli esempi di forme di attuazione descritte di seguito fanno riferimento alla sequenza “destra†che viene fusa nella sequenza “sinistra†, varie forme di attuazione possono prevedere che la sequenza “sinistra†venga fusa nella sequenza “destra†.
Il diagramma della Figura 8 à ̈ rappresentativo della possibilità di assoggettare una delle sequenze in un segnale video stereo (per esempio la sequenza destra) ad una sequenza di moduli/fasi di codifica per mezzo dei quali la sequenza può essere predetta (100, sulla base del segnale prodotto nei moduli/fasi da 106 a 118), trasformata, quantizzata (moduli/fasi da 102 a 105) e codificata (moduli/fasi da 122 a 126) come al solito, per ottenere una sequenza di bit indicata nel suo complesso come MESSAGGIO, quale per esempio una stringa di bit su 8-bit “01100010†.
Secondo la dimensione di blocco variabile, si può ipotizzare che la lunghezza del messaggio sia o inferiore a 1/128 della dimensione di frame se la dimensione del blocco nel codificatore viene impostata piccola quanto 4×4 o inferiore a 1/2048 se la dimensione del blocco viene impostata grande quanto 16×16. Come rappresentato schematicamente nella Figura 9, l'altra sequenza nel segnale video stereo (per esempio la sequenza sinistra, nell'esempio di attuazione qui considerato) può essere similmente assoggettata ad una sequenza di fasi in cui, in ciascun frame, i blocchi (per esempio 4x4) vengono estratti (fase/modulo 302), trasformati (fase/modulo 102), quantizzati (fase/modulo 104) e codificati utilizzando la run-length coding (fase/modulo 105) ottenendo di conseguenza una sequenza codificata in cui i livelli risultanti dalla quantizzazione, per esempio
…7, 5, 4, 4, 3, 0, 0, 0, 0, …
vengono codificati come entità a due numeri in cui in ciascun blocco il livello non nullo viene preceduto da un valore di “run†, che indica il numero di zeri prima del livello e terminato da un indicatore (flag) di Fine Blocco (EOB), vale a dire:
[07] [05] [04] [04] [03] [EOB]
in cui [03] Ã ̈ rappresentativo dell'ultimo livello (non nullo).
La Figura 10 à ̈ rappresentativa di una forma di attuazione in cui la prima sequenza (qui, la sequenza “destra†) viene fusa nella seconda sequenza (qui, la sequenza “sinistra†) sostituendo ciascun bit meno significativo (LSB) di uno dei livelli (per esempio l'ultimo livello) di ciascun blocco (per esempio 4x4) correlato alla sequenza rappresentativa della sequenza video sinistra con un bit del “messaggio†rappresentativo della sequenza video destra.
Nel caso dell’esempio delle Figure 9 e 10:
- la sequenza di “messaggi†ottenuta per il segnale video a destra à ̈ “01100010†; e
- l'ultimo livello della sequenza rappresentativa della sequenza video sinistra à ̈ “3†, vale a dire “00000011†nella codifica binaria a 8-bit.
Come rappresentato schematicamente nelle Figure 10 e 11, ciascun singolo bit (per esempio l'ultimo bit nella Figura 10, cioà ̈ “0†), della sequenza di “messaggio†ottenuta dal segnale video a destra viene sostituito con il bit meno significativo (LSB) dell'ultimo livello del blocco attuale (per esempio 4x4) correlato alla sequenza rappresentativa del segnale video a destra, producendo di conseguenza “00000010†, vale a dire “2†in forma binaria a 8-bit, invece di “00000011†, vale a dire “3†come era stato originalmente ottenuto dalla codifica della vista a sinistra da sola.
La sequenza così modificata (cioà ̈ con l'ultimo livello modificato da “3†a “2†, cioà ̈ con [02] sostituito con [03]) viene codificata come al solito utilizzando la codifica entropica (VLC) nel modulo/fase 120.
Questa procedura viene ripetuta per ciascun blocco sino a che tutti i bit del messaggio non vengono inseriti nella codifica a sinistra, in modo che i dati relativi al segnale video a destra vengano nascosti nel “rumore†dell'immagine, producendo un segnale codificato, che può sembrare apparentemente come un segnale con “vista-mono†ma che di fatto convoglia l’informazione di un segnale con “vistastereo†. In varie forme di attuazione, il flusso di bit generato codificando la sequenza a destra può essere considerato come il messaggio da unire nel flusso di bit della prima vista o nella sua interezza o solo parzialmente. Nell'ultimo caso, le parti relative alle informazioni legate alla struttura dello stesso flusso di bit (per esempio intestazioni o header, campi dei parametri di sequenza impostati, campi dei parametri di immagine impostati, ecc., cioà ̈ quelle parti che non contengono dati direttamente legati alle immagini) sono le stesse di quelle convogliate dal flusso di bit per l'altra vista (cioà ̈ a sinistra); queste parti possono essere di conseguenza ricavate dal flusso di bit della vista sinistra quando si ricostruisce il flusso di bit della vista destra come descritto di seguito.
Le Figure 12 e 13 sono una rappresentazione schematica di codificatori che funzionano secondo i criteri esemplificativi di “fusione†descritti precedentemente (cioà ̈ la Figura 12 rappresenta un approccio simulcast, mentre la Figura 13 mostra una predizione inter-vista (simile alla MVC) della vista destra da quella sinistra). Ancora una volta, parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in unione a qualsiasi delle precedenti figure vengono indicati nelle Figure 12 e 13 con gli stessi riferimenti già utilizzati per le precedenti figure; la corrispondente descrizione non verrà ripetuta.
Tramite confronto diretto con la Figura 7, si apprezzerà inoltre che nei diagrammi delle Figure 12 e 13 la soluzione di elaborazione per la sequenza video sinistra à ̈ sostanzialmente la stessa, mentre la soluzione di elaborazione per la sequenza video destra può essere semplificata.
In effetti, la generazione del segnale del messaggio per il segnale video a destra da fondere (per esempio al livello del codificatore run-length 105 della sequenza a sinistra) nella sequenza video sinistra può fare a meno di moduli/fasi di elaborazione separati a valle della codifica entropica (VLC), vale a dire dei moduli/fasi 122 e 126, e anche del modulo/fase di controllo del passo di quantizzazione 124.
La Figura 14 à ̈ una rappresentazione schematica di un decodificatore configurato per decodificare il segnale “di fusione†prodotto secondo i criteri esemplificativi di “fusione†descritti in precedenza in relazione alle Figure da 8 a 13.
Ancora una volta, parti, elementi o funzioni identiche o equivalenti a parti, elementi o funzioni già descritte in abbinamento a qualsiasi delle precedenti figure (per esempio la Figura 2) vengono indicati nella Figura 14 con gli stessi riferimenti già utilizzati nelle precedenti figure e la corrispondente descrizione non viene ripetuta. Nella disposizione esemplificativa di decodificatore della Figura 14, il segnale video a sinistra viene ricuperato (come nel caso della disposizione della Figura 2) all'uscita del sommatore 212.
Nella disposizione esemplificativa del decodificatore della Figura 14, Ã ̈ previsto un modulo/fase di estrazione 304 localizzato a valle del modulo/fase 204 dove viene eseguita la Decodifica a Lunghezza Variabile (VLD) ottenendo la corrispondente sequenza codificata.
Nel modulo/fase 304, il bit meno significativo di ciascun ultimo livello della sequenza viene identificato e raccolto per ricostruire il messaggio rappresentativo del segnale video a destra come meglio descritto nel dettaglio di seguito.
La decodifica del segnale video a sinistra procede altrimenti come al solito.
La lunghezza del messaggio rappresentativo per l'immagine video destra sarà in modo atteso inferiore al numero di blocchi di trasformata della vista sinistra (principale); altrimenti al lato del decodificatore si potrebbe verificare un errore mentre si ricostruisce il messaggio. In quel caso, in certe forme di attuazione, al fine di assicurare la compatibilità a ritroso, la fase di fusione può operare a livello di frame, vale a dire fondendo un frame a destra nel corrispondente a sinistra. Quindi, conoscendo la dimensione dell’immagine, il decodificatore può completare l’estrazione quando il frame a sinistra à ̈ completamente costruito.
Il caso in cui la lunghezza del messaggio rappresentativo dell’immagine video destra sia superiore al numero di blocchi di trasformata della vista sinistra (principale) à ̈ assai improbabile.
In certe forme di attuazione, per essere sicuri che la lunghezza sia adeguatamente ridotta, nella vista destra si potrebbe impostare un Bit Rate Costante (CBR).
L’estrazione dei dati per il segnale video a destra fuso nel segnale video a sinistra ha luogo sul segnale estratto in corrispondenza del modulo/fase 304.
Qui, il bit meno significativo di ciascun ultimo livello della sequenza viene identificato e raccolto per ricostruire il messaggio.
In certe forme di attuazione, l’intero flusso di bit corrispondente alla vista codificata destra può essere ottenuto o semplicemente ricostruendo il messaggio dal flusso di bit per la vista sinistra come raffigurato schematicamente nella Figura 15 (cioà ̈ estraendo gli LSB dagli ultimi livelli in ciascun blocco prima della EOB), o fondendo in modo appropriato lo stesso messaggio estratto con alcuni elementi di informazione comuni con il flusso di bit per la vista sinistra (per esempio intestazione, campi dei parametri di sequenza impostati, campi dei parametri di immagine impostati, ecc…) che vengono presi e copiati dal flusso di bit legato alla vista sinistra.
La Decodifica a Lunghezza Variabile (VLD) può essere eseguita sul messaggio ricostruito dalla vista sinistra e la decodifica continua come al solito.
Si apprezzerà che certe forme di attuazione possono permettere di conseguire i seguenti vantaggi:
- la quantità di dati codificati trasmessa per un segnale video con vista stereo à ̈ sostanzialmente la stessa rispetto ad un segnale codificato con vista mono, vale a dire metà dei corrispondenti dati trasmessi utilizzando per esempio la modalità multicast H.264, e – in qualsiasi caso meno dei corrispondenti dati trasmessi quando si usa la MVC;
- un effettivo cambiamento nella codifica risultante per il canale “principale†(negli esempi qui considerati, la vista a sinistra in cui viene fusa la vista destra) interviene statisticamente solo nel 50% dei casi, ed un cambiamento nel LSB dell’ultimo livello della sequenza ottenuta dopo la codifica Run-Length introduce solo una piccola quantità di rumore nel canale principale, che à ̈ quasi invisibile per la vista;
- il flusso di bit codificato à ̈ conforme al decoder 2D.
Fermo restando il principio dell'invenzione, i particolari di realizzazione e le forme di attuazione potranno variare, anche in modo significativo, rispetto a quanto qui illustrato a puro titolo di esempio non limitativo, senza per questo uscire dall'ambito dell'invenzione così come definito dalle rivendicazioni annesse. Specificatamente, si apprezzerà che, pur se fornita a titolo di esempio in relazione al caso della codifica H.264, la presente descrizione non à ̈ limitata alla codifica H.264 ma à ̈ generalmente applicabile a qualsiasi segnale video digitale comprendente una prima sequenza video ed una seconda sequenza video formanti congiuntamente un segnale video digitale con vista stereo, ed in cui la prima sequenza video viene assoggettata a trasformata coseno discreta, quantizzazione e run-length coding per produrre una sequenza di blocchi di livelli digitali non nulli rappresentativi della prima sequenza video, mentre la seconda sequenza video viene assoggettata a trasformata coseno discreta, quantizzazione, run-length coding e codifica a lunghezza variabile per produrre messaggi digitali rappresentativi della seconda sequenza video.
L’applicazione della descrizione può essere rilevata anche l livello del risultante segnale video digitale codificato confrontando tale segnale, che à ̈ rappresentativo di una prima sequenza video e di una seconda sequenza video formanti congiuntamente un segnale video digitale con vista stereo, con un segnale di test prodotto basandosi sulla presente descrizione partendo dalle stesse sequenze video. Il segnale codificato comprenderà una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video quando assoggettata a trasformata coseno discreta, quantizzazione e run-length coding, in cui i bit meno significativi di uno dei livelli digitali nei blocchi rappresentativi della prima sequenza video hanno in sostituzione i bit di messaggi digitali rappresentativi della seconda sequenza video quando assoggettata a trasformata coseno discreta, quantizzazione, run-length coding e codifica a lunghezza variabile, per cui i bit dei messaggi digitali sono fusi nella sequenza di blocchi di livelli digitali.
Claims (11)
- RIVENDICAZIONI 1. Procedimento di codifica di un segnale video digitale comprendente una prima sequenza video (L) ed una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il procedimento comprendendo: - assoggettare detta prima sequenza video (L) a trasformata coseno discreta (102), quantizzazione (104) e run-length coding (105) per produrre una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L), - assoggettare detta seconda sequenza video (R) a trasformata coseno discreta (102), quantizzazione (104), run-length coding (105) e codifica a lunghezza variabile (120) per produrre messaggi digitali rappresentativi di detta seconda sequenza video (R), - fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo i bit di detti messaggi digitali al posto di rispettivi bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) per produrre un segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
- 2. Procedimento secondo la rivendicazione 1, comprendente fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo ciascun bit di detti messaggi digitali con il bit meno significativo dell’ultimo livello digitale di detti blocchi rappresentativi di detta prima sequenza video (L).
- 3. Procedimento secondo la rivendicazione 1 o rivendicazione 2, comprendente assoggettare a codifica a lunghezza variabile (120) detto segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
- 4. Procedimento secondo qualsiasi della rivendicazioni precedenti, in cui detta prima sequenza video (L) e detta seconda sequenza video (R) sono organizzate in blocchi di immagine, preferibilmente blocchi di immagine 4x4 o 16x16.
- 5. Procedimento secondo la rivendicazione 4, comprendente controllare la lunghezza di detti messaggi digitali, preferibilmente forzando un bit rate costante in detta seconda sequenza video (R), assicurando che detta lunghezza non sia superiore al numero di blocchi di trasformata per detta prima sequenza video (L).
- 6. Procedimento secondo qualsiasi delle rivendicazioni precedenti, in cui la quantizzazione (104) di detta prima sequenza video (L) e quantizzazione (104) di detta seconda sequenza video (R) sono controllabili rispettivamente con passo di quantizzazione variabile e passo di quantizzazione fisso (122, 124).
- 7. Codificatore per codificare con il procedimento secondo qualsiasi delle rivendicazioni da 1 a 5 un segnale video digitale comprendente una prima sequenza video (L) ed una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il codificatore comprendendo: - un trasformatore coseno discreto (102), un quantizzatore (104) ed un codificatore run-length (105) per assoggettare detta prima sequenza video (L) a trasformata coseno discreta, quantizzazione (104) e run-length coding per produrre detta sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L), - un trasformatore coseno discreto (102), un quantizzatore (104), un codificatore run-length (105) ed un codificatore a lunghezza variabile (120) per assoggettare detta seconda sequenza video (R) a trasformata coseno discreta, quantizzazione, run-length coding (105) e codifica a lunghezza variabile per produrre detti messaggi digitali rappresentativi di detta seconda sequenza video (R), - un dispositivo di fusione (merger) (105) per fondere i bit di detti messaggi digitali in detta sequenza di blocchi di livelli digitali sostituendo i bit di detti messaggi digitali al posto di rispettivi bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) per produrre un segnale video digitale codificato rappresentativo di dette prima sequenza video (L) e seconda sequenza video (R).
- 8. Decodificatore per decodificare un segnale video digitale codificato con il procedimento secondo qualsiasi delle rivendicazioni da 1 a 5, detto segnale video digitale codificato essendo rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il decodificatore comprendendo un estrattore (304) per rimuovere i bit di detti messaggi digitali rappresentativi di detta seconda sequenza video (R) dai bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L).
- 9. Decodificatore secondo la rivendicazione 8, comprendente un decodificatore a lunghezza variabile (204) disposto a monte di detto estrattore (304) per assoggettare a codifica a lunghezza variabile inversa detto segnale video digitale codificato rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R).
- 10. Prodotto informatico caricabile nella memoria di almeno un computer e comprendente porzioni di codice software per eseguire le fasi del procedimento secondo qualsiasi delle rivendicazioni da 1 a 5.
- 11. Segnale video digitale codificato rappresentativo di una prima sequenza video (L) e di una seconda sequenza video (R) formanti congiuntamente un segnale video digitale con vista stereo, il segnale codificato comprendendo una sequenza di blocchi di livelli digitali non nulli rappresentativi di detta prima sequenza video (L) quando assoggettata a trasformata coseno discreta (102), quantizzazione (104) e run-length coding (105), in cui i bit meno significativi di uno dei livelli digitali in detti blocchi rappresentativi di detta prima sequenza video (L) hanno sostituiti al loro posto i bit di messaggi digitali rappresentativi di detta seconda sequenza video (R) quando assoggettata a trasformata coseno discreta (102), quantizzazione (104), run-length coding (105) e codifica a lunghezza variabile (120), per cui i bit di detti messaggi digitali sono fusi in detta sequenza di blocchi di livelli digitali.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000414A ITTO20110414A1 (it) | 2011-05-11 | 2011-05-11 | Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi |
US13/469,873 US20120287237A1 (en) | 2011-05-11 | 2012-05-11 | Method and apparatus for processing video signals, related computer program product, and encoded signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000414A ITTO20110414A1 (it) | 2011-05-11 | 2011-05-11 | Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi |
Publications (1)
Publication Number | Publication Date |
---|---|
ITTO20110414A1 true ITTO20110414A1 (it) | 2012-11-12 |
Family
ID=44554545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT000414A ITTO20110414A1 (it) | 2011-05-11 | 2011-05-11 | Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120287237A1 (it) |
IT (1) | ITTO20110414A1 (it) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122020024986B1 (pt) | 2011-06-16 | 2022-02-22 | Ge Video Compression, Llc | Codificação de entropia das diferenças do vetor de movimento |
US10229250B2 (en) * | 2015-02-16 | 2019-03-12 | Arebus, LLC | System, method and application for transcoding data into media files |
US12375459B2 (en) | 2015-02-16 | 2025-07-29 | Arebus Llc | Systems, methods, and applications for transcoding data into media files |
US11582202B2 (en) | 2015-02-16 | 2023-02-14 | Arebus, LLC | System, method and application for transcoding data into media files |
WO2018180579A1 (ja) * | 2017-03-31 | 2018-10-04 | ソニーセミコンダクタソリューションズ株式会社 | 撮像制御装置、および撮像制御装置の制御方法、並びに移動体 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9022326D0 (en) * | 1990-10-15 | 1990-11-28 | British Telecomm | Signal coding |
KR0134177B1 (ko) * | 1992-03-24 | 1998-04-22 | Toshiba Kk | 가변장 부호의 기록 재생 장치 |
US5652616A (en) * | 1996-08-06 | 1997-07-29 | General Instrument Corporation Of Delaware | Optimal disparity estimation for stereoscopic video coding |
JP2001502504A (ja) * | 1996-10-11 | 2001-02-20 | サーノフ コーポレイション | 立体視ビデオを符号化及び複号する装置及び方法 |
CN101248453B (zh) * | 2005-07-04 | 2011-11-16 | 联邦科学和工业研究组织 | 对图像加水印以及对加水印的图像解码的方法和装置 |
US8503568B1 (en) * | 2006-09-07 | 2013-08-06 | The Boeing Company | Differential encoding for multiplexed data streams |
MY162861A (en) * | 2007-09-24 | 2017-07-31 | Koninl Philips Electronics Nv | Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal |
US20120027091A1 (en) * | 2010-07-28 | 2012-02-02 | Wei-Lien Hsu | Method and System for Encoding Video Frames Using a Plurality of Processors |
-
2011
- 2011-05-11 IT IT000414A patent/ITTO20110414A1/it unknown
-
2012
- 2012-05-11 US US13/469,873 patent/US20120287237A1/en not_active Abandoned
Non-Patent Citations (7)
Title |
---|
CELIK M U ET AL: "Lossless Generalized-LSB Data Embedding", IEEE TRANSACTIONS ON IMAGE PROCESSING, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 14, no. 2, 1 February 2005 (2005-02-01), pages 253 - 266, XP011124986, ISSN: 1057-7149, DOI: 10.1109/TIP.2004.840686 * |
CHANG C-C ET AL: "A STEGANOGRAPHIC METHOD BASED UPON JPEG AND QUANTIZATION TABLE MODIFICATION", INFORMATION SCIENCES, AMSTERDAM, NL, vol. 141, 1 January 2002 (2002-01-01), pages 123 - 138, XP001091528, ISSN: 0020-0255, DOI: 10.1016/S0020-0255(01)00194-3 * |
COLTUC D ET AL: "Stereo embedding by reversible watermarking: Further results", PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON SIGNALS, CIRCUITS AND SYSTEMS, 2009 (ISSCS 2009), IASI, ROMANIA, 9-10 JULY 2009, 9 July 2009 (2009-07-09), IEEE, PISCATAWAY, NJ, USA, pages 1 - 4, XP031513910, ISBN: 978-1-4244-3785-6 * |
DINU COLTUC ET AL: "Color stereo embedding by reversible watermarking", PROCEEDINGS OF THE 3RD INTERNATIONAL SYMPOSIUM ON ELECTRICAL AND ELECTRONICS ENGINEERING (ISEEE), 2010, GALATI, ROMANIA, 16-18 SEPTEMBER 2010, 16 September 2010 (2010-09-16), IEEE, PISCATAWAY, NJ, USA, pages 256 - 259, XP031795432, ISBN: 978-1-4244-8406-5 * |
DINU COLTUC: "On Stereo Embedding by Reversible Watermarking", PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON SIGNALS, CIRCUITS AND SYSTEMS, 2007. ISSCS 2007, IASI, ROMANIA, 12-13 JULY 2007, 12 July 2007 (2007-07-12), IEEE, Piscataway, NJ, USA, pages 1 - 4, XP031128629, ISBN: 978-1-4244-0968-6 * |
KHAN A ET AL: "Hiding depth map of an object in its 2D image: Reversible watermarking for 3D cameras", DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 2009 (ICCE '09), LAS VEGAS, NV, USA, 10-14 JANUARY 2009, 10 January 2009 (2009-01-10), IEEE, PISCATAWAY, NJ, USA, pages 1 - 2, XP031466966, ISBN: 978-1-4244-4701-5 * |
NEIL F JOHNSON ET AL: "Exploring steganography: Seeing the unseen", COMPUTER, IEEE SERVICE CENTER, LOS ALAMITOS, CA, US, vol. 31, no. 2, 1 February 1998 (1998-02-01), pages 26 - 34, XP011236628, ISSN: 0018-9162, DOI: 10.1109/MC.1998.4655281 * |
Also Published As
Publication number | Publication date |
---|---|
US20120287237A1 (en) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2893011C (en) | Method and apparatus for efficient coding of depth lookup table | |
CN102308585B (zh) | 多视点视频编码/解码方法和设备 | |
US9942550B2 (en) | Image encoding device, image encoding method and program, image decoding device, and image decoding method and program | |
KR102848783B1 (ko) | 인트라 프레임 스킵 모드 정보의 부호화 방법 및 장치, 복호화 방법 및 장치 | |
EP3399746B1 (en) | Decoder and encoder for coding of a video sequence | |
US9143797B2 (en) | Lossy data compression with conditional reconstruction refinement | |
CN102308583B (zh) | 对多视角图像进行编码和解码的设备和方法 | |
EP2816805A1 (en) | Lossy data compression with conditional reconstruction reinfinement | |
KR20120118779A (ko) | 전처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 부호화 방법 및 그 장치, 후처리 필터링을 수반한 계층 간 예측을 수행하는 비디오 복호화 방법 및 그 장치 | |
ITTO20110414A1 (it) | Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi | |
JP7291753B2 (ja) | メディアファイルのためのブランド | |
JP7431827B2 (ja) | 画像デコーディング方法、デコーダ及びコンピューター記憶媒体 | |
TW201505424A (zh) | 將影像序列的可調串流表示解碼之方法及裝置與對應之編碼方法及裝置 | |
KR102284107B1 (ko) | 영상을 부호화/복호화하기 위한 파라미터 세트 생성 방법 및 장치 | |
JP2023508665A (ja) | ビデオコーディングにおける復号パラメータセット | |
WO2014050057A1 (en) | Systems and methods for reference picture set extension | |
TR201002451A2 (tr) | Süper çözünürlük tabanlı N-bakışlı + N-derinlikli çok bakışlı video kodlama. | |
Adikari et al. | A H. 264 compliant stereoscopic video codec | |
JP2011244025A (ja) | 画像処理装置および画像処理方法 | |
KR20140127400A (ko) | 비디오 부호화 및 복호화 방법, 그를 이용한 장치 | |
KR20120084628A (ko) | 다시점 영상 부호화/복호화 장치 및 방법 | |
WO2024037574A1 (en) | System and method for end-to-end lossless stereo image compression | |
KR20110118744A (ko) | 쓰리디 티브이 동영상 부호화 방법, 복호화 방법 | |
WO2025212408A1 (en) | Extension mechanisms for jpeg ai sub-streams | |
WO2025193684A1 (en) | Carriage of sub-streams in a jpeg ai codestream |