ITVI20100175A1

ITVI20100175A1 - Sistema per la codifica entropica di video h.264 per applicazioni hdtv in tempo reale

Info

Publication number: ITVI20100175A1
Application number: IT000175A
Authority: IT
Inventors: Daniele Alfonso; Sumit Johar; Ravin Sachdeva
Original assignee: St Microelectronics Pvt Ltd; St Microelectronics Srl
Priority date: 2010-06-21
Filing date: 2010-06-21
Publication date: 2011-12-22
Also published as: US20110310958A1; US9001882B2

Description

DESCRIZIONE

del Brevetto per Invenzione Industriale avente titolo â€œSISTEMA PER LA CODIFICA ENTROPICA DI VIDEO H.264 PER APPLICAZIONI HDTV IN TEMPO REALEâ€

La presente invenzione riguarda un decoder per la decodifica entropica di video H.264 per applicazioni HDTV in tempo reale, in particolare a unâ€™implementazione hardware ottimizzata del decoder CABAC.

CAMPO TECNICO DELLA PRESENTE INVENZIONE

La codifica entropica gioca un ruolo chiave in teoria deHâ€™informazione. Per definizione, lâ€™entropia H(X) Ã ̈ il tasso (rate) minimo a cui una sorgente discreta X con alfabeto {xl , x2, ... , xN) puÃ² essere codificata senza perdite. Lâ€™obiettivo della codifica entropica Ã ̈ quindi di definire un codice C che permetta la codifica dellâ€™alfabeto sorgente approssimativamente al tasso entropico. In linea di principio, questo Ã ̈ possibile usando codici a lunghezza variabile (Variable Lenght Codes, VLC), come il famoso codice Huffmann. Unâ€™importante limitazione dei codici VLC Ã ̈ il prerequisito di allocazione di bit interi, che significa che ogni simbolo Ã ̈ codificato con un numero intero di bit.

Questa limitazione Ã ̈ superata dalla codifica aritmetica, un tipo di codifica entropica che assegna un codice a un messaggio nella sua totalitÃ , piuttosto che a simboli sorgente, cosÃ¬ che ogni simbolo del messaggio Ã ̈ effettivamente codificato con un numero frazionario di bit, raggiungendo cosÃ¬ un tasso finale che e piÃ¹ vicino allâ€™entropia.

La Codifica Aritmetica Adattiva Binaria basata sul Contesto (Context-Based Adaptive Binary Arithmetic Coding, CABAC) Ã ̈ uno dei due metodi di codifica entropica dello standard ITU-T/ISO/IEC per codifica video H.264/AVC (cf. ITU-T and ISO/IEC JTC 1 , â€œAdvanced Video Coding for Generic Audio-Visual Servicesâ€ , ITU-T Ree. H.264 e ISO/IEC 14496- 10 (MPEG-4 AVC), Versione 11 , Marzo 2009). Il metodo CABAC utilizza un meccanismo di adattamento a ritroso sensibile al contesto per calcolare le probabilitÃ dei simboli in entrata. La modellizzazione del contesto Ã ̈ applicata a una sequenza binaria degli elementi sintattici dei dati video, come tipi di blocco, vettori di movimento e coefficienti quantizzati, binarizzati usando meccanismi predefiniti. Ogni bit Ã ̈ quindi codificato con modelli di probabilitÃ adattativa o fissa. Valori di contesto sono usati per adattare in modo adeguato i modelli di probabilitÃ .

Figura 1 Ã ̈ un diagramma a blocchi di un decoder H.264 convenzionale e mostra la composizione di un decoder CABAC allâ€™interno del decoder H.264.

II flusso di bit in entrata Ã ̈ ricevuto dal decoder entropico 110 allo scopo di decodificare informazione di intestazione, vettori di movimento (motion vectors), e coefficienti di trasformazione. I coefficienti di trasformazione sono riordinati (blocco 120), e sottoposti a processi di quantizzazione inversa e di trasformata inversa nei blocchi 130 e 135. Il risultato Ã ̈ il segnale di previsione di errore, cui o un segnale di predizione inter (inter-prediction signal) o un segnale di previsione intra (intra-prediction signal) Ã ̈ sommato per mezzo del sommatore 140. Il segnale di interprediction Ã ̈ ottenuto dal blocco di compensazione di movimento 150 sulla base dellâ€™informazione di vettore di movimento e dei frame di riferimento memorizzati nel blocco 160. Il segnale intra-prediction Ã ̈ calcolato dal blocco intraprediction 170. Il segnale di uscita del sommatore 140 Ã ̈ quindi fornito attraverso il filtro di de-blocking 180 allo scopo di ottenere un frame ricostruito 190.

Figura 2 Ã ̈ un diagramma a blocchi dettagliato del decoder CABAC che Ã ̈ parte del decoder entropico 110 in fig. 1 e esegue le tre elaborazioni essenziali seguenti, cioÃ ̈ modellizzazione del contesto, decodifica binaria aritmetica, e de-binarizzazione.

La modellizazione del contesto Ã ̈ eseguita dal blocco di modelizzazione del contesto 220, che definisce quale elemento di sintassi deve essere decodificato ora e trova lâ€™indice del contesto che deve essere usato per la decodifica bin corrente, basato su informazione contigua e altri parametri.

La decodifica aritmetica binaria Ã ̈ eseguita dal motore regolare di decodifica (regular decoding engine) 230, che riceve i bit in entrata, per esempio per mezzo di una memoria ad accesso diretto (DMA), ed elabora questi in tre sotto-fasi per produrre una stringa bin di uscita, cioÃ ̈ una sequenza di cifre binarie. Le tre sotto-fasi sono (i) allineamento buffer & ricerca del contesto (ii) decodifica e rinormalizzazione, e (iii) stato successivo e aggiornamento del contesto. I bin che sono codificati senza lâ€™uso di un modello esplicitamente assegnato sono decodificati dal motore bypass di decodifica (bypass decoding engine) 240. La scelta fra i due motori di decodifica Ã ̈ eseguita dallâ€™unitÃ di switch 210.

La debinarizzazione, cioÃ ̈ la fase di binarizzazione inversa Ã ̈ eseguita dal blocco di debinarizzazione 260, che converte stringhe bin in elementi di sintassi a valori non binari. Elementi di sintassi a valori binari sono bypassati per mezzo dellâ€™unitÃ di switch 250.

CABAC fornisce una compressione incondizionata approssimativamente del 19% indipendentemente dal flusso in entrata. Comunque la complessitÃ del processo di codifica di CABAC Ã ̈ di gran lunga maggiore che gli schemi di codifica entropica guidati da tabelle come la codifica Huffman. CABAC Ã ̈ anche bit seriale e la sua parallelizazione multi-bit Ã ̈ estremamente difficile. Di conseguenza, CABAC occupa una gran parte del tempo totale necessario per la decodifica H.264.

Molti processi di decodifica, eccetto CABAC, possono essere parallelizzati/concatenati(pipelined). CABAC diventa quindi il collo di bottiglia quando la decodifica HDTV H.264 Ã ̈ richiesta si sistemi incorporati (embedded).

La maggio parte delle implementazioni della decodifica CABAC sono eseguite in parte in hardware e in parte in firmware, che non Ã ̈ sufficiente per la decodifica di video HDTV in tempo reale su sistemi embedded. Quindi, câ€™Ã ̈ il bisogno di un co-processore dedicato e indipendente che, quando un segnale di iniziazione viene inviato, puÃ² fornire in uscita un macroblocco CABAC decodificato (togliendo quindi il carico dallâ€™host) ad una FIFO dedicata da cui i dati di macroblocco possono essere presi dallâ€™host o dal decoder video per la decodifica dei pixel finchÃ© la fine di una immagine/slice Ã ̈ raggiunta.

Una implementazione hardware del processo di decodifica CABAC Ã ̈, per esempio, nota dallâ€™articolo di Chang Yuan-Teng (â€œA Novel Pipeline Architecture for H.264/AVC CABAC Decoderâ€ , IEEE Asia Pacific Conference on Circuits and Systems, 2008) dellâ€™articolo di Y. Yi and I.-C. Park ("High-Speed H.264/AVC CABAC Decoding,â€ IEEE Transactions on Circuits and Systems for Video Technology, voi. 17, no. 4, pp. 490-494, 2007). Questi approcci convenzionali sono basati sulla possibilitÃ di concatenare il processo di decodifica CABAC in tre fasi di pipeline. CiÃ² ha lo svantaggio di necessitare un percorso a ritroso nelle fasi di pipeline dovuto allâ€™aggiornamento della memoria di contesto, portando a stalli non necessari. Sebbene gli autori ottengono una prestazione reai time, questa prestazione Ã ̈ strettamente limitata al flusso video in entrata. Un input avente molti accessi continui a una singola locazione della memoria di contesto soffrirebbe di stalli multipli, risultando in un calo di prestazioni.

Un acceleratore hardware per decodifica CABAC Ã ̈ anche noto da un articolo di Jian-Wen Chen, Cheng-Ru Chang, e Youn-Long Lin, â€œA Hardware Accelerator for Context-Based Adaptive Binary Arithmetic Decoding in H.264/AVCâ€ in Proc. IEEE ISCAS, May 2005, voi. 5, pp. 4525-4528, dove la decodifica Ã ̈ controllata da un automa ottimizzato a stati finiti (optimized finite state machine). Questâ€™acceleratore, comunque Ã ̈ in grado di processare in tempo reale solo una risoluzione video massima di 352x288 e quindi Ã ̈ non adatto per applicazioni HDTV. Inoltre, il decoder aritmetico binario (Binary Arithmetic Decoder, BAD), il blocco responsabile della lettura del flusso di bit compressi e della gestione della decodifica aritmetica e dei processi di rinormalizzazione, Ã ̈ parte del blocco di decodifica dellâ€™elemento sintattico, che non Ã ̈ la piÃ¹ efficiente implementazione del blocco BAD. Infine, Î“ acceleratore convenzionale usa due memorie separate per memorizzare i coefficienti IDCT in una maniera a ping-pong, implicando quindi lâ€™uso del pipelining nella progettazione che ha i suoi costi aggiuntivi. Inoltre, nel fornire accesso host diretto alle sue memorie di coefficiente, Î“ acceleratore convenzionale CABAC deve gestire una un alto volume di comunicazione e una frequente comunicazione inter-blocchi.

Unâ€™architettura per la decodifica CABAC basata sulla pipeline Ã ̈ nota anche da un articolo di Junhao Zheng, David Wu, Don Xie e Wen Gao, â€œA Novel Pipeline Design for H.264 CABAC Decodingâ€ in Advances in Multimedia Information Processing - PCM 2007, voi. 4810/2007, pp.

559-568, dove Ã ̈ sviluppato un efficiente automa a stati finiti per allinearsi ai requisiti di controllo della pipeline, e il percorso critico Ã ̈ ottimizzato per il timing. Questâ€™approccio, comunque, Ã ̈ solo in grado di decodificare lâ€™informazione di coefficiente. Estendere questâ€™approccio a una decodifica di tutti gli elementi sintattici mantenendo lâ€™elaborazione richiesta di 1 bin/ciclo non Ã ̈ possibile per certe ragioni tecniche.

Prima di tutto, lâ€™approccio di Zheng et al. usa un â€œBanco di Registro di Contestoâ€ (Context Register Bank) per memorizzare i contesti riguardanti la decodifica dei coefficienti, e questo banco di registro Ã ̈ presente dentro Î“Î™Î¡ e usa un tipo di pre-fetching di contesti dalla memoria di contesto principale, che Ã ̈ situata fuori dallâ€™IP. I contesti di coefficiente sono solo una frazione del numero totale di contesti supportati dallo standard H.264, e quindi il banco di registro Ã ̈ molto piÃ¹ piccolo in area che la memoria di contesto principale. Allo scopo di decodificare tutti gli elementi di sintassi CABAC, i cicli devono essere presi in considerazione, cioÃ ̈, in primo luogo eseguire un fetch di una porzione (chunk) di contesti richiesti dalla memoria principale al banco di registro di contesto e, in secondo luogo i cicli dovevano riscrivere i contesti aggiornati nella memoria principale. Quindi, ogni volta câ€™Ã ̈ un cambio di contesto. Considerando questo tempo di attesa per il ciclo dovuto al cambio di contesto, il mantenimento di 1 bin/ciclo non Ã ̈ possibile, nemmeno con il pipelining.

In secondo luogo, lâ€™approccio di Zheng et al. non tiene in considerazione il posizionamento della memoria di macroblocco contigua (neighbor macroblock memory) e le tabelle di stato, che rappresenta un altro fattore significativo che condiziona la velocitÃ di trasferimento (throughput) del modello. In effetti, tutti gli elementi sintattici eccetto i dati di coefficiente richiedono dati di macroblocco contigui per la decodifica. Quindi, lâ€™effetto di accedere la memoria contigua non Ã ̈ stato considerato da Zhen et al.

SOMMARIO DELLâ€™INVENZIONE

Lâ€™oggetto della presente invenzione Ã ̈ di fornire un decoder per la decodifica dellâ€™intestazione e dati di macroblocco richiesti durante la decodifica dei pixel a un tasso di un bin per ciclo di clock. Questo Ã ̈ ottenuto dalle caratteristiche della rivendicazione indipendente. Forme di attuazione preferite sono oggetto delle rivendicazioni dipendenti.

Il particolare approccio della presente invenzione Ã ̈ controllare un blocco di decodifica aritmetica binaria per mezzo di una pluralitÃ di automi a stati finiti (Finite State Machines FSMs), ognuno dei quali Ã ̈ atto a decodificare uno particolare degli elementi sintattici definiti nello standard. In questo modo, si ottiene una divisione efficiente del processo di debinarizzazione e una unione (clubbing) ottimale della decodifica degli elementi sintattici per formare dati di macroblocco.

Secondo un primo aspetto della presente invenzione, Ã ̈ fornito un decoder per la decodifica di un flusso di bit con una pluralitÃ di elementi sintattici codificati CABAC. Il decoder comprende una memoria di contesto per memorizzare una pluralitÃ di valori di contesto, un blocco di decodifica aritmetica binaria per la conversione dei bit di un elemento sintattico corrente in una stringa bin sulla base dei valori di contesto memorizzati, e una pluralitÃ di automi a stati finiti, ognuno degli automi a stati finiti atto a decodificare un elemento sintattico distinto di una pluralitÃ di elementi sintattici predefiniti, per fornire al blocco di decodifica aritmetica binaria un indice di contesto indicante un valore di contesto della pluralitÃ di valori di contesto memorizzati richiesto per decodificare un bin corrente deHâ€™elemento sintattico corrente, e per convertire la stringa bin in un valore deHâ€™elemento sintattico corrente.

Il blocco di decodifica aritmetica binaria Ã ̈ preferibilmente atto a ricercare il valore di contesto indicato dallâ€™indice di contesto entro la memoria di contesto, per decodificare il bin corrente dello specifico elemento sintattico in conformitÃ con detto valore di contesto, e per rinormalizzare e aggiornare detto valore di contesto. In questo modo, una prestazione di un bin per ciclo puÃ² essere ottenuta, riducendo quindi costi e complessitÃ dellâ€™intero design.

Inoltre, la pluralitÃ di automi agli stati finiti Ã ̈ preferibilmente configurata cosi da eseguirli uno dopo lâ€™altro in una sequenza particolare. In una forma di attuazione preferita, detta sequenza particolare Ã ̈ la sequenza di elementi sintattici nellâ€™ informazione di macroblocco come definita nello standard H.264. In questo modo, il processo di debinarizzazione Ã ̈ diviso efficientemente in sotto-compiti che possono essere implementati in modo altamente efficiente per mezzo di una corrispondente pluralitÃ di automi a stati finiti.

Il decoder potrebbe anche comprendere una memoria contigua (neighbor memory) per memorizzare informazioni su macroblocchi contigui, dove almeno uno della pluralitÃ di automi a stati finiti Ã ̈ atto a selezionare lâ€™indice di contesto sulla base dellâ€™informazione memorizzata nella memoria contigua. Il contenuto della memoria contigua puÃ² quindi, essere precaricato (pre-fetched) una volta per ciascun macroblocco allo scopo di ridurre il numero di accessi a questa memoria.

Inoltre il decoder potrebbe comprendere un blocco di packaging per impacchettare i valori di dati degli elementi sintattici di un macroblocco corrente in un formato predefinito e per memorizzare lo stesso in un buffer di memoria. Secondo una forma di attuazione preferita, il buffer di memoria Ã ̈ una memoria FIFO esterna. Usando il macroblocco FIFO intermedio per comunicare col mondo esterno, la quantitÃ di comunicazione inter-blocco Ã ̈ minimizzata, portando a un incremento nelle prestazioni generali.

Lâ€™oggetto di cui sopra e altri ancora e le caratteristiche della presente invenzione diventeranno piÃ¹ evidenti dalla descrizione seguente e dalle forme di attuazione preferite fornite in connessione con i disegni che accompagnano, in cui:

Fig. 1 Ã ̈ un diagramma a blocchi di un decoder H.264 convenzionale;

Fig. 2 Ã ̈ un diagramma a blocchi dettagliato del decoder CABAC;

Fig. 3A Ã ̈ una tabella che mostra il formato di unâ€™intestazione intra-macroblocco;

Fig. 3B Ã ̈ una tabella che mostra il formato di unâ€™intestazione inter- macroblocco;

Fig. 3C Ã ̈ una tabella che contiene una descrizione dellâ€™informazione dâ€™intestazione delle figure 3A e 3B;

Fig. 4 Ã ̈ un diagramma a blocchi che illustra lâ€™architettura del decoder CABAC secondo una forma di attuazione della presente invenzione;

Fig. 5 Ã ̈ un diagramma a blocchi che illustra lâ€™integrazione del decoder CABAC inventivo in un acceleratore hardware video; e

Figure 6A e 6B mostrano un diagramma di flusso dellâ€™intero processo di decodifica.

DESCRIZIONE DETTAGLIATA

La configurazione dellâ€™intestazione del macroblocco intra e inter, come definita dallo standard H.264, Ã ̈ illustrata in figure 3A e 3B, rispettivamente. Come risulta apparente da queste figure, ogni intestazione di macroblocco Ã ̈ composta da diversi tipi di elementi sintattici predefiniti, che sono descritti nella tabella mostrata in figura 3C. Ognuno di questi elementi sintattici puÃ² essere codificato entropicamente secondo il metodo CABAC. Allo scopo di decodificare i simboli codificati CABAC, ogni simbolo richiede di essere trattato in una maniera specifica, che Ã ̈ definita dallo standard.

Secondo la presente invenzione, il decoder CABAC Ã ̈ fornito di una pluralitÃ di automi a stati finiti (Finite State Machines FSMs), ognuno dei quali Ã ̈ atto a decodificare uno particolare di questi elementi sintattici.

Figura 4 Ã ̈ un diagramma a blocchi che fornisce una visione dâ€™insieme del decoder CABAC secondo una forma di attuazione della presente invenzione. I componenti centrali del decoder CABAC sono il blocco di decodifica aritmetica binaria (Binary Arithmetic Decoder, BAD) 430 e la pluralitÃ di automi a stati finiti 451 a 459.

II blocco BAD 430 Ã ̈ il motore principale del decoder CABAC. La decodifica CABAC Ã ̈ divisa in selezione del contesto, decodifica aritmetica, e debinarizzazione. Il blocco BAD 430 accede direttamente al flusso di bit e riceve un indice della locazione di memoria del contesto dallâ€™automa a stati finiti che Ã ̈ responsabile della decodifica degli elementi sintattici correnti. Per impostare i parametri di â€œstatoâ€ richiesti durante la decodifica aritmetica, il blocco BAD 430 usa anche un gruppo fisso di tabelle memorizzate in una ROM 440. Sulla base dei bit letti dal flusso di bit e del contesto ripescato dalla memoria di contesto 420 secondo lâ€™indice ricevuto, il blocco BAD 430 produce il bin richiesto, che Ã ̈ quindi fornito alTautoma a stati finiti correntemente attivo. Il blocco ROM 440 comprende la tabella rLPS (256 linee di 8 bit ciascuna = 256 Bytes), la tabella Next State MPS (64 linee di 6 bits ciascuna = 48 Bytes), la tabella Next State LPS (64 linee di 6 bits ciascuna = 48 Bytes), cosÃ¬ come la tabella di contesto fissa per vari elementi sintattici, che potrebbe essere implementata fisicamente come 17 ROM differenti con una grandezza totale di approssimativamente di 5.7 Kbytes. Le tabelle di contesto fisse sono usate per inizializzare la memoria di contesto 420 allâ€™inizio di ogni slice.

Il blocco BAD 430 Ã ̈ lâ€™unico blocco che accede il flusso di bit, quindi Ã ̈ lâ€™unico blocco che interagisce con la memoria ad accesso diretto (DMA). Inoltre, questo blocco Ã ̈ lâ€™unico blocco che accede la memoria di contesto 420 durante il processo di decodifica aritmetica.

Il blocco BAD 430 puÃ² necessitare di un particolare valore di contesto della memoria di contesto 420 diverse volte in successione. Quindi il blocco BAD 430 Ã ̈ configurato per evitare letture multiple dalla memoria di contesto allo scopo di migliorare le prestazioni. Inoltre, il contesto aggiornato Ã ̈ riscritto nella memoria di contesto solamente una volta che si deve accedere una nuova locazione della memoria di contesto. La memoria di contesto 420 potrebbe essere implementata come una memoria SRAM avente un totale di 720 parole di 7 bit ciascuna, cioÃ ̈ 630 Bytes, in caso di video 720p. La memoria di contesto potrebbe anche includere i contesti aggiuntivi per codifica video scalabile (Scalable Video Coding SVC) e/o per codifica video Multi-view (Multi-view Video Coding MVC).

Lâ€™architettura per lâ€™analisi sintattica (parsing) del flusso di bit CABAC Ã ̈ stata largamente divisa nei vari automi a stati finiti 451 a 459, a seconda dellâ€™elemento sintattico che Ã ̈ correntemente codificato. Tutti questi automi a stati finiti sono progettati per produrre un bin per ciclo, cioÃ ̈, ognuno di questi automi a stati (state machines) chiama il blocco BAD 430 ogni ciclo. Inoltre, questi automi a stati sono configurati per essere eseguiti uno dopo lâ€™altro in una sequenza particolare, cioÃ ̈ nella sequenza degli elementi sintattici come definiti dallo standard H.264.

Secondo una forma di attuazione preferita della presente invenzione, ci sono 8 automi a stati finiti 451 a 459. Ognuno di questi automi a stati finiti Ã ̈ atto a decodificare un particolare elemento sintattico. Nello specifico, lâ€™automa a stati 451 decodifica il tipo di macroblocco (macroblock type) per il macroblocco corrente per differenti macroblocchi intra/inter. Lâ€™automa a stati 452 decodifica il tipo di blocco (block type) per ogni partizione 8-per-8 del macroblocco. Lâ€™automa a stati 453 decodifica la modalitÃ luma di predizione inter (luma inter-prediction mode) per il macroblocco corrente. Lâ€™automa a stati 454 decodifica la modalitÃ chroma di predizione inter (chroma inter-prediction mode) per il blocco chroma corrente. Lâ€™automa a stati 456 decodifica il differenziale di vettore di movimento (motion vector differential) per il macroblocco corrente. Lâ€™automa a stati 457 decodifica lo schema di blocco codificato per il macroblocco corrente. Lâ€™automa a stati 458 decodifica il parametro di quantizzazione dati (data quantization parameter) per il macroblocco corrente. Infine, lâ€™automa a stati 459 decodifica i coefficienti luma/chroma, 8-per-8/4-per-4, AC/DC per il macroblocco corrente.

Ognuno di questi automi a stati 451 a 459 ha accesso a un insieme di registri locali 460 che sono usati per memorizzare temporaneamente i risultati durante la decodifica di un macroblocco. I registri locali 460 contengono anche le copie locali di elementi contigui superiore/sinistro (top/left), come memorizzati nella memoria contigua 470 per accesso veloce durante la decodifica.

La memoria contigua 470 potrebbe anche essere implementata come una memoria SRAM in grado di contenere informazioni per un massimo di una riga di macroblocchi piÃ¹ un macroblocco. In caso di video 720p la memoria contigua contiene 122 macroblocchi o approssimativamente 19 Kb. Tra le informazioni che richiedono di essere memorizzate nella memoria contigua per ogni macroblocco ci sono tutti i possibili tipi di macroblocco (inter, intra, e skip: 6bit) una flag per indicare la modalitÃ skip (1 bit); gli indici di riferimento al livello blocco (block level) 8x8 (6*8=48 bits); i differenziali del vettore di moto per ogni livello di sottoblocco 4x4 (16*64=1024 bits); il tipo di sottoblocco per inter-macroblocchi (5*4=20 bits); la direzione di previsione per ogni sottoblocco 8x8 (forward/backward, interpolated: 5*4=20 bits); la flag transform size 8x8 (1 bit); la modalitÃ intra prediction per ogni sottoblocco 4x4 (4* 16 = 64 bits); la modalitÃ chroma intra prediction (2 bits); lo schema di blocco codificato per il macroblocco completo (32 bits); e lo schema di blocco codificato (32 bits).

Il decoder CABAC comprende anche un blocco di packaging 480 per impacchettare i dati di macroblocco correnti in un formato specifico e per spingere i dati impacchettati in un buffer first-in/first-out (FIFO) esterno, da cui Ã ̈ preso daHâ€™host/controller per la successiva elaborazione e decodifica.

Lâ€™inizializzazione del decoder CABAC Ã ̈ eseguita dal blocco dâ€™inizializzazione 410, che Ã ̈ responsabile del ricevimento del segnale â€œstartâ€ dalThost/controller, da cui incomincia con lâ€™inizializzazione delle variabili richieste e delle memorie (includendo la memoria di contesto) sulla base dei parametri globali forniti dallâ€™host. Quando lâ€™inizializzazione Ã ̈ completata, il controllo Ã ̈ passato allâ€™automa a stati rilevante per eseguire il parsing del flusso di bit (decodifica CABAC). Figura 5 Ã ̈ un diagramma a blocchi che illustra lâ€™integrazione del decoder CABAC inventivo in un acceleratore hardware video.

Lâ€™acceleratore video hardware (Hardware Video Accelerator, HVA) comprende unâ€™unitÃ di controllo per lâ€™elaborazione frame (Frame Processing Control, FPC) 520 che riceve comandi di controllo dallâ€™host. Il decoder CABAC 530 (che Ã ̈ anche chiamato codec entropico hardware, HEC) Ã ̈ visto come un processore responsabile del parsing del flusso di bit al volo (on thÃ ̈ fly), indipendentemente su base slice, prima che la decodifica della texture sia eseguita dal blocco hardware di codifica video 550 (hardware video codec HVC). I dati in uscita del decoder CABAC 530 sono memorizzati in una FIFO 540, che Ã ̈ atta a contenere un numero predeterminato di macroblocchi e Ã ̈ riempita con informazione di livello di macroblocco in un formato predefinito. Il decoder CABAC 530 Ã ̈ responsabile solo per la decodifica CABAC. Casi in cui CAVLC Ã ̈ usato potrebbero essere gestiti direttamente dal blocco hardware di codifica video 550.

Figure 6A e 6B mostrano un diagramma di flusso del processo di decodifica video come definito nello standard video H.264. I passi eseguiti dagli automi a stati finiti sono evidenziati (cioÃ ̈, passi S 125, S 154 a S 170, S 174, e S 176).

II sistema incomincia la decodifica del flusso di bit una volta ricevuto il segnale â€œstartâ€ dallâ€™host o controller. Nel passo S100 in figura 6A, il sistema determina se il macroblocco corrente Ã ̈ il primo macroblocco della slice corrente. Se questo Ã ̈ il caso, la memoria di contesto e gli altri parametri CABAC sono inizializzati nel passo S 105. Altrimenti il macroblocco contiguo superiore/sinistro del macroblocco corrente Ã ̈ determinato nel passo S I 10. In entrambi i casi, lâ€™elaborazione continua con il passo S I 15, dove i parametri del macroblocco corrente sono inizializzati. Lâ€™informazione Ã ̈ quindi caricata dalla memoria contigua globale 470 nella memoria locale 460 nello step S 120. Dopo che il tipo macroblocco e il tipo 8-per-8 sono decodificati nel passo S125, viene determinato, nel passo S 130, se il macroblocco corrente Ã ̈ un macroblocco â€œskipâ€ oppure no. Se questo Ã ̈ il caso, un contatore Ã ̈ incrementato nel passo S 135 e lâ€™elaborazione continua con il passo S 100 per decodificare il macroblocco seguente.

Se il macroblocco corrente non Ã ̈ un macroblocco â€œskipâ€ , lâ€™elaborazione continua con il passo S 140 in figura 6B dove viene determinato se il macroblocco corrente Ã ̈ un macroblocco intra-coded o un macroblocco inter-coded. Nel promo caso, viene determinato, nel passo S 150, se il macroblocco corrente Ã ̈ un macroblocco IPCM oppure no. Se questo Ã ̈ il caso, il macroblocco IPCM Ã ̈ decodificato nel passo S 152 e lâ€™elaborazione continua al passo S 180. Se questo non Ã ̈ il caso, le modalitÃ inter-prediction e le modalitÃ chroma inter-prediction sono lette nei passi S 154 e S156. Lâ€™elaborazione continua quindi con il passo S 170. Se il macroblocco corrente non Ã ̈ un macroblocco intra-coded (â€œnoâ€ nel passo S 140), lâ€™informazione del frame di riferimento e lâ€™informazione differenziale del vettore di movimento Ã ̈ letta nei passi S 160 e S 162. Lâ€™elaborazione continua nel passo S170, dove lâ€™informazione dello schema di blocco di codifica (coded block pattern CBP) viene letta. Nei passi S 172 a S 176 lâ€™informazione flag di trasformazione, lâ€™informazione dei dati di quantizzazione, lâ€™informazione AC/DC, lâ€™informazione luma/chroma, e lâ€™informazione di coefficiente 4-per-4/8-per-8 viene letta. Infine, lâ€™informazione del macroblocco corrente Ã ̈ memorizzata per uso futuro come informazione contigua e lâ€™uscita FIFO Ã ̈ riempita nel passo S 180.

I passi di cui sopra sono ripetuti per tutti i macroblocchi dello slice corrente (cf. passo S 190).

La descrizione di cui sopra Ã ̈ focalizzata su uno schema di compressione entropica CABAC, come definito dallo standard di compressione video H.264. La presente invenzione comunque non Ã ̈ limitata a questo standard particolare e potrebbe anche essere impiegata con altri standard, in particolare con altri standard della famiglia H.263, come lo standard Scale Video Coding (SVC) (Annex G of ITU-T and ISO/IEC JTC 1 , â€œAdvanced Video Coding for Generic AudioVisual Servicesâ€ , ITU-T Ree. H.264 and ISO/IEC 14496- 10 (MPEG-4 AVC), Version 11 , March 2009) e lo standard Multi-view Video Coding (MVC) (Annex H of ITU-T and ISO/IEC JTC 1 , â€œAdvanced Video Coding for Generic Audio-Visual Servicesâ€ , ITU-T Ree. H.264 and ISO/IEC 14496- 10 (MPEG-4 AVC), Versione 11 , marzo 2009), come il sistema inventive potrebbe anche accomodare i contesti aggiuntivi e la logica di debinarizzazione aggiuntiva richiesti per decodificare un flusso SVC o un flusso MVC.

Con la presente invenzione il decoder Ã ̈ sostanzialmente in grado di gestire risoluzioni piÃ¹ alte rispetto a molti decoder dello stato della tecnica, cioÃ ̈ risoluzioni fino a un ordine di 1280x720 in tempo reale. Questo Ã ̈ dovuto allâ€™elaborazione di un bin per ciclo ottenuta dal blocco BAD ottimizzato.

Inoltre, secondo la presente invenzione, il numero di accessi alla memoria, in particolare accessi alla memoria contigua sono minimizzati unendo in maniera ottimale la decodifica dei vari elementi sintattici in una pluralitÃ di automi a stati finiti dedicati.

Inoltre, il decoder della presente invenzione usa un macroblocco FIFO intermedio per comunicare con il mondo esterno, minimizzando quindi la comunicazione inter-blocco. In sintesi, la presente invenzione fornisce un decoder per decodificare in tempo reale dati video codificati CABAC per applicazioni HDTV. Il decoder comprende un blocco di decodifica aritmetica binaria per convertire un flusso di bit in entrata in una stringa bin, una memoria di contesto per memorizzare una pluralitÃ di valori di contesto, e una pluralitÃ di automi a stati finiti. Ognuno degli automi a stati finiti Ã ̈ atto a decodificare uno particolare degli elementi sintattici deHâ€™H.264 fornendo al blocco di decodifica aritmetica binaria un indice del valore di contesto rilevante entro la memoria di contesto e convertendo il flusso bin risultante in un valore deHâ€™elemento sintattico corrente. In questo modo puÃ² essere ottenuta una prestazione di un bin per ciclo.

Claims

RIVENDICAZIONI 1. Un decoder per la decodifica di un flusso di bit con una pluralitÃ di elementi sintattici codificati CABAC, il decoder comprendente: una memoria di contesto (420) per memorizzare una pluralitÃ di valori di contesto; un blocco di decodifica aritmetica binaria (430) per la conversione di bit di un elemento sintattico corrente in una stringa bin sulla base dei valori di contesto memorizzati; e una pluralitÃ di automi a stati finiti (451-459), ognuno degli automi a stati finiti essendo atto a decodificare un elemento sintattico distinto di una pluralitÃ di elementi sintattici predefiniti, per fornire al blocco di decodifica aritmetica binaria (430) un indice di contesto indicante un valore di contesto della pluralitÃ di valori di contesto memorizzati richiesto per decodificare un bin corrente deHâ€™elemento sintattico corrente, e per convertire la stringa bin in un valore deHâ€™elemento sintattico corrente.
2. Un decoder secondo la rivendicazione 1 , dove il blocco di decodifica aritmetica binaria (430) Ã ̈ atto a ricercare il valore di contesto indicato dallâ€™indice di contesto entro la memoria di contesto (420), per decodificare un bin deHâ€™elemento sintattico corrente in accordo con detto valore di contesto, e per rinormalizzare e aggiornare detto valore di contesto.
3. Un decoder secondo la rivendicazione 1 o 2, dove il blocco di decodifica aritmetica binaria (430) Ã ̈ atto a generare un bin per ciclo di clock.
4. Un decoder secondo ognuna delle rivendicazioni 1 a 3, dove la pluralitÃ di automi a stati finiti (451-459) Ã ̈ configurata cosi da eseguirli uno dopo lâ€™altro in una sequenza particolare.
5. Un decoder secondo la rivendicazione 4, dove la sequenza particolare Ã ̈ la sequenza di elementi sintattici nellâ€™intestazione di macroblocco come definita dallo standard H.264.
6. Un decoder secondo ognuna delle rivendicazioni 1 a 5, comprendente in aggiunta una memoria contigua (470) per memorizzare informazioni su macroblocchi contigui, e dove almeno uno della pluralitÃ di automi a stati finiti (451-459) Ã ̈ atto a selezionare lâ€™indice di contesto sulla base di informazione memorizzata nella memoria contigua (470).
7. Un decoder secondo ognuna delle rivendicazioni 1 a 6, comprendente in aggiunta un blocco di packaging (480) per impacchettare i valori degli elementi sintattici di un macroblocco corrente in un formato predefinito e per memorizzare lo stesso in un buffer di memoria (540).
8. Un decoder secondo la rivendicazione 7, dove il buffer di memoria (540) Ã ̈ una memoria FIFO esterna.