ITTO20100311A1 - "PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH" - Google Patents

"PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH" Download PDF

Info

Publication number
ITTO20100311A1
ITTO20100311A1 IT000311A ITTO20100311A ITTO20100311A1 IT TO20100311 A1 ITTO20100311 A1 IT TO20100311A1 IT 000311 A IT000311 A IT 000311A IT TO20100311 A ITTO20100311 A IT TO20100311A IT TO20100311 A1 ITTO20100311 A1 IT TO20100311A1
Authority
IT
Italy
Prior art keywords
frame
aging
coding
block
layer
Prior art date
Application number
IT000311A
Other languages
Italian (it)
Inventor
Lorenzo Rossi
Laura Toni
Original Assignee
Fond Istituto Italiano Di Tecnologia
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fond Istituto Italiano Di Tecnologia filed Critical Fond Istituto Italiano Di Tecnologia
Priority to ITTO2010A000311A priority Critical patent/IT1399565B1/en
Publication of ITTO20100311A1 publication Critical patent/ITTO20100311A1/en
Application granted granted Critical
Publication of IT1399565B1 publication Critical patent/IT1399565B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Description

DESCRIZIONE dell’invenzione industriale dal titolo: DESCRIPTION of the industrial invention entitled:

“Procedimento di codifica/decodifica di segnali video/immagine con descrizione multipla e relativo apparato di codifica/decodifica†⠀ œCoding / decoding process of video / image signals with multiple description and related coding / decoding apparatusâ €

TESTO DELLA DESCRIZIONE TEXT OF THE DESCRIPTION

La presente invenzione si riferisce a tecniche di codifica/decodifica di sorgente di segnali video/immagine con descrizione multipla, in particolare tecniche di segnali di immagine di tipo scalabile, in particolare per trasmissione su canali con trasmissione a pacchetto di reti di telecomunicazioni, che comprende di operare su una sequenza di immagini digitali organizzate in frame una codifica di tipo layered su detta sequenza per ottenere una pluralità di layer comprendenti un Base Layer con un primo livello di qualità e uno o più Enhancement Layer cui sono associati rispettivi maggiori livelli di qualità. The present invention relates to coding / decoding techniques of source of video / image signals with multiple description, in particular techniques of image signals of the scalable type, in particular for transmission on channels with packet transmission of telecommunications networks, which includes to operate on a sequence of digital images organized in frames a layered coding on said sequence in order to obtain a plurality of layers comprising a Base Layer with a first level of quality and one or more Enhancement Layers to which respective higher levels of quality are associated.

Per codifica di sorgente si intende un mappaggio da una sequenza di simboli generati da una sorgente ad una sequenza di simboli di un alfabeto (solitamente binario), tale che i simboli sorgenti possono essere esattamente recuperati dai bit (codifica senza perdite) o recuperati con qualche distorsione (codifica con perdite). Questo à ̈ il concetto che sta alla base della compressione dei dati. Source coding means a mapping from a sequence of symbols generated by a source to a sequence of symbols of an alphabet (usually binary), such that the source symbols can be exactly recovered from the bits (lossless encoding) or recovered with some distortion (lossy coding). This is the concept behind data compression.

In altre parole si può dire che à ̈ la modalità con la quale ciascun evento associato ad una sorgente discreta viene codificato mediante una sequenza di simboli. In other words, it can be said that it is the way in which each event associated with a discrete source is encoded by means of a sequence of symbols.

In generale, nel seguito della presente descrizione ci si riferirà alle immagini digitali, o fotogrammi, di una sequenza di immagini con il termine di †̃frame’, adottato comunemente nelle principali tecniche di codifica digitale, quali JPEG e MPEG, per definire l’immagine completa e immagini derivate per realizzare schemi di codifica quali inter-frame (P-frame) e intra-frame (I-frame). In general, in the following of this description we will refer to the digital images, or frames, of a sequence of images with the term â € frameâ € ™, commonly adopted in the main digital coding techniques, such as JPEG and MPEG, to define the € ™ complete image and derived images to create coding schemes such as inter-frame (P-frame) and intra-frame (I-frame).

Il Moving Pictures Experts Group (MPEG) ha fornito schemi di codifica video scalabile per soddisfare i diversi livelli di qualità delle immagini a seconda degli ambienti di trasmissione e le prestazioni dei terminali a livello utente e, insieme alle raccomandazioni ITU-T, ha proposto un avanzato standard video di codifica per la radiodiffusione o broadcasting e servizi multimediali internet. Nelle tecniche di codifica scalabile (con scalabilità di SNR, temporale o spaziale), adottate nel formato MPEG-2, il flusso di bit compressi à ̈ diviso in un Base Layer (BL), o strato di base e uno o più Enhancement Layer (EL), o strato di arricchimento. Il Base Layer garantisce la qualità di base del video codificato, mentre un miglioramento della qualità può essere ottenuta attraverso la ricezione dello Enhancement Layer in aggiunta al bitstream dello Base Layer. La debolezza principale di tale codifica layered scalabile à ̈ che l'Enhancement Layer deve essere interamente trasmesso/ricevuto/decodificato oppure non fornisce alcun miglioramento. The Moving Pictures Experts Group (MPEG) has provided scalable video coding schemes to meet different levels of picture quality depending on broadcast environments and user-level terminal performance and, together with ITU-T recommendations, has proposed a advanced video coding standard for broadcasting or broadcasting and internet multimedia services. In the scalable coding techniques (with SNR scalability, temporal or spatial), adopted in the MPEG-2 format, the compressed bit stream is divided into a Base Layer (BL), or base layer and one or more Enhancement Layers ( EL), or enrichment layer. The Base Layer guarantees the basic quality of the encoded video, while an improvement in quality can be obtained by receiving the Enhancement Layer in addition to the Base Layer bitstream. The main weakness of such scalable layered encoding is that the Enhancement Layer must be fully transmitted / received / decoded or does not provide any enhancements.

Per far fronte a questa limitazione delle precedenti norme di codifica video scalabile, à ̈ stata proposta la codifica video scalabile a granularità fine (Fine Granularity Scalable, FGS) nell’ambito del comitato MPEG-4, come ad esempio delineato nella pubblicazione W. Li, “Overview of fine granularity scalability in MPEG-4 video standard,†IEEE Trans. on Circuits and Syst. for Video Tech., vol. 11, no. 3, pp. 301–317, Mar 2001. La codifica FGS, oltre al Base Layer comprende un unico Enhancement Layer codificato in maniera progressiva. Anche se il Base layer à ̈ codificato ad un rispettivo certo tasso RBL, tale che la larghezza di banda minima ricevuta à ̈ superiore a RBL (RBL < Rmin), lo Enhancement Layer può essere compresso su ogni intervallo di bit-rate desiderato [Rmin; Rmax]. Grazie alla natura progressiva dello Enhancement Layer, il decodificatore à ̈ in grado di ricostruire lo Enhancement Layer per ogni valore di bit rate in ricezione. Mentre nella codifica video scalabile lo Enhancement Layer à ̈ interamente ricevuto o perso, con la codifica FGS qualsiasi parte dello Enhancement Layer precedente ad un eventuale errore di ricezione migliora la qualità del flusso video decodificato. To address this limitation of previous scalable video encoding standards, Fine Granularity Scalable (FGS) video encoding has been proposed within the MPEG-4 committee, as outlined for example in publication W. Li, â € œOverview of fine granularity scalability in MPEG-4 video standard, â € IEEE Trans. on Circuits and Syst. for Video Tech., vol. 11, no. 3, pp. 301â € “317, Mar 2001. The FGS encoding, in addition to the Base Layer, includes a single Enhancement Layer encoded progressively. Even if the Base layer is encoded at a respective certain RBL rate, such that the minimum received bandwidth is greater than RBL (RBL <Rmin), the Enhancement Layer can be compressed to any desired bit-rate range [Rmin ; Rmax]. Thanks to the progressive nature of the Enhancement Layer, the decoder is able to reconstruct the Enhancement Layer for each received bit rate value. While in scalable video encoding the Enhancement Layer is entirely received or lost, with FGS encoding any part of the Enhancement Layer preceding a possible reception error improves the quality of the decoded video stream.

Tuttavia, il compromesso fra l'efficienza della codifica e la robustezza à ̈ ancora un problema aperto. In particolare, la maggior parte dei codec video di ultima generazione incorporano la predizione di compensazione del moto (Motion-compensated prediction, MCP), portando a una maggiore compressione della sorgente video. Con la predizione MCP, un errore sul singolo bit può causare il cosiddetto problema di deriva, o drift, che à ̈ il deterioramento della qualità, a causa di un errore di propagazione dovuto alla mancata corrispondenza di predizione fra codificatore e decodificatore. In alcuni codificatori MPEG-4 FGS, la predizione MCP à ̈ considerata per il Base Layer ma non per lo Enhancement Layer, evitando il problema di deriva quando lo Enhancement Layer venga perduto. E’ noto migliorare l'efficienza di codifica mediante l'integrazione dello Enhancement Layer nel ciclo MCP. However, the trade-off between coding efficiency and robustness is still an open question. In particular, most of the latest generation video codecs incorporate motion-compensated prediction (MCP), leading to higher compression of the video source. With MCP prediction, a single-bit error can cause the so-called drift problem, which is the deterioration of quality, due to a propagation error due to the prediction mismatch between encoder and decoder. In some MPEG-4 FGS encoders, MCP prediction is considered for the Base Layer but not for the Enhancement Layer, avoiding the problem of drift when the Enhancement Layer is lost. It is known to improve coding efficiency by integrating the Enhancement Layer into the MCP cycle.

Le soluzioni note in letteratura (ad esempio, FGS progressivo, codifica video a livelli con perdita) conducono ad un flusso codificato che ha una maggiore efficienza di codifica, ma che può soffrire di propagazione di errore quando la previsione MCP dello Enhancement Layer viene perduta. Solutions known in the literature (for example, progressive FGS, lossy level video encoding) lead to an encoded stream which has higher encoding efficiency, but which can suffer from error propagation when the MCP prediction of the Enhancement Layer is lost.

Lo scopo della presente invenzione à ̈ quello di risolvere gli inconvenienti dell’arte nota e, in particolare, di realizzare un procedimento di codifica che sia in grado di in grado di generate un bitstream embedded robusto rispetto alla perdita di pacchetti. The object of the present invention is that of solving the drawbacks of the known art and, in particular, of realizing an encoding process capable of generating an embedded bitstream robust with respect to packet loss.

Secondo la presente invenzione, tale scopo viene raggiunto grazie a un procedimento avente le caratteristiche richiamate in modo specifico nelle rivendicazioni che seguono, che formano parte integrante della presente descrizione. According to the present invention, this object is achieved thanks to a process having the characteristics referred to specifically in the following claims, which form an integral part of the present description.

L’invenzione riguarda anche il corrispondente apparato di codifica/decodifica, nonché il corrispondente prodotto informatico direttamente caricabile nella memoria di un elaboratore numerico quale un processore e comprendente porzioni di codice software per attuare il procedimento secondo l’invenzione quando il prodotto à ̈ eseguito su un elaboratore. The invention also relates to the corresponding coding / decoding apparatus, as well as the corresponding computer product that can be directly loaded into the memory of a digital computer such as a processor and comprising portions of software code to implement the process according to the invention when the product is It is performed on a computer.

Secondo un aspetto importante dell’invenzione, il procedimento prevede di operare su una sequenza di frame una codifica layered per ottenere una pluralità di layer, comprendenti un Base Layer con un primo livello di qualità e uno o più strati di arricchimento con rispettivi maggiori livelli di qualità, il procedimento comprendendo inoltre di operare una codifica alle descrizioni multiple di ciascuno di detti layer, dividendo ciascuno di detti layer in una matrice di blocchi, ciascuno indipendente l’uno dall’altro, in detta matrice di blocchi del layer selezionare blocchi per la trasmissione tramite i passi di calcolare per ciascun blocco corrente di detto strato, a livello di blocco, uno stimatore di differenza rispetto a un corrispondente blocco di un frame precedente e paragonare detto stimatore con una soglia impostabile per valutare se trasmettere il blocco corrente. According to an important aspect of the invention, the process involves operating a layered coding on a sequence of frames to obtain a plurality of layers, including a Base Layer with a first level of quality and one or more enrichment layers with respective higher levels of quality, the process further comprising of encoding the multiple descriptions of each of said layers, dividing each of said layers into a matrix of blocks, each independent of each other, in said matrix of blocks of the layer select blocks for transmission through the steps of calculating for each current block of said layer, at block level, an estimator of difference with respect to a corresponding block of a previous frame and comparing said estimator with a settable threshold to evaluate whether to transmit the current block .

Grazie alle caratteristiche sopra indicate, il procedimento secondo l’invenzione permette di ottenere un apparato codificatore con un alto grado di scalabilità in grado di soddisfare dinamicamente i requisiti di larghezza di banda e che, rispetto ai codificatori video scalabili noti, ha migliori prestazioni quando la perdita di pacchetto sul canale sia maggiore di zero. Thanks to the characteristics indicated above, the process according to the invention allows to obtain an encoder apparatus with a high degree of scalability capable of dynamically satisfying the bandwidth requirements and which, compared to known scalable video encoders, has better performance when the packet loss on the channel is greater than zero.

Ulteriori caratteristiche e vantaggi dell’invenzione risulteranno dalla descrizione che segue con riferimento ai disegni annessi, forniti a puro titolo di esempio non limitativo, in cui: Further characteristics and advantages of the invention will emerge from the following description with reference to the attached drawings, provided purely by way of non-limiting example, in which:

- la figura 1 mostra schematicamente una sequenza di frame impiegati dal procedimento secondo l’invenzione, - Figure 1 schematically shows a sequence of frames used by the process according to the invention,

- la figura 2 à ̈ uno schema a blocchi rappresentativo di un apparato di codifica secondo l’invenzione, - la figura 3 à ̈ uno schema a blocchi di un modulo dell’apparato di codifica di figura 2, - figure 2 is a block diagram representing a coding apparatus according to the invention, - figure 3 is a block diagram of a module of the coding apparatus of figure 2,

- la figura 4 rappresenta uno schema a blocchi di un modulo di codifica layered dell’apparato di codifica figura 2; - figure 4 represents a block diagram of a layered coding module of the coding apparatus of figure 2;

- la figura 5 rappresenta uno schema a blocchi di un modulo di decodifica secondo l’invenzione; figure 5 represents a block diagram of a decoding module according to the invention;

- la figura 6 mostra un diagramma illustrativo di prestazioni raggiunte dal procedimento secondo l’invenzione, - figure 6 shows an illustrative diagram of the performances achieved by the process according to the invention,

- la figura 7 à ̈ un rappresentazione schematica di un segnale d’immagine elaborato dal procedimento secondo l’invenzione, - figure 7 is a schematic representation of an image signal processed by the process according to the invention,

In breve, sono descritti un procedimento di codifica e un apparato di codifica nel quale il flusso di sorgente progressivo à ̈ abbinato a una codifica di tipo descrizioni multiple al livello dell’application layer, piuttosto che al livello fisico. In short, a coding procedure and a coding apparatus are described in which the progressive source stream is combined with a multiple description type coding at the application layer, rather than at the physical layer.

Nella codifica alle descrizioni multiple, nota in generale ad esempio dalla pubblicazione “V. K. Goyal, “Multiple description coding: Compression meets the network†IEEE Signal Processing Mag., vol. 18, no. 5, pp. In the coding with multiple descriptions, known in general for example from the publication â € œV. K. Goyal, â € œMultiple description coding: Compression meets the networkâ € IEEE Signal Processing Mag., Vol. 18, no. 5, pp.

74–93, Sept. 2001, il flusso di bit à ̈ frammentato in una pluralità di descrizioni, ciò conducendo a una trasmissione dell’immagine più affidabile su canali wireless soggetti a errori. Poiché ciascuna descrizione può essere decodificata indipendentemente, i bit d’informazione possono essere ricuperati nonostante la perdita di pacchetti. La qualità del flusso video decodificato dipende dal numero di pacchetti ricevuti con successo. A causa della sensibilita’ agli errori della codifica progressiva, i primi studi si sono occupati di proteggere da errore i pacchetti sfruttando il concetto MD a livello di codificatore di canale, tramite ad esempio forward error correction (FEC). 74â € “93, Sept. 2001, the bit stream is fragmented into a plurality of descriptions, leading to more reliable image transmission over error-prone wireless channels. Since each description can be decoded independently, the information bits can be recovered despite packet loss. The quality of the decoded video stream depends on the number of successfully received packets. Due to the sensitivity to errors of progressive encoding, the first studies dealt with protecting packets from error by exploiting the MD concept at the channel encoder level, for example through forward error correction (FEC).

E’ previsto di impiegare un codificatore di sorgente adatto a codificare una sequenza video o una sequenza di quadri in flussi a pacchetto di tipo a strati, o layered, frammentato in descrizioni indipendenti. Un ulteriore livello di scalabilità viene raggiunto trasmettendo solo un sottoinsieme dei blocchi codificati. Ciò significa che possono essere ottenuti parecchi livelli di qualità di servizio, o Quality of Service (QoS) tramite un singolo frame codificato, adottando una selezione intelligente dei blocchi trasmessi. Sebbene la tecnica di codifica di sorgente secondo l’invenzione nella forma realizzativa qui descritta sia basata sullo standard Joint Photographic Experts Group (JPEG), per il quale ci si può riferire alla CCITT Recommendation ITU-T T.81 (09/92), in particolare Chapter IV, pag. 12-22, essa può essere estesa a altri standard, che operano codifiche di compressione, quali, ad esempio, Moving Pictures Experts Group (MPEG), Set Partitioning In Hierarchical Trees (SPIHT), and altri standard consimili. Anche altre forme di codifica, ad esempio di tipo wavelet, sono compatibili con la soluzione proposta. La forma realizzativa preferita qui descritta fa riferimento allo standard JPEG per la sua flessibilità e perché richiede una limitata potenza di calcolo, adatto a sistemi di tipo embedded e reti di sensori. It is envisaged to use a source encoder suitable for encoding a video sequence or a sequence of frames in packet streams of the layered or layered type, fragmented into independent descriptions. A further level of scalability is achieved by transmitting only a subset of the encoded blocks. This means that several levels of Quality of Service, or Quality of Service (QoS) can be achieved through a single coded frame, by adopting intelligent selection of the transmitted blocks. Although the source coding technique according to the invention in the embodiment described here is based on the Joint Photographic Experts Group (JPEG) standard, for which reference can be made to the CCITT Recommendation ITU-T T.81 (09/92) , in particular Chapter IV, p. 12-22, it can be extended to other standards, which operate compression coding, such as, for example, Moving Pictures Experts Group (MPEG), Set Partitioning In Hierarchical Trees (SPIHT), and other similar standards. Other forms of encoding, for example of the wavelet type, are also compatible with the proposed solution. The preferred embodiment described here refers to the JPEG standard for its flexibility and because it requires limited computing power, suitable for embedded systems and sensor networks.

Viene ora descritto il procedimento di codifica di sorgente proposto, con riferimento a un codec JPEG per una sequenza di frame (o video), tenendo conto degli obiettivi di scalabilità e robustezza alla perdita di pacchetti In figura 1 à ̈ mostrata schematicamente una possibile sequenza S di segnali di immagine digitali, strutturati in frame, impiegata ad esempio dal procedimento secondo l’invenzione, che comprende un numero Nfdi frame, come mostrato nella figura 1. Con FIà ̈ perciò indicato un intraframe o I-frame, codificato senza alcun riferimento, mentre con FPà ̈ indicato un inter-frame o P-frame codificato impiegando l’I-frame FIprecedente come riferimento. La sequenza di segnali di immagine S mostrata comprende un I-frame ogni Nf-1 P-frame. Il numero Nfdi frame può assumere diversi valori, negli esempio qui riportati vale 12. Il procedimento proposto prevede che sia per gli intra-frame FIche per gli inter-frame FPdella sequenza S, in primo luogo la immagine da essi veicolata venga sottoposta a una procedura di codifica layered, detta anche codifica a strati, che produce un numero L di layer, o strati, di tipo rispettivamente intra- o inter-, a seconda se derivati da intra-frame FIo inter-frame FP, per ogni frame completo. Tali layer sono indicati con I<0>, I<1,>… I<l>, I<L>, per gli I- The proposed source coding procedure is now described, with reference to a JPEG codec for a sequence of frames (or video), taking into account the objectives of scalability and robustness to packet loss. Figure 1 schematically shows a possible sequence S of digital image signals, structured in frames, used for example by the method according to the invention, which comprises a number of frames Nf, as shown in Figure 1. With FI therefore indicated an intraframe or I-frame, encoded without any reference , while FP indicates an inter-frame or P-frame encoded using the previous I-frame FI as a reference. The sequence of image signals S shown comprises an I-frame every Nf-1 P-frame. The number Nf of frames can assume different values, in the examples shown here it is 12. The proposed procedure provides that both for the intra-frames FI and for the inter-frames FP of the sequence S, in the first place the image conveyed by them is subjected to a procedure of layered coding, also called layered coding, which produces a number L of layers, or layers, of the type intra- or inter- respectively, depending on whether they are derived from intra-frame FI or inter-frame FP, for each complete frame. These layers are indicated with I <0>, I <1,> â € ¦ I <l>, I <L>, for I-

frame o P<0>, P<1,>… P<l>, P<L>per i P-frame, con l indice intero che indica il layer l-esimo fra gli L layer. Successivamente, à ̈ previsto che ogni layer in detta pluralità di layer sia codificato in modo scalabile. frame or P <0>, P <1,> â € ¦ P <l>, P <L> for P-frames, with the integer index indicating the l-th layer among the L layers. Subsequently, it is expected that each layer in said plurality of layers is coded in a scalable way.

A questo proposito in figura 2 à ̈ indicato un sistema di codifica secondo l’invenzione, che riceve la sequenza di immagini digitali S in ingresso che viene codificata da un modulo codificatore layered secondo una procedura di codifica a layered. Ogni layer, I<l>o P<l>, viene quindi inviato a un modulo 12 di codifica scalabile alle descrizioni multiple, che comprende moduli di suddivisione a blocchi 13 e un modulo selettore 14, impostato con parametri di aging e soglia regolabile per selezionare i blocchi da trasmettere sul canale. In this regard, Figure 2 indicates a coding system according to the invention, which receives the sequence of digital images S at the input which is coded by a layered encoder module according to a layered coding procedure. Each layer, I <l> or P <l>, is then sent to a scalable multi-description encoding module 12, which includes 13 block subdivision modules and a selector module 14, set with aging parameters and adjustable threshold for select the blocks to be transmitted on the channel.

Viene ora descritta la procedura di codifica di tipo layered che viene applicata nel codificatore layered 11. The layered encoding procedure that is applied in layered encoder 11 is now described.

Il codificatore proposto permette di codificare ciascun frame YUV, dove YUV 4:2:0 indica lo spazio di colore di ciascun frame, negli L layer I<l>o P<l>, ciascuno dei quali fornisce un’immagine decodificata a qualità migliore rispetto al layer precedente. The proposed encoder allows to encode each YUV frame, where YUV 4: 2: 0 indicates the color space of each frame, in the L layer I <l> or P <l>, each of which provides a decoded image at quality better than the previous layer.

Quando si consideri un I-frame originale FI, il rispettivo layer I<0>di ordine 0, ossia il Base Layer, viene ottenuto codificando tale frame originale FIdopo un filtraggio passabasso e sottocampionamento, o downsampling, che conduce a ottenere un flusso a bassa qualità con alta efficienza di codifica. In particolare, denotando con un I-frame FIfiltrato e sottocampionato, il Base Layer I<0>codificato JPEG à ̈: When we consider an original I-frame FI, the respective layer I <0> of order 0, that is the Base Layer, is obtained by encoding this original frame FI after a low pass filtering and subsampling, or downsampling, which leads to obtaining a low quality with high coding efficiency. In particular, denoting with a filtered and subsampled I-frame, the JPEG encoded Base Layer I <0> is:

I<0>= JPG (F<0>I <0> = JPG (F <0>

I)(1)Si noti che il k-esimo I-frame originale FIdovrebbe essere denotato tramite FI,k, ma per semplicità k, indice temporale di successione dei frame, à ̈ qui omesso e viene inserito solo ove necessario. I) (1) Note that the original k-th I-frame FI should be denoted by FI, k, but for simplicity k, time frame sequence index, is omitted here and is inserted only where necessary.

Per ottenere i successivi Enhancement Layer I<1,>… I<l>, I<L>dal Base Layer (BL), ottenuto dallo I-frame originale filtrato e sottocampionato , il frame ricostruito dai layer inferiori viene sottratto al frame originale. La differenza risultante à ̈ codificata a un coefficiente di compressione dato. Si sottolinea che layer d’ordine superiore raggiungono una migliore qualità dell’immagine ricostruita al prezzo di una minore efficienza di compressione. Ciascun layer l-esimo I<l>à ̈ codificato in maniera ricorsiva secondo le seguenti relazioni per gli I-frame: To obtain the subsequent Enhancement Layer I <1,> â € ¦ I <l>, I <L> from the Base Layer (BL), obtained from the original filtered and subsampled I-frame, the frame reconstructed from the lower layers is subtracted from the frame original. The resulting difference is encoded at a given compression coefficient. It is emphasized that higher order layers achieve a better quality of the reconstructed image at the price of a lower compression efficiency. Each l-th layer I <l> is recursively encoded according to the following relations for the I-frames:

ì I 0 =JPG ( F 0 ì I 0 = JPG (F 0

I ) , I),

à ̄ TO

I1 0 I1 0

à =JPG[ F I -IJPG ( I ) ] , (2) à = JPG [F I -IJPG (I)], (2)

<Ã ̄>I l IJPG (I l-1 ) )+IJPG ( I l <Ã ̄> I l IJPG (I l-1)) + IJPG (I l

î=JPG[F<->2 î = JPG [F <-> 2

I -( ) ], l ³ 2 dove indica un (l-1)-esimo layer decodificato JPEG. I - ()], l ³ 2 where it indicates a (l-1) -th JPEG decoded layer.

Per gli inter-frame, il procedimento di codifica For interframes, the encoding process

impiega il frame , ossia il Base Layer dell’intraframe, decodificato JPEG, come frame di riferimento. Dal momento che il Base Layer dello I-frame à ̈ richiesto dal codificatore come riferimento, al lato ricevitore, si dovrebbe ricevere il flusso di Base Layer I<0>degli I-frame, come rate minimo per evitare problemi di deriva. uses the frame, ie the base layer of the intraframe, decoded JPEG, as the reference frame. Since the I-frame Base Layer is required by the encoder as a reference, at the receiver side, the I-frame Base Layer I <0> stream should be received as a minimum rate to avoid drift problems.

Per codificare il Base Layer P<0>degli inter-frame, dopo un filtraggio passabasso e un sottocampionamento, il P-frame FPviene paragonato alla ricostruzione del Base Layer I<0>dello I-frame FIe codificato come segue: To encode the Base Layer P <0> of the inter-frames, after low-pass filtering and subsampling, the P-frame FP is compared to the reconstruction of the Base Layer I <0> of the encoded I-frame FIe as follows:

P<0>=JPG[IJPG(JPG (F<0>) ) - IJPG ( I<0>P <0> = JPG [IJPG (JPG (F <0>)) - IJPG (I <0>

P) ](3)Gli altri layer agli altri livelli sono codificati in modo simile impiegando il layer inferiore come riferimento: l’immagine ricostruita dal layer inferiore à ̈ paragonata al P-frame originale FPe il layer corrente à ̈ codificato in modo ricorsivo come segue: P)] (3) The other layers at the other levels are encoded in a similar way using the lower layer as a reference: the image reconstructed from the lower layer is compared to the original P-frame FP and the current layer is recursively encoded as follows:

ìP0 =JPG[IJPG(JPG ( F0 ìP0 = JPG [IJPG (JPG (F0

P ) ) -IJPG ( I 0 ) ] , P)) -IJPG (I 0)],

à ̄ TO

ÃP1=JPG[ F P-IJPG (P0 ) IJPG ( I 0 ) ] , (4) ÃP1 = JPG [F P-IJPG (P0) IJPG (I 0)], (4)

<Ã ̄><Ã ̄>

îP l =JPG[F P-(IJPG (Pl-1 ) )+IJPG ( P l<->2 ) ], l ³ 2 îP l = JPG [F P- (IJPG (Pl-1)) + IJPG (P l <-> 2)], l ³ 2

dove F<0>where F <0>

Pindica il Base Layer ottenuto dal P-frame originale Fpsottocampionato e filtrato. P indicates the Base Layer obtained from the original P-frame Fpsubsampled and filtered.

Al fine di ottenere una scalabilità con risoluzione maggiore di quella degli L layer, o strati, della codifica layered, il procedimento proposto prevede di impiegare una tecnica di codifica alle descrizioni multiple. Come si può riscontrare da figura 2, nel modulo 12 di codifica scalabile ciascun layer I<l>, P<l>à ̈ perciò suddiviso in una matrice di N blocchi B1…BN, ogni j-esimo blocco Bjessendo indipendente rispetto agli altri, inviando tale layer a un corrispondente modulo di suddivisione a blocchi 13, che opera la suddivisione e la codifica del blocco. In particolare, I blocchi sono ottenuti suddividendo il layer in una matrice di decomposizione, comprendente sottoblocchi quadrati adiacenti l’uno all’altro, come dettagliato in Figura 7, e di dimensioni multiple rispetto a quelle del blocco elementare utilizzato nella codifica JPEG, nell’esempio realizzativo 8x8 pixel. Nel seguito della presente descritto ci si riferirà quindi ai blocchi così ottenuti come descrizioni. La definizione di blocco qui impiegata à ̈ quello adottata nello standard JPEG. In order to obtain a scalability with a resolution greater than that of the L layers, or layers, of the layered coding, the proposed method provides for the use of a multiple description coding technique. As can be seen from figure 2, in the scalable coding module 12 each layer I <l>, P <l> is therefore divided into a matrix of N blocks B1â € ¦BN, each j-th block Bj being independent from the others , sending this layer to a corresponding block subdivision module 13, which performs the subdivision and coding of the block. In particular, the blocks are obtained by dividing the layer into a decomposition matrix, comprising square sub-blocks adjacent to each other, as detailed in Figure 7, and of multiple dimensions compared to those of the elementary block used in the JPEG encoding, in the example 8x8 pixel. In the remainder of this description, the blocks thus obtained will therefore be referred to as descriptions. The block definition used here is the one adopted in the JPEG standard.

In base alle richieste d’utente, ad esempio in termini di qualità percepita e banda disponibile, il modulo selettore 14 permette la trasmissione solo di un sottoinsieme dei blocchi codificati. On the basis of user requests, for example in terms of perceived quality and available bandwidth, the selector module 14 allows the transmission of only a subset of the coded blocks.

La selezione di ciascun blocco à ̈ basata, preferibilmente, sulla valutazione di una parametro di errore quadratico medio mse nel modulo selettore 14, un cui schema di dettaglio à ̈ mostrato in figura 3. The selection of each block is based, preferably, on the evaluation of a mean square error parameter mse in the selector module 14, a detailed diagram of which is shown in figure 3.

Si assume per la presente descrizione che ciascun blocco B abbia dimensione di MxM pixel, con M ad esempio pari a 8 a livello 0 del Base Layer, mentre indica il jesimo blocco del frame k-esimo, ossia il blocco del frame corrente in ingresso al codificatore, specificamente al selettore 14. Si noti a questo riguardo che ciascun l-esimo layer I<l>o P<l>possiede un suo blocco j-esimo, che pertanto For the present description it is assumed that each block B has a size of MxM pixels, with M for example equal to 8 at level 0 of the Base Layer, while it indicates the jth block of the k-th frame, i.e. the block of the current frame entering the coder, specifically to selector 14. Note in this regard that each l-th layer I <l> or P <l> has its own j-th block, which therefore

dovrebbe essere indicato per completezza con . Ciascun should be indicated for completeness with. Each

blocco viene tuttavia raffrontato sempre con blocchi however, block is always compared with blocks

appartenenti al suo stesso l-esimo layer I<l>o P<l>, pertanto per semplicità di rappresentazione nel seguito viene omesso l’apice l che indica il layer I<l>o P<l>corrente in elaborazione, lasciando l’apice k che indica a quale frame nella successione temporale di frame appartiene e il pedice j che indica quale blocco sia fra gli N blocchi in cui viene suddiviso il layer I<l>o P<l>. belonging to its l-th layer I <l> or P <l>, therefore for simplicity of representation the superscript l indicating the current I <l> or P <l> layer is omitted below, leaving the superscript k which indicates to which frame in the temporal succession of frames it belongs and the subscript j which indicates which block is among the N blocks into which the layer I <l> or P <l> is divided.

Una volta che il j-esimo blocco à ̈ stato codificato, il modulo selettore 14 lo paragona con il j-esimo blocco del frame precedente, di indice k-1, , valutando uno stimatore della differenza rispetto a un corrispondente blocco di un frame precedente a livello del blocco, ossia uno stimatore di una grandezza valutata sul complesso del blocco di dimensione MxM, ad esempio sui suoi valori di pixel. Si noti che ogni layer l ha un suo proprio blocco jesimo che dovrebbe essere denotato da . Dal momento che Once the j-th block has been coded, the selector module 14 compares it with the j-th block of the previous frame, of index k-1, evaluating an estimator of the difference with respect to a corresponding block of a previous frame at the level of the block, ie an estimator of a quantity evaluated on the complex of the block of size MxM, for example on its pixel values. Note that each layer l has its own jth block which should be denoted by. Since

ogni blocco à ̈ paragonato a blocchi dello stesso layer each block is compared to blocks of the same layer

, con m indicante un generico frame m-esimo o immagine ricostruita, viene per semplicità qui omesso il pedice che indica il layer l cui appartiene il j-esimo blocco. In particolare, tale stimatore à ̈ preferibilmente un valore dell’errore quadratico medio mse del blocco corrente secondo la relazione: , with m indicating a generic m-th frame or reconstructed image, the subscript indicating the layer l to which the j-th block belongs is omitted here for simplicity. In particular, this estimator is preferably a value of the mean square error mse of the current block according to the relation:

M M 2 M M 2

mse=<1>( k ) ( k 1 mse = <1> (k) (k 1

M 2åå<X>n,m<B>j-<X ->n ,m<B>j )(5)n = 1 m = 1 M 2à ¥ à ¥ <X> n, m <B> j- <X -> n, m <B> j) (5) n = 1 m = 1

dove indica un pixel alla posizione (n,m), n e m indicando le righe e colonne nel blocco, per il blocco jesimo del k-esimo frame . Ai fini della presente dscrizione per j-esimo blocco del frame precedente, di where it indicates a pixel at position (n, m), n and m indicating the rows and columns in the block, for the jth block of the k-th frame. For the purposes of this description for the j-th block of the previous frame, di

indice k-1, da cui si preleva il j-esimo blocco , si intende un frame a sé stante o, preferibilmente come frame k-1 à ̈ considerata l’ultima immagine ricostruita. Se il valore dell’errore quadratico medio mse à ̈ maggiore di una soglia data THmse, impostabile, tale blocco viene trasmesso. Tale soglia data THmse, che à ̈ rappresentativa di una differenza minima fra i blocchi, à ̈ impostabile, ossia regolabile, secondo le richieste d’utente e la banda disponibile. Più bassa à ̈ la soglia data THmse, più elevata la qualità e il tasso, o rate, di blocchi trasmesso. index k-1, from which the j-th block is taken, means a frame in its own right or, preferably as frame k-1, it is considered the last image reconstructed. If the value of the mean square error mse is greater than a given threshold THmse, which can be set, this block is transmitted. This threshold given THmse, which is representative of a minimum difference between the blocks, can be set, ie adjustable, according to user requests and the available bandwidth. The lower the given THmse threshold, the higher the quality and rate, or rate, of blocks transmitted.

Dal lato di decodifica, ciascun blocco filtrato dal modulo selettore 14, cioà ̈ ciascun blocco, indicato nel seguito come blocco scartato n , che non à ̈ stato trasmesso, viene sostituito dal blocco corrispondente del frame precedente. Poiché la sostituzione dei blocchi con valore di errore mse sotto la soglia data THmsepuò condurre alla propagazione di una distorsione permanente nella sequenza video, al fine di ridurre tale effetto, addizionalmente alla valutazione del valore dell’errore quadratico medio mse, che in varie forme d’attuazione potrebbe essere usata da sola, à ̈ previsto di introdurre un parametro contatore di invecchiamento, o aging, in trasmissione aj(o aj<k>) volendo indirizzare il frame) per il blocco j-esimo e una soglia di conteggio di aging Ath,tx. Il parametro contatore di aging ajdi ciascun blocco viene incrementato ogni volta che il blocco Bjviene scartato, e resettato, ossia reimpostato a zero, quando il blocco viene trasmesso su un canale 15. Dunque tale parametro contatore di aging ajindica sostanzialmente il numero di tentativi di trasmissione del blocco nel corso della trasmissione della sequenza S. Se il parametro contatore di invecchiamento ajraggiunge la soglia di conteggio di aging Ath,tx, il blocco j-esimo corrente viene inviato in ogni caso, senza tener conto della soglia data THmse, ed il contatore di aging viene resettato. Il blocco corrente viene dunque trasmesso se una della due seguenti condizioni à ̈ soddisfatta: On the decoding side, each block filtered by the selector module 14, ie each block, indicated below as rejected block n, which has not been transmitted, is replaced by the corresponding block of the previous frame. Since the substitution of the blocks with error value mse below the given threshold THm can lead to the propagation of a permanent distortion in the video sequence, in order to reduce this effect, in addition to the evaluation of the value of the mean square error mse, which in various embodiments could be used alone, it is envisaged to introduce an aging counter parameter, or aging, in transmission aj (or aj <k>), wanting to address the frame) for the j-th block and a threshold of Ath aging count, tx. The aging counter parameter aj of each block is incremented each time the block Bj is discarded, and reset, i.e. reset to zero, when the block is transmitted on a channel 15. Therefore this aging counter parameter aj substantially indicates the number of transmission attempts of the block during the transmission of the sequence S. If the aging counter parameter aj reaches the aging count threshold Ath, tx, the j-th current block is sent in any case, regardless of the given threshold THmse, and the counter aging is reset. The current block is then transmitted if one of the following two conditions is satisfied:

ìmse > TH mse ìmse> TH mse

à TO

îaj ³ A (6) îaj ³ A (6)

th , tx th, tx

ossia se l’errore quadratico medio mse à ̈ maggiore della soglia data o se il parametro contatore di aging ajà ̈ maggiore della soglia di conteggio di aging Ath,tx. that is, if the mean square error mse is greater than the given threshold or if the aging counter parameter aj is greater than the aging count threshold Ath, tx.

In figura 3 à ̈ mostrato il dettaglio del modulo selettore 14, che riceve in ingresso il j-esimo blocco corrente , e comprende, in parallelo, un primo modulo di memoria di transito 141, ossia un buffer, per immagazzinare temporaneamente tale blocco e un secondo modulo di memoria di transito 142 preceduto da una linea di ritardo 143 per immagazzinare il blocco precedente . Le uscite di detto primo modulo 141 e detto secondo modulo 142 vengono inviate a un modulo di calcolo 144 che implementa il calcolo dell’errore mse come indicato nell’equazione (5). In un modulo di paragone 145 viene quindi valutato se l’errore mse sia maggiore della soglia data THmse, come nella prima delle due condizioni (6). In caso positivo, in un modulo di riassetto aging 146 il parametro di aging ajviene resettato, ossia posto a zero e il j-esimo blocco corrente viene trasmesso sul canale 15. In caso negativo il controllo passa a un modulo di scarto 147 che provvede alla verifica del parametro di aging ed eventualmente a scartare tale j-esimo blocco corrente . In figura 3 per maggiore chiarezza di descrizione à ̈ rappresentato tale blocco scartato n,quantunque esso venga in generale semplicemente scartato omettendo di trasmetterlo. Tale modulo di scarto 147 comprende inoltre un modulo di paragone dell’aging 148, che riceve il parametro contatore di aging aj, che viene calcolato, in particolare incrementato, al modulo 141 al ricevimento del j-esimo blocco corrente , e valuta se tale parametro contatore di aging a<k>Figure 3 shows the detail of the selector module 14, which receives the j-th current block as input, and comprises, in parallel, a first buffer module 141, i.e. a buffer, to temporarily store this block and a second buffer module 142 preceded by a delay line 143 for storing the preceding block. The outputs of said first module 141 and said second module 142 are sent to a calculation module 144 which implements the calculation of the error mse as indicated in equation (5). In a comparison module 145 it is therefore evaluated whether the error mse is greater than the given threshold THmse, as in the first of the two conditions (6). In the positive case, in an aging reorganization module 146 the aging parameter aj is reset, i.e. set to zero and the j-th current block is transmitted on channel 15. In the negative case, the control passes to a reject module 147 which provides for the verification of the aging parameter and possibly discarding this j-th current block. For greater clarity of description, Figure 3 shows this discarded block n, although it is generally simply discarded by failing to transmit it. This reject module 147 also includes an aging comparison module 148, which receives the aging counter parameter aj, which is calculated, in particular increased, at module 141 upon receipt of the j-th current block, and evaluates whether this aging counter parameter a <k>

jsia maggiore della soglia di conteggio di aging Ath,txin trasmissione. In caso positivo, nel modulo di riassetto aging 146 il parametro di aging ajviene resettato, ossia posto a zero, e il j-esimo blocco corrente viene trasmesso. In caso negativo, in un modulo di incremento aging 149 viene incrementato il parametro contatore di aging aje il j-esimo blocco B<k>j is greater than the Ath aging count threshold, txin transmission. If so, in the aging reorganization module 146 the aging parameter aj is reset, i.e. set to zero, and the j-th current block is transmitted. If not, in an aging increment module 149 the aging counter parameter aj is incremented and the j-th block B <k>

jviene tralasciato, ossia non viene trasmesso e scartato, ciò essendo simboleggiato in figura 3 dal blocco scartato . j is omitted, that is, it is not transmitted and discarded, this being symbolized in figure 3 by the discarded block.

Viene qui ora descritto il procedimento e sistema secondo l’invenzione nell’applicazione a canali con trasmissione a pacchetto, illustrando il procedimento di occultamento di perdita di pacchetto, o packet loss concealment. The process and system according to the invention in the application to channels with packet transmission is now described, illustrating the process of packet loss concealment.

In una trasmissione ideale, senza perdita di pacchetto, il processo di decodifica à ̈ correlato strettamente al codificatore: al decodificatore viene eseguita una serie inversa di operazioni rispetto a quelle eseguita al codificatore. Ad esempio, indicando con il layer l-esimo, per un inter-frame, ricostruito dal decodificatore, esso à ̈ valutato come la decodifica JPEG della differenza fra il layer l-esimo e i layer precedenti, più la decodifica JPEG dei layer precedenti. Dunque, il layer à ̈ valutato come segue: In an ideal transmission, without packet loss, the decoding process is closely related to the encoder: the decoder is performed an inverse series of operations compared to those performed by the encoder. For example, indicating with the l-th layer, for an inter-frame, reconstructed by the decoder, it is evaluated as the JPEG decoding of the difference between the l-th layer and the previous layers, plus the JPEG decoding of the previous layers. Thus, the layer is evaluated as follows:

I<ˆl>=IJPG(I<l>)+IJPG(I<(l-1)>)-IJPG(I<( l -2 )>), l ³ 2(7)Tale processo di decodifica può essere esteso a qualsiasi blocco dei layer. I <Ë † l> = IJPG (I <l>) + IJPG (I <(l-1)>) - IJPG (I <(l -2)>), l ³ 2 (7) This decoding process can be extended to any layer block.

In decodifica, i blocchi vengono giustapposti secondo l’ordine utilizzato nella matrice di decomposizione utilizzata per l’operazione di suddivisione. In decoding, the blocks are juxtaposed according to the order used in the decomposition matrix used for the subdivision operation.

Si introduce anche nel processo di decodifica un rispettivo parametro di contatore di aging di ricezione aj,rxe una soglia di aging di ricezione Ath,rx. Ogni volta che il j-esimo blocco à ̈ perduto, ossia tralasciato al modulo selettore 14 in trasmissione oppure trasmesso ma non correttamente ricevuto (per esempio per un errore lungo il canale di trasmissione), il contatore di aging di ricezione aj,rxviene incrementato e il blocco viene sostituito dal blocco precedente dello strato l-esimo. A respective reception aging counter parameter aj, rx and a reception aging threshold Ath, rx are also introduced in the decoding process. Whenever the j-th block is lost, i.e. it is left out to the selector module 14 in transmission or transmitted but not correctly received (for example due to an error along the transmission channel), the reception aging counter aj, rx is incremented and the block is replaced by the previous block of the l-th layer.

Quando il parametro di contatore di aging di ricezione aj,rxraggiunge la soglia di aging di ricezione Ath,rx, il blocco mancante non viene più sostituito, produce un “buco†nel layer l-esimo. Il parametro contatore di aging di ricezione aj,rxviene resettato a ogni corretta ricezione del blocco. When the reception aging counter parameter aj, rx reaches the reception aging threshold Ath, rx, the missing block is no longer replaced, it produces a "hole" in the l-th layer. The reception aging counter parameter aj, rx is reset upon each successful reception of the block.

Nel seguito viene indicata una possibile procedura per impostare la soglia data mse e ottimizzare dei parametri di aging. Sulla base delle condizioni al contorno imposte dalla rete di accesso e le richieste d’utente, si considera un dato bit-rate R per un canale wireless con un determinato tasso di perdita di pacchetto Plr. Quindi, i bit medi per ogni frame trasmesso sono dati dalla relazione: Below is a possible procedure for setting the data mse threshold and optimizing the aging parameters. On the basis of the boundary conditions imposed by the access network and user requests, a given bit-rate R is considered for a wireless channel with a given rate of packet loss Plr. Hence, the average bits for each transmitted frame are given by the relation:

b<- 1>b <- 1>

<pf>=R [bps ] ́(Rf[ fps ] )(8)dove Rfà ̈ il frame-rate, impostato di solito a 25-30 fps. Assumendo una lunghezza di pacchetto di Spbits, il numero medio di pacchetti per frame à ̈ <pf> = R [bps] ́ (Rf [fps]) (8) where Rfà is the frame-rate, usually set at 25-30 fps. Assuming a packet length of Spbits, the average number of packets per frame is

é ù à © ù

<P>pf =<b>pf <P> pf = <b> pf

ê ú ê ú

êê S(9)p úú êê S (9) p úú

Sulla base delle condizioni al contorno e dei parametri di canale imposti dal sistema, si può esprimere dunque la minimizzazione della distorsione attesa E[D] per una sequenza video, valutata come distorsione di ciascun frame singolo mediato sull’intera sequenza On the basis of the boundary conditions and the channel parameters imposed by the system, we can therefore express the minimization of the expected distortion E [D] for a video sequence, evaluated as the distortion of each single frame averaged over the entire sequence

P pf P pf

E [D ] =Ã¥D<(>Bk<)>Pk(10) k= 0 E [D] = Ã ¥ D <(> Bk <)> Pk (10) k = 0

dove Bkrappresenta il numero di bit di informazione correttamente ricevuti quando i primi k pacchetti trasmessi sono correttamente ricevuti, e D(Bk) denota la distorsione, preferibilmente calcolata come mse. Pkrappresenta la probabilità di perdere il k-esimo pacchetto, e dipende dalla packet loss Plr. where Bkra represents the number of information bits correctly received when the first k transmitted packets are correctly received, and D (Bk) denotes the distortion, preferably calculated as mse. Pkra represents the probability of losing the k-th packet, and depends on the packet loss Plr.

Perciò, il problema dell’ottimizzazione da risolvere à ̈ Therefore, the optimization problem to solve is

{Th ,mAin,A }={E [D ](Plr,bpf , Sp ) } (11) mse th,tx th ,rx{Th, mAin, A} = {E [D] (Plr, bpf, Sp)} (11) mse th, tx th, rx

che permette di ottimizzare la distorsione attesa E[D], individuando i parametri di soglia data mse e di soglie di aging in funzione dei valori di in funzione di tasso di perdita di pacchetto Plr, numero di bit medi per frame e lunghezza di pacchetto Spcaratteristici di una certa rete in cui la sequenza video S viene trasmessa. Si noti che la soglia data mse e i parametri di aging permettono di massimizzare la performance del sistema e di ottimizzare la qualità del servizio anche quando gli utenti eseguono un handoff, ossia il trasferimento di una sessione dati o fonia, da una tecnologia a alta velocità a tecnologia a più basso bit-rate. which allows to optimize the expected distortion E [D], identifying the threshold parameters given mse and aging thresholds as a function of the values of as a function of packet loss rate Plr, number of average bits per frame and packet length Sp of a certain network where the video sequence S is being broadcast. Note that the mse data threshold and the aging parameters allow to maximize system performance and optimize the quality of the service even when users perform a handoff, i.e. the transfer of a data or voice session, from a high-speed technology to lower bit-rate technology.

In figura 4 à ̈ mostrato uno schema di dettaglio di una forma di realizzazione del modulo di codifica 11 layered, indicata con 41, che implementa a procedura di codifica layered descritta in precedenza con riferimento alle equazioni (1), (2), (3), (4). Tale modulo di codifica 11 layered opera in questo caso con L=3, producendo in uscita per l’intra-frame quindi un Base Layer I<0>e due Enhancement Figure 4 shows a detailed diagram of an embodiment of the layered coding module 11, indicated with 41, which implements a layered coding procedure described previously with reference to equations (1), (2), (3 ), (4). This layered coding module 11 operates in this case with L = 3, producing an output for the intra-frame therefore a Base Layer I <0> and two Enhancements

Layer I<1>e I<2>. Pertanto, tale struttura presenta tre rispettivi rami t0, t1, t2, che ricevono in ingresso l’ I-frame FI. L’inter-frame à ̈ inviata a una struttura simile, con tre rispettivi rami t’0, t’1, t’2 che determinano un Base Layer P<0>e due Enhancement Layer P<1>e P<2>. Nella figura 4, così come nella successiva figura 5, riferimenti uguali indicano moduli che eseguono funzioni sostanzialmente equivalenti, anche se possono avere differenze di implementazione legate alle grandezze ai loro ingressi. Layer I <1> and I <2>. Therefore, this structure has three respective branches t0, t1, t2, which receive the I-frame FI as input. The inter-frame is sent to a similar structure, with three respective branches tâ € ™ 0, tâ € ™ 1, tâ € ™ 2 which determine a Base Layer P <0> and two Enhancement Layer P <1> and P <2>. In figure 4, as well as in the following figure 5, identical references indicate modules that perform substantially equivalent functions, even if they may have implementation differences linked to the quantities at their inputs.

Sul primo ramo t0 à ̈ ricevuto quindi l’I-frame FI, che à ̈ filtrato in un filtro passa basso 41 e sotto scalato in un modulo di downscaling 42, dando origine all’I-frame filtrato e sottocampionato, che viene codificato con codifica JPEG con un codificatore JPEG dello Base Layer 430, ossia un codificatore che produce i coefficienti DCT del layer al livello 0. In generale i coefficienti utilizzati per la compressione JPEG di differenti livelli vengono infatti scelti solitamente con valori differenti. The I-frame FI is therefore received on the first branch t0, which is filtered in a low-pass filter 41 and under-scaled in a downscaling module 42, giving rise to the filtered and subsampled I-frame, which is encoded with JPEG encoding with a JPEG encoder of the Base Layer 430, ie an encoder that produces the DCT coefficients of the layer at level 0. In general, the coefficients used for JPEG compression of different levels are in fact usually chosen with different values.

Tale Base Layer I<0>à ̈ prodotto in uscita del primo ramo t0, ma à ̈ anche inviato sul secondo ramo t1 a un decodificatore JPEG 44, la cui uscita decodificata à ̈ inviata a un blocco interpolatore 45 e quindi a un blocco sottrattore 46 che esegue la differenza con l’I-frame originale FI. Tale differenza à ̈ inviata a un codificatore di livello 1 431, che produce i coefficienti DCT del layer al livello 1, I<1>, ossia il primo Enhancement Layer, che viene inviato in uscita sul secondo ramo t1. Il primo Enhancement Layer I<1>à ̈ anche inviato al terzo ramo t2 attraverso un ulteriore decodificatore JPEG 44 del terzo ramo t2, la cui uscita à ̈ sommata in un sommatore 47 del ramo t2 con la versione decodificata del Base Layer I<0>proveniente dal primo ramo t0. La somma risultante à ̈ sottratta poi dall’I-frame originale FI, in un blocco sottrattore 46 del ramo t2, che fornisce in uscita, dopo codifica JPEG in un codificatore di livello 2432, il secondo Enhancement Layer I<2>. This Base Layer I <0> is produced at the output of the first branch t0, but it is also sent on the second branch t1 to a JPEG 44 decoder, whose decoded output is sent to an interpolator block 45 and then to a subtractor block 46 which makes the difference with the original I-frame FI. This difference is sent to a level 1 431 encoder, which produces the DCT coefficients of the layer at level 1, I <1>, i.e. the first Enhancement Layer, which is output on the second branch t1. The first Enhancement Layer I <1> is also sent to the third branch t2 through a further JPEG decoder 44 of the third branch t2, whose output is summed in an adder 47 of the branch t2 with the decoded version of the Base Layer I <0 > coming from the first branch t0. The resulting sum is then subtracted from the original I-frame FI, in a subtractor block 46 of the t2 branch, which outputs, after JPEG encoding in a 2432 level encoder, the second Enhancement Layer I <2>.

La struttura del modulo decodificatore 41 che opera sul P-frame , come detto à ̈ simile, con tre rami t’0, t’1, t’2 che ricevono tale P-frame originale in parallelo, il P-frame originale inviato sul primo ramo t’0, à ̈ sottoposto anch’esso a un filtraggio in un filtro passa basso 41 e a un’operazione di sottoscalamento in un modulo di downscaling 42. Il P-frame sottoscalato e filtrato tuttavia, rispetto al caso dell’I-frame, prima della decodifica JPEG sul primo ramo t’0 in un decodificatore 44 viene ricodificato JPEG con un codificatore di livello 0 430del ramo t’0. Quindi alla versione decodificata e ricodificata del frame così ottenuta viene sottratto il Base Layer I<0>decodificato proveniente dal corrispondente codificatore JPEG 430sul primo ramo t0 della codifica dell’I-frame, in un modulo sottrattore 46 del primo ramo t’0 a cui viene anche inviato il Base Layer decodificato dell’I-frame prelevato dal corrispondente codificatore JPEG 430nella porzione di codifica dell’I-frame. La differenza in uscita dal modulo sottrattore 46 del primo ramo t’0 à ̈ codificata JPEG tramite un ulteriore codificatore JPEG 430à ̈ inviata in uscita del primo ramo t’0 come Base Layer del P-frame, P<0>, nonché inviata al secondo ramo t’1 attraverso un decodificatore 44, la cui uscita à ̈ inviata a un sommatore 47 del secondo ramo t’1 per essere sommata ancora al Base Layer I<0>decodificato, e, previa interpolazione in un blocco interpolatore 45 del secondo ramo t’1, il risultato di tale somma à ̈ sottratto in un modulo sottrattore 46 del secondo ramo t’1 dal frame originale . La differenza à ̈ codificata JPEG in un codificatore di livello 1 431e avviata all’uscita del secondo ramo t’1 come primo Enhancement Layer, P<1>. Tale primo Enhancement The structure of the decoder module 41 which operates on the P-frame, as mentioned, is similar, with three branches tâ € ™ 0, tâ € ™ 1, tâ € ™ 2 receiving this original P-frame in parallel, the P-frame sent on the first leg tâ € ™ 0, it is also subjected to a filtering in a low pass filter 41 and to an underscale operation in a downscaling module 42. The P-frame underscale is filtered however, compared in the case of the I-frame, before the JPEG decoding on the first branch tâ € ™ 0 in a decoder 44 the JPEG is recoded with a level 0 encoder 430 of the branch tâ € ™ 0. Then the decoded Base Layer I <0> from the corresponding JPEG 430 encoder on the first branch t0 of the I-frame encoding is subtracted from the decoded and recoded version of the frame, in a subtractor module 46 of the first branch tâ € ™ 0 to which the decoded Base Layer of the I-frame taken from the corresponding JPEG 430 encoder in the coding portion of the I-frame is also sent. The difference in output from the subtractor module 46 of the first branch tâ € ™ 0 is JPEG encoded by a further JPEG 430 encoder and is sent to the output of the first branch tâ € ™ 0 as the Base Layer of the P-frame, P <0>, as well as © sent to the second branch tâ € ™ 1 through a decoder 44, whose output is sent to an adder 47 of the second branch tâ € ™ 1 to be added again to the decoded Base Layer I <0>, and, after interpolation in a interpolator block 45 of the second branch tâ € ™ 1, the result of this sum is subtracted in a subtractor module 46 of the second branch tâ € ™ 1 from the original frame. The difference is JPEG encoded in a level 1 encoder 431e started at the output of the second branch tâ € ™ 1 as the first Enhancement Layer, P <1>. This first Enhancement

Layer, P<1>, anche decodificato in un decodificatore 44 del terzo ramo t’2 e sommato con l’uscita dell’interpolatore del primo ramo t’0 in un sommatore 47 del terzo ramo t’2, la cui somma risultante viene sottratta dal P-frame originale per ottenere il secondo Enhancement Layer, P<2>, in uscita sul terzo ramo t’2. Layer, P <1>, also decoded in a decoder 44 of the third branch tâ € ™ 2 and added with the interpolator output of the first branch tâ € ™ 0 in an adder 47 of the third branch tâ € ™ 2, whose resulting sum is subtracted from the original P-frame to obtain the second Enhancement Layer, P <2>, output on the third branch tâ € ™ 2.

In figura 5 à ̈ rappresentata schematicamente una forma realizzativa di decodificatore 51 che implementa l’equazione (7). Esso à ̈ più semplice rispetto al codificatore 41 e comprende un decodificatore JPEG 54 in parallelo per ogni layer I<0>, I<1>, I<2>, P<0>, P<1>, P<2>, in ingresso. Il Figure 5 schematically represents an embodiment of decoder 51 which implements equation (7). It is simpler than encoder 41 and includes a JPEG decoder 54 in parallel for each layer I <0>, I <1>, I <2>, P <0>, P <1>, P <2>, in entrance. The

Base Layer I<0>Ã ̈ quindi inviato a un interpolatore 55 e poi in uscita come frame IQ0, ossia con QoP (Quality of Picture) 0. Il primo Enhancement Layer I<1>in uscita dal rispettivo decodificatore 54 Ã ̈ inviato a un sommatore 57 che lo somma con il frame Q0 per realizzare un frame IQ1 con QoP 1. Il secondo Enhancement Layer I<2>in uscita dal rispettivo decodificatore JPEG 54 Ã ̈ inviato a un altro sommatore 57 che lo somma con il frame IQ1 con QoP pari a 1 per realizzare un frame IQ2 con QoP2. Base Layer I <0> is then sent to an interpolator 55 and then output as IQ0 frame, i.e. with QoP (Quality of Picture) 0. The first Enhancement Layer I <1> output from the respective decoder 54 is sent to an adder 57 which adds it to frame Q0 to create a frame IQ1 with QoP 1. The second Enhancement Layer I <2> output from the respective JPEG decoder 54 is sent to another adder 57 which adds it to frame IQ1 with QoP equal to 1 to make an IQ2 frame with QoP2.

Per quanto riguarda la porzione di decodifica del P-frame, a valle del decodificatore JPEG 54 che decodifica il Base Layer P<0>Ã ̈ previsto un sommatore per sommare il Base As regards the decoding portion of the P-frame, downstream of the JPEG 54 decoder which decodes the Base Layer P <0>, an adder is provided to add the Base

Layer P<0>decodificato con il Base Layer I<0>decodificato e inviare la somma a un interpolatore 55. Il resto della struttura a valle dell’interpolatore 55 à ̈ analogo a quella descritta per la decodifica degli I-frame e determina tre P-frame PQ0, PQ1 e PQ2, con QoP 0, 1, 2 rispettivamente. Come mostrato in figura sia per l’I-frame che per il P-Frame à ̈ poi possibile selezionare il frame con la QoP desiderata. Layer P <0> decoded with the Base Layer I <0> decoded and send the sum to an interpolator 55. The rest of the structure downstream of the interpolator 55 is similar to that described for the decoding of the I-frames and determines three P-frames PQ0, PQ1 and PQ2, with QoP 0, 1, 2 respectively. As shown in the figure for both the I-frame and the P-Frame it is then possible to select the frame with the desired QoP.

In figura 6 à ̈ fornito a titolo di esempio un diagramma comparativo delle prestazioni di un procedimento secondo MPEG4-FGS (Fine Granularity Scalable video coding) e il procedimento secondo l’invenzione. Figure 6 provides by way of example a comparative diagram of the performances of a process according to MPEG4-FGS (Fine Granularity Scalable video coding) and the process according to the invention.

Per gli stream video non esiste una tecnica oggettiva per la valutazione della qualità percepita dall'utente. Il benchmark impiegato da molto tempo per valutare la qualità video à ̈ la raccomandazione ITU-R BT.500, mentre più recentemente l’organizzazione ITU-T ha sviluppato la raccomandazione P.910 per la valutazione della qualità multimediali e lo ITU-T Study Group 9 sta lavorando in collaborazione con il Quality Video gruppo di esperti (VQEG) sul mantenimento e il miglioramento delle raccomandazioni P.910 , P.911, P.920, P.930, P.931, J.146, J.148, J.149. Il modello di riferimento obiettivo proposto dalla VQEG à ̈ il Peak Signal to Noise Ratio (PSNR). Tale metrica PSNR à ̈ impiegato nel raffronto di figura 6 tra il codec proposto e lo stato dell'arte MPEG-4 FGS. La codifica FGS à ̈ adottata dallo standard MPEG-4 per la distribuzione efficiente e flessibile dei flussi multimediali su reti eterogenee, ossia reti comprendenti diversi media fisici cablate e wireless. For video streams there is no objective technique for assessing the quality perceived by the user. The benchmark that has long been used to assess video quality is the ITU-R BT.500 recommendation, while more recently the ITU-T organization developed the P.910 recommendation for multimedia quality assessment and the ITU-T Study Group 9 is working in conjunction with the Quality Video Expert Group (VQEG) on maintaining and improving recommendations P.910, P.911, P.920, P.930, P.931, J.146, J. 148, J.149. The objective reference model proposed by the VQEG is the Peak Signal to Noise Ratio (PSNR). This PSNR metric is used in the comparison of figure 6 between the proposed codec and the state of the art MPEG-4 FGS. The FGS encoding is adopted by the MPEG-4 standard for the efficient and flexible distribution of multimedia streams over heterogeneous networks, ie networks comprising different wired and wireless physical media.

La figura 6, che riporta sull’asse orizzontale valori di probabilità di perdita di pacchetto Plre sull’asse verticale valori di PSNR, mostra dunque la curva dello standard FGS (MPEG4-FGS) (curva tratto punto) raffrontata a differenti curve per diversi valori di soglia data THmse, in particolare valore zero (curva continua) nonché ulteriori quattro curve per rispettive coppie di valori dei parametri: THmse= 10 Ath= 1; THmse= 10 Ath= 4; THmse= 30 Ath= 1; THmse= 30 Ath= 4, come indicato nella legenda di figura 6. Tali curve sono dunque ottenute con il procedimento di codifica proposto, e rappresentano una regolazione fine dei parametri di codifica. In ogni caso raffigurato, con una probabilità di perdita di pacchetto Plrmaggiore di zero il procedimento di codifica/decodifica e apparato codificatore/decodificatore secondo l’invenzione presentano valori PNSR del tutto maggiori rispetto alla codifica dello standard FGS. Figure 6, which shows on the horizontal axis values of probability of packet loss Plre on the vertical axis values of PSNR, therefore shows the curve of the FGS standard (MPEG4-FGS) (curve point point) compared to different curves for different threshold values given THmse, in particular zero value (continuous curve) as well as further four curves for respective pairs of parameter values: THmse = 10 Ath = 1; THmse = 10 Ath = 4; THmse = 30 Ath = 1; THmse = 30 Ath = 4, as indicated in the legend of figure 6. These curves are therefore obtained with the proposed coding procedure, and represent a fine adjustment of the coding parameters. In any case shown, with a probability of packet loss greater than zero, the encoding / decoding process and encoder / decoder apparatus according to the invention have completely higher PNSR values than the coding of the FGS standard.

La figura 7 à ̈ una rappresentazione schematica di un frame di immagine della sequenza S di segnali d’immagine codificata dal procedimento secondo l’invenzione, ad esempio un intra-frame FI, e della suddivisione in blocchi. I quadrati più grandi indicano i blocchi del Base Layer scartati dal selettore 14 in figura 3, indicati con n (I<0>), mentre i quadrati più piccoli al loro interno indicano i blocchi degli Enhancement Layer scartati dal selettore 14 in figura 3, indicati con n (I<l>). Le zone Figure 7 is a schematic representation of an image frame of the sequence S of image signals encoded by the method according to the invention, for example an intra-frame FI, and of the subdivision into blocks. The larger squares indicate the Base Layer blocks discarded by selector 14 in figure 3, indicated with n (I <0>), while the smaller squares inside them indicate the Enhancement Layer blocks discarded by selector 14 in figure 3, denoted by n (I <l>). The areas

vuote, che sono occupate da blocchi analoghi (I<0>) (I<l>) non evidenziati in figura 7, sono quelle relative ai blocchi non scartati, ossia trasmessi. Con HM à ̈ indicata una zona contraddistinta da elevato movimento, e, come si può notare, in questa zona vi à ̈ il maggior numero di blocchi trasmessi. In definitiva, le zone ad alto movimento sono quelle che variano più rapidamente e che quindi nel modulo di paragone 145 che valuta se l’errore mse sia maggiore della soglia data THmsedanno risultato positivo quindi sono trasmesse più probabilmente sul canale 15. empty, which are occupied by similar blocks (I <0>) (I <l>) not highlighted in figure 7, are those relating to the blocks not discarded, that is, transmitted. HM indicates an area characterized by high movement, and, as you can see, in this area there is the greatest number of blocks transmitted. Ultimately, the areas with high movement are those that vary more rapidly and therefore in the comparison module 145 which evaluates whether the error mse is greater than the threshold given THm give a positive result and are therefore more likely transmitted on channel 15.

Dunque, sono chiari i vantaggi del procedimento di codifica appena descritto. Therefore, the advantages of the coding process just described are clear.

Il procedimento secondo l’invenzione prevede vantaggiosamente di impiegare una codifica layered, che à ̈ di per sé meno efficiente dal punto di vista della compressione, tuttavia la codifica alle descrizioni multiple rende la trasmissione più robusta e, permettendo di non trasmettere tutti i blocchi, permette di recuperare efficienza di compressione. The method according to the invention advantageously provides for the use of a layered encoding, which is in itself less efficient from the point of view of compression, however the encoding with multiple descriptions makes the transmission more robust and, allowing not to transmit all the blocks, it allows to recover compression efficiency.

Il procedimento secondo l’invenzione permette tramite operazioni di codifica multi-layer scalabile, di venire incontro alle richieste multiutente in una rete eterogenea. Sulla base della tecnologia delle reti d’accesso e delle richieste d’utente, si possono regolare i migliori valori di soglia, specificamente di soglia di mse e di parametri di aging, che permettono di ottenere uno streaming video codificato in grado di adattarsi ai vincoli imposti, in termini di qualità e larghezza di banda. The method according to the invention allows, by means of scalable multi-layer coding operations, to meet the multi-user requests in a heterogeneous network. On the basis of access network technology and user requests, the best threshold values can be adjusted, specifically the mse threshold and aging parameters, which allow to obtain an encoded video streaming capable of adapting the constraints imposed in terms of quality and bandwidth.

In particolare, i procedimenti e apparati secondo l’invenzione sono particolarmente adatti a risolvere problemi di scalabilità per lo streaming video su reti wireless. La coesistenza di multiple tecnologie di accesso, determina che i sistemi wireless di quarta generazione in sviluppo siano caratterizzati da crescente eterogeneità. In tale scenario, uno degli scopi à ̈ fornire un servizio cosiddetto “always best connected†(ABC) e in ciò il tipo di rete di accesso gioca un ruolo primario. Il servizio ABC viene migliorato dall’ottimizzazione della codifica di sorgente, secondo l’invenzione. In particular, the processes and apparatuses according to the invention are particularly suitable for solving scalability problems for video streaming on wireless networks. The coexistence of multiple access technologies determines that the fourth generation wireless systems under development are characterized by increasing heterogeneity. In this scenario, one of the purposes is to provide a so-called â € œalways best connectedâ € (ABC) service and in this the type of access network plays a primary role. The ABC service is enhanced by the optimization of the source coding, according to the invention.

Da un singolo processo di codifica, il procedimento secondo l’invenzione à ̈ vantaggiosamente in grado di venire incontro alle richieste multi-utente con il migliore trade off qualità-codifica. Al di là della scalabilità, il codificatore proposto si caratterizza per la robustezza alla perdita di pacchetti. Quando si consideri una perdita di pacchetto non pari a zero, il procedimento proposto raggiunge una qualità anche di 7 dB superiore al codec MPEG-4 FGS. From a single coding process, the process according to the invention is advantageously able to meet multi-user requests with the best quality-coding trade off. Beyond scalability, the proposed encoder is characterized by robustness to packet loss. When a non-zero packet loss is considered, the proposed procedure achieves a quality even 7 dB higher than the MPEG-4 FGS codec.

Naturalmente, fermo restando il principio dell’invenzione, i particolari di costruzione e le forme di attuazione potranno ampiamente variare rispetto a quanto descritto ed illustrato a puro titolo di esempio, senza per questo uscire dall'ambito della presente invenzione. Naturally, the principle of the invention remaining the same, the details of construction and the embodiments may vary widely with respect to those described and illustrated purely by way of example, without thereby departing from the scope of the present invention.

Claims (15)

RIVENDICAZIONI 1. Procedimento di codifica di sorgente di segnali di immagine di tipo scalabile, in particolare per trasmissione su canali con trasmissione a pacchetto di reti di telecomunicazioni, che comprende di operare su una sequenza (S) di immagini digitali organizzate in frame (FI, FP, I, P) una codifica di tipo layered per ottenere una pluralità di layer (I<l>, P<l>), comprendenti un Base Layer (I<0>, P<0>) cui à ̈ associato un primo livello di qualità d’immagine e uno o più Enhancement Layer (I<l>, P<l>) cui sono associati rispettivi maggiori livelli di qualità d’immagine, caratterizzato dal fatto che detto procedimento di codifica comprende inoltre di operare una codifica alle descrizioni multiple (12) di ciascuno di detti layer (I<l>, P<l>), detta codifica alle descrizioni multiple (12) comprendendo le operazioni di: dividere (13) ciascuno di detti layer (I<l>, P<l>) in una rispettiva matrice di blocchi (B1…BN), ciascuno indipendente l’uno dall’altro, in detta matrice di blocchi (B1…BN) del layer (I<l>, P<l>) selezionare (14) blocchi per la trasmissione tramite i passi di: calcolare (144) per ciascun blocco corrente ( ) di detto layer (I<l>, P<l>), a livello di blocco, uno stimatore di differenza (mse) rispetto a un corrispondente blocco di un frame precedente ( ), e paragonare (145) detto stimatore (mse) con una soglia impostabile (THmse) di differenza per valutare se trasmettere il blocco corrente ( ). CLAIMS 1. A method of coding the source of image signals of a scalable type, in particular for transmission on channels with packet transmission of telecommunications networks, which comprises operating on a sequence (S) of digital images organized in frames (FI, FP , I, P) a layered coding to obtain a plurality of layers (I <l>, P <l>), including a Base Layer (I <0>, P <0>) which is associated with a first level of image quality and one or more Enhancement Layers (I <l>, P <l>) which are associated with respective higher levels of image quality, characterized by the fact that said encoding procedure further comprises encoding the multiple descriptions (12) of each of said layers (I <l>, P <l>), said coding to multiple descriptions (12) including the operations of: divide (13) each of said layers (I <l>, P <l>) into a respective matrix of blocks (B1â € ¦BN), each independent of each other, in said matrix of blocks (B1â € ¦BN) of the layer (I <l>, P <l>) select (14) blocks for transmission through the steps of: calculate (144) for each current block () of said layer (I <l>, P <l>), at the block level, a difference estimator (mse) with respect to a corresponding block of a previous frame (), and compare (145) said estimator (mse) with a settable threshold (THmse) of difference to evaluate whether to transmit the current block (). 2. Procedimento secondo la rivendicazione 1, caratterizzato dal fatto che l’operazione di calcolare (144) detto stimatore di differenza (mse) comprende valutare un errore quadratico medio fra valori di pixel ( ) di detto blocco corrente ( ) e del corrispondente blocco ( ) di un frame precedente. 2. Process according to claim 1, characterized in that the operation of calculating (144) said difference estimator (mse) comprises evaluating a mean square error between pixel values () of said current block () and of the corresponding block () of a previous frame. 3. Procedimento secondo la rivendicazione 1 o 2, caratterizzato dal fatto che comprende inoltre di calcolare (149) per ogni blocco corrente ( ) un valore di aging (aj) che viene incrementato ogni volta che il blocco corrente ( ) viene scartato per la trasmissione a seguito di detta operazione di paragone (145), e resettato (146) quando il blocco viene trasmesso, e di confrontare (148) detto valore di aging (aj) con una soglia di aging (Ath,tx), trasmettendo comunque il blocco corrente ( ) se il corrispondente valore di aging (aj) supera detta soglia di aging (Ath,tx). Method according to claim 1 or 2, characterized in that it further comprises calculating (149) for each current block () an aging value (aj) which is incremented each time the current block () is discarded for transmission following said comparison operation (145), and reset (146) when the block is transmitted, and to compare (148) said aging value (aj) with an aging threshold (Ath, tx), transmitting the block anyway current () if the corresponding aging value (aj) exceeds said aging threshold (Ath, tx). 4. Procedimento secondo la rivendicazione 1 o 2 o 3, caratterizzato dal fatto che detta operazione di codifica layered (11) comprende di ottenere un Base Layer (I<0>) da un intra-frame (FI) in detta sequenza (S) operando una codifica con compressione di detto intra-frame (FI) dopo un filtraggio passabasso e un downsampling e di ottenere almeno un Enhancement Layer (I<l>) sottraendo a intra-frame (FI) originale uno o più frame ricostruiti da layer inferiori, codificando la differenza risultante a una risoluzione data e a un coefficiente di compressione dato. 4. Process according to claim 1 or 2 or 3, characterized in that said layered coding operation (11) comprises obtaining a Base Layer (I <0>) from an intra-frame (FI) in said sequence (S) by carrying out an encoding with compression of said intra-frame (FI) after a low-pass filtering and a downsampling and to obtain at least one Enhancement Layer (I <l>) by subtracting one or more frames reconstructed from lower layers from the original intra-frame (FI) , encoding the resulting difference at a given resolution and a given compression coefficient. 5. Procedimento secondo la rivendicazione 4, caratterizzato dal fatto che detta codifica layered comprende di ottenere un Base Layer (P<0>) da un inter-frame (FP) in detta sequenza (S) operando una compressione della differenza fra detto inter-frame (FP), prima compresso e poi decompresso, e di detto Base Layer (I<0>), decompresso, dell’inter-frame (FP). 5. Process according to claim 4, characterized in that said layered coding comprises obtaining a Base Layer (P <0>) from an inter-frame (FP) in said sequence (S) by compressing the difference between said inter-frame frame (FP), first compressed and then decompressed, and of said Base Layer (I <0>), decompressed, of the inter-frame (FP). 6. Procedimento secondo la rivendicazione 4 o 5, caratterizzato dal fatto che detta sequenza (S) comprende un intra-frame (FI) e uno o più inter-frame (FP) riferiti a detto intra-frame (FI). 6. Process according to claim 4 or 5, characterized in that said sequence (S) comprises an intra-frame (FI) and one or more inter-frames (FP) referred to said intra-frame (FI). 7. Procedimento secondo una o più delle rivendicazioni da 4 a 6, caratterizzato dal fatto che detta operazione di codifica con compressione à ̈ una codifica JPEG. 7. Process according to one or more of claims 4 to 6, characterized in that said compression coding operation is a JPEG coding. 8. Procedimento di decodifica di segnali di immagine codificati secondo il procedimento di codifica secondo una o più delle rivendicazioni da 1 a 7, caratterizzato dal fatto che comprende di operare una corrispondente decodifica di tipo layered per ottenere da detti Base Layer (I<0>, P<0>) e Enhancement Layer (I<l>, P<l>) trasmessi una pluralità di frame ricostruiti (IQO, IQ1, IQ2, PQO, PQ1, PQ2) cui sono associati differenti livelli di qualità d’immagine. 8. Process for decoding coded image signals according to the coding process according to one or more of claims 1 to 7, characterized in that it comprises operating a corresponding layered decoding to obtain from said Base Layer (I <0> , P <0>) and Enhancement Layer (I <l>, P <l>) transmitted a plurality of reconstructed frames (IQO, IQ1, IQ2, PQO, PQ1, PQ2) which are associated with different levels of image quality . 9. Procedimento di decodifica secondo la rivendicazione 8, caratterizzato dal fatto che comprende di calcolare un rispettivo parametro di contatore di aging di ricezione (aj,rx) e impostare una soglia di aging di ricezione (Ath,rx), incrementare ogni volta che il blocco corrente ( ) viene tralasciato in trasmissione, o comunque non correttamente ricevuto, detto contatore di aging di ricezione (aj,rx) e sostituire il blocco corrente ( ) con il blocco precedente ( ), detta operazione di sostituzione essendo eseguita solo fino a quando il parametro di contatore di aging di ricezione (aj,rx) raggiunge la soglia di aging di ricezione (Ath,rx). 9. Decoding method according to claim 8, characterized in that it comprises calculating a respective reception aging counter parameter (aj, rx) and setting a reception aging threshold (Ath, rx), increasing each time the current block () is omitted in transmission, or in any case not correctly received, said reception aging counter (aj, rx) and replace the current block () with the previous block (), said replacement operation being performed only until the receive aging counter parameter (aj, rx) reaches the receive aging threshold (Ath, rx). 10. Procedimento di codifica di segnali di immagine secondo una o più delle rivendicazioni da 1 a 8 e decodifica secondo una o più delle rivendicazioni da 8 a 9, caratterizzato dal fatto che comprende di regolare detta soglia impostabile (THmse) e dette soglie di aging (Ath,tx, Ath,rx) per la trasmissione e la ricezione trovando i corrispondenti valori che minimizzano una distorsione attesa (E[D]) della sequenza (S) di immagini digitali, rispetto a valori dati di tasso di perdita di pacchetto (Plr), bit medi per frame ( ) e lunghezza di pacchetto (Sp) caratteristici di una rete di comunicazione in cui la sequenza (S) di immagini digitali à ̈ trasmessa. 10. Process for coding image signals according to one or more of claims 1 to 8 and decoding according to one or more of claims 8 to 9, characterized in that it comprises regulating said settable threshold (THmse) and said aging thresholds (Ath, tx, Ath, rx) for transmission and reception by finding the corresponding values that minimize an expected distortion (E [D]) of the sequence (S) of digital images, with respect to given values of packet loss rate ( Plr), average bits per frame () and packet length (Sp) characteristic of a communication network in which the sequence (S) of digital images is transmitted. 11. Apparato di codifica di segnali di immagine in una sequenza (S) di immagini digitali, in particolare per trasmissione su canali con trasmissione a pacchetto di reti di telecomunicazioni, caratterizzato dal fatto che à ̈ configurato per implementare il procedimento di codifica secondo una o più delle rivendicazioni da 1 a 7. 11. Apparatus for coding image signals in a sequence (S) of digital images, in particular for transmission on channels with packet transmission of telecommunications networks, characterized in that it is configured to implement the coding process according to one or more than claims 1 to 7. 12. Apparato di codifica secondo la rivendicazione 11, caratterizzato dal fatto che comprende un modulo (11, 41) configurato per realizzare dette operazioni di codifica layered e un modulo (12) configurato per operare detta operazione di codifica alle descrizioni multiple di ciascuno di detti layer, che comprende moduli per dividere (13) ciascuno di detti layer (I<l>, P<l>) in una matrice di blocchi (B1…BN), ciascuno indipendente l’uno dall’altro e moduli (14) per operare in detta matrice di blocchi dello strato (I<l>, P<l>) una selezione di blocchi per la trasmissione. 12. Coding apparatus according to claim 11, characterized in that it comprises a module (11, 41) configured to perform said layered coding operations and a module (12) configured to perform said coding operation on the multiple descriptions of each of said layer, which includes modules to divide (13) each of said layers (I <l>, P <l>) into a matrix of blocks (B1â € ¦BN), each independent of each other and modules ( 14) to operate in said block matrix of the layer (I <l>, P <l>) a selection of blocks for transmission. 13. Apparato di codifica secondo la rivendicazione 11 o 12, caratterizzato dal fatto che detti moduli (14) per operare in detta matrice di blocchi dello strato (I<l>, P<l>) una selezione di blocchi per la trasmissione sono inoltre configurati per calcolare per ogni blocco corrente ( ) un valore di aging (aj) e confrontare detto valore di aging (aj) con una soglia di aging (Ath,tx), trasmettendo comunque il blocco corrente ( ) se il corrispondente valore di aging (aj) supera detta soglia di aging (Ath,tx). 13. Coding apparatus according to claim 11 or 12, characterized in that said modules (14) to operate in said block matrix of the layer (I <l>, P <l>) a selection of blocks for transmission are also configured to calculate an aging value (aj) for each current block () and compare said aging value (aj) with an aging threshold (Ath, tx), still transmitting the current block () if the corresponding aging value ( aj) exceeds said aging threshold (Ath, tx). 14. Apparato di decodifica configurato per implementare il procedimento di decodifica secondo la rivendicazione 8 o 9 caratterizzato dal fatto che comprende un modulo configurato per calcolare un rispettivo parametro di contatore di aging di ricezione (aj,rx) e impostare una soglia di aging di ricezione (Ath,rx), incrementare ogni volta che il blocco corrente ( ) viene tralasciato in trasmissione, o comunque non correttamente ricevuto, detto contatore di aging di ricezione (aj,rx) e sostituire il blocco corrente ( ) con il blocco precedente ( ), detta operazione di sostituzione essendo eseguita solo fino a quando il parametro di contatore di aging di ricezione (aj,rx) raggiunge la soglia di aging di ricezione (Ath,rx). 14. Decoding apparatus configured to implement the decoding method according to claim 8 or 9 characterized in that it comprises a module configured to calculate a respective reception aging counter parameter (aj, rx) and set a reception aging threshold (Ath, rx), increment each time the current block () is omitted in transmission, or in any case not correctly received, called reception aging counter (aj, rx) and replace the current block () with the previous block () , said replacement operation being performed only until the reception aging counter parameter (aj, rx) reaches the reception aging threshold (Ath, rx). 15. Prodotto informatico direttamente caricabile nella memoria di un elaboratore numerico e comprendente porzioni di codice software per attuare il procedimento secondo una qualsiasi delle rivendicazioni da 1 a 9 quando il prodotto à ̈ eseguito su un elaboratore. Il tutto sostanzialmente come descritto ed illustrato e per gli scopi specificati.15. Computer product which can be directly loaded into the memory of a digital computer and comprising portions of software code for carrying out the method according to any one of claims 1 to 9 when the product is executed on a computer. All substantially as described and illustrated and for the specified purposes.
ITTO2010A000311A 2010-04-16 2010-04-16 "PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH" IT1399565B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ITTO2010A000311A IT1399565B1 (en) 2010-04-16 2010-04-16 "PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH"

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ITTO2010A000311A IT1399565B1 (en) 2010-04-16 2010-04-16 "PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH"

Publications (2)

Publication Number Publication Date
ITTO20100311A1 true ITTO20100311A1 (en) 2011-10-17
IT1399565B1 IT1399565B1 (en) 2013-04-19

Family

ID=43034401

Family Applications (1)

Application Number Title Priority Date Filing Date
ITTO2010A000311A IT1399565B1 (en) 2010-04-16 2010-04-16 "PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH"

Country Status (1)

Country Link
IT (1) IT1399565B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT202100004073A1 (en) 2021-02-22 2022-08-22 Stefano Ficco CONCEALED ZIPPER

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0485230A2 (en) * 1990-11-09 1992-05-13 Victor Company Of Japan, Ltd. Moving picture signal progressive coding system
WO1993020650A1 (en) * 1992-03-27 1993-10-14 British Telecommunications Public Limited Company Layered video coder
WO2003036983A2 (en) * 2001-10-26 2003-05-01 Koninklijke Philips Electronics N.V. Spatial scalable compression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0485230A2 (en) * 1990-11-09 1992-05-13 Victor Company Of Japan, Ltd. Moving picture signal progressive coding system
WO1993020650A1 (en) * 1992-03-27 1993-10-14 British Telecommunications Public Limited Company Layered video coder
WO2003036983A2 (en) * 2001-10-26 2003-05-01 Koninklijke Philips Electronics N.V. Spatial scalable compression

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"MPEG DIGITAL VIDEO-CODING STANDARDS - DELIVERING PICTURE-PERFECT COMPRESSION FOR STORAGE, TRANSMISSION, AND MULTIMEDIA APPLICATIONS", IEEE SIGNAL PROCESSING MAGAZINE, IEEE SERVICE CENTER, PISCATAWAY, NJ, US LNKD- DOI:10.1109/79.618010, vol. 14, no. 5, 1 September 1997 (1997-09-01), pages 82 - 100, XP011089789, ISSN: 1053-5888 *
STEVEN MCCANNE ET AL: "Low-Complexity Video Coding for Receiver-Driven Layered Multicast", IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, IEEE SERVICE CENTER, PISCATAWAY, US, vol. 15, no. 6, 1 August 1997 (1997-08-01), XP011054678, ISSN: 0733-8716 *
SULLIVAN G J ET AL: "RATE-DISTORTION OPTIMIZATION FOR VIDEO COMPRESSION", IEEE SIGNAL PROCESSING MAGAZINE, IEEE SERVICE CENTER, PISCATAWAY, NJ, US LNKD- DOI:10.1109/79.733497, vol. 15, no. 6, 1 November 1998 (1998-11-01), pages 74 - 90, XP011089821, ISSN: 1053-5888 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT202100004073A1 (en) 2021-02-22 2022-08-22 Stefano Ficco CONCEALED ZIPPER

Also Published As

Publication number Publication date
IT1399565B1 (en) 2013-04-19

Similar Documents

Publication Publication Date Title
KR100942395B1 (en) Rate control for multi-layer video design
CN103299627B (en) Frame division in video coding
JP5280003B2 (en) Slice layer in video codec
JP5007322B2 (en) Video encoding method
US7826527B2 (en) Method for video data stream integration and compensation
JP4829581B2 (en) Method and apparatus for encoding a sequence of images
KR20140120891A (en) Method and apparatus for efficient transform unit encoding
KR101353165B1 (en) Method and arrangement for jointly encoding a plurality of video streams
CN105103554A (en) Method for protecting video frame sequence against packet loss
CN113228667B (en) Video encoding and decoding method, device and storage medium
CN101755464A (en) Line based video rate control and compression
KR20130108948A (en) Image encoding method using adaptive preprocessing
CN110351552B (en) Fast coding method in video coding
KR20190033771A (en) Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method
Carreira et al. Selective motion vector redundancies for improved error resilience in HEVC
ITTO20100311A1 (en) &#34;PROCEDURE FOR CODIFYING / DECODING VIDEO / IMAGE SIGNALS WITH MULTIPLE DESCRIPTION AND ITS CODIFICATION / DECODING APPROACH&#34;
JP2010010917A (en) Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, and dynamic image decoding method
KR100942700B1 (en) Fine-granular scalability coding/decoding method and apparatus
Ha et al. Packet loss resilience using unequal forward error correction assignment for video transmission over communication networks
EP3496405A1 (en) Devices and methods for video reconstruction from multiple source videos
KR100998754B1 (en) Method of object oriented rate control and error concealment for video transmission and receiving in video conference
Zhang et al. Estimation of the utilities of the NAL units in H. 264/AVC scalable video bitstreams
Madala Study of the Impact of Encoder Parameters and Unequal Error Protection Scheme on HEVC Performance on Fading Channels
Parameswaran et al. Adapting quantization offset in multiple description coding for error resilient video transmission
Rhaiem et al. New robust decoding scheme-aware channel condition for video streaming transmission