ITMI20130785A1

ITMI20130785A1 - Codifica near-real time di un segnale lineare

Info

Publication number: ITMI20130785A1
Application number: IT000785A
Authority: IT
Inventors: Massimo Bertolotti; Stefano Crespi
Original assignee: Sky Italia S R L
Priority date: 2013-05-13
Filing date: 2013-05-13
Publication date: 2014-11-14
Also published as: US9973770B2; MY179715A; WO2014184632A1; EP2997734B1; US20160127737A1; EP2997734A1

Description

"Codifica near-real time di un segnale lineare"

DESCRIZIONE

La presente invenzione si riferisce alla codifica di segnali lineari, in particolare la codifica near-real time di un segnale video compreso in flusso lineare.

ANTEFATTO DELL'INVENZIONE

Attualmente la trasmissione di canali e contenuti, in modalitÃ broadcast (Satellite, Cavo, Terrestre) Ã ̈ basata sul concetto di avere un sistema di playout che emette, attraverso una playlist, in modo sequenziale una serie di canali e/o di contenuti. I canali possono essere inviati in formato SDÃŒ (Serial Digital Interface) o attraverso flussi IP (Internet Protocol) su rete Ethernet, verso un sistema di compressione rea time, il quale tipicamente Ã ̈ composto da uno o piÃ¹ encoder (ad esempio conformi alle norme MPEG2, MPEG4, AVC, H.264) che effettuano la compressione sia in modalitÃ CBR (Constant Bit Rate, ovvero alle componenti audio, video e dati del canale vengono assegnati dei parametri e un bit rate fisso) sia VBR (Variable Bit Rate) . In particolare il processo VBR sfrutta, frame per frame, una statistica per dare piÃ¹ banda al canale (di un gruppo di canali) che ha contenuti richiedenti maggiore banda cosÃ¬ da avere una buona qualitÃ rispetto ad altri canali che nello stesso frame richiedono meno banda; in tal modo, ad esempio, Ã ̈ possibile mantenere fissa la banda totale (ad esempio di un transponder e/o un Mux digitale terrestre) dei diversi canali del gruppo.

La gestione della compressione, pur ottimizzata dal processo VBR, ad oggi Ã ̈ basata su una compressione reai time con una latenza, ossia la differenza di tempo tra l'istante in cui un frame entra nell'encoder a l'istante in cui ne esce compresso, che varia da pochi millisecondi a qualche secondo (ad esempio due secondi). L'encoder si trova quindi ad avere a disposizione solo pochi frame da analizzare; le routine di compressione non possono quindi effettuare delle analisi accurate del video, il che determina un limite alla capacitÃ di riduzione (compressione) del flusso video in termini di rapporto tra qualitÃ e dimensione del flusso dati (bit rate o banda) confrontato con quanto riescono a ottenere gli encoder che lavorano off-line (ad esempio gli encoder per il VOD, Video On Demand) e che quindi hanno la possibilitÃ di analizzare l'intero video.

Pertanto, le codifiche note e attualmente applicate a flussi lineari di contenuto richiedono di una banda di trasmissione elevata per le ragioni sopra esposte

SOMMARIO DELL'INVENZIONE

La presente invenzione ha quale oggetto quello di ovviare ai problemi legati alle tecniche note di codifica di flussi lineari.

Un primo aspetto dell'invenzione prevede un metodo per la codifica near-real time di un segnale comprendente almeno un segnale video, il metodo comprendente le fasi di :

acquisire il segnale video incluso in un flusso lineare, in cui il flusso lineare comprende almeno due contenuti senza distinzione logica fra gli stessi;

suddividere il segnale video in almeno un primo e secondo segmento di rispettive durate prefissate, almeno uno dei due segmenti essendo adatto a contenere almeno una parte dei due contenuti e comprendente informazioni di ricomposizione;

effettuare una prima codifica del primo segmento utilizzando una codifica off-line per ottenere un primo segmento codificato;

- effettuare una seconda codifica del secondo segmento utilizzando una codifica off-line per ottenere un secondo segmento codificato, in cui la seconda codifica Ã ̈ effettuata almeno parzialmente in parallelo con la prima codifica;

ricomporre, utilizzando le informazioni di ricomposizione, il primo segmento codificato e il secondo segmento codificato per ottenere un segnale continuo codificato.

Un secondo aspetto dell'invenzione prevede un'entitÃ per la codifica near-real time di un segnale comprendente almeno un segnale video, il dispositivo comprendente: - mezzi di acquisizione per acquisire il segnale video incluso in un flusso lineare, il flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi;

- mezzi di suddivisione per suddividere il segnale video in almeno un primo segmento ed un secondo segmento di durata prefissata, almeno uno dei segmenti essendo adatto a contenere almeno una parte dei due contenuti e comprendente informazioni di ricomposizione;

mezzi di prima codifica per effettuare una prima codifica del primo segmento utilizzando una codifica off-line per ottenere un primo segmento codificato; - mezzi di seconda codifica per effettuare una seconda codifica del secondo segmento utilizzando una codifica off-line per ottenere un secondo segmento codificato, detta seconda codifica essendo effettuata almeno parzialmente in parallelo con la prima codifica;

- mezzi di ricomposizione per ricomporre, utilizzando dette informazioni di ricomposizione, il primo e secondo segmento codificato per ottenere un segnale continuo codificato .

Un terzo aspetto dell'invenzione prevede un metodo per il trattamento di un segnale da sottoporre a codifica near-real time, detto segnale comprendente almeno un segnale video, detto metodo comprendente le fasi di:

acquisire il segnale video incluso in un flusso lineare, detto flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi;

suddividere il segnale video in almeno un primo segmento e secondo segmento ciascuno avente rispettiva durata prefissata, ciascuno dei segmenti essendo adatto a contenere almeno una parte di detti due contenuti senza distinzione logica e comprendente informazioni di ricomposizione ,

Un quarto aspetto dell'invenzione prevede un programma per elaboratore predisposto per eseguire, quando detto programma Ã ̈ eseguito su un computer, tutte le fasi secondo uno qualsiasi dei metodi previsti dagli aspetti su descritti.

LISTA DELLE FIGURE

La figura 1 illustra un diagramma di flusso di un metodo per codificare segnali in near reai time secondo una prima forma di realizzazione;

La figura 2 illustra un diagramma a blocchi di un'entitÃ per codificare segnali in near reai time secondo una seconda forma di realizzazione;

La figura 3 illustra un diagramma di flusso di un metodo per il trattamento di un segnale da sottoporre a codifica near-reai time secondo una terza forma di realizzazione,·

La figura 4 illustra un diagramma a blocchi di un'entitÃ per il trattamento di un segnale da sottoporre a codifica near- reai time secondo una quarta forma di realizzazione;

La figura 5 illustra un esempio per la codifica di segnali in near reai time;

DESCRIZIONE DETTAGLIATA

Gli inventori, sulla base delle loro considerazioni e analisi delle tecniche note di codifica di canali lineari, hanno osservato che una possibilitÃ per migliorare il rapporto fra qualitÃ e bit rate Ã ̈ l'utilizzo di un processo di compressione off-line. La compressione off-line Ã ̈ infatti particolarmente efficiente: a paritÃ di qualitÃ dell'output puÃ² comprimere il contenuto il 4 0% in piÃ¹ di una compressione reai time. Tuttavia, richiede un processo lungo e accurato, perchÃ© l'intero contenuto puÃ² dover essere processato piÃ¹ volte; al fine di mantenere un elevato livello di qualitÃ , inoltre, il segnale codificato va analizzato per rilevare imperfezioni nel processo di compressione; le imperfezioni rilevate possono quindi essere rimosse e/o corrette. Questo processo accurato puÃ² richiedere 2-3 volte il tempo di durata del singolo contenuto. Si fa tuttavia notare che la compressione off-line processa singoli contenuti e non flussi continui di contenuti, ossia contenuti che hanno un inizio e una fine. Il prodotto della compressione, anche quando viene messo in sequenza, non perde questa individualitÃ . Infatti, i contenuti compressi off-line, ove riuniti in sequenza, non hanno una fine che combacia perfettamente con l'inizio del contenuto successivo e per garantire la giunzione fra i contenuti Ã ̈ necessario inserire degli elementi "a nero". CiÃ² Ã ̈ dovuto al fatto che i contenuti off-line, anche quando riuniti in sequenza, sono unitÃ logiche distinte poichÃ© appartengono a due unitÃ distinte, ad esempio a due file distinti o a due flussi di dati distinti. PiÃ¹ in particolare, in un contenuto compresso {sia esso un file o un flusso) ogni frame Ã ̈ contraddistinto da due â€žcontatori", PTS (Presentation TimeStamp) e DTS (Display TimeStamp) . Il primo numera la sequenza di trasmissione dei frames, mentre il secondo indica l'ordine di riproduzione. Questi numeri devono essere monotonicamente crescenti all'interno del contenuto, e normalmente il primo frame del contenuto ha un numero scelto casualmente. Concatenando due contenuti Ã ̈ molto probabile che i due contatori violino il vincolo di crescita monotonica. CiÃ² rende necessario inizializzare, oltre ad altri parametri, i due contatori quando si comincia a processare un secondo contenuto. Questo rende la riproduzione di due contenuti separati codificati offline non adatta alla riproduzione lineare.

Grazie alla presente soluzione, Ã ̈ possibile ottenere un processo di codifica che possa garantire una compressione con un efficienza maggiore di quella attualmente disponibile sul mercato offerta dai provider di tecnologia, mantenendo invariati i processi di playout, compressione e trasmissione, ossia senza richiedere modifiche sostanziali all'architettura delle soluzioni esistenti.

Gli inventori hanno tuttavia riconosciuto, tra gli altri fattori, il problema che nella compressione reai time, notoriamente applicata alla codifica di canali lineari, la codifica deve essere eseguita in tempi ragionevolmente veloci che non consentono di ottenere un fattore di compressione particolarmente elevato, poichÃ© questo richiederebbe diverse elaborazioni sul segnale e dei controlli di qualitÃ non fattibili in tempi veloci. Nel caso invece di una compressione piÃ¹ accurata come quella off-line, il delay Ã ̈ estremamente elevato. In aggiunta, la compressione off-line non Ã ̈ adatta alla compressione di canali lineari, poichÃ© questa opera su ciascun contenuto come unitÃ logica a sÃ© stante e quindi non Ã ̈ in grado di processare un flusso continuo in cui due o piÃ¹ unitÃ di contenuto sono state congiunte senza distinzione logica.

Muovendosi dalle considerazioni di cui sopra e sulla base dei propri riconoscimenti, gli inventori propongono un sistema per ottimizzare le procedure di compressione dei contenuti destinati alla distribuzione in broadcasting. In particolare, si suggerisce di sfruttare i meccanismi di compressione off-line gestendoli in un tempo tale da garantire un delay configurabile e prevedibile, il delay essendo preferibilmente compreso tra una decina di secondi e qualche minuto. Questa modalitÃ di codifica puÃ² definirsi Near Live o Near Reai Time e verrÃ illustrata nel seguito con riferimento alle diverse forme di realizzazione, loro varianti nonchÃ© esempi ,

Con riferimento alla figura 1, verrÃ illustrata una prima forma di realizzazione dell'invenzione relativa ad un metodo per la codifica near-real time di un segnale comprendente almeno un segnale video. Per codifica nearreal time si intende una codifica in cui la latenza (delay) introdotta dalla codifica Ã ̈ costante (o anche pressochÃ© costante, come piÃ¹ avanti illustrato) e configurabile i cui valori tipici sono preferibilmente compresi tra una decina di secondi e qualche minuto (i valori sono illustrativi e non limitanti).

Nella fase S100 il metodo acquisisce un segnale video incluso in un flusso lineare. Il flusso lineare, o anche canale lineare, comprende almeno due contenuti senza distinzione logica fra gli stessi. Per contenuto si intende almeno uno tra servizi audio, video e dati corrispondenti a quelli usufruibili dall'utente. Sottotitoli o applicazioni (interattive o non) sono esempi del servizio dati. Esempi di contenuto sono film, pubblicitÃ , promo, varietÃ , etc. Pertanto, un flusso lineare comprendente il segnale video acquisito include perlomeno due servizi video (come giÃ detto, senza distinzione logica tra gli stessi). La non distinzione (o continuitÃ ) logica indica che i due contenuti, ad esempio i due servizi video, sono sequenziali senza interruzioni temporali e logiche. Per quanto visto prima nell'esempio precedente, i due contenuti sono caratterizzati da PTS e DTS aventi una sequenza corretta. Nel caso in cui sia desiderata un'interruzione intenzionale tra due video rappresentanti due programmi televisivi, ad esempio una pausa o uno stacco (ad esempio a nero), il flusso conterrÃ tale interruzione interposta tra i due programmi e senza essere separata logicamente dalle due unitÃ rappresentanti i programmi stessi. In tal senso, l'interruzione puÃ² essere considerata come un'unitÃ di contenuto (o un servizio video) frapposta fra i due programmi televisivi e logicamente contÃ¬nua con i programmi stessi all'interno del flusso lineare. Il processo di acquisizione della fase S100 puÃ² essere effettuato attraverso un'apposita scheda di acquisizione montata ad esempio su un server, o dai mezzi di acquisizione 210 con riferimento alla figura 2 piÃ¹ avanti illustrata. Il segnale acquisito puÃ² essere in un qualsiasi formato noto nell'arte, ad esempio in formato SD , HD-SDI, MPEG-2, MPEG-4, AVC, H.2 64, etc... Il segnale acquisito, se in un formato MPEG-2, MPEG-4, AVC, H.264, etc., puÃ² essere ottenuto applicando una codifica, ad esempio reai time, su un segnale digitale (o analogico dopo opportuna conversione) il quale puÃ² ad esempio essere disponibile nel formato SDÃŒ o HS-SDI.

In una fase S200 il segnale video Ã ̈ suddiviso in almeno un primo segmento ed un secondo segmento di rispettive durate prefissate (come diverrÃ evidente piÃ¹ avanti, i due segmenti possono avere diversa lunghezza a causa di scarti o tolleranze diverse o perchÃ© la lunghezza viene riconfigurata) . La durata prefissata puÃ² essere stabilita una volta per sempre o variata periodicamente in maniera manuale, ad esempio attraverso la configurazione di un operatore, o automatica, ad esempio per mezzo di un dispositivo di supervisione che altera ciclicamente la durata del segmento o sulla base di allarmi o analisi sul segnale. Per durata prefissata si intende una durata stabilita o una durata stabilita piÃ¹ o meno uno scarto stabilito come piÃ¹ avanti spiegato.

Pertanto, Ã ̈ possibile che due segmenti consecutivi in cui viene suddiviso il flusso lineare possano avere una durata diversa, sia perchÃ© la durata prefissata Ã ̈ stata nel contempo variata o perchÃ© Ã ̈ variata all'interno della tolleranza corrispondente allo scarto stabilito. Ciascuno di detti segmenti Ã ̈ adatto a contenere almeno una parte dei due contenuti menzionati. CiÃ² significa che ciascun segmento {in cui il flusso viene suddiviso) non deve necessariamente contenere parte di tutti e due i contenuti; deve perÃ² essere predisposto affinchÃ© questo avvenga quando necessario. In tal senso, un segmento in cui viene suddiviso il flusso lineare Ã ̈ diverso da un GOP, poichÃ© infatti un GOP per definizione puÃ² contenere solo una parte relativa ad un contenuto e non contemporaneamente parti relative a due contenuti, essendo i due contenuti distinti e relativi a due unitÃ logiche distinte. Si consideri l'esempio di un programma di news seguito da uno stacco pubblicitario, a sua volta seguito da un programma meteo. Nella suddivisione del flusso, molti dei segmenti conterranno solo una parte di una delle tre unitÃ costituenti il flusso, mentre sarÃ possibile che almeno due segmenti comprendano ciascuno una parte di due flussi distinti (in particolare, un segmento conterrÃ con buona probabilitÃ parte delle news e parte della pubblicitÃ ; un altro segmento, consecutivo o lontano dall'altro, potrÃ contenere parte della pubblicitÃ e parte del meteo) . Nel caso in cui un contenuto, ad esempio il programma meteo, sia piÃ¹ corto della lunghezza di un segmento, vi sarÃ anche il caso in cui un segmento comprenda un'unitÃ di contenuto nella sua totalitÃ . Non puÃ² poi escludersi il caso in cui un contenuto (ad esempio le news) finiscano esattamente in corrispondenza della fine di un segmento. Nel seguito verranno illustrati esempi in cui il segmento ha lunghezza di 1 o 2 minuti (eventualmente con la tolleranza imposta dallo scarto predeterminato) ; tuttavia, la soluzione qui descritta non si limita a tali valori. Infatti anche una diversa lunghezza del segmento Ã ̈ adatta, purchÃ© sia sufficientemente maggiore del numero di frame su cui lavora un encoder rea time. Ad esempio, nel caso in cui un encoder reai time lavori su una media di 12 frame, un segmento avrÃ una lunghezza pari ad almeno tre volte il numero di frame reai time, preferibilmente almeno 5 volte, e ancora preferibilmente 10 volte. Infatti, piÃ¹ il segmento Ã ̈ lungo rispetto al numero di frame su cui opera encoder rea time, piÃ¹ si potrÃ trarre vantaggio dalla codifica off line. Essendo tuttavia la lunghezza (e la sua tolleranza o scarto) configurabili, Ã ̈ possibile mantenere un delay prevedibile e controllabile.

I segmenti comprendono inoltre delle informazioni di composizione per consentire la ricostruzione del flusso lineare (codificato) una volta completata la compressione di ciascuno dei segmenti. Ãˆ infatti importante assicurarsi che i segmenti codificati (o in uscita) mantengano la stessa sequenza che i frame avevamo prima della segmentazione. Le informazioni di composizione, che nel seguito saranno anche indicate con il nome di informazioni di IN/OUT, sono rappresentate ad esempio da una numerazione progressiva assegnata a ciascun segmento, o da un identificativo univoco assegnato a ciascun segmento (' identificativo puÃ² essere associato ad esempio alla posizione relativa o assoluta del segmento nel flusso e/o al canale a cui il segmento appartiene, o un identificativo corrispondente o ricavato a partire da uno o ambedue i valori PTS e DTS piÃ¹ in alto citati, etc...).

In una fase S300 il metodo effettua una prima codifica del primo segmento utilizzando una codifica offline per ottenere un primo segmento codificato. La prima codifica del primo segmento puÃ² cominciare quando Ã ̈ stato ricevuto tutto il segmento o quando Ã ̈ stata ricevuta almeno una porzione dello stesso, la lunghezza della porzione dipendente dei parametri scelti per la codifica. In via opzionale e preferenziale, la codifica comincia quando una parte sostanziale del segmento Ã ̈ ricevuta dall'encoder addetto (ad esempio, si veda in alto, quando almeno 5, 7 o 10 volte il numero di frame di un encoder rea time sono stati ricevuti), al fine di poter effettuare un'analisi dettagliata su un numero rilevante di frame e ottenendo pertanto un fattore di compressione piÃ¹ elevato rispetto ad un algoritmo realtime operante su un numero di frame ben piÃ¹ limitato. Per codifica offline si intende qui una codifica senza vincoli temporali di rea -time, ossia con vincoli di tempo predefiniti e con igurabili. In altre parole, per codifica offline si intende una codifica i cui parametri sono impostati in modo da completare l'intero processo di codifica su un segmento in un intervallo di tempo prefissato (al limite entro una certa tolleranza) e configurabile; in un esempio tale intervallo Ã ̈ preferibilmente compreso tra la decina di secondi e qualche minuto. PoichÃ© Ã ̈ possibile analizzare un numero elevato di frame, eventualmente anche tutti i frame del segmento, Ã ̈ possibile ottenere un fattore di compressione piÃ¹ elevato rispetto al caso di una codifica real-time e senza comprometterne la qualitÃ . La presenza di due contenuti all'interno del segmento Ã ̈ tuttavia trasparente all'algoritmo di codifica offline poichÃ© i due contenuti sono sequenziali e senza distinzione logica. Questo accorgimento crea un distinguo rispetto all'utilizzo comune degli encoder offline: infatti, nella tecnica nota un encoder offline Ã ̈ applicato ad un primo contenuto e, a codifica di questo completata, ad un secondo contenuto, la giunzione dei quali richiede l'inserimento di una pausa artificiale e non controllabile (o non cosÃ¬ facilmente controllabile) e/o difficilmente configurabile. In contrasto, la segmentazione come su descritta consente di processare i due contenuti o parte dei due contenuti all'interno dello stesso segmento in maniera trasparente all'algoritmo di codifica offline. In altre parole, la codifica offline non deve conoscersi o preoccuparsi dell'inizio e della fine dei contenuti, ma deve solo processare ciascun segmento come un'unitÃ a sÃ© stante.

In una fase S400 viene effettuata una seconda codifica del secondo segmento utilizzando una codifica offline per ottenere un secondo segmento codificato. La codifica offline utilizzata nella fase S400 puÃ² essere preferibilmente la stessa di quella utilizzata nella prima codifica ma non necessariamente la stessa. In un esempio, i parametri di codifica applicati al primo segmento possono essere gli stessi o diversi da quelli applicati al secondo segmento. Come verrÃ illustrato piÃ¹ avanti, la prima e seconda codifica possono essere effettuate da due distinte unitÃ hardware, da una stessa unitÃ hardware le cui risorse sono opportunamente partizionate o da una qualsiasi combinazione hardware /software distribuita o concentrata. Si fa notare che la seconda codifica secondo la fase S400 Ã ̈ effettuata almeno parzialmente in parallelo con la prima codifica della fase S300. In altre parole, la seconda codifica comincia quando la prima codifica non Ã ̈ stata ancora completata. La seconda codifica puÃ² completarsi prima, contemporaneamente o dopo il completamento della prima codifica. Grazie all'esecuzione almeno parzialmente parallela, Ã ̈ piÃ¹ facile garantire che la codifica sia effettuata in un intervallo di tempo predefinito e configurabile e quindi evitare che il delay vada ad aumentare con il tempo e con il numero di segmenti processati. Tuttavia, non puÃ² escludersi il caso in cui per mezzo di ingenti risorse hardware /software sia possibile effettuare una codifica con compressione elevata di una prima porzione del segmento (quando ne Ã ̈ stato ad esempio ricevuto una porzione sostanziale, ad esempio almeno 5/7/10 volte il numero di fratrie di una codifica reai time) ed una codifica eventualmente con fattore di compressione minore - di una seconda parte del segmento di modo che la codifica totale del segmento sia completata in coincidenza o pochi frame dopo la ricezione dell'ultimo frame del segmento. In tale ipotesi i due segmenti potrebbero essere processati sequenzialmente cosÃ¬ da avere un delay all'incirca pari alla lunghezza del segmento (e della tolleranza o scarto se presente). Si fa riferimento anche all'esempio illustrato piÃ¹ in basso con riferimento alla figura 5.

Nella fase S500 vengono ricomposti il primo segmento codificato ed il secondo segmento codificato utilizzando le informazioni di ricomposizione cosi da ottenere un segnale continuo codificato. Il segnale cosÃ¬ ottenuto puÃ² quindi essere trasmesso in diffusione (ad esempio via satellite, digitale terrestre, internet, reti radio mobili, etc...), direttamente o dopo essere stato opzionalmente ulteriormente processato secondo le necessitÃ .

La codifica offline Ã ̈ tale da completare la codifica stessa (ossia le varie elaborazioni necessarie) del rispettivo segmento in un tempo inferiore o uguale ad un delay pre-configurato . Il delay pre-configurato puÃ² essere impostato una volta per tutte o puÃ² essere variato manualmente o automaticamente; la variazione puÃ² essere effettuata ad intervalli prestabiliti (ad esempio con una certa frequenza: ogni ora, giorno, o ogni numero M di segmenti) o sulla base di altre impostazioni, ad esempio allarmi o stato della qualitÃ del segnale in uscita. Il delay pre-configurato puÃ² anche essere messo in relazione con la lunghezza del segmento; ad esempio, puÃ² essere uguale in un esempio alla somma della lunghezza del segmento (e piÃ¹ in particolare alla durata prefissata, espressa in minuti, secondi, o millesimi di secondo) e di un intervallo predefinito (anch'esso espresso in un'unitÃ di tempo). L'intervallo predefinito Ã ̈ una quantitÃ maggiore o uguale di zero. In particolare, quando tale valore Ã ̈ uguale a zero, vorrÃ dire che il delay sarÃ uguale alla lunghezza del segmento (ossia alla durata prefissata) e che la codifica dovrÃ essere ultima quando l'ultimo frame del segmento Ã ̈ stato ricevuto (si veda piÃ¹ avanti: in questo caso la compressione degli ultimi frame sarÃ molto bassa o assente). Quando invece l'intervallo predefinito avrÃ un valore maggiore di zero, vuol dire che la codifica offline avrÃ piÃ¹ tempo a disposizione per codificare tutto il segmento una volta ricevuto l'ultimo fraine del segmento. Nell'esempio illustrativo di figura 5, la codifica dovrÃ essere ultimata in un tempo preconfigurato di 4 minuti. CiÃ² significa che una volta ricevuto l'ultimo frame del segmento, la codifica offline avrÃ ancora due minuti a disposizione per ultimare la codifica. In tal modo, Ã ̈ possibile controllare il delay complessivo ed evitare che questo vada ad accumularsi in maniera inaccettabile. La persona esperta del ramo riconosce che Ã ̈ possibile variare diversi fattori in vista delle esigenze, ed in particolare: lunghezza del segmento, delay e parametri di compressione (e/o potenza di calcolo). Ad esempio, fissato il delay desiderato, diminuendo la lunghezza del segmento Ã ̈ possibile lasciare piÃ¹ tempo alla codifica offline, che potrÃ quindi processare piÃ¹ approfonditamente i segmenti disponibili, e/o effettuare la codifica con risorse HW e/o SW meno performanti. Ragionamenti analoghi si applicano al caso in cui un segmento piÃ¹ lungo sia scelto. In maniera simile, allungando il delay, si potrÃ allungare la lunghezza del segmento (consentendo quindi alla codifica offline di analizzare piÃ¹ segmenti) e/o dare piÃ¹ tempo alla codifica offline per analizzare i frame del segmento.

Come su accennato, i suddetti primo e secondo segmenti sono distinti dai raggruppamenti di frame ottenuti tramite un noto algoritmo di codifica video quale MPEG2, MPEG4 o H.264 (in cui il GOP rappresenta un esempio del raggruppamento) . Infatti, il segmento puÃ² essere ottenuto a partire ad esempio da un segnale SDÃŒ che, anche qualora fosse compresso, non presenta una struttura con raggruppamenti di frame. Ãˆ importante inoltre osservare che la segmentazione si basa sulle considerazioni del delay configurabile e prevedibile, mentre il raggruppamento Ã ̈ determinato dall'encoder sulla base di considerazioni imposte dai parametri della codifica. In altre parole, la scelta della lunghezza del segmento Ã ̈ dettata o basata su una latenza desiderata, e indipendente da valutazioni relative alla codifica. PuÃ² dirsi pertanto che un raggruppamento di frame Ã ̈ effettuato sulla base di decisioni dell'algoritmo di codifica, mentre la segmentazione Ã ̈ fatta a priori o indipendentemente dai criteri che ne regolano la codifica. Nel caso in cui il segnale d'ingresso non comprenda un raggruppamento (ad esempio il caso in cui segnale acquisito nella fase S100 sia in un formato digitale ma non MPEG), la durata prefissata del segmento puÃ² essere pari ad un tempo predeterminato, ad esempio esattamente un minuto. In tal caso, il segnale d'ingresso, ad esempio in formato HD-SDI, verrÃ esattamente spezzettato in segmenti di un minuto (un minuto Ã ̈ un esempio non limitante; altri valori possono essere 10s o meno, 2min, lOmin, o anche piÃ¹). Nel caso in cui invece il segnale d'ingresso sia un segnale raggruppato (ad esempio in formato MPEG2, MPEG4, AVC, H.264, etc...), la durata prefissata del segmento potrÃ (ma non necessariamente dovrÃ ) essere uguale ad un tempo predeterminato piÃ¹ o meno un certo valore prestabilito che indicheremo con Î”, e che chiameremo anche scarto prestabilito. Il valore Î” (delta) puÃ² essere scelto uguale alla lunghezza massima prevedibile del GOP del segnale di ingresso, uguale alla durata media (prevista, statistica o basata sul flusso finora ricevuto) del GOP del segnale di ingresso, o uguale ad una quantitÃ a sua volta prestabilita per consentire che il segmento venga chiuso esattamente in corrispondenza della fine di un GOP del segnale di ingresso. Quanto detto verrÃ chiarito con un esempio: si supponga che il segnale di ingresso sia caratterizzato da un GOP a lunghezza variabile ma avente lunghezza media pari a 05s, e che la lunghezza del segmento debba essere pari a circa 1 minuto al fine di avere un delay pressochÃ© costante pari a circa un minuto. PoichÃ© la lunghezza Ã ̈ variabile, non puÃ² escludersi il caso in cui in corrispondenza del sessantesimo secondo del segmento in esame il GOP del segnale in ingresso non sia ancora finito: si ipotizzi che restino ancora N frame (ad esempio 10 frame) per chiuderlo. Impostando il delta ad un valore pari a dodici trame (nell'esempio, la lunghezza media del GOP di ingresso), il segnale di ingresso potrÃ essere suddiviso al sessantesimo secondo piÃ¹ dodici trame o al sessantesimo secondo meno due trame, ossia all'interno dell'intervallo (60s - Î”, 60s+ Î”). Altri esempi sono possibili, in cui l'intervallo in questione Ã ̈ (60s, 60s+ Î”) , (60s - Î”, 60s), (60s - Î”1, 60s+ Î”2) con Î”1 e Î”2 maggiori di o uguali a zero. In tal modo, si consente la chiusura del segmento con la chiusura del corrispondente GOP del segnale d'ingresso; ossia, l'ultimo trame del segmento coincide con l'ultimo trame di un GOP del segnale di ingresso. Si puÃ² pertanto dire che la durata prefissata corrisponde alla combinazione di un tempo predeterminato ed uno scarto prestabilito (negli esempi rappresentati rispettivamente da 60s e dal valore Î”). In altre parole, la durata prefissata Ã ̈ compresa in un intervallo temporale determinato dalla combinazione di un tempo predeterminato ed uno scarto prestabilito. Si fa inoltre notare quanto segue. Al fine di evitare che la latenza cresca eccessivamente con il tempo e con il passare dei segmenti, il Î” puÃ² essere variato periodicamente. Ad esempio, nel caso in cui dieci segmenti consecutivi venissero segmentati tutti per una lunghezza pari a un minuto piÃ¹ dodici trame, la segmentazione dei segmenti successivi potrÃ essere effettuata in anticipo (quindi con un delta negativo) per un certo numero di segmenti successivi fintanto che la latenza complessiva non rientri entro certi limiti.

La variazione del delta puÃ² essere quindi controllata sulla base della latenza complessiva misurata in un certo istante (o ad istanti campione) o sulla media delle latenze introdotte dagli ultimi M (con M grande a piacere) segmenti.

Secondo un primo esempio illustrativo, la codifica offline consente opzionalmente di processare piÃ¹ volte il singolo segmento o almeno parte di questo. Secondo un altro esempio, il segnale elaborato, processato uno o piÃ¹ volte come nel primo esempio, puÃ² essere analizzato per rilevare imperfezioni dovute al processo di compressione, le quali possono quindi essere opzionalmente rimosse e/o corrette.

Secondo un'opzione illustrativa, la codifica offline puÃ² comprendere la variazione della lunghezza del raggruppamento di frame. Ad esempio, nel caso di una codifica H.264, la codifica offline puÃ² decidere, dopo aver analizzato tutto il segmento o una parte sostanziale dello stesso, di variare la lunghezza del GOP all'interno del segmento in maniera tale da ottimizzare la compressione e la qualitÃ .Ad esempio, se l'analisi dell'intero (o parte del) segmento rivela la presenza di una scena statica, l'encoder potrÃ decidere di adottare un GOP molto lungo (ad esempio 5, 10 o piÃ¹ volte piÃ¹ lungo di quello che un encoder reai time avrebbe scelto) e quindi ottenendo un'elevata compressione non altrimenti raggiungibile da una compressione reai-time, poichÃ© quest' ultima non Ã ̈ in grado di analizzare molti rame nel futuro.

Secondo un'ulteriore opzione illustrativa, la codifica offline puÃ² comprendere il processare un segmento piÃ¹ volte al fine ad esempio di rilevare, rimuovere e/o correggere eventuali imperfezioni. Il ripetuto processare puÃ² comprendere anche applicare, in ciascuna iterazione, diversi parametri di compressione al fine di selezionare la migliore codifica al termine di un certo numero di iterazioni.

Nell'esempio in cui il segnale di ingresso sia raggruppato il segmento Ã ̈ costituito da un numero finito di raggruppamenti del segnale di ingresso. Come su giÃ spiegato, infatti, in tal caso la durata prefissata sarÃ pari ad un tempo predeterminato ed uno scarto Î” per sincerare che il segmento sia chiuso non in corrispondenza di un timer predefinito ma in corrispondenza dell'ultimo frame del GOP del segnale di ingresso, Ã ̈ inoltre pensabile il caso in cui si voglia effettivamente limitare la durata prefissata ad un tempo predeterminato {ossia con delta uguale a zero) , ad esempio un minuto, nonostante il segnale di ingresso sia raggruppato. In tal caso, sarÃ necessario decodificare il segnale di ingresso cosÃ¬ da ottenere un segnale intermedio scollegato dai vincoli della precedente codifica; in tal modo, sarÃ possibile suddividere o interrompere il segnale intermedio con il rame che cade esattamente in corrispondenza del sessantesimo secondo.

Secondo un ulteriore esempio, il segnale continuo codificato viene ricomposto insieme ad almeno uno tra un segnale audio ed un segnale dati. I segnali audio e dati possono essere compressi o meno. Pertanto, il metodo descritto in alto, ad esempio con riferimento alla figura 1, puÃ² essere applicato non solo alla codifica di un segnale video ma anche alla codifica di un segnale comprendente anche un segnale audio e/o un segnale dati.

In un ulteriore esempio il segnale continuo codificato e relativo ad un canale viene ricomposto insieme ai segnali video (eventualmente anche con audio e/o dati) di altri canali.

Secondo un ulteriore esempio, il segnale video compreso nel flusso lineare come piÃ¹ in alto descritto puÃ² essere sottoposto ad una codifica real-time prima di essere acquisito (S100) o dopo essere stato acquisito. Ad esempio, nel caso in cui il segnale di ingresso sia un segnale SDÃŒ o HD-SDI, Ã ̈ possibile effettuare una prima compressione real-time per ottenere un segnale raggruppato secondo uno standard noto (ad esempio MPEG2, MPEG4 o H.264), per poi essere sottoposto alle successive fasi S200, S300, S400 ed S500 come illustrate nella figura 1. In tal caso, la codifica real-time potrÃ essere impostata per elaborare solo un numero molto limitato di frame, ad esempio un numero tra 10 e 15, ottenendo cosÃ¬ in tempi rapidi un segnale avente una banda di lOMb/s (ad esempio con una lunghezza media del GOP pari a 12 frame) e quindi molto piÃ¹ limitata di quella di un segnale ad esempio HD-SDI avente una banda pari ad esempio a 1.5Gb/s. In tal caso, la segmentazione potrÃ essere effettuata sul segnale codificato in rea time. In alternativa, la segmentazione potrÃ essere effettuata prima della compressione reai-time, ossia direttamente sul segnale HD-SDI. Ciascun segmento puÃ² quindi essere sottoposto ad una prima compressione reai time del segmento, alla quale seguirÃ la codifica offline come da fasi S300 e S400, consentendo quindi di raggiungere un elevato livello di compressione senza pregiudicare la qualitÃ ma mantenendo una latenza prefissata e configurabile.

In un esempio illustrativo, la prima codifica puÃ² essere seguita da un primo encoder, mentre la seconda codifica da un secondo encoder, in cui sia il primo che il secondo encoder sono parte di una struttura encoder dedicata al flusso lineare. Maggiori dettagli verranno forniti nel seguito con riferimento alla figura 2.

Una seconda forma di realizzazione verrÃ nel seguito illustrata con riferimento alla figura 2 in cui Ã ̈ rappresentata un'entitÃ per la codifica real-time di un segnale comprendente almeno un segnale video. Un'entitÃ puÃ² essere implementata in un solo dispositivo, per via HW/SW o combinazione di questi, o su molteplici unitÃ o dispositivi interconnessi {anch'essi HW, SW o combinazione degli stessi) . Tutte le considerazioni giÃ espresse con riferimento alla prima forma di realizzazione varranno in generale anche nel seguito {e quindi con riferimento anche ad altre forme di realizzazione o esempi) e non saranno pertanto ripetute. Il dispositivo 200 della figura 2 comprende mezzi di acquisizione 210, mezzi di suddivisione 220, mezzi di prima codifica 230, mezzi di seconda codifica 240 e mezzi di ricomposizione 250.

I mezzi di acquisizione 210 sono configurati per acquisire il segnale video incluso nel flusso lineare, il flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi. Il segnale IN fornito ai mezzi di acquisizione Ã ̈ un esempio del segnale di ingresso su menzionato, che puÃ² essere in formato raggruppato (ad esempio secondo standard quali MPEG2 , MPEG4, AVC, H.264, etc...) o non raggruppato perchÃ© fornito ad esempio in formato HD-SDI, SDÃŒ, etc..., o in qualsiasi formato digitale (perchÃ© cosÃ¬ disponibile dalla fonte o dopo conversione da segnale analogico).

I mezzi di suddivisione 220 suddividono il segnale acquisito in almeno un primo segmento ed un secondo segmento di rispettive durate prefissate (come suddetto non necessariamente identiche) , in cui almeno uno dei due segmenti Ã ̈ adatto a contenere almeno una parte dei due contenuti (infatti, Ã ̈ importante che almeno un segmento abbia questa proprietÃ , nel caso si riesca a stabilire che l'altro segmento conterrÃ certamente solo un contenuto) . I segmenti comprendono inoltre informazioni di ricomposizione, come piÃ¹ in alto accennato o come piÃ¹ avanti ulteriormente dettagliato.

I mezzi di prima codifica 230 sono configurati per effettuare una prima codifica del primo segmento (221) utilizzando una codifica offline cosi ottenendo un primo segnale codificato 232. I secondi mezzi di codifica 240 sono invece configurati per effettuare una seconda codifica del secondo segmento (222) utilizzando una codifica offline per ottenere un secondo segmento codificato 242. Nella figura i segnali di uscita 221 e 222 sono illustrati come uscenti da due porte distinte; i mezzi 220 possono tuttavia essere configurati per essere emessi da una stessa porta. Lo stesso vale per gli ingressi ai mezzi 250. La seconda codifica Ã ̈ effettuata almeno parzialmente in parallelo con la prima modifica, per le ragioni su illustrate, sebbene sia pensabile omettere uno dei due encoder 230, 240 in modo da eseguire la codifica dei due segmenti sequenzialmente, purchÃ© 'encoder rimanente abbia risorse sufficienti per garantire che la codifica sia completata con l'ultimo fraine o subito dopo la ricezione dell'ultimo frame {nell'ipotesi ad esempio che l'ultima porzione del frame non sia compressa o compressa con un fattore di compressione assai minore da garantirne il completamento della compressione in corrispondenza o quasi della fine del segmento).

I mezzi di ricomposizione 250 ricompongono infine, utilizzando le informazioni di ricomposizione, il primo segmento codificato 232 ed il secondo segmento codificato 242 per ottenere un segnale continuo codificato OUT. Il segnale cosÃ¬ ottenuto puÃ² quindi essere portato in diffusione eventualmente dopo essere stato sottoposto ad ulteriori elaborazioni.

Si fa notare che la figura 2 Ã ̈ una rappresentazione schematica. I mezzi di acquisizione 210, di suddivisione 220, di prima e seconda codifica 220 e 230 nonchÃ© di ricomposizione 250 (notando che possono essere anche identificati come acquisitore 210, suddivisore 220, primo e secondo encoder 230, 240 e ricompositore 250, rispettivamente) possono essere realizzati in hardware, in software o combinazione opportuna dei due. Ad esempio, gli encoder 230 e 240 possono essere ottenuti tramite due strutture hardware separate, o per mezzo di una partizione logica di una stessa struttura hardware. Ãˆ inoltre pensabile combinare diversi encoder separati con uno o piÃ¹ encoder piÃ¹ performanti da partizionare in maniera logica, caso che potrebbe tornare di utilitÃ in presenza ad esempio di un numero elevato di segmenti da processare in parallelo. Inoltre, potrebbe utilizzarsi un encoder con struttura Grid, in grado di suddividere il lavoro di codifica (schematicamente rappresentato dai blocchi 230 e 240) su piÃ¹ macchine e processori contemporaneamente .

Con riferimento alla figura 3, verrÃ illustrata una terza forma di realizzazione relativa ad un metodo per il trattamento di un segnale da sottoporre a codifica near-real time, in cui il segnale comprende almeno un segnale video. In una fase S310 viene acquisito il segnale video incluso in un flusso lineare, il flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi. Tale segnale puÃ² essere rappresentato dal segnale d'ingresso precedentemente descritto, quale ad esempio in formato non compresso, in un formato SDÃŒ o HD-SDI o in formato compresso secondo un formato MPEG2, MPEG4, AVC, H.264, etc... In una successiva fase S320, il segnale video viene suddiviso in almeno un primo segmento ed un secondo segmento di durata prefissata, in cui ciascuno dei due segmenti Ã ̈ adatto a contenere almeno una parte dei due contenuti senza distinzione logica. Ciascuno dei segmenti comprende inoltre informazioni di ricomposizione. Come su accennato, la durata prefissata corrisponde alla combinazione di un tempo predeterminato ed uno scarto prestabilito, in cui lo scarto prestabilito puÃ² assumere il valore di 0 in un caso specifico. Nel caso in cui lo scarto prestabilito assuma un valore uguale a 0, ciascun segmento avrÃ una durata costante uguale al tempo predeterminato fintanto che il tempo predeterminato non venga variato manualmente o automaticamente come su illustrato. Ad esempio, nel caso in cui il tempo predeterminato sia uguale ad un minuto e lo scarto prestabilito uguale a 0, ciascun segmento avrÃ esattamente la lunghezza di un minuto fintanto che nessuno di tali valori non venga modificato per via manuale e/o automatica. Nel caso in cui il segnale di ingresso sia raggruppato, non potrÃ escludersi il caso in cui i GOP del segnale di ingresso siano caratterizzati da una lunghezza leggermente variabile. Al fine di ottenere un segmento che comprenda un numero intero di GOP, sarÃ pertanto opportuno impostare la durata prefissata aggiungendo o sottraendo uno scarto prestabilito al tempo predeterminato. Si consideri ad esempio un tempo predeterminato pari a 60s e uno scarto prestabilito pari a dodici frame, valore scelto perchÃ© coincidente nell'esempio con la lunghezza media del GOP del segnale d'ingresso. La fine di un segmento potrÃ quindi essere convenientemente determinata in corrispondenza della fine dell'ultimo frame del GOP compreso nell'intervallo (60s 12; 60s 12 frame). Si fa riferimento anche alla discussione presentata piÃ¹ in altro che, come detto, si applica anche a questa ed altre forme di realizzazione nonchÃ© esempi. Le informazioni di ricomposizione sono tali da consentire la ricostruzione dei segmenti in uscita, una volta codificati, in modo da rispettare la stessa sequenza prima della segmentazione. Ad esempio, le informazioni di ricomposizione sono rappresentate da un numero sequenziale o da un identificativo univoco di ciascun segmento all'interno di ciascun flusso lineare o canale, come su illustrato. Le informazioni di ricomposizione si rendono necessarie poichÃ© non si puÃ² escludere il caso in cui la codifica di un secondo segmento, temporalmente successivo al primo, sia completata prima della codifica del primo segmento. Si pensi ad esempio il caso in cui il secondo segmento si riferisca ai titoli di coda di un film ed il primo segmento all'ultima scena di azione dello stesso film: non puÃ² escludersi il caso in cui la codifica dei titoli di coda sia ultimata prima che l'ultima scena di azione sia codificata, in particolare nel caso in cui nella codifica della scena di azione sia necessario rielaborare piÃ¹ volte i frame o nel caso in cui vengano rilevati degli errori da correggere tramite un ulteriore passaggio Le informazioni di ricomposizione consentono pertanto di ovviare ad un'errata ricostruzione del segnale codificato.

Secondo una fase opzionale non illustrata in figura 3, il metodo puÃ² comprendere una fase di ricomporre, utilizzando le informazioni di ricomposizione, un primo segmento codificato ed un secondo segmento codificato ottenuti codificando i due segmenti risultanti dalla fase S320.

La figura 4 illustra un'ulteriore forma di realizzazione relativa ad un dispositivo per il trattamento per un segnale da sottoporre a codifica near-real time e comprendente mezzi di acquisizione 410 e mezzi di suddivisione 420. I mezzi di acquisizione 410 sono adatti ad acquisire il segnale video incluso in un flusso lineare, il flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi. I mezzi di suddivisione 420 sono invece configurati per suddividere il segnale video in almeno un primo segmento ed un secondo segmento di durata prefissata in cui ciascuno Ã ̈ adatto a contenere almeno una parte di uno dei due contenuti senza distinzione logica fra gli stessi. Inoltre, ciascuno dei segmenti comprende informazioni di ricomposizione. Grazie a tale accorgimento, Ã ̈ possibile scomporre un flusso continuo in segmÃ©nti di durata prefissata facile da processare, ad esempio (ma non limitatamente) facile da sottoporre ad una codifica offline trasparente all'encoder offline.

11 flusso cosÃ¬ segmentato puÃ² essere piÃ¹ facilmente sottoposto ad altre operazioni normalmente non (direttamente) applicabili a flussi lineari.

La figura 5 illustra un esempio esplicativo in cui un flusso lineare IN avente una banda B1 Ã ̈ processato secondo il metodo illustrato nella figura 1 o una delle sue varianti. Nell'esempio della figura 5, si ipotizza che il segnale IN sia in formato HD-SDI avente banda 1.5 Gb/s o sia raggruppato in GOP aventi lunghezza media di 12 frame e banda di 10 Mb/s ottenuti tramite ad esempio 10 standard H.264. Il flusso IN viene quindi segmentato nei segmenti SI, S2, S3 (e cosÃ¬ via secondo le necessitÃ ) ciascuno avente lunghezza di due minuti nell'esempio (notando che la lunghezza potrebbe differenziarsi di pochi millisecondi al fine di includere un numero intero di GOP (Ng) nel caso in cui 11 segnale IN sia raggruppato. Nell'ipotesi in cui esistano solo due encoder, il primo segmento SI verrÃ processato in un intervallo TI mentre il secondo segmento S2 in un corrispondente intervallo T2.

intervallo T2 comincerÃ al piÃ¹ presto nel momento in cui il segmento S2 Ã ̈ disponibile. Al termine di ciascuna codifica, ossia al termine degli intervalli TI e T2, rispettivamente, i segmenti compressi S'1 e S'2 sono forniti in uscita in una sequenza corrispondente ai segmenti d'ingresso SI e S2 grazie alle informazioni di ricomposizione. In tal modo, la sequenza dei frame di uscita corrisponde alla sequenza dei frame di ingresso. Sebbene gli intervalli TI e T2 siano raffigurati come aventi la stessa lunghezza, il loro tempo di codifica puÃ² variare, anche sostanzialmente nella pratica, come illustrato piÃ¹ in alto nell'esempio dei titoli di coda e della scena di azione. La codifica offline applicata rispettivamente nei tempi TI e T2 dovrÃ essere tale da garantire il completamento della compressione dell'intero segmento prima che lo stesso debba essere reso in output. Nell'esempio illustrato vi saranno dei corrispondenti margini MI e M2 indicanti che ciascuno degli encoder ha completato le rispettive operazioni con un certo anticipo rispetto al momento in cui il segmento deve essere reso in uscita (i due segmenti devono essere resi in uscita rispettivamente al minuto 3:00 e al minuto 5:00), CiÃ² significa che ad esempio, dimensionando ad esempio 1'encoder rispetto ad un caso tipico, Ã ̈ possibile prevedere un tempo di sicurezza MI o M2 per processare segmenti particolarmente complessi (ad esempio ricchi di dettagli o di cambi di scena) o per correggere errori inaspettati.

Nella figura 5 Ã ̈ illustrato l'esempio in cui due segmenti sono processati in parallelo. Tuttavia la persona esperta del ramo riconoscerÃ immediatamente che la stessa parallelizzazione puÃ² applicarsi al caso di un numero N (grande a piacere) di segmenti da processare in parallelo. In tal caso vi saranno N processi distinti anzichÃ© due, realizzati da un encoder con architettura grid, da N encoder distinti o da qualsiasi combinazione HW/SW opportunamente predisposta. Come su accennato, Ã ̈ pensabile anche rinunciare alla parallelizzazione nel caso in cui si abbia a disposizione un encoder particolarmente potente, ad esempio in grado di effettuare un'ottima compressione sulla maggior parte del segmento (escluso ad esempio l'ultima parte del segmento, ad esempio gli ultimi 20 frame o l'ultimo o alcuni degli ultimi GOP) in modo da completare il processo nel momento in cui l'ultimo GOP del rispettivo segmento Ã ̈ ricevuto (o pochi istanti dopo che l'ultimo trame Ã ̈ stato ricevuto, ad esempio l'equivalente di 10-50 rame dalla fine del segmento). Come detto, i valori della figura 5 sono puramente esemplificativi. In un altro esempio, si potrebbe scegliere un segmento di 32sec con un tempo di 4 min lasciato alla codifica offline. La latenza rimane costante (al limite nell'intervallo stabilito dalla tolleranza o scarto di cui sopra) perchÃ©, nei 4 minuti necessari a codificare il primo segmento vengono avviate (in parallelo) le codifiche dei segmenti successivi, e quindi a 4:00 Ã ̈ pronto il primo segmento, a 4:32 Ã ̈ pronto il secondo, a 5:04 il terzo e cosi via.

Secondo un'altra forma di realizzazione, la presente invenzione prevede inoltre un programma per elaboratore predisposto per eseguire, quando lo stesso programma Ã ̈ eseguito su computer, una o piÃ¹ delle fasi secondo il metodo su descritto o una delle sue varianti. Il computer su cui questo programma puÃ² essere eseguito Ã ̈ da intendersi come un qualsiasi sistema in grado di elaborare segnali e processare istruzioni, realizzato in una o diverse unitÃ interconnesse fra di loro, in grado di eseguire istruzioni programmate o predisposte per le esecuzioni delle fasi su descritte.

Le istruzioni del programma per elaboratore possono inoltre essere memorizzate su un supporto adeguato, quale ad esempio una memoria statica, un disco fisso o un qualsiasi altro supporto quale CD, DVD, Blue Ray, o possono essere trasmesse su un segnale portante per l'esecuzione su un'entitÃ remota.

Come su esposto, i riconoscimenti degli inventori hanno portato ad una nuova soluzione per il Video Encoding che sfrutta i meccanismi di compressione off-line, ma li gestisce in un tempo tale da garantire un delay massimo dell'ordine di qualche minuto (nell'esempio della figura 5) . La definizione di questa modalitÃ di video encoding Ã ̈ definita Near Live o Near Reai Time. I passaggi del procedimento di video encoding in Near Reai Time sono i seguenti in questo ulteriore esempio illustrativo:

â€¢ acquisizione del segnale audio/video/sottotitoli in ingresso, compressione live del segnale audio/video in un formato ad altissima qualitÃ ed alto bit rate e contestuale estrazione e salvataggio dei sottotitoli; ad esempio, il processo di acquisizione del segnale HD-SDI viene effettuato attraverso un apposita scheda di acquisizione montata su un server. Il segnale a 1.5Gbit/s non puÃ² essere scritto a questo bit rate su supporti comunemente utilizzati, pertanto c'Ã ̈ un primo encoding effettuato a 50 Mbit/s in CBR con GOP a 4 secondi (questa scelta non Ã ̈ vincolante) . La gop Ã ̈ settata "closed" in modo da permettere la divisione del flusso continuo in piÃ¹ segmenti di durata prefissata. In questo stadio (di questo esempio) vengono anche acquisiti i sottotitoli all'interno dei VANC dell'SDÃŒ che vengono estratti in forma binaria e segmentati in modo sincrono al flusso audio/video in modo che per ogni segmento audio/video ci sia il corrispondente segmento di sottotitolo.

â€¢ suddivisione del flusso continuo audio/video (senza distinzione logica tra un contenuto e un altro) in Segmenti (costituiti da n-GOPs o Group Of Pictures) di durata prefissata dall'operatore, con estrazione di informazioni in/out (ossia informazioni che consentono di riaggregare i Segmenti);

â€¢ parcellizzazione ed encoding dei Segmenti audio/video in modo indipendente l'uno dall'altro (i.e. ogni segmento Ã ̈ processato in parallelo e, sfruttando potenzialmente un maggior numero di encoder, piÃ¹ Segmenti possono essere processati contemporaneamente su piÃ¹ encoder) ; in questa fase il flusso segmentato (in segmenti della durata due minuti in un esempio) puÃ² essere codificato da un encoder VOD. Per questo motivo puÃ² essere conveniente utilizzare un encoder VOD con architettura Grid, in grado di suddividere il lavoro di encoding su piÃ¹ macchine e processori contemporaneamente, garantendo inoltre la possibilitÃ di rilavorare eventuali segmenti che dovessero provocare degli errori.

â€¢ multiplexing dei Segmenti (n-GOPs) audio/video codificati con i relativi sottotitoli mantenendo il sincronismo temporale (ossia riaggregazione dei Segmenti utilizzando le informazioni in/out estratte nella fase di suddivisione del flusso continuo audio/video) . Infatti, una volta terminato 1'encoding dei diversi segmenti, gli stream audio, video e sottotitoli devono essere "messi insieme" (multiplexati) in modo da avere un unico flusso (transport stream) composto da video, audio e sottotitoli. Avendo a disposizione i differenti elemantary stream, il muxer (ad esempio un componente custom sviluppato su librerie commerciali prodotte ad esempio da "Manzanitaâ€ ) li mette insieme, rispettando le specifiche tecniche definite dagli standard denominati DVB-S2 , in modo da formare un unico Transport Stream con i singoli componenti insieme.

â€¢ playout (ossia erogazione) continuo dei Segmenti multiplexati , nel formato di output dell 'encoder: l'ultimo stage opzionale della catena nel presente esempio Ã ̈ quello di playout. Scopo di questo componente Ã ̈ quello di inviare il Transport Stream in modo continuo verso i multiplexer della catena trasmissiva satellitare. L'output Ã ̈ effettuato in un formato conforme alle specifiche ASI, su canale SDÃŒ o IP. Il playout Ã ̈ sincronizzato con il processo di acquisizione ed applica un delay costante alla riproduzione dei frames nell'ordine dei minuti rispetto all'istante di acquisizione .

Come piÃ¹ in alto accennato, grazie al riconoscimento degli inventori si ottiene un risultato che garantisce un'elevata qualitÃ , mantiene invariati i processi, ed ha un'efficienza di banda pari al 30-40% rispetto a quella oggi utilizzata, che significa un equivalente beneficio di banda di trasmissione.

L'architettura complessiva dell'encoder si presta ad essere distribuita su piÃ¹ server fisici. Ad esempio, in una configurazione formata da due server, uno ospiterÃ i processi di acquisizione e playout e l'altro ospiterÃ encoding grid.

In particolare il riconoscimento degli inventori consente una soluzione efficiente di compressione offline applicata alla distribuzione lineare, dal momento che divide il segnale continuo audio/video in Segmenti della durata prefissata dall'operatore (che puÃ² andare da alcuni secondi ad alcuni minuti, in base alla potenza e al numero degli encoder che devono processare in parallelo i Segmenti) e riesce ad avviare alla compressione off-line (nata per la gestione di singoli contenuti separati gli uni dagli altri) un flusso continuo, ottenendo come output un flusso continuo compresso con la qualitÃ tipica della compressione offline ma gestito con un delay di pochi minuti (nell'esempio della figura 5). E quindi con il procedimento di compressione Near Rea/ Time la qualitÃ di compressione migliora rispetto alla compressione real-time sinora adottata per il broadcasting satellitare (perchÃ© si sfruttano le potenzialitÃ della compressione off-line) e tuttavia si crea un procedimento che (grazie alla creazione di Segmenti riaggregabili e tarati sulla possibilitÃ di gestione in parallelo da parte degli encoder a disposizione) puÃ² essere adattato anche alla distribuzione lineare. Si noti che un metodo per gestire un flusso continuo audio/video con compressione off-line e con delay di pochi minuti consente di migliorare la distribuzione in broadcasting satellitare {la compressione off-line Ã ̈ piÃ¹ efficiente anche del 40% rispetto a quella reai time). Tale soluzione puÃ² inoltre essere applicata a una percentuale significativa dei contenuti distribuiti da un operatore: infatti, possono essere processati tramite la sequenza segmentazione- compressione in parallelo riaggregazione, in modo utile a non determinare alcuna interruzione nel flusso di distribuzione lineare, anche il 60% (o piÃ¹) dei contenuti normalmente distribuiti rendendo possibile quindi il raggiungimento di un notevole risparmio di banda (anche del 40% o piÃ¹) non immaginabile con i presenti sistemi di codifica di canali lineari.

In aggiunta a quanto giÃ esposto e ad ulteriori fini illustrativi, si fanno notare anche altre caratteristiche di un processo di compressione off-line. Ad esempio:

(A) Nella compressione off-line sono processati singoli contenuti e non flussi continui di contenuti (ossia sono processati contenuti che hanno un inizio e una fine, come un film, una pubblicitÃ , un promo, etc.) e quindi il prodotto della compressione, anche quando viene messo in sequenza, non perde questa individualitÃ . I contenuti compressi off-line, ove riuniti in sequenza, non hanno una fine che combacia perfettamente con l'inizio del contenuto successivo e per garantire la giunzione tra i contenuti Ã ̈ necessario inserire degli elementi "a nero", (B) La compressione off-line Ã ̈ particolarmente efficiente (a paritÃ di qualitÃ dell'output puÃ² comprimere il contenuto il 40% in piÃ¹ di una compressione real/-time) e tuttavia richiede un processo lungo e accurato, perchÃ© l'intero contenuto Ã ̈ processato piÃ¹ volte e, se risultano delle imperfezioni nel processo di compressione, queste sono rilevate e rimosse. Questo processo accurato richiede 2-3 volte il tempo di durata del singolo contenuto (ossia, se si deve comprimere offline un film che dura 2 ore posso impiegare sino a 6 ore).

Si fa inoltre notare quanto seguito in merito alla creazione dei Segmenti secondo quanto riconosciuto dagli inventori. La compressione off-line Ã ̈ applicata in genere a contenuti integrali (un film, una pubblicitÃ , etc .) e quindi ha tempi di gestione che non sono compatibili con la distribuzione lineare (richiederebbe infatti un delay di diverse ore). I contenuti processati off-line non possono essere messi in sequenza senza inserire degli elementi "a nero" perchÃ© la fine di un contenuto non combacia perfettamente con l'inizio del contenuto successivo. Nella soluzione Video Encoding Ã ̈ prevista la suddivisione del flusso continuo audio/video in Segmenti di una durata determinata. Si noti che i Segmenti non coincidono necessariamente con un contenuto o con una porzione di contenuto (ossia in un segmento potrebbero coesistere la fine di un contenuto e l'inizio di un altro contenuto, senza soluzione di continuitÃ ). Insieme ai Segmenti sono estratti dal flusso continuo audio/video delle informazioni in/out, che consentono di ricomporre il flusso continuo audio/video dopo il processo di compressione off-line esattamente cosÃ¬ com'era prima della compressione. La durata dei Segmenti Ã ̈ predeterminata dall'operatore (e puÃ² andare da alcuni secondi ad alcuni minuti) . Detta durata puÃ² essere calibrata in base alla potenza e al numero degli encoder a disposizione e in base al numero di Segmenti che devono essere processati in parallelo. Il calcolo della durata dei Segmenti consente al processo di compressione off-line di procedere fluidamente (i.e. i Segmenti non durano piÃ¹ del tempo che gli encoder impiegano per processarli parallelamente cosÃ¬ non si crea nessun "collo di bottiglia" tra quello che entra e che esce dall 'encoder). I Segmenti possono avere una durata tale da consentire di una compressione off-line con un delay limitato a pochi minuti.

Molte delle forme di realizzazione e esempi sono stati esposti con riferimento a fasi di metodi o processi. Tuttavia, quanto descritto puÃ² essere anche implementato in un programma da eseguire su un entitÃ di elaborazione (anche distribuita) o su un'entitÃ i cui mezzi sono opportunamente configurati. Come su illustrato, l'entitÃ puÃ² essere implementata in un solo dispositivo, per via HW/SW o combinazione di questi, o su molteplici unitÃ o dispositivi interconnessi (anch'essi HW, SW o combinazione degli stessi),

Naturalmente, la descrizione sopra esposta di forme di realizzazione e di esempi applicanti i principi riconosciuti dagli inventori Ã ̈ riportata solo a titolo esemplificativo di tali principi e non deve perciÃ² essere intesa come limitazione dell'ambito di privativa qui rivendicato.

Claims

Rivendicazioni 1 Metodo per la codifica near-real time di un segnale comprendente almeno un segnale video, il metodo comprendente le fasi di: - acquisire (S100) detto segnale video incluso in un flusso lineare, detto flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi; - suddividere (S200) il segnale video in almeno un primo segmento ed un secondo segmento di rispettive durate prefissate, almeno uno di detti segmenti essendo adatto a contenere almeno una parte di detti due contenuti e comprendente informazioni di ricomposizione,· - effettuare (S300) una prima codifica di detto primo segmento utilizzando una codifica off-line per ottenere un primo segmento codificato; effettuare (S400) una seconda codifica di detto secondo segmento utilizzando una codifica off-line per ottenere un secondo segmento codificato, detta seconda codifica essendo effettuata almeno parzialmente in parallelo con la prima codifica; - ricomporre (S500), utilizzando dette informazioni di ricomposizione, detto primo segmento codificato e detto secondo segmento codificato per ottenere un segnale continuo codificato.
2. Metodo secondo la rivendicazione 1, in cui la codifica offline Ã ̈ tale da completare la codifica del rispettivo segmento in un tempo inferiore o uguale ad un delay pre-configurato .
3. Metodo secondo una delle rivendicazioni precedenti, in cui ciascuna di dette durate prefissate Ã ̈ compresa in un intervallo determinato dalla combinazione di un tempo predeterminato ed uno scarto prestabilito.
4. Metodo secondo una delle rivendicazioni precedenti, in cui detti primo segmento e secondo segmento sono distinti da raggruppamenti di frame ottenuti tramite un algoritmo di codifica video
5. Metodo secondo una delle rivendicazioni precedenti, in cui la codifica offline comprende almeno una fase tra: variare la lunghezza del raggruppamento di frame all interno di un segmento; processare un segmento piÃ¹ volte, e in cui il processare comprende almeno una fase tra rilevare, rimuovere e correggere eventuali imperfezioni.
6. Metodo secondo una delle rivendicazioni precedenti, in cui, nel caso in cui il segnale in ingresso sia raggruppato, un segmento Ã ̈ costituito da un numero finito di raggruppamenti del segnale di ingresso.
7. EntitÃ (200) per la codifica near-real time di un segnale comprendente almeno un segnale video, il dispositivo comprendente: - mezzi di acquisizione (210) configurati per acquisire detto segnale video incluso in un flusso lineare, detto flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi; mezzi di suddivisione (220) configurati per suddividere il segnale video in almeno un primo segmento ed un secondo segmento di durata prefissata, almeno uno di detti segmenti essendo adatto a contenere almeno una parte di detti due contenuti e comprendente informazioni di ricomposizione; mezzi di prima codifica (230) configurati per effettuare una prima codifica di detto primo segmento utilizzando una codifica off-line per ottenere un primo segmento codificato; mezzi di seconda codifica (240) configurati per effettuare una seconda codifica di detto secondo segmento utilizzando una codifica off-line per ottenere un secondo segmento codificato, detta seconda codifica essendo effettuata almeno parzialmente in parallelo con la prima codifica; mezzi di ricomposizione (250) configurati per ricomporre, utilizzando dette informazioni di ricomposizione, detto primo segmento codificato e detto secondo segmento codificato per ottenere un segnale continuo codificato.
8 . Metodo per il trattamento di un segnale da sottoporre a codifica near-real time, detto segnale comprendente almeno un segnale video, detto metodo comprendente le fasi di: - acquisire (S310) detto segnale video incluso in un flusso lineare, detto flusso lineare comprendente almeno due contenuti senza distinzione logica fra gli stessi ; - suddividere (S320) il segnale video in almeno un primo segmento ed un secondo segmento ciascuno avente rispettiva durata prefissata, almeno uno di detti segmenti essendo adatto a contenere almeno una parte di detti due contenuti senza distinzione logica e comprendente informazioni di ricomposizione.
9, Metodo secondo la rivendicazione 8, in cui detto segnale video incluso in detto flusso lineare Ã ̈ sottoposto ad una codifica real-time prima di essere acquisito per ottenere un segnale video raggruppato, ed in cui ciascuna detta rispettiva durata prefissata Ã ̈ compresa in un intervallo determinato dalla combinazione di un tempo predeterminato ed uno scarto prestabilito.
10. Metodo per il trattamento di un segnale secondo la rivendicazione 9, comprendente inoltre la fase di ricomporre, utilizzando dette informazioni di ricomposizione, un primo segmento codificato e un secondo segmento codificato per ottenere un segnale continuo codificato, detti primo e secondo segmenti codificati ottenuti a partire da detti primo segmento e secondo segmento per mezzo di un algoritmo di codifica off-line .
11. Programma per elaboratore predisposto per eseguire, quando detto programma Ã ̈ eseguito su un computer, tutte le fasi secondo una qualsiasi delle rivendicazioni di metodo precedenti.