ITGE20090037A1 - Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video - Google Patents

Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video Download PDF

Info

Publication number
ITGE20090037A1
ITGE20090037A1 IT000037A ITGE20090037A ITGE20090037A1 IT GE20090037 A1 ITGE20090037 A1 IT GE20090037A1 IT 000037 A IT000037 A IT 000037A IT GE20090037 A ITGE20090037 A IT GE20090037A IT GE20090037 A1 ITGE20090037 A1 IT GE20090037A1
Authority
IT
Italy
Prior art keywords
audio
video
signal
speed
modifying
Prior art date
Application number
IT000037A
Other languages
English (en)
Inventor
Stefania Repetto
Michele Ricchetti
Luca Rocca
Matteo Rocca
Original Assignee
Linear Srl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linear Srl filed Critical Linear Srl
Priority to IT000037A priority Critical patent/ITGE20090037A1/it
Priority to EP10165115A priority patent/EP2261900A1/en
Publication of ITGE20090037A1 publication Critical patent/ITGE20090037A1/it

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

DESCRIZIONE dell'Invenzione Industriale dal titolo: METODO E DISPOSITIVO DI MODIFICA DELLA VELOCITA DI RIPRODUZIONE DI SEGNALI AUDIO-VIDEO
TESTO DELLA DESCRIZIONE
La presente invenzione ha per oggetto un metodo che permette la modifica della velocità di riproduzione di segnali audio e video e un dispositivo per l'attuazione del detto metodo.
Attualmente l'arte nota prevede metodi per la modifica della velocità di riproduzione di un segnale video separatamente alla modifica di riproduzione di un segnale audio.
Soprattutto per quanto riguarda segnali audio, sono stati compiuti numerosi studi atti ad ottimizzare la modifica di segnali audio in modo da ottenere un segnale che presentasse una variazione nella velocità di riproduzione rispetto al segnale originale senza però modificare l'ampiezza dei picchi del segnale originale, non presentando di conseguenza distorsioni o effetti all'orecchio sgradevoli sul segnale modificato.
Ad esempio nei documenti US 5,717,818, US 5,175,769 e "an overlap-add technique based on waveform similarità (WSOLA) for high qualità time scale modification of speech-IEEE Proceedings of ICASSP-93, voi.II, pp. 554-557,1993 vengono trattati dei metodi che permettono la modifica della velocità di esecuzione di un segnale audio senza creare distorsioni sulle frequenze del segnale modificato: tali metodi si basano sull'utilizzo di una famiglia particolare di algoritmi denominata SOLA e permettono di modificare la velocità di riproduzione di segnali audio senza causare effetti indesiderati noti, come ad esempio la trasformazione del tono di una persona adulta in quello di un bambino quando si desidera accelerare un discorso registrato.
Nonostante i diversi metodi noti relativi ai segnali audio e ai segnali presi singolarmente, non è ancora stato trovato un metodo che permetta, non solo di rallentare i segnali sia audio che video, ma che permetta di sincronizzare la parte audio con la parte video e con eventuali altre informazioni contenute nel segnale da analizzare senza portare distorsioni e/o artefatti e/o perdite di informazioni sul detto segnale di uscita.
Dallo stato dell'arte appare quindi che non esiste un metodo che permetta la modifica della velocità di riproduzione di un segnale audio-video e che sia adatto a mantenere la sincronia tra la componente audio e la componente video.
Inoltre non esiste allo stato dell'arte un metodo di variazione della velocità di esecuzione di segnali audio-video che mantiene un aspetto acustico e visivo simile ad un comportamento realistico e che non cada nella riproduzione video cosiddetta rallentee e/o nell'abbassamento delle frequenze della parte audio rendendo il risultato sì più lento ma anche irreale.
Scopo della presente invenzione è risolvere tale problema con un metodo che permette la modifica della velocità di riproduzione di segnali audio e video e un dispositivo per l'attuazione del detto metodo.
La possibilità di modificare la velocità di un segnale audio-video presenta numerosi vantaggi. Un tale metodo ad esempio permette di migliorare la comprensione da parte di soggetti ipoudenti di segnali audio-video: molte persone affette da un abbassamento cronico della soglia uditiva lamentano difficoltà di comprensione durante la visione di programmi televisivi come ad esempio telegiornali e spettacoli di intrattenimento. Grazie alla presente invenzione si garantisce a queste persone una maggiore comprensione rallentando la velocità di riproduzione dei segnali audio-video che contraddistinguono tali programmi senza far venire meno il piacere dell'intrattenimento grazie ad una sincronia tra le immagini, la musica e le parole.
L'uso del metodo e del dispositivo oggetto della presente invenzione risulta vantaggioso anche quale strumento durante lo svolgimento di una terapia logopedica sia per una valutazione dei soggetti ipoudenti, sia come supporto allo svolgimento della terapia stessa e/o a terapie di allenamento ed esercizio in particolare di soggetti ipoudenti.
Inoltre il metodo e il dispositivo oggetto della presente invenzione possono apportare un grande vantaggio nello studio delle lingue straniere consentendo una maggiore comprensione da parte degli studenti durante la visione di film in lingua originale.
Un ulteriore utilizzo alternativo e vantaggioso del metodo e del dispositivo oggetto della presente invenzione è quello di rallentare il flusso temporale delle informazioni audio o audio-video per rendere più facile la comprensione di messaggi audio o audiovideo molto disturbati: proprio grazie al fatto di poter variare la velocità del segnale in ingresso senza modificarne sostanzialmente la timbrica è possibile superare le difficoltà nella comprensione di un messaggio disturbato, comprensione che con i noti metodi è resa ancor più difficoltosa a causa di una modifica delle frequenze, che porta ad un'alterazione dannosa del segnale audio o audiovideo .
La presente invenzione può anche essere utilizzata quale strumento utile per facilitare le trascrizioni in testo scritto ed eventuali traduzioni di contenuti vocali registrati o esposti in tempo reale. In questo caso, 1'utilizzatore sia umano che sotto forma di programma di scrittura automatica da file audio può impostare la velocità fra un massimo ed un minimo mantenendo inalterate le caratteristiche frequenziali della voce. In combinazione, tale effetto si ripercuote anche sul fatto che la scansione delle parole e la pronuncia restano sostanzialmente inalterate e ben comprensibili, cosa che non avviene con i normali metodi di variazione della velocità di riproduzione di segnali audio.
Per quanto riguarda le definizioni dei protocolli e delle tipologie di comunicazione o di reti queste sono descritte in dettaglio dalle pubblicazioni reperibili tramite il cosiddetto RFC-Editor Web pages con cui è consultabile l'RFC Document database che contiene i documenti pubblicati dalla "The Internet Society" ISOC e dalla IETF (Iternet enginnering task force) e sono reperibili dal sito www.ietf.org.
Si sottolinea inoltre che per semplicità di redazione e comprensione verranno utilizzati alternativamente i termini "valore di campioni/secondo" e "campioni/secondo" per indicare l'unità di misura della velocità di esecuzione del segnale audio, così come si utilizzerà il termine di "frame rate" per indicare l'unità di misura della velcità di riproduzione del segnale video.
Allo scopo di risolvere i suddetti problemi e di ottenere quindi i vantaggi descritti, l'invenzione ha per oggetto un metodo che prevede i seguenti passi: l'acquisizione di un segnale audio-video di ingresso;
la memorizzazione di tale segnale all'interno di una memoria di lavoro di un dispositivo di elaborazione ;
1'impostazione della velocità alla quale si desidera riprodurre il segnale audio-video in uscita, venendo il segnale caricato nella memoria di lavoro del dispositivo di elaborazione prelevato e venendo riconosciute e divise all'interno del detto segnale la parte relativa all'informazione audio e la parte relativa all'informazione video e venendo le dette due parti di segnale elaborate separatamente relativamente alla modifica della velocità di riproduzione, venendo utilizzato il parametro impostato precedentemente di modifica della velocità di riproduzione,
la detta elaborazione prevedendo il calcolo dei nuovi valori relativi alle velocità di riproduzione della parte audio e della parte video;
mentre la parte audio e al parte video con velocità di riproduzione modificata vengono accoppiate in modo da poter formare un nuovo segnale audio-video in uscita che presenta sincronia tra la parte audio e la parte video.
I passi di determinazione della velocità modificata di riproduzione dei segnali audio e video e di sincronizzazione verranno descritti con maggiori dettagli con riferimento a diverse possibili varianti a seguito. Tutte queste modalità forniscono segnali audio-video con velocità di riproduzione modificata e che possono venire riprodotti senza mostrare distorsioni né perdite di informazioni e trasmissione dello stesso segnale.
E' da notare che il metodo e il dispositivo oggetto della presente invenzione lavorano principalmente, ma non solo, in presenza di segnali digitali: nel caso di sorgenti analogiche il metodo e il dispositivo oggetto della presente invenzione prevedono una variante esecutiva che utilizza un campionatore digitale di comune utilizzo che riceve in ingresso un segnale audio-video analogico e restituisce un segnale audio-video digitale che presenta un determinato valore di campioni/secondo per la parte audio e un determinato valore di frame rate relativo alla parte video.
Secondo un perfezionamento dell'invenzione, prima della riproduzione del segnale audio-video a velocità modificata, in uscita dai mezzi di elaborazione è possibile prevedere un controllo che garantisce la sincronia tra la parte audio e la parte video.
Sono possibili diverse modalità di controllo della sincronizzazione.
Un esempio prevede di utilizzare sequenze temporali di gruppi di bit di sincronia, formati da almeno due bit, che si susseguono secondo una sequenza temporale che ha intervalli di stanziamento prestabiliti e fissi, essendo ogni bit dello stesso gruppo associato univocamente ad una ed una sola sequenza della parte del segnale di cui si vuole modificare la velocità di riproduzione, mentre i bit appartenenti allo stesso gruppo sono inoltre univocamente correlati tra di loro, venendo eseguito un controllo sulla identità della sequenza temporale dei bit di sincronia prima e dopo l'elaborazione e venendo considerata mantenuta la sincronia quando da detto controllo risulta che i bit di sincronia, a monte e a valle dell'elaborazione sul segnale, seguono la medesima sequenza temporale.
Il controllo relativo alla sincronia delle due parti audio e video previsto nel metodo oggetto della presente invenzione, responsabile può provvedere anche alla creazione di una copia del segnale in ingresso che viene caricato nella memoria di lavoro per essere rielaborato nel caso il segnale in uscita non presentasse sincronia tra le dette parti del detto segnale in ingresso.
Secondo una possibile variante esecutiva, è possibile eseguire un controllo numerico sui valori della velocità di riproduzione delle singole parti del segnale prima e dopo l'elaborazione, il quale controllo numerico prevede i seguenti passi:
l'estrapolazione del valore relativo alla frame rate della parte video del segnale in uscita da cui si ottiene il valore nominale della frame rate del segnale in ingresso tramite l'utilizzo di una funzione inversa dell'applicazione relativa all'elaborazione, cioè una funzione inversa di modifica della velocità di riproduzione ovvero della frame rate;
il successivo confronto dei valori della frame rate nominale e della frame rate effettiva i quali valori sono relativi alla parte video del segnale in ingresso.
Analogamente si calcolano e si confrontano i valori di campioni/secondo relativi alla parte audio del segnale in ingresso.
Il metodo oggetto della presente invenzione permette inoltre di modificare la velocità di riproduzione di segnali audio-video in reai time. Il segnale in ingresso viene infatti elaborato e ritrasmesso senza ritardi. Il segnale in ingresso viene caricato nella memoria di lavoro per poter gestire i ritardi che sono dovuti alla differenza di velocità di riproduzione tra il segnale in ingresso e quello in uscita, in modo da non avere perdite di informazione al momento della ricostruzione del segnale. La presenza di una ricostruzione reai time e l'assenza di asincronie tra la parte audio e la parte video del segnale sono caratteristiche che vengono mantenute anche nel caso in cui il segnale in ingresso contiene altre informazioni.
È importante sottolineare questo aspetto perché, ad esempio, la presenza di sottotitoli all'interno di un programma televisivo può essere un elemento fondamentale per alcuni degli scopi caratteristici del metodo oggetto della presente invenzione: I sottotitoli infatti aiutano nella comprensione di fonti audio video sia i soggetti ipoudenti che gli studenti di lingue straniere e, di conseguenza, la sincronia tra audio, video e sottotitoli è un aspetto di fondamentale importanza che aumenta l'utilità e perfeziona il funzionamento del metodo oggetto della presente invenzione.
Il metodo oggetto della presente invenzione prevede come forma preferita per la modifica della velocità di riproduzione della parte audio relativamente al segnale in ingresso una suddivisione della parte audio del segnale in ingresso in finestre di una larghezza temporale costante che rappresenta la parte minima di segnale che verrà elaborata nel senso della modifica della velocità di riproduzione e la sovrapposizione di dette finestre sulla parte audio del segnale in uscita per una quantità temporale che dipende dalla larghezza temporale delle finestre scelte e dal valore della modifica della velocità di esecuzione/riproduzione del segnale audio -video.
Partendo dai passi sopra descritti il metodo oggetto della presente invenzione utilizza preferibilmente algoritmi appartenenti alla famiglia di algoritmi denominata SOLA per la modifica della sola parte audio di segnali audio video, di cui dettagli più precisi sono da ricercare nei documenti US 5,717,818, US 5,175,769 e "an overlap-add technique based on waveform similarità (WSOLA) for high qualità time scale modification of speech-IEEE Proceedings of ICASSP-93, voi.II, pp. 554-557,1993.
Inoltre il metodo oggetto della presente invenzione utilizza nella sua forma esecutiva preferita il parametro della frame rate video per la modifica della velocità di riproduzione della parte video del segnale in ingresso. In questo caso viene estrapolato il dato relativo alla modifica della velocità di riproduzione del segnale in ingresso che è stata impostata dall'utente, si ottiene il nuovo valore di velocità di riproduzione della parte audio del segnale attraverso il metodo sopra descritto e tramite questo nuovo valore in combinazione con una funzione tabellare si calcola il nuovo valore di velocità di riproduzione della parte video modificando il valore della frame rate del segnale video in uscita.
L'invenzione ha per oggetto anche un dispositivo che viene utilizzato per l'attuazione del descritto metodo e che è oggetto delle rivendicazioni.
Il dispositivo oggetto della presente invenzione è costituito da mezzi di elaborazione per l'esecuzione di programmi che presentano una memoria di lavoro all'interno della quale vengono caricati i segnali audio-video che il detto dispositivo riceve da una fonte tramite porte di ingresso. Oltre alla memoria di lavoro i mezzi di elaborazione comprendono una memoria di programma in cui è caricato o caricabile un programma di elaborazione del segnale audio-video, il quale programma modifica la velocità di riproduzione del segnale audio-video in ingresso e fornisce tramite delle porte di uscita un segnale audio-video a velocità modificata e che presenta sincronia tra la parte audio e la parte video senza portare distorsioni e/o artefatti e/o perdite di informazioni sul detto segnale di uscita.
L'entità della modifica della velocità di riproduzione viene impostata dagli utenti: il dispositivo infatti presenta un'interfaccia utente di immissione di dati e comandi che possono preferibilmente essere costituiti da mezzi remoti di comando via cavo o wireless, come i telecomandi di comune utilizzo nei dispositivi elettronici.
Una possibile forma esecutiva del dispositivo oggetto della presente invenzione presenta all'interno dei detti mezzi di elaborazione una memoria supplementare in cui è possibile memorizzare il segnale di uscita a velocità modificata, per poi richiamarli tramite l'interfaccia utente e ritrasmetterli senza la necessità di avere il segnale in ingresso. Questa variante conferisce al dispositivo oggetto dell'invenzione un'ulteriore potenzialità, di agire come archivio di filmati e programmi televisivi: il segnale in ingresso potrà essere modificato e salvato in memoria per poter essere visionato in un secondo tempo e a diverse velocità di esecuzione scelte dall'utente in base alle proprie esigenze tramite l'interfaccia utente.
Secondo una ulteriore caratteristica, il dispositivo oggetto della presente invenzione, presenta tutte le peculiarità dei comuni decoder in commercio, come ad esempio la possibilità di avere un timer interno che permetta la registrazione e la modifica di un segnale audio-video in ingresso attraverso delle pre-impostazioni, senza la necessità che l'utente da remoto faccia partire la registrazione .
Inoltre, una volta memorizzato un segnale audio video, il dispositivo secondo la presente invenzione permette di scegliere solo alcune delle parti del segnale da riprodurre e selezionare per ciascuna parte velocità di riproduzione diverse.
Il dispositivo può inoltre presentare più di un ingresso per poter selezionare la fonte dalla quale attingere il segnale, come ad esempio televisore, lettore di supporti vari (cd, DVD), ricevitori satellitari e qualsivoglia sorgente esterna e può elaborare più segnali in ingresso modificando la velocità di riproduzione degli stessi con valori comuni o differenti per ciascun segnale in ingresso.
Da quanto sopra esposto risultano chiaramente i vantaggi della presente invenzione.
Ulteriori perfezionamenti del metodo e del dispositivo della presente invenzione sono oggetto delle sottorivendicazioni.
Le caratteristiche dell'invenzione ed i vantaggi da esse derivanti risulteranno più chiaramente dalla seguente descrizione di alcuni esempi esecutivi illustrati nei disegni allegati in cui:
la fig. 1 illustra il diagramma di flusso che riassume schematicamente i passi del metodo oggetto della presente invenzione;
la fig. 2 illustra in maniera schematica il passo del controllo di sincronia del metodo oggetto della presente invenzione;
la fig. 3 illustra uno schema a blocchi della struttura del dispositivo oggetto della presente invenzione .
Nelle figure è illustrata schematicamente la struttura ed il funzionamento di un esempio esecutivo del metodo e del dispositivo oggetto della presente invenzione .
In figura 1 è illustrato il diagramma di flusso che riassume i passi del metodo oggetto della presente invenzione secondo una possibile modalità di funzionamento .
Il metodo oggetto della presente invenzione viene utilizzato per la modifica della velocità di esecuzione di segnali audio video, restituendo un segnale audio video in uscita a velocità modificata che presenta sincronia tra la parte audio, la parte video ed eventuali informazioni portate dal segnale, senza creare distorsioni o perdite di informazioni rispetto al segnale in ingresso.
La figura 1 illustra una possibile modalità di funzionamento del metodo oggetto della presente invenzione prevedendo i seguenti passi, presentati per blocchi funzionali:
accensione e selezione sorgente, indicato con 101, l'utente, tramite un dispositivo di controllo remoto, accende un dispositivo all'interno del quale avviene il metodo, seleziona poi la sorgente dalla quale si vuole attingere il segnale da modificare; caricamento segnale, indicato con 102, il segnale viene caricato all'interno di una memoria di lavoro:
modifica della velocità di riproduzione, indicato con 103, l'utente decide se modificare la velocità di riproduzione: Se l'utente non intende modificare tale velocità viene trasmesso in uscita un segnale uguale a quello in ingresso, altrimenti viene impostato un parametro di modifica della velocità di esecuzione;
elaborazione del segnale, indicato con 104, il segnale in ingresso viene preso dalla memoria di lavoro e viene divisa la parte audio dalla parte video e caricate separatamente all'interno di mezzi di elaborazione. Si utilizza il parametro ottenuto in ingresso dall'utente e si ottengono due nuovi valori di velocità di riproduzione, un nuovo valore di campioni/secondo per la parte audio e un nuovo valore di frame rate per la parte video:
Per quanto riguarda la parte audio, il segnale in ingresso viene finestrato tramite l'utilizzo di finestre, che vengono poi sovrapposte nella ricostruzione del segnale per ottenere il valore desiderato in uscita di campioni/secondo in modo da non causare distorsioni di frequenza;
Per quanto riguarda la parte video si utilizza una funzione tabellare che associa ad un variazione generale di velocità di un qualsiasi segnale audiovideo una modifica del valore della frame rate relativa alla parte video del segnale in ingresso; si sottolinea che, per guanto riguarda la parte video, la modifica della velocità di esecuzione prevede la diminuzione o l'aumento della fraine rate con metodi attualmente di uso comune, mentre per quanto riguarda la parte audio la possibilità di modificare la velocità di esecuzione senza causare distorsioni nelle frequenze, mantenendo cioè inalterato, ad esempio, il tono di una voce, non è banale: per ottenere l'effetto desiderato il metodo oggetto della presente invenzione utilizza preferibilmente una categoria particolare di algoritmi denominata SOLA, algoritmi e/o metodi sono noti e sono descritti con maggior dettaglio nei documenti US 5,717,818, US 5,175,769 e "an overlapadd technique based on waveform similarità (WSOLA) for high qualità time scale modification of speech-IEEE Proceedings of ICASSP-93, voi.II, pp. 554-557,1993 il cui contenuto è parte integrante della presente descrizione.
Con 105 si indica il controllo della sincronia. Questa viene controllata tra la parte audio e la parte video ed il controllo agisce a monte e a valle dell'elaborazione .
Un esempio esecutivo di una metodologia di verifica della sincronia prevede prevede l'utilizzo di bit di sincronia, ed è illustrato e descritto con maggiore dettaglio con riferimento alla fig. 2.
Ovviamente sono possibili anche altri metodi di verifica della sincronia fra componente audio e componente video del segnale dopo che la velocità di riproduzione delle due componenti è stata modificata corrispondentemente ai parametri di variazione impostati dall'utente.
Nel caso si presentasse una condizione di asincronia tra le due parti di segnale e cioè la parte audio e la parte video, il controllo carica nuovamente il segnale in ingresso e modifica iterativamente la velocità di riproduzione delle due parti audio e video fino ad ottenere la sincronia sul segnale in uscita;
Con 106 si indica il passo di generazione e trasmissione del segnale che viene eseguito quando la parte audio e la parte video del segnale presentano sincronia, vengono riaccoppiate generando il segnale di uscita modificato che poi viene trasmesso.
In figura 2 viene mostrato il passo del controllo di sincronia del metodo oggetto della presente invenzione secondo l'esempio su citato.
Il controllo di sincronia a monte del processo di elaborazione suddivide le due parti audio e video del segnale in ingresso, indicate in figura rispettivamente con 1 e 2, in una sequenza temporale di sottounità; ad ogni sottounità 11 e 22 vengono univocamente associati i bit di sincronia 31 e 32, nella figura 2 ciò è evidenziato mediante una differente resinatura dei bit e delle sottounità; i bit sono anche correlati univocamente tra loro e appartenenti ad una sequenza di coppie di bit di sincronia che si susseguono secondo una base tempi cioè un orologio, che ha intervalli di stanziamento prestabiliti e fissi; ogni copia di bit viene divisa e associata univocamente ad ogni sottounità audio e sottounità video del segnale in ingresso. A questo punto il segnale viene elaborato tramite mezzi di elaborazione 42 e il controllo verifica che ci sia corrispondenza sia tra i bit di sincronia accoppiati 31 e 32, sia tra le sottounità audio e video 11 e 22 e il proprio bit associato, rispettivamente 31 e 32.
La figura 3 illustra uno schema a blocchi della struttura del dispositivo 4 oggetto della presente invenzione.
Il dispositivo 4 riceve da una qualsivoglia sorgente un segnale audio-video tramite la porta di ingresso 41 che comunica con un'unità di elaborazione 42. All'interno dell'unità di elaborazione 42 sono previsti una memoria di lavoro 421 dove viene caricato il segnale in ingresso, una memoria di programma 422 in cui è caricato o caricabile un programma di elaborazione del segnale audio-video e una CPU 423 che divide il segnale in ingresso nella parte audio e nella parte video e che permette l'elaborazione delle due dette parti: le due dette parti vengono poi controllate dall'unità di controllo 43 che agisce a monte e a valle dei mezzi di elaborazione 42 che, tramite la metodologia descritta in precedenza, controlla la sincronia del segnale modificato e nel caso di esito positivo riaccoppia le 2 parti del segnale e trasmette il segnale alla porta di uscita 44.
Il dispositivo 4 presenta infine un'unità di interfaccia 45 che comunica con l'unità di elaborazione 42 e permette all'utente tramite un controllo remoto di impostare la velocità desiderata e di compiere altre svariate azioni come ad esempio scegliere la sorgente da utilizzare come segnale di ingresso oppure scegliere il segnale da riprodurre -tra i segnali registrati all'interno della memoria di lavoro 421.

Claims (19)

  1. RIVENDICAZIONI 1. Metodo di modifica della velocità di riproduzione di segnali audio-video che comprende i seguenti passi: a) acquisizione di un segnale di ingresso da una qualsivoglia sorgente, b) memorizzazione del detto segnale all'interno di una memoria di lavoro di un dispositivo, c) impostazione della velocità di riproduzione del detto segnale audio-video, d) prelevamento del detto segnale audio-video all'interno della detta memoria di lavoro, e) divisione della parte audio dalla parte video del detto segnale f) elaborazione della velocità di esecuzione sia della parte audio che della parte video in cui viene utilizzato il parametro impostato al passo c) della velocità di riproduzione per determinare il nuovo valore della frame rate della parte video e il nuovo valore di campioni/secondo della parte audio, modificate separatamente e in maniera bilanciata, g) accoppiamento della parte audio con velocità di esecuzione modificata con la parte video con velocità di esecuzione modificata, h) generazione e trasmissione di un segnale in uscita che presenta sincronia tra la parte audio e la parte video senza portare distorsioni e/o artefatti e/o perdite di informazioni sul detto segnale di uscita .
  2. 2 . Metodo di modifica della velocità di riproduzione di segnali audio-video secondo la rivendicazione 1, caratterizzato dal fatto che l'elaborazione del detto segnale in ingresso e la generazione e trasmissione del detto segnale di uscita avvengono in reai-time o in quasi reai-time.
  3. 3. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che il detto segnale audio-video in ingresso contiene informazioni in aggiunta alla parte audio e alla parte video.
  4. 4. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che la modifica della velocità di riproduzione della sola parte audio prevede la suddivisione in finestre della parte audio del detto segnale in ingresso e la sovrapposizione di dette finestre sulla parte audio del segnale in uscita di una quantità che dipende dalla larghezza delle finestre scelte e dal valore della modifica della velocità di esecuzione del segnale audio-video.
  5. 5. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che la modifica della velocità di riproduzione della sola parte audio viene attuata mediante l'utilizzo di un algoritmo noto appartenente alla famiglia degli algoritmi denominata SOLA.
  6. 6. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che prevede un passo ulteriore di controllo sulla sincronia della parte audio con la parte video, o sulla sincronia di almeno una di dette parti con informazioni aggiuntive contenute all'interno del detto segnale in ingresso.
  7. 7. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che il detto controllo viene effettuato utilizzando sequenze temporali di gruppi di bit di sincronia, formati da almeno due bit, che si susseguono secondo una sequenza temporale che ha intervalli di stanziamento prestabiliti e fissi, i bit di ciascun gruppo essendo univocamente correlati fra loro e univocamente associati ad ogni parte di sequenza video, di sequenza audio o di altre eventuali informazioni contenute nel detto segnale, in modo tale per cui se i bit di sincronia si trovano nella stessa sequenza a monte e a valle dell'elaborazione del detto segnale viene mantenuta la sincronia tra la parte audio e la parte video all'interno del segnale in uscita.
  8. 8. Metodo di modifica della velocità di riproduzione di segnali audio-video secondo una o più delle precedenti rivendicazioni, caratterizzato dal fatto che il detto controllo viene effettuato a valle e a monte dell'elaborazione del detto segnale, si estrapola il valore relativo alla fraine rate del segnale in uscita e si ottiene il valore nominale della frame rate in ingresso mediante una funzione inversa dell'applicazione relativa alla detta elaborazione, dopodiché si confrontano i valori in ingresso di frame rate nominale ed effettivo; allo stesso modo viene effettuato il controllo sul valore di campioni/secondo relativo al segnale audio in ingresso.
  9. 9. Dispositivo per la modifica della velocità di riproduzione di segnali audio video Caratterizzato dal fatto che è costituito da mezzi di elaborazione per l'esecuzione di programmi con almeno un ingresso per un segnale audio-video, un uscita per il detto segnale audio-video, una interfaccia utente di immissione di dati e/o comandi e i quali mezzi di elaborazione comprendono una memoria di lavoro, essendo all'interno di detta memoria di lavoro caricabili spezzoni e/o una successione di parti di file audio-video, ed almeno una memoria di programma in cui è caricato o caricabile un programma di elaborazione del segnale audio-video, il quale modifica la velocità di riproduzione del segnale audio-video in ingresso in base ad un parametro di modifica della velocità di riproduzione impostato dall'utente e fornisce in uscita un segnale audiovideo con la detta nuova a velocità modificata che presenta sincronia tra la parte audio e la parte video senza portare distorsioni e/o artefatti e/o perdite di informazioni sul detto segnale di uscita.
  10. 10. Dispositivo per la modifica della velocità di riproduzione di segnali audio video secondo la rivendicazione 9 caratterizzato dal fatto che il detto segnale audio-video in uscita a velocità modificata presenta sincronia tra la parte audio, la parte video ed eventuali informazioni in aggiunta alla parte audio e alla parte video, senza portare distorsioni e/o artefatti e/o perdite di informazioni sul detto segnale di uscita.
  11. 11. Dispositivo per la modifica della velocità di riproduzione di segnali audio video secondo una o più delle rivendicazioni precedenti caratterizzato dal fatto che presenta mezzi di interfaccia utente costituiti da mezzi remoti di comando via cavo o wireless.
  12. 12. Dispositivo per la modifica della velocità di riproduzione di segnali audio video secondo una o più delle rivendicazioni precedenti caratterizzato dal fatto che all'interno della memoria della detta unità di elaborazione è possibile memorizzare il segnale in uscita dalla stessa unità di elaborazione.
  13. 13. Dispositivo per la modifica della velocità di riproduzione di segnali audio video secondo una o più delle rivendicazioni precedenti caratterizzato dal fatto che presenta almeno più di un ingresso e di un'uscita e i detti mezzi di elaborazione permettono la modifica della velocità di esecuzione di distinti segnali audio video contemporaneamente.
  14. 14. Uso del metodo e/o del dispositivo per il rallentamento di programmi audio-video direttamente registrati su supporto o direttamente trasmessi al detto dispositivo tramite un'interfaccia di ingresso.
  15. 15. Uso del metodo e/o del dispositivo secondo una o più delle rivendicazioni precedenti per facilitare la comprensione di segnali audio video.
  16. 16. Uso del metodo e/o del dispositivo secondo una o più delle rivendicazioni precedenti come strumento di ausilio durante terapie di logopedia per la valutazione di soggetti, in particolare ipoudenti.
  17. 17. Uso del metodo e/o del dispositivo secondo una o più delle rivendicazioni precedenti come strumento di supporto durante lo svolgimento di terapie di logopedia e/o di allenamento e/o esercizio di soggetti ,in particolare, ipoudenti.
  18. 18. Uso del metodo e/o del dispositivo secondo una o più delle rivendicazioni precedenti per l'apprendimento delle lingue.
  19. 19. Uso del metodo e/o del dispositivo secondo una o più delle rivendicazioni precedenti come strumento utile per le trascrizioni in testo scritto ed eventuali traduzioni di contenuti vocali registrati o esposti in tempo reale.
IT000037A 2009-06-08 2009-06-08 Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video ITGE20090037A1 (it)

Priority Applications (2)

Application Number Priority Date Filing Date Title
IT000037A ITGE20090037A1 (it) 2009-06-08 2009-06-08 Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video
EP10165115A EP2261900A1 (en) 2009-06-08 2010-06-07 Method and apparatus for modifying the playback rate of audio-video signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000037A ITGE20090037A1 (it) 2009-06-08 2009-06-08 Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video

Publications (1)

Publication Number Publication Date
ITGE20090037A1 true ITGE20090037A1 (it) 2010-12-09

Family

ID=41600772

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000037A ITGE20090037A1 (it) 2009-06-08 2009-06-08 Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video

Country Status (2)

Country Link
EP (1) EP2261900A1 (it)
IT (1) ITGE20090037A1 (it)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101224165B1 (ko) * 2008-01-02 2013-01-18 삼성전자주식회사 데이터 처리 모듈 제어 방법 및 장치
EP3241206A4 (en) * 2014-12-31 2018-08-08 Novotalk, Ltd. A method and system for online and remote speech disorders therapy
CN112750436B (zh) * 2020-12-29 2022-12-30 上海掌门科技有限公司 一种用于确定语音消息的目标播放速度的方法与设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077381A1 (en) * 2003-02-28 2004-09-10 Dublin Institute Of Technology A voice playback system
WO2005045830A1 (en) * 2003-11-11 2005-05-19 Cosmotan Inc. Time-scale modification method for digital audio signal and digital audio/video signal, and variable speed reproducing method of digital television signal by using the same method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5717818A (en) 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077381A1 (en) * 2003-02-28 2004-09-10 Dublin Institute Of Technology A voice playback system
WO2005045830A1 (en) * 2003-11-11 2005-05-19 Cosmotan Inc. Time-scale modification method for digital audio signal and digital audio/video signal, and variable speed reproducing method of digital television signal by using the same method

Also Published As

Publication number Publication date
EP2261900A1 (en) 2010-12-15

Similar Documents

Publication Publication Date Title
Szarkowska Text-to-speech audio description: towards wider availability of AD
US10180981B2 (en) Synchronous audio playback method, apparatus and system
JP5093239B2 (ja) 文字情報提示装置
TW201135684A (en) System for translating spoken language into sign language for the deaf
JP4621758B2 (ja) コンテンツ情報再生装置、コンテンツ情報再生システム、および情報処理装置
US20160295293A1 (en) System and Method for Synchronization of Audio and Closed Captioning
CN103747287A (zh) 应用于flash的视频播放速度调整的方法及系统
US20210151082A1 (en) Systems and methods for mixing synthetic voice with original audio tracks
JP7045266B2 (ja) 音響信号補助情報変換伝送装置及びプログラム
Alm et al. Audio-visual speech experience with age influences perceived audio-visual asynchrony in speech
ITGE20090037A1 (it) Metodo e dispositivo di modifica della velocita' di riproduzione di segnali audio-video
Hupke et al. Effect of a global metronome on ensemble accuracy in networked music performance
Laderman Punk Slash! Musicals: Tracking Slip-Sync on Film
JP2008299032A (ja) 語学教材および文字データ再生装置
KR101618777B1 (ko) 파일 업로드 후 텍스트를 추출하여 영상 또는 음성간 동기화시키는 서버 및 그 방법
JP2013005423A (ja) 映像再生装置、映像再生方法およびプログラム
GB2577742A (en) Data processing apparatus and method
CA2951422C (en) Computing device and corresponding method for generating data representing text
Roesler et al. Acoustic characteristics of tense and lax vowels across sentence position in clear speech
JP4086886B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
Cohen Wireless Imaginations
JP2008154258A (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
US10031899B2 (en) Computing device and corresponding method for generating data representing text
JP2003309786A (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
WO2021255831A1 (ja) 送信装置、コミュニケーション方法、及びプログラム