ITMI951379A1 - Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato - Google Patents
Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato Download PDFInfo
- Publication number
- ITMI951379A1 ITMI951379A1 IT95MI001379A ITMI951379A ITMI951379A1 IT MI951379 A1 ITMI951379 A1 IT MI951379A1 IT 95MI001379 A IT95MI001379 A IT 95MI001379A IT MI951379 A ITMI951379 A IT MI951379A IT MI951379 A1 ITMI951379 A1 IT MI951379A1
- Authority
- IT
- Italy
- Prior art keywords
- voice signal
- waveform
- prototype
- segment
- sampled voice
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000005284 excitation Effects 0.000 claims abstract description 27
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 230000000737 periodic effect Effects 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims description 24
- 230000003595 spectral effect Effects 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 8
- 230000001755 vocal effect Effects 0.000 abstract description 3
- 230000006835 compression Effects 0.000 abstract description 2
- 238000007906 compression Methods 0.000 abstract description 2
- 238000001228 spectrum Methods 0.000 description 18
- 230000006978 adaptation Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000000417 anti-transforming effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
La presente invenzione si riferisce ad un metodo ed ai relativi apparati di codifica e di decodifica di un segnale vocale campionato. Esso fa parte dei sistemi utilizzati per l'elaborazione del parlato in particolare per la compressione dell'informazione.Il metodo introdotto si basa su una descrizione tempo/frequenza e su una rappresentazione del prototipo come periodo fondamentale di una forma d'onda periodica, inoltre l'eccitazione del filtro di sintesi è effettuata mediante un singolo impulso adattato in fase.
Description
D E S C R I Z I O N E:
La presente invenzione si riferisce ad un metodo ed ai relativi apparati di codifica e di decodifica di un segnale vocale periodico campionato. Esso fa parte dei sistemi utilizzati per l’elaborazione del parlato in particolare per la compressione dell’informazione. Si tratta quindi di un metodo per la codifica di forme d’onda periodiche costituenti la componente Vocalizzata’ dei segnali vocali. E’ noto che tale componente vocalizzata e’ costituita dalla ripetizione periodica (o semi-periodica) di una forma d’onda fondamentale, che in letteratura (si veda ad esempio l’articolo di W. B. Kleijn "Methods for waveform interpolation in speech coding", Digital Signal Processing, pp. 215-230, Sept. 1991) viene sovente chiamata 'prototipo’.
Dalla letteratura, i metodi di rappresentazione, parametrizzazione e codifica della componente vocalizzata vengono generalmente divisi in due classi:
1) - Rappresentazione e codifica nel dominio del tempo.
2) - Rappresentazione e codifica nel dominio della frequenza. 1) - I codificatori operanti nel dominio del tempo sono basati generalmente su strutture di tipo 'Linear Predictive Coding’ (LPC). In questo caso, le componenti spettrali della forma d’onda vengono determinate sulla base di segmenti di segnale di lunghezza generalmente fissa, tale lunghezza non essendo vincolata in alcun modo alla lunghezza del prototipo. Le componenti spettrali vengono univocamente rappresentate da un insieme di coefficienti di un opportuno filtro digitale, detto filtro di sintesi LPC. La periodicità’ della forma d’onda viene introdotta generalmente mediante la ripetizione periodica di una forma d’onda detta ’di eccitazione’; tale forma d’onda costituisce il segnale di ingresso per il filtro di sintesi. Una descrizione dettagliata del principio di funzionamento di tali codificatori può’ essere trovata nell’articolo di M. R. Schroeder e B. S. Atal, "Code-Exdted Linear Prediction (CELP): High Quality Speech at Very Low Bit Rates”, Proceedings of thè International Conference on Acoustic, Speech and Signal Processing, 1985, pp. 937-940.
2) - Nei codificatori operanti nel dominio della frequenza, le componenti spettrali del segnale vengono determinate con opportune analisi di Fourier. La periodicità’ della forma d’onda viene introdotta mediante la somma di componenti sinusoidali di ampiezza e fase opportune. La frequenza fondamentale di tale insieme di sinusoidi e’ evidentemente legata alla lunghezza del prototipo. Similmente ai codificatori operanti nel dominio del tempo, la forma d’onda vocalizzata viene analizzata e ri-sintetizzata secondo segmenti di lunghezza fissa, tale lunghezza non essendo vincolata in alcun modo alla lunghezza del prototipo. Per una descrizione dettagliata di tali codificatori si veda, ad esempio, l’articolo di D. W. Griffm e J. S. Lim "Multiband Excitation Vocoder", IEEE Transactions on Acoustic, Speech and Signal processing, pp.
Piu’ recentemente, una nuova tecnica di codifica e’ stata introdotta, al fine di ottenere una forma d’onda vocalizzata ricostruita di alta qualità’. Tale tecnica e’ incentrata sulla rappresentazione, parametrizzazione e codifica di un singolo prototipo (e quindi su un segmento di voce di lunghezza variabile). Un segmento vocalizzato può’ essere ricostruito mediante la concatenazione di tale prototipo, rigenerando cosi’ la necessaria periodicità’. Piu’ precisamente, dati due prototipi separati temporalmente secondo una certa distanza, la forma d’onda periodica tra i due prototipi può’ essere ricostruita mediante tecniche di interpolazione opportuna tra i due prototipi. In sede di decodifica, l’informazione che descrive un prototipo e i parametri di interpolazione e’ quindi sufficiente a ricostruire un segmento vocalizzato: il decodificatore e’ in grado di ricostruire il segmento vocalizzato per interpolazione, avendo in memoria la descrizione del prototipo 'passato’ e ricevendo dal canale di trasmissione la descrizione del prototipo 'presente’ e i parametri di interpolazione. Questa tecnica di codifica e’ notai con il nome di ’Prototype Waveform Interpolation’ (PWI) ed e’ descritta, ad esempio, nell’articolo di W. B. Kleijn "Methods for waveform interpolation in speech coding", Digital Signal Processing, pp.
215-230, Sept. 1991.
Scopo della presente invenzione è quello di provvedere ad un nuovo metodo di codifica dei segnali vocali più efficiente: dei sovraesposti metodi; tale metodo utilizza la tecnica di codifica di tipo PWI e si propone di ottenere un metodo efficace ed efficiente per rappresentare, parametrizzare e trasmettere un prototipo.
Con tale tecnica di codifica è possibile ottenere una buona qualità del segnale ricostruito a bassi bit rates (ad esempio attorno ai 2400 bit/s).
Un ulteriore vantaggio è costituito dal fatto che la bit rate di codifica può essere facilmente variata in funzione del numero di parametri tempo/frequenza usati per la descrizione del segnale di eccitazione e della frequenza di estrazione del prototipo.
In accordo all’invenzione tale scopo viene raggiunto
mediante un metodo di codifica, ad un codificatore, ad un metodo di decodifica, e ad un codificatore aventi le caratteristiche esposte rispettivamente nelle rivendicazioni 1, 9, 10, 11.
Ulteriori caratteristiche dell’invenzione sono descritte nelle rivendicazioni dipendenti.
L’invenzione verrà ora illustrata in maggior dettaglio con l’ausilio del disegno allegato in cui è rappresentato un segnale periodico campionato in cui in a) il periodo di campionamento non è un multiplo del periodo del segnale, mentre in b)
il periodo di campionamento è un multiplo del periodo del segnale. Il metodo introdotto si basa su una descrizione tempo/frequenza ed e’ basato sui punti seguenti: rappresentazione di tipo LPC del prototipo; eccitazione mediante singolo impulso adattato in fase; e l’algoritmo di adattamento in fase.
Nel seguito è presente una descrizione dettagliata di tali punti.
E’ noto che la rappresentazione LPC di una forma d’onda consente di ottenere una stima ai minimi quadrati deH’inviluppo spettrale del segnale. In particolare, i coefficienti LPC di un filtro di sintesi generano una funzione di trasferimento che offre, generalmente, una buona rappresentazione spettrale delle risonanze presenti nel segnale. I metodi classici di estrazione dei coefficienti LPC lavorano su segmenti di segnale di lunghezza fissa. Specificamente, essi lavorano lungo delle 'finestre’ temporali al di fuori delle quali il segnale e’ supposto essere nullo. Questo approccio genera degli effetti di bordo che possono implicare delle distorsioni indesiderate nella rappresentazione spettrale del segnale.
NeH’impostare una rappresentazione di tipo LPC di un prototipo si può’ sfruttare l’ipotesi che il prototipo sia esattamente il periodo fondamentale della forma d’onda periodica che rappresenta il segmento vocalizzato. Sotto tale ipotesi, la 'finestra’ temporale per il calcolo dei coefficienti LPC ha una lunghezza pari alla lunghezza del prototipo stesso. Inoltre, si può’ evitare di supporre che il segnale sia nullo al di fuori di tale finestra di analisi: una estensione periodica del segnale al di fuori della finestra di analisi permette di evitare i suddetti effetti di bordo. In particolare, i coefficienti di correlazione (necessari per il calcolo dei coefficienti del filtro) sono calcolati sulla estensione periodica del segnale, garantendo comunque la stabilita’ del filtro di sintesi LPC. I coefficienti LPC che risultano da tale metodo di calcolo permettono una piu’ efficace rappresentazione spettrale del prototipo, non essendo presente la suddetta polarizzazione dovuta agli effetti di bordo. Per quanto riguarda l’eccitazione mediante singolo impulso adattato in fase, i vocoders LPC tradizionali (si veda, ad esempio: T. Tremain, "The Government Standard Linear Predictive Coding Algorithm: LPC-10", Speech Technology, pp. 40- 49, Apr. 82) sono basati su un semplice modello di produzione della voce: ogni segmento vocalizzato è ricostruito mediante un sequenza di impulsi di ampiezza costante e a distanza fissa; tale sequenza costituisce l’ingresso del filtro LPC di sintesi opportuno. 11 treno di impulsi cosi’ definito ricostruisce la periodicità’ necessaria. E’ quindi evidente che, in linea di principio, un singolo impulso (di ampiezza e posizione opportune) potrebbe costituire l’eccitazione al filtro LPC descritto nel paragrafo 2b. Il prototipo, infatti, non è altro che un periodo fondamentale della forma d’onda vocalizzata. La determinazione di tale impulso deve pero’ tenere conto del fatto che il prototipo viene idealmente periodicizzato, cosi’ come viene fatto per il calcolo dei coefficienti LPC. L’insieme (coefficienti LPC, singolo impulso) viene quindi a costituire il modello di sintesi di una forma d’onda (prototipo) che definisce il periodo fondamentale di un segmento vocalizzato. L’ampiezza e la posizione del singolo impulso devono quindi essere calcolate ’a regime’: un treno di infiniti impulsi, separati fra loro da una distanza (periodo) fissa e pari alla lunghezza del prototipo vengono inviati all’ingresso del filtro di sintesi LPC, consentendo di ricostruire, dopo un numero infinito di periodi, la forma d’onda fondamentale (prototipo). In pratica, e’ stato osservato che poche ripetizioni (3 o 4) dell’impulso sono sufficienti per portare a regime lo stato del filtro di sintesi. Un modello siffatto di ricostruzione del prototipo, combinato con una opportuna tecnica PWI consente di ricostruire un segmento vocalizzato con una accuratezza molto maggiore rispetto a metodi basati sul modello classico di sintesi LPC-10 descritto sopra.
Il modello di sintesi descritto, pur migliorando sostanzialmente lo stato dell’arte, si presta facilmente ad ulteriori miglioramenti, al fine di ottenere una ricostruzione del prototipo di alta qualità’. E’ noto infatti che il filtro LPC di sintesi e’ a fase minima, mentre il prototipo non Io è, in generale. Un sistema di sintesi del prototipo (basato su impulso singolo, filtro LPC) può’ garantire una buona ricostruzione del MODULO dello spettro del prototipo, ma non della sua FASE.
Un modo per ovviare a questo problema e quindi migliorare ulteriormente la qualità’ può’ essere quello di variare in modo opportuno lo spettro di fase del singolo impulso (un singolo impulso e’ caratterizzato da una trasformata di Fourier avente modulo costante e fase lineare). Dato quindi uno spettro costante (rappresentativo di un singolo impulso in posizione zero), si tratta di trovare dei valori opportuni dello spettro di fase, in modo tale che il prototipo ricostruito sia ’vicino’ al prototipo originale, secondo un certo criterio di errore. Le considerazioni fatte precedentemente sulla ricostruzione del prototipo (ripetizione periodica di una opportuna eccitazione, filtro di sintesi LPC calcolato sul prototipo periodicizzato) sono ancora valide; il segnale di eccitazione viene pero’ parametrizzato in modo piu’ completo, descrivendolo in termini dì una forma d’onda opportuna, ottenuta mediante variazioni appropriate dello spettro di fase di un singolo impulso. La descrizione del segnale di eccitazione viene quindi fatta mediante un opportuno spettro di fase, una posizione e una ampiezza.
Nel seguito vengono descritte tecniche opportune per variare opportunamente lo spettro di fase del singolo impulso (problema dell’ "adattamento in fase").
Sono stati fatti di recente dei tentativi per adattare in fase lo spettro di un generico segnale di eccitazione del filtro LPC. In particolare, nell’articolo di P. Lupini e V. Cuperman "Excitation Modeling Based on Speech Residuai Information", Proc. International Conference on Acoustic, Speech and Signal Processing, pp.
333-336, 1992, viene mostrato un algoritmo di adattamento in fase in cui i campioni di fase utilizzati sono quelli del residuo di predizione e l’eccitazione al filtro LPC deriva da segmenti di rumore casuale a densità’ di probabilità’ gaussiana (come nei classici codificatori di tipo CELP).
Tale algoritmo, pur portando a buoni risultati, deriva da considerazioni puramente sperimentali: in generale, non e’ detto che sia corretto utilizzare come informazione di fase quella derivante dal residuo di predizione; più specificatamente, i campioni di fase per l’adattamento dovrebbero essere determinati secondo la ben nota procedura della ’Analisi-per-Sintesi’: ovvero, i valori dei campioni di fase dovrebbero essere determinati in modo tale che il prototipo ricostruito sia 'vicino’ (secondo un opportuno criterio di errore) al prototipo originale.
Nel nostro caso, come visto, l’eccitazione 'di partenza’ e’ costituita da un singolo impulso, ovvero da una forma d’onda avente spettro costante e spettro di fase lineare (eventualmente nullo, se l’impulso e’ in posizione 0). Per ottenere l’adattamento in fase desiderato, la forma d’onda di eccitazione deve essere ottenuta antitrasformata di un segnale in frequenza avente spettro costante e spettro di fase non-lineare. Lo spettro di fase va quindi adattato opportunamente, secondo un pre-defmito criterio di errore (ad esempio, l’errore quadratico minimo) rispetto al prototipo originale.
L’adattamento dello spettro di fase viene ottenuto variando opportunamente i campioni di fase; in particolare, si può’ variare:
1) - Un solo campione di fase, a una frequenza pre-stabilita.
2) - Tutti i campioni di fase (l’intero spettro di fase).
3) - Un gruppo di campioni di fase, a frequenze contigue.
4) - Un gruppo di campioni di fase opportunamente separati per sottogruppi di frequenza.
Nel caso 4), le frequenze alle quali si effettua l’adattamento in fase possono essere scelte secondo opportuni criteri: ad esempio, si potrebbe decidere di adattare i valori dei campioni di fase alle frequenze in cui lo spettro di potenza del filtro di sintesi LPC assume i valori massimi relativi, oppure valori oltre una certa soglia, etc.
A titolo di esempio, si supponga che i! periodo del prototipo sia pari a 30 (campioni); si avranno quindi 30 righe spettrali (soggette ai noti legami della Discrete Fourier Transform) e si considerino quindi le frequenze fi ... fl5. Nel caso 1), si potrebbe variare la fase ad esempio alla frequenza discreta 13. Nel caso 2), tutti i campioni di fase (dalla frequenza fi alla fi 5) verrebbero variati. Nel caso 3), si potrebbe variare la fase dei campioni ad esempio alle frequenze fi ... f4. Infine, nel caso 4), si potrebbero variare le fasi dei campioni ad esempio alle frequenze fi, f2, f3, f5, f6, f9. In particolare, nel caso 4), i campioni di fase potrebbero essere quelli corrispondenti a valori "significativi" dello spettro di potenza del filtro LPC di sintesi (ad esempio, corrispondenti a massimi assoluti o relativi).
Come esempio di applicazione del metodo di adattamento dei campioni di fase, si consideri il caso in cui venga definita una 'griglia’ possibile di valori di fase (ad esempio: 0-gradi, 90-gradi,
180-gradi, 270-gradi) e si faccia variare un certo numero N di campioni di fase secondo tale griglia. Viene scelta la combinazione di valori della griglia che consente di minimizzare la distanza tra il prototipo originale e il prototipo sintetico. Inoltre, nel minimizzare tale distanza, bisogna considerare anche il valore della posizione che il singolo impulso adattato in fase può’ avere. La procedura di calcolo può’ essere schematizzata come segue: Dato un certo numero N di campioni di fase, ciascun campione di fase potendo variare secondo una griglia predefinita (ad esempio, una griglia con passo di 90 gradi), viene implementato il seguente algoritmo:
L’algoritmo descritto può’ essere implementato direttamente nel dominio delle frequenze, con conseguente aumento della velocita’ di calcolo.
Vediamo ora l’estensione al caso in cui il periodo del prototipo non è multiplo intero del periodo di campionamento.
Poiché l’eiaborazione dei segnali è fatta in un dominio tempo-discreto, anche il prototipo è tempo-discreto e viene ottenuto mediante campionamento di un prototipo 'continuo’ f(t). Sia PO il periodo di tale prototipo continuo. Il prototipo continuo sia campionato con periodo di campionamento pari a T. Si possono distinguere due casi:
1) - PO è multiplo intero di T
2) - PO non è multiplo intero di T.
Il caso 1) è stato già’ discusso precedentemente.
Nel caso 2) bisogna adottare delle procedure che permettano di pre-elaborare e post-elaborare opportunamente il prototipo campionato, in modo da poter applicare le tecniche descritte precedentemente. Semplici tecniche di pre-elaborazione possono consistere nel trascurare l’ultimo campione del prototipo, o aggiungere un campione al prototipo, secondo criteri opportuni. Tali tecniche possono essere pero’ troppo semplificative e portare a una perdita di efficienza nell’algoritmo di codifica. Tecniche di pre-elaborazione piu’ sofisticate richiedono una variazione del periodo di campionamento del prototipo. Ciò’ può’ essere fatto direttamente sul prototipo campionato, usando note tecniche di conversione della frequenza di campionamento. Si abbia dunque un prototipo continuo con periodo PO. Il corrispondente prototipo discreto sia stato ottenuto mediante campionamento e sia T il periodo di campionamento. Sia M il numero di campioni per periodo PO; se PO non è multiplo intero del periodo di campionamento T, M è composto da una parte intera I e da una parte frazionaria F. Se il prototipo viene campionato con periodo di campionamento Tl, avendo definito:
TI = PO / K,
ed essendo K > = 1+ 1, allora PO diventa multiplo intero del nuovo periodo di campionamento Tl.
A titolo di esempio, si consideri la Figura 1. In Figura 1 (a), viene rappresentato un segnale periodico f(t), di periodo fondamentale PO = 14 (unita temporali). Se f(t) è stato campionato con periodo di campionamento pari a T = 4, si ha evidentemente:
M = PO / T = 3.5
E’ quindi possibile ri-campionare il segnale, adottando come periodo di campionamento: Tl = PO / K = 14 / (3 1) = 3.5. In questo caso, si avranno esattamente 4 campioni per periodo e si ritorna al caso in cui il periodo fondamentale è multiplo intero del periodo di campionamento. Nel cambiare la. frequenza di campionamento, si può’ utilizzare anche un periodo di campionamento minore di quello necessario (caso in cui: K > 1+1). Nell’esempio visto si potrebbe, ad esempio, adottare un periodo di campionamento pari a: Tl = PO / (1+4) = 14 / 7 = 2.
Questo è il caso del sovracampionamento ed è, in generale, sconsigliabile, dato che l’analisi LPC può’ perdere efficienza. Inoltre, se la banda del segnale continuo lo permette, e’ anche possibile effettuare un sottocampionamento, adottando come periodo di campionamento: TI = PO / K, con K < = I.
In sintesi, nel caso in cui la lunghezza del prototipo non sia un numero multiplo intero del periodo di campionamento si può’ procedere come segue:
1) - Conversione del periodo di campionamento del prototipo, da T a TI (pre-elaborazione).
2) - Applicazione delle tecniche di codifica viste al paragrafo 2.
3) - Ri-conversione del periodo di campionamento del prototipo sintetico, da TI a T (post-elaborazione).
Vediamo a questo punto la decodifica.
II decodificatore riceve in ingresso i seguenti parametri:
- parametri rappresentativi del filtro LPC,
- valori dei campioni di fase,
- posizione della forma d’onda,
- ampiezza (energia) della forma d’onda,
- lunghezza del prototipo.
Quindi, partendo da una descrizione del segnale di eccitazione nel dominio della frequenza (spettro costante e campioni di fase della trasformata ricevuti) opera una antitrasformata, ottenendo la forma d’onda di eccitazione. Tale forma d’onda viene quindi traslata di una quantità’ pari al valore ricevuto della posizione e scalata rispetto al valore desiderato di ampiezza (energia).
II prototipo sintetico viene calcolato previa periodicizzazione della forma d’onda di eccitazione (avente come lunghezza del periodo fondamentale la lunghezza ricevuta) e quindi filtraggio, secondo i coefficienti del filtro LPC, della forma d’onda periodicizzata. La periodicizzazione della forma d’onda di eccitazione consente di portare a regime lo stato del filtro di sintesi; sebbene, a rigore, un infinito numero di ripetizioni periodiche sia necessario, è stato osservato che, in pratica, poche ripetizioni (3 o 4) periodiche sono sufficienti. Una volta ricostruito il prototipo 'corrente’ e dato il prototipo ricostruito precedentemente, la forma d’onda vocalizzata di sintesi viene ottenuta mediante tecniche di interpolazione opportune, come spiegato nel precedentemente (è evidente che anche i parametri di interpolazione devono essere ricevuti dal decodificatore).
La presente invenzione può essere implementata mediante un processore di segnali digitali con un appropriato programma di controllo che provvede alle operazioni funzionali qui descritte. Benché l’invenzione sia stata descritta con riferimento ad una sua specifica forma di attuazione, si deve tener presente che essa non è limitata alla forma di attuazione descritta essendo suscettibile di numerose varianti che si presenteranno agli esperti del ramo e che devono essere intese come rientranti nell’ ambito protettivo delle rivendicazioni allegate.
Claims (11)
- RIVENDICAZIONI 1. Metodo di codifica di un segnale vocale campionato comprendente le fasi di: prelevare un segmento di detto segnale vocale campionato; calcolare una serie di coefficienti di autocorrelazione di detto segmento di segnale vocale campionato; calcolare da detta serie di coefficienti di autocorrelazione una serie di coefficienti LPC, relativi ad un filtro di sintesi; determinare una forma d’onda di eccitazione di detto filtro di sintesi, in modo che il segnale all’uscita di detto filtro minimizzi le distorsioni rispetto detto segmento di segnale vocale campionato; quantizzare detta serie di coefficienti LPC e detta forma d’onda di eccitazione; caratterizzato dal fatto che detto segmento di detto segnale vocale campionato ha lunghezza pari a quella del prototipo di detto segnale vocale campionato.
- 2. Metodo di codifica in accordo alla rivendicazione 1 caratterizzato dal fatto che per calcolare detta serie di coefficienti di autocorrelazione si considera che detto prototipo sia un periodo di una forma d’onda periodica.
- 3. Metodo di codifica in accordo alle rivendicazioni precedenti caratterizzato dal fatto che detta forma d’onda di eccitazione consiste di un impulso di ampiezza e posizione opportune.
- 4. Metodo di codifica in accordo alla rivendicazione 3 caratterizzato dal fatto che nella determinazioni di dette ampiezze e posizione si considera come eccitazione di detto filtro di sintesi, una serie di impulsi in modo da portare a regime la risposta di detto filtro.
- 5. Metodo di codifica in accordo alla rivendicazione 3 caratterizzato dal fatto che vengono assegnati valori di fase opportuni ad almeno una frequenza delle righe spettrali di detto impulso.
- 6. Metodo di codifica in accordo alla rivendicazione 5 caratterizzato dal fatto che detti valori di fase sono discretizzati secondo una griglia di valori opportuni.
- 7. Metodo di codifica in accordo alla rivendicazione 5 caratterizzato dal fatto che vengono assegnati detti valori di fase a gruppi di frequenze delle righe spettrali di detto impulso secondo opportuni criteri.
- 8. Metodo di codifica in accordo alle rivendicazioni precedenti caratterizzato dal fatto di comprendere ulteriormente, prima di prelevare detto segmento, la fase di variare il periodo di campionamento, e dopo detta quantizzazione la fase di ripristinare il periodo di campionamento originario.
- 9. Codificatore di un segnale vocale campionato comprendente: mezzi per prelevare un segmento di detto segnale vocale campionato; mezzi per calcolare una serie di coefficienti di autocorrelazione di detto segmento di segnale vocale campionato; mezzi per calcolare da detta serie di coefficienti di autocorrelazione una serie di coefficienti LPC, relativi ad un filtro di sintesi; mezzi per determinare una forma d’onda di eccitazione di detto filtro di sintesi, in modo che il segnale all’uscita di detto filtro minimizzi le distorsioni rispetto detto segmento di segnale vocale campionato; mezzi per quantizzare detta serie di coefficienti LPC e detta forma d’onda di eccitazione; caratterizzato dal fatto che detti mezzi per prelevare detto segmento di detto segnale vocale campionato prelevano un segmento di segnale di lunghezza pari a quella del prototipo di detto segnale vocale campionato.
- 10. Metodo di decodifica di un segnale vocale campionato comprendente le fasi di: ricevere i parametri di un filtro LPC; ricevere i parametri di una forma d’onda di eccitazione di detto filtro; ricostruire detta forma d’onda; ricostruire detto segnale vocale; caratterizzato dal fatto di periodicizzare detta forma d’onda.
- 11. Decodificatore di un segnale vocale campionato comprendente: mezzi per ricevere i parametri di un filtro LPC; mezzi per ricevere i parametri di una forma d’onda di eccitazione di detto filtro; mezzi per ricostruire detta forma d’onda; ricostruire detto segnale vocale; caratterizzato dal fatto che detti mezzi per ricostruire detta forma d’onda periodicizzano detta forma d’onda.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT95MI001379A IT1277194B1 (it) | 1995-06-28 | 1995-06-28 | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
EP96109160A EP0751492A3 (en) | 1995-06-28 | 1996-06-07 | Method and equipment for coding and decoding a sampled speech signal |
AU56169/96A AU714555B2 (en) | 1995-06-28 | 1996-06-24 | Coding/decoding a sampled speech signal |
US08/670,510 US5809456A (en) | 1995-06-28 | 1996-06-27 | Voiced speech coding and decoding using phase-adapted single excitation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT95MI001379A IT1277194B1 (it) | 1995-06-28 | 1995-06-28 | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
Publications (3)
Publication Number | Publication Date |
---|---|
ITMI951379A0 ITMI951379A0 (it) | 1995-06-28 |
ITMI951379A1 true ITMI951379A1 (it) | 1996-12-28 |
IT1277194B1 IT1277194B1 (it) | 1997-11-05 |
Family
ID=11371877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT95MI001379A IT1277194B1 (it) | 1995-06-28 | 1995-06-28 | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
Country Status (4)
Country | Link |
---|---|
US (1) | US5809456A (it) |
EP (1) | EP0751492A3 (it) |
AU (1) | AU714555B2 (it) |
IT (1) | IT1277194B1 (it) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6304843B1 (en) * | 1999-01-05 | 2001-10-16 | Motorola, Inc. | Method and apparatus for reconstructing a linear prediction filter excitation signal |
JP3905706B2 (ja) * | 1999-04-19 | 2007-04-18 | 富士通株式会社 | 音声符号化装置、音声処理装置及び音声処理方法 |
US6397175B1 (en) * | 1999-07-19 | 2002-05-28 | Qualcomm Incorporated | Method and apparatus for subsampling phase spectrum information |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
US6871176B2 (en) * | 2001-07-26 | 2005-03-22 | Freescale Semiconductor, Inc. | Phase excited linear prediction encoder |
JP6276845B2 (ja) | 2014-05-01 | 2018-02-07 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5067158A (en) * | 1985-06-11 | 1991-11-19 | Texas Instruments Incorporated | Linear predictive residual representation via non-iterative spectral reconstruction |
JPH0738116B2 (ja) * | 1986-07-30 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
FR2700632B1 (fr) * | 1993-01-21 | 1995-03-24 | France Telecom | Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués. |
JP2800618B2 (ja) * | 1993-02-09 | 1998-09-21 | 日本電気株式会社 | 音声パラメータ符号化方式 |
GB2282943B (en) * | 1993-03-26 | 1998-06-03 | Motorola Inc | Vector quantizer method and apparatus |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
-
1995
- 1995-06-28 IT IT95MI001379A patent/IT1277194B1/it active IP Right Grant
-
1996
- 1996-06-07 EP EP96109160A patent/EP0751492A3/en not_active Withdrawn
- 1996-06-24 AU AU56169/96A patent/AU714555B2/en not_active Ceased
- 1996-06-27 US US08/670,510 patent/US5809456A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0751492A2 (en) | 1997-01-02 |
IT1277194B1 (it) | 1997-11-05 |
AU714555B2 (en) | 2000-01-06 |
EP0751492A3 (en) | 1998-03-04 |
AU5616996A (en) | 1997-01-09 |
US5809456A (en) | 1998-09-15 |
ITMI951379A0 (it) | 1995-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1846921B1 (en) | Method for concatenating frames in communication system | |
JP2650201B2 (ja) | ピツチ関連遅延値を導出する方法 | |
US5903866A (en) | Waveform interpolation speech coding using splines | |
IL135192A (en) | Method and system for speech reconstruction from speech recognition features | |
USRE43099E1 (en) | Speech coder methods and systems | |
KR20130133848A (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
JPH04506574A (ja) | 量子化されない適応変換ボイス信号を再構成する方法および装置 | |
JPH03505929A (ja) | 適応変換コード化の改良 | |
US5924061A (en) | Efficient decomposition in noise and periodic signal waveforms in waveform interpolation | |
JP2019049729A (ja) | 情報符号化のコンセプト | |
ITMI951379A1 (it) | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato | |
Gibson et al. | Fractional rate multitree speech coding | |
KR20240036029A (ko) | 장기 예측 및/또는 고조파 후치 필터링에 기초하여 예측 스펙트럼을 생성하기 위한 프로세서 | |
Chong et al. | A new waveform interpolation coding scheme based on pitch synchronous wavelet transform decomposition | |
CN108885875A (zh) | 用于改进从音频信号的隐藏音频信号部分到后继音频信号部分的转换的装置和方法 | |
KR20220104049A (ko) | 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법 | |
CN107924683B (zh) | 正弦编码和解码的方法和装置 | |
KR100849375B1 (ko) | 오디오 또는 스피치 신호의 파라메트릭 코딩 | |
FI105624B (fi) | Menetelmä luonteeltaan toistuvan analogisen signaalin koodaamiseksi sekä laite sanotulla menetelmällä koodaamista varten | |
JP2002099300A (ja) | 音声符号化方法及び装置 | |
Ramírez et al. | Split-order linear prediction for segmentation and harmonic spectral modeling | |
Tang et al. | Fixed bit-rate PWI speech coding with variable frame length | |
KR100346732B1 (ko) | 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 | |
EP0987680A1 (en) | Audio signal processing | |
JPH09134196A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
0001 | Granted |