ITUD960012A1 - Codebook algebrico con ampiezze di impulso selezionate in funzione del segnale per la codifica rapida di un segnale - Google Patents

Codebook algebrico con ampiezze di impulso selezionate in funzione del segnale per la codifica rapida di un segnale Download PDF

Info

Publication number
ITUD960012A1
ITUD960012A1 IT96UD000012A ITUD960012A ITUD960012A1 IT UD960012 A1 ITUD960012 A1 IT UD960012A1 IT 96UD000012 A IT96UD000012 A IT 96UD000012A IT UD960012 A ITUD960012 A IT UD960012A IT UD960012 A1 ITUD960012 A1 IT UD960012A1
Authority
IT
Italy
Prior art keywords
amplitude
pulses
combinations
codebook
signal
Prior art date
Application number
IT96UD000012A
Other languages
English (en)
Inventor
Jean Pierre Adoul
Claude Laflamme
Original Assignee
Univ Sherbrooke
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27010408&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ITUD960012(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Univ Sherbrooke filed Critical Univ Sherbrooke
Publication of ITUD960012A0 publication Critical patent/ITUD960012A0/it
Publication of ITUD960012A1 publication Critical patent/ITUD960012A1/it
Application granted granted Critical
Publication of IT1305724B1 publication Critical patent/IT1305724B1/it

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Metodo per eseguire una ricerca in un codenbook allo scopo di codificare un segnale sonoro, detto codenbook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, detto metodo comprendendo le fasi di:- preselezione da detto codenbook di un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e - ricerca soltanto in detto sottoinsieme di combinazioni di impulsi allo scopo di codificare il segnale sonoro;la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di impulsi del codebook.Dispositivo adottante il metodo di cui sopra.Sistema comprendente il dispositivo adottante il metodo di cui sopra.

Description

Descrizione del trovato avente per titolo:
"CODEBOOK ALGEBRICO CON AMPIEZZE DI IMPULSO SELEZIONATE IN FUNZIONE DEL SEGNALE PER LA CODIFICA RAPIDA DI UN SEGNALE SONORO"
Forma oggetto del presente trovato un codebook algebrico con ampiezze dell'impulso selezionate in funzione del segnale per la codifica rapida di un segnale sonoro come espresso nella rivendicazione principale.
Il trovato viene utilizzato per realizzare una tecnica perfezionata per la codifica numerica di un segnale sonoro, in particolare ma non esclusivamente di un segnale vocale, allo scopo di trasmettere e sintetizzare detto segnale sonoro.
STATO DELLA TECNICA
La richiesta per efficaci tecniche numeriche di codifica della voce con un buon rapporto soggettivo qualità/bit rate è aumentata per numerose applicazioni quali la trasmissione vocale da satellite, la trasmissione mobile via terra, le reti radio numeriche o impaccate, la memorizzazione vocale, la risposta vocale e la telefonia radiomobile.
Una delle migliori tecniche note in grado di ottenere un buon rapporto qualità/bit rate è la cosiddetta Code Excited Linear Prediction (CELP) (predizione lineare a codice.eccitato).
Secondo questa tecnica, il segnale vocale viene campionato ed elaborato in blocchi di L campioni (vettori), in cui L è un numero predeterminato.
La tecnica CELP utilizza un codebook.
Un codebook, nel contesto CELP, è un insieme indicizzato di sequenze di L campioni a cui ci si riferirà come vettori di codice L-dimensionale (combinazione di impulsi definenti L posizioni differenti e comprendenti sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2,... L della combinazione).
II codebook comprende un indice K che varia da 1 a M, dove M rappresenta la dimensione del codebook, talvolta espressa come numero di bits b:
M=2<b>
Un codebook può essere memorizzato in una memoria fisica (ad esempio una tabella look-up), o ci si può affidare ad un meccanismo per correlare l'indice ad un corrispondente vettore di codice (ad esempio una formula).
Per sintetizzare la voce secondo la tecnica CELP, ciascun blocco di campioni vocali viene sintetizzato filtrando l'opportuno vettore di codice dal codebook mediante filtri tempo-varianti che modellano le caratteristiche spettrali del segnale vocale.
Al termine del codificatore, l'uscita sintetizzata viene calcolata per tutti o per un sottoinsieme dei vettori di codice candidati dal codebook (ricerca di codebook).
II vettore di codice mantenuto è quello che produce l'uscita sintetizzata che è la più vicina al segnale vocale originale in base ad una misura di distorsione perceptualmente pesata.
Un primo tipo di codebooks sono i cosiddetti codebooks "stocastici ".
Uno svantaggio di questi codebooks è che spesso comportano notevoli memorizzazioni fisiche.
Essi sono stocastici, vale a dire casuali nel senso che il cammino dall'indice ai vettori di codice associati comporta tabelle look-up che sono il risultato di numeri generati casualmente o tecniche statistiche applicate a grandi insiemi di apprendimento vocale.
La dimensione dei codebooks stocastici tende ad essere limitata dalla complessità della memorizzazione e/o della ricerca.
Un secondo tipo di codebooks sono i codebooks algebrici.
Al contrario dei codebooks stocastici, i codebooks algebrici non sono casuali e non richiedono memorizzazione.
Un codebook algebrico è un insieme di vettori di codice indicizzati in cui le ampiezze e le posizioni degli impulsi del k-esimo vettore di codice possono essere derivate dal suo indice k mediante una regola che non richiede alcuna, o.minima, memorizzazione fisica.
Pertanto, la dimensione di un codebook algebrico non è limitata dai requisiti di memorizzazione.
I codebooks algebrici possono inoltre essere strutturati per una ricerca efficiente.
Alla proponente non sono tuttavia noti codebooks algebrici che permettano di ridurre la complessità della ricerca, nonché permettano di aumentare la dimensione del codebook senza che ciò comporti un aumento della complessità della ricerca.
Per ottenere un codebook algebrico che risolva questi inconvenienti la proponente ha studiato , sperimentato e realizzato il presente trovato .
ESPOSIZIONE DEL TROVATO
Il presente trovato è espresso e caratterizzato nelle rispettive rivendicazioni principali.
Le rivendicazioni secondarie espongono varianti all'idea di soluzione principale.
Uno scopo del presente trovato è quello di fornire un metodo ed un dispositivo per ridurre drasticamente la complessità della ricerca codebook nella codifica di un segnale sonoro, questo metodo e questo dispositivo essendo applicabili ad una vasta classe di codebooks.
Altro scopo del trovato è quello di fornire un metodo ed un dispositivo in grado di selezionare a priori un sottoinsieme di combinazioni di impulsi codebook e di limitare le combinazioni da ricercare a questo sottoinsieme allo scopo di ridurre la complessità della ricerca codebook.
Ulteriore scopo del trovato è quello di aumentare la dimensione di un codebook consentendo che i singoli impulsi di ampiezza diversa da 0 assumano almeno una delle q possibil i ampiezze senza aumentare la complessità di ricerca .
Più in particolare, secondo il presente trovato .
viene fornito un metodo per condurre una ricerca in un codebook allo scopo di codificare un segnale sonoro, il codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, questo metodo comprendendo le fasi di:
- preselezione dal codebook di un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e
- ricerca solo nel sottoinsieme delle combinazioni di impulsi allo scopo di codificare il segnale sonoro;
di conseguenza, nel funzionamento, la complessità della ricerca viene ridotta in quanto viene ricercato solo un sottoinsieme delle combinazioni di impulsi del codebook.
Il presente trovato si riferisce anche ad un metodo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro in cui il codebook consiste in un insieme di combinazioni di ampiezza/posizione di impulsi, ciascuna combinazione di ampiezza/posizione di impulsi definendo L differenti posizioni e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1 , 2 , . . . L della combinazione, e ciascun impulso di ampiezza diversa da 0 assumendo almeno una delle q possibili ampiezze.
Questo metodo comprende le fasi di:
- preselezione dal codebook di un sottoinsieme di combinazioni di ampiezza/posizione di impulsi in funzione del segnale sonoro; e
- ricerca solo nel sottoinsieme di combinazione di ampiezza/posizione di impulsi allo scopo di codificare il segnale sonoro.
Di nuovo, la complessità della ricerca viene ridotta in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook.
Ancora, in base al presente trovato, viene fornito un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, il codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, il dispositivo comprendendo:
mezzi per preselezionare dal codebook un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e
- mezzi per ricercare solo il sottoinsieme di combinazioni di impulsi allo scopo di codificare il segnale sonoro.
Nel funzionamento, la complessità della ricerca viene ridotta in quanto viene ricercato solo un sottoinsieme delle combinazioni di impulsi del codebook.
Il presente trovato si riferisce inoltre ad un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, il codebook consistendo in un insieme di combinazioni di ampiezza/posizione di impulsi, ciascuna combinazione di ampiezza/posizione di impulsi definendo L posizioni differenti e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2, ...,L della combinazione e ciascun impulso di ampiezza diversa da 0 assumendo almeno una fra q possibili ampiezze.
Questo dispositivo comprende mez z i per preselezionare dal codebook un sottoinsieme di combinazioni di ampiezza/posizione impulsi in funzione del segnale sonoro, e mezzi per ricercare so lo i l sot t oins i eme di combinaz i oni ampiezza/posizione impulsi allo scopo di codificare il segnale sonoro; di conseguenza la complessità della ricerca viene ridotta in quanto viene ricercato solo un sottoinsieme di combinazione ampiezza/posizione del codebook.
Ancora, secondo il presente trovato, viene fornito un sistema di comunicazione cellulare per servire una vasta area geografica divisa in una pluralità di celle, comprendente :
- unità mobili portatili trasmettitore/ricevitore; - stazioni cellulari base rispettivamente collocate nelle celle;
- mezzi per il controllo della comunicazione tra le stazioni cellulari base;
- un sottosistema di comunicazione radio bidirezionale tra ciascuna unità mobile collocata in una cella e la stazione cellulare base di quella cella, il sottosistema di comunicazione radio bidirezionale comprendendo sia nell'unità mobile che nella stazione cellulare base:
- (a) un trasmettitore comprendente mezzi per la codifica di un segnale vocale e mezzi per la trasmissione del segnale vocale codificato, e
- (b) 'un ricevitore comprendente mezzi per la ricezione di un segnale vocale codificato trasmesso e mezzi per la decodifica del segnale vocale codificato ricevuto, in cui i mezzi di codifica del segnale vocale comprendono un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare il segnale vocale, il codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, il dispositivo di esecuzione della ricerca comprendendo:
- mezzi per la preselezione dal codebook di un sottoinsieme di combinazioni di impulsi in funzione del segnale vocale; e
- mezzi per ricercare solo il sottoinsieme delle combinazioni di impulsi allo scopo di codificare il segnale vocale.
Nel funzionamento, la complessità della ricerca viene ancora ridotta in quanto viene ricercato solo un sottoinsieme delle combinazioni di impulsi del codebook.
Infine, il presente trovato si riferisce ad un sistema di comunicazione cellulare per servire una vasta area geografica divisa in una pluralità di celle, comprendente:
- unità mobili portatili trasmettitore/ricevitore; - stazioni cellulari base rispettivamente collocate nelle celle;
- mezzi per il controllo della comunicazione tra le stazioni cellulari base;
- un sottosistema di comunicazione radio bidirezionale tra ciascuna unità mobile collocata in una cella e la stazione cellulare base di quella cella, il sottosistema di comunicazione radio bidirezionale comprendendo sia nell'unità mobile che nella stazione cellulare base:
- (a) un trasmettitore comprendente mezzi per la codifica di un segnale vocale e mezzi per la trasmissione del segnale vocale codificato, e
- (b) un ricevitore comprendente mezzi per la ricezione di un segnale vocale codificato trasmesso e mezzi per la decodifica del segnale vocale codificato ricevuto
I mezzi di codifica del segnale vocale comprendono un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare il segnale vocale, il codebook consistendo in un insieme di combinazioni di ampiezza/posizione impulsi, ciascuna combinazione di ampiezza/posizione impulsi definendo L posizioni differenti e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2, L della combinazione, e ciascun impulso di ampiezza diversa da 0 assumendo almeno una fra q possibili ampiezze, il dispositivo di esecuzione della ricerca comprendendo:
- mezzi per la preselezione dal codebook di un sottoinsieme di combinazioni di ampiezza/posizione impulsi in funzione del segnale vocale; e
- mezzi per ricercare solo il sottoinsieme delle combinazioni di ampiezza/posizione impulsi allo scopo di codificare il segnale vocale.
Nel funzionamento, la complessità della ricerca viene ridotta in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione impulsi del codebook.
Secondo una forma di realizzazione preferenziale del trovato, (a) il sottoinsieme di combinazioni di ampiezza/posizione impulsi viene preselezionato predefinendo, in funzione del segnale sonoro, una funzione Sp tra le rispettive posizioni p = 1, 2, . . . , L e le q possibili ampiezze, e (b) vengono ricercate solo le combinazioni di ampiezza/posizione di impulsi del codebook aventi impulsi di ampiezza diversa da 0 che rispettano la funzione predefinita. Vantaggiosamente la funzione Sp viene predefinita preassegnando, in funzione del segnale sonoro, una delle q possibili ampiezze a ciascuna posizione p, e la funzione predefinita viene rispettata quando ciascun impulso di ampiezza diversa da 0 di una combinazione ampiezza/posizione di impulsi presenta un'ampiezza pari all'ampiezza Sp preassegnata alla posizione p dell'impulso di ampiezza diversa da 0.
Preferenzialmente il preassegnare una delle q possibili ampiezze a ciascuna posizione p comprende le fasi di:
- elaborazione del segnale sonoro per produrre un segnale obiettivo D filtrato a posteriori ed un segnale residuo R' a passo rimosso;
- calcolo di un vettore di stima delle ampiezze B in risposta al segnale obiettivo D filtrato a posteriori ed al segnale residuo R<1 >a passo rimosso; e
- per ciascuna delle posizioni p, quantizzazione di una stima di ampiezza Bp del vettore B per ottenere l'ampiezza da selezionare per la posizione p.
Il calcolo del vettore di stima delle ampiezze B comprende vantaggiosamente il passo di sommare il segnale obiettivo D filtrato a posteriori nella forma normalizzata:
al segnale residuo R' a passo rimosso nella forma normalizzata:
per ottenere così un vettore di stima delle ampiezze B della forma:
in cui β è una costante che di preferenza ha un valore compreso tra 0 e 1 .
Secondo un ' ulteriore forma di realizzazione pre ferenz iale del presente t rovat o , la quant izzazione viene realizzata su una stima di ampiezza Bp a picco normalizzata del vettore B utilizzando la seguente espressione:
in cui il denominatore
è un fattore di normalizzazione che rappresenta un'ampiezza di picco degli impulsi di ampiezza diversa da 0.
Ciascuna delle combinazioni di impulsi può
comprendere un numero N di impulsi di ampiezza diversa da 0 , e le posizioni p degli impulsi di ampiezza diversa da 0 sono vantaggiosamente limitate in funzione di almeno un codice di permutazione a singolo impulso N-interconnesso .
La ricerca del codebook comprende preferenzialmente la massimizzazione di un dato rapporto avente un denominatore a<2 >k calcolato mediante N anelli annidati in funzione della seguente relazione:
<2>
in cui il calcolo per ciascun anello viene scritto in una riga separata da un anello più esterno ad un anello più interno degli N anelli annidati, in cui pn è la posizione dell'impulso n-esimo di ampiezza diversa da 0 della combinazione ed in cui U'(px,Py) è una funzione dipendente dall’ampiezza Spx preassegnata ad una posizione px tra le posizioni p e dall'ampiezza SPy preassegnata ad una posizione py tra le posizioni p.
Nel calcolo di cui sopra almeno l'anello più interno degli N anelli annidati può essere saltato ogni qual volta è vera la seguente disuguaglianza:
dove SD è l'ampiezza preassegnata alla posizione pn, DD è la componente pn-esima del vettore obiettivo D e TD è una soglia riferita al vettore obiettivo D filtrato a priori.
ILLUSTRAZIONE DELLE TAVOLE
Le figure allegate sono fornite a titolo esemplificativo, non limitativo, ed illustrano una soluzione preferenziale del trovato.
Nelle tavole abbiamo che:
- la fig. 1 illustra un diagramma a blocchi del dispositivo di codifica del segnale sonoro comprendente un selettore di ampiezza ed un controllore di ottimizzazione secondo il presente trovato;
- la fig. 2 illustra un diagramma a blocchi del dispositivo di decodifica associato al dispositivo di codifica di fig. 1 ;
- la fig . 3a illustra una sequenza di operazioni di base per la ricerca rapida su codebook secondo il presente trovato , basata sulle ampiezze di impulsi selezionate in funzione del segnale;
- la fig. 3b illustra una sequenza di operazioni per la preassegnazione di una delle q ampiezze a ciascuna posizione p delle combinazioni di ampiezza/posizioni di impulso;
- la fig. 3c illustra una sequenza di operazioni coinvolte nella ricerca di anello N-incorporato in cui l’anello più interno viene saltato ogni qual volta il contributo dei primi N-l impulsi al numeratore DAk<T >viene considerato insufficiente;
la fig. 4 illustra una rappresentazione schematica degli anelli N-ahnidati utilizzati nella ricerca di codebook;
- la fig. 5 illustra un diagramma a blocchi che mostra l'infrastruttura di un tipico sistema di comunicazione cellulare.
DESCRIZIONE DELLE TAVOLE
La fig. 5 illustra la struttura di un tipico sistema di comunicazione cellulare 1.
Anche se l'applicazione del metodo e del dispositivo di esecuzione della ricerca secondo il trovato ad un sistema di comunicazione cellulare viene illustrato come esempio non limitativo nella seguente descrizione, va considerato che il trovato può essere utilizzato con gli stessi vantaggi in molti altri tipi di sistemi di comunicazione in cui viene richiesta la codifica del segnale sonoro.
In un sistema di comunicazione cellulare quale quello indicato con 1, viene fornito un sistema di telecomunicazione su una vasta area geografica dividendo tale vasta area in una pluralità di celle più piccole.
Ciascuna cella presenta una stazione cellulare base 2 (figura 5) per fornire canali di segnalazione radio, canali audio e di dati.
I canali di segnalazione radio sono utilizzati per telefoni radiomobile (unità mobili trasmettitore/ricevitore) quale quello indicato con 3 all'interno dei limiti della zona di copertura della stazione cellulare base (cella), e per eseguire chiamate ad altri radiotelefoni sia all'interno che all'esterno della cella della stazione di base, o su un'altra rete 4 quale la rete telefonica pubblica a commutazione (PSTN) .
Una volta che un radiotelefono 3 ha inviato o ricevuto con successo una chiamata, un canale audio o di dati viene settato con la stazione cellulare base 2 corrispondente alla cella in cui il radiotelefono 3 è situato e la comunicazione tra la stazione base 2 ed il radiotelefono 3 avviene su quel canale audio o di dati.
II radiotelefono 3 può anche ricevere informazioni di controllo o di temporizzazione sul canale di segnalazione mentre è in corso una chiamata.
Se un radiotelefono 3 lascia una cella durante una chiamata ed entra in un'altra cella, il radiotelefono gestisce la chiamata su un canale audio o di dati disponibile nella nuova cella.
Similmente, se nessuna chiamata è in corso, viene inviato un messaggio di controllo sul canale di segnalazione tale che il radiotelefono si lega alla stazione base 2 associata alla nuova cella.
In questo modo è possibile una comunicazione mobile su una vasta area geografica .
II sistema di comunicazione cellulare 1 comprende inoltre un terminale 5 per controllare la comunicazione tra le stazioni cellulari base 2 e la rete telefonica pubblica a commutazione 4, per esempio durante una comunicazione tra un radiotelefono 3 e la rete telefonica pubblica 4, oppure tra un radiotelefono 3 in una prima cella ed un radiotelefono 3 in una seconda cella .
Naturalmente , viene richiesto un sottosistema di comunicazione radio bidirezionale per stabilire la comunicazione tra ciascun radiotelefono 3 situato in una cella e la stazione cellulare base 2 di quella cella .
Tale sistema di comunicazione radio bidirezionale comprende tipicamente, sia nel radiotelefono 3 che nella stazione cellulare base 2, (a) un trasmettitore per la codifica del segnale vocale e per la trasmissione del segnale vocale codificato tramite un'antenna quale la 6 o la 7, e (b) un ricevitore per ricevere un segnale vocale codificato trasmesso tramite la stessa antenna 6 o 7 e per decodificare il segnale vocale codificato ricevuto. Come è ben noto ai tecnici del settore, la codifica della voce è richiesta per ridurre la larghezza di banda necessaria per trasmettere la voce lungo il sistema di comunicazione radio bidirezionale, vale a dire tra un radiotelefono 3 ed una stazione base 2.
Lo scopo del presente trovato è quello di fornire una efficace tecnica di codifica numerica della voce con un buon rapporto soggettivo qualità/bit rate per esempio per la trasmissione bidirezionale di segnali vocali tra una stazione cellulare base 2 ed un radiotelefono 3 attraverso un canale audio o di dati .
La fig . 1 è un diagramma a blocchi di un dispositivo di codifica numerica della voce idoneo ad eseguire questa efficace tecnica.
II dispositivo di codifica della voce di fig. 1 è lo stesso dispositivo di codifica illustrato nella fig. 1 della domanda di brevetto americana collegata n. 07/927,528 nella quale è stato aggiunto un selettore di ampiezza 112 secondo il presente trovato.
La domanda di brevetto americana collegata n.
07/927,528 è stata depositata il 10 settembre 1992 per una invenzione avente per titolo "DYNAMIC CODEBOOK FOR EFFICIENT SPEECH CODING BASED ON ALGEBRAIC CODES" (codebook dinamico per una efficace codifica vocale basata su codici algebrici).
II segnale vocale analogico viene campionato ed elaborato in blocchi.
Resta inteso che il presente trovato non è limitato all’applicazione al segnale vocale; può essere contemplata anche la codifica di altri tipi di segnali sonori .
Nell ' esempio illustrato il blocco di segnali vocali campionati S in ingresso (figura 1) comprende L campioni consecutivi.
Nella letteratura CELP, L è indicato come la lunghezza di "subframe" ed è tipicamente compreso tra 20 e 80.
Inoltre i blocchi di L campioni sono indicati come vettori L-dimensionali.
Vari vettori L-dimensionali vengono prodotti durante la procedura di codifica.
Una lista di questi vettori che appare nelle figure 1 e 2, così come una lista di parametri trasmessi, viene fornita nel seguito:
Lista dei principali vettori L-dimensionali:
S vettore vocale d'ingresso;
R' vettore residuo a passo rimosso;
X vettore obiettivo;
D vettore obiettivo filtrato a posteriori;
Α3⁄4 vettore di codice di indice k dal codebook algebrica; e
vettore di innovazione (vettore di codice filtrato).
Lista dei parametri trasmessi:
k indice del vettore di codice (ingresso del codebook algebrico);
g guadagno;
STP parametri di predizione di breve periodo (definenti A(z)); e
LTP parametri di predizione di lungo periodo (definenti un guadagno di passo b ed un ritardo di passo T).
Si ritiene che sia preferibile descrivere in primo luogo il dispositivo di decodifica vocale di figura 2 illustrando i vari passi eseguiti tra l'ingresso numerico (ingresso del demoltiplicatore 205) ed il segnale vocale campionato di uscita (uscita del filtro sintetizzatore 204).
Il demoltiplicatore 205 estrae quattro differenti parametri dall'informazione binaria ricevuta da un canale numerico di ingresso, vale a dire l'indice k, il guadagno g, i parametri di predizione di breve periodo STP ed i parametri di predizione di lungo periodo LTP.
Il vettore S L-dimensionale corrente del segnale vocale viene sintetizzato in base a questi parametri come sarà spiegato nella seguente descrizione.
Il dispositivo di decodifica vocale della figura 2 comprende un codebook dinamico 208 composto da un generatore di codice algebrico 201 e da un prefiltro adattativo 202, da un amplificatore 206, da un sommatore 207, da un predittore di lungo periodo 203 e da un filtro di sintesi 204.
In una prima fase il generatore di codice algebrico 201 produce un vettore di codice come risposta all'indice k.
In una seconda fase, il vettore di codice viene elaborato da un prefiltro adattativo 202 alimentato con i parametri di predizione di lungo periodo LTP per produrre in uscita un vettore di innovazione C^. Lo scopo del prefiltro adattativo 202 è di controllare dinamicamente il contenuto di frequenza del vettore di innovazione in uscita C3⁄4 in modo da aumentare la qualità vocale, vale a dire per ridurre la distorsione percepibile causata dalle frequenze che disturbano 1'orecchio umano.
Tipiche funzioni di trasferimento F(z) per il prefiltro adattativo 202 sono fornite nel seguito:
Fa(z) è un prefiltro formante in cui 0<γι<γ2<1 sono costanti.
Questo prefiltro aumenta le regioni formanti e lavora molto efficacemente specialmente a velocità di codifica inferiori a 5 kbit/s .
Fb ( z ) è un prefiltro di passo in cui T è il ritardo di passo tempo variante e k>o è o costante o pari al parametro di predizione di passo di lungo periodo quantizzato dal subframe corrente o da quello precedente .
Fb (z) è molto efficace per aumentare le frequenze armoniche di passo a tutte le velocità.
Pertanto F ( z ) comprende tipicamente un prefiltro di passo talvolta combinato con un pref iltro formante, vale a dire :
Secondo la tecnica CELP, il segnale vocale
A
campionato in uscita S viene ottenuto in primo luogo pesando il vettore d'innovazione C* dal codebook 208 con il guadagno g attraverso l'amplificatore 206.
Il sommatore 207 quindi somma la forma d'onda pesata gC^ all'uscita E (il componente di predizione di lungo periodo del segnale di eccitazione del filtro di sintesi 204) di un predittore di lungo periodo 203 fornito con i parametri LTP, posti in un anello di -retroazione ed aventi una funzione di trasferimento B(z) definita come segue:
B (z) = bz<-T>,
in cui b e T sono rispettivamente il guadagno di passo ed il ritardo di passo come sopra definiti. Il predittore 203 è un filtro avente funzione di trasferimento che è funzione degli ultimi parametri LTP, b e T ricevuti per modellare la periodicità di passo del segnale vocale.
Esso introduce gli opportuni guadagno di passo b e ritardo di passo T dei campioni.
Il segnale composto E gCk costituiscono il segnale di eccitazione del filtro di sintesi 204 che ha una funzione di trasferimento 1/A(z), A(z) venendo definita nel seguito della descrizione.
Il filtro 204 fornisce la corretta conformazione spettrale in funzione degli ultimi parametri ricevuti.
Più specificatamente il filtro 204 modella le frequenze risonanti (formanti della voce).
Il blocco di uscita S è il segnale vocale campionato sintetizzato che può essere convertito in un segnale analogico con un opportuno filtraggio anti-aliasing secondo una tecnica ben nota.
Ci sono molti modi per progettare un generatore di codice algebrico 201.
Un metodo vantaggioso , i l lustrato nel la summenzionata domanda di brevetto americana n. 07/927 , 528 consiste nell 'usare almeno un codice di permutazione a singolo impulso N- interconnesso .
Questo concetto sarà illustrato mediante un semplice generatore di codice algebrico 301.
In questo esempio, L = 40 e l ' insieme dei vettori di codice 40-dimensionali contiene soltanto N = 5 impulsi di ampiezza diversa da 0 che saranno chiamati SPl, Sp2, SP;ji <S∑>V <S>P5-In questa notazione, Pi definisce la collocazione dell'impulso i-esimo all'interno del subframe (vale a dire pi è compreso tra 0 e L-l).
Si supponga che l'impulso SPi sia vincolato a otto possibili posizioni p^ come segue:
P1 = 0, 5, 10, 15, 20, 25, 30, 35 = 0 8m1(·
= 0, 1, ...7.
All'interno di queste otto posizioni, che possono essere chiamate "track" #1, SPl e sette impulsi di ampiezza 0 possono liberamente permutare.
Questo è un "codice di permutazione a singolo impulso".
Possiamo ora interconnettere cinque di tali " codice di permutazione a singolo impulso" vincolando anche le posizioni degli impulsi rimanenti in modo analogo (vale a dire track #2 , track #3 , track #4 e track #5) .
Pi = 0, 5, 10, 15, 20 , 25, 30 , 35 = 0 8mi ;
Si noti che gli interi ni! = 0 , 1 , . . .7 definiscono completamente la posizione pi di ciascun impulso SPi-Pertanto , un semplice indice di posizione kp può essere derivato mediante la multiplazione diretta degli m3 utilizzando la seguente relazione:
Va evidenziato che altri codebooks possono essere derivati utilizzando le tracce di impulsi di cui sopra.
Ad esempio, possono essere utilizzati solo 4 impulsi in cui i primi tre impulsi occupano le posizioni nelle prime tre tracce rispettivamente, mentre il quarto impulso occupa o la quarta o la quinta traccia con un bit che specifica quale traccia.
Questa struttura origina un codebook di posizione a tredici bit.
Nella tecnica nota si assumeva che gli impulsi di ampiezza diversa da 0 avessero un'ampiezza fissa per tutti gli scopi pratici per ragioni di complessità di ricerca del vettore di codice.
Infatti, se l'impulso SPi può assumere una delle q possibili ampiezze, un numero pari a q<N >combinazioni di ampiezze d'impulso dovrà essere considerato nella ricerca.
Ad esempio, se i cinque impulsi del primo esempio possono assumere una fra q = 4 possibili ampiezze, ad esempio SPi = 1, - 1, 2, - 2 invece che un'ampiezza fissa, la dimensione del codebook algebrico si amplia da 15 a 15 (5x2) bits = 25 bits; questa è una ricerca un migliaio di volte più complessa.
E' lo scopo del presente trovato illustrare il fatto sorprendente che prestazioni molto buone possono essere ottenute con impulsi di q ampiezze senza pagare un prezzo pesante.
La soluzione consiste nel limitare la ricerca ad un sottoinsieme ridotto di vettori di codici.
Il metodo di selezionare i vettori di codice fa riferimento al segnale vocale d'ingresso come sarà descritto nella seguente descrizione.
Il beneficio pratico del presente trovato è quello di consentire un aumento della dimensione del codebook algebrico dinamico 208 consentendo che i singoli impulsi assumano differenti possibili ampiezze senza aumentare la complessità della ricerca dei vettori di codici.
l segnale vocale campionato S viene codificato in blocchi dal sistema di codifica di figura 1 che è suddiviso in undici moduli numerati dal 102 al 112. La funzione ed il funzionamento della maggior parte di questi moduli sono invariati rispetto alla descrizione della domanda di brevetto americana collegata n. 07/927 , 528.
Pertanto, anche se la seguente descrizione spiegherà almeno brevemente la funzione ed il funzionamento di ciascun modulo, essa si concentrerà su ciò che è nuovo rispetto alla descrizione della domanda di brevetto americana collegata n .
07/927,528.
Per ciascun blocco di L campioni del segnale vocale, un insieme di parametri di Codifica Lineare Predittiva (LPC), chiamati parametri di predizione di breve periodo (STP), viene prodotto secondo una tecnica nota mediante un analizzatore di spettro LPC 102.
Più specificatamente, l'analizzatore 102 modella le caratteristiche spettrali di ciascun blocco S di L campioni.
Il blocco di ingresso S di L campioni viene elaborato da un filtro sbiancante 103 avente la seguente funzione di trasferimento basata sui valori' correnti dei parametri STP:
in cui a0 è pari a 1 e z è la consueta variabile della cosiddetta trasformata z.
Come illustrato in fig. 1, il filtro sbiancante 103 produce un vettore residuo R.
Un estrattore di passo 104 viene utilizzato per calcolare e quantizzare i parametri LTP vale a dire, il ritardo di passo T ed il guadagno di passo g.
Lo stato iniziale dell'estrattore 104 viene settato ad un valore FS da un estrattore di stato iniziale 110.
Una procedura dettagliata per calcolare e quantizzare i parametri LTP viene descritto nella domanda di brevetto americana collegata n.
07/927,528 e si ritiene che sia ben nota ai tecnici del settore.
Di conseguenza essa non sarà ulteriormente descritta nella presente esposizione.
Un caratterizzatore delle risposte di filtro 105 {fig. 1) viene alimentato con i parametri STP ed LTP per calcolare una caratterizzazione delle risposte di filtro FRC da utilizzare nelle fasi successive.
L ' informazione FRC consiste nei seguenti tre componenti , in cui n = 1, 2 ,
- f (n) : risposta di F (z) ;
Si noti che F ( z ) comprende tipicamente il prefiltro di passo .
- h (n) risposta di 1 a T(N)
in cui γ è un fattore perceptuale.
Più in generale, h(n) è la risposta impulsiva di F{z)W(z)/A(z) che è la cascata del prefiltro F(z), del filtro di pesatura perceptuale W(z) e del filtro di sintesi 1/A(z).
Si noti che F(z) e 1/A(z) sono gli stessi filtri utilizzati nel decodificatore di figura 2.
- U (i,j): autocorrelazione di h(n) secondo la seguente espressione:
per l<i≤L e l<j<L; h(n) = 0 per n <1.
Il predittore di lungo termine 106 viene inviato con il segnale di eccitazione passato (vale a dire E gC^ del subframe precedente) per formare il nuovo componente E utilizzando l'opportuno ritardo di passo T e il guadagno b di passo.
Lo stato iniziale del filtro perceptuale 107 viene settato al valore FS inviato dall'estrattore di stato iniziale 110.
Il vettore residuo R' = R - E di passo rimosso calcolato da un sotrattore 121 {figura 1) viene quindi inviato al filtro perceptuale 107 per ottenere all'uscita di quest'ultimo filtro un vettore obiettivo X.
Come illustrato in figura 1, i parametri STP sono applicati al filtro 107 per variare la sua funzione di trasferimento in relazione a questi parametri. Fondamentalmente, X = R' - P dove P rappresenta il contributo della predizione di lungo periodo (LTP) comprendendo "ringing" (lo sdoppiamento) dalla passata eccitazione.
Il criterio MSE che si applica a Δ può ora essere stabilito nella seguente notazione matriciale:
dove h è una matrice di Toeplitz LxL triangolare inferiore formata dalla risposta h(n) come segue.
Il termine h(0) occupa la diagonale della matrice e h(l), h(2), ..., h(L - 1} occupano le rispettive diagonali inferiori.
Una fase di filtraggio a posteriori viene realizzata dal filtro 108 di figura 1.
Ponendo a 0 la derivata dell’equazione di cui sopra rispetto al guadagno g si ottiene il guadagno ottimo come segue:
Con questo valore di g la minimizzazione diventa :
L’obiettivo è di trovare il particolare indice k per cui si ottiene la minimizzazione.
Si noti che poiché llx<2>II è una quanti tà fissa , lo stesso indice può essere trovato mass imizzando la seguente quantità
Nel filtro a priori 108 viene calcolato un vettore obiettivo D = (XH).
Il termine filtraggio a posteriori per quest'operazione deriva dall'interpretazione di (XH) come il filtraggio di X tempo invertito.
Soltanto un selettore di ampiezza 112 è stato aggiunto alla fig. 1 della summenzionata domanda di brevetto americana collegata n. 07/927,528.
La funzione del selettore di ampiezza 112 è quella di limitare i vettori di codice Ak che vengono ricercati dal controllore di ottimizzazione 109 ai vettori di codice Ak più promettenti riducendo così la complessità della ricerca dei vettori di codice.
Come descritto nella descrizione precedente, ciascun vettore di codice Ak è una forma d'onda di combinazione di ampiezza/posizione impulso definente L differenti posizioni p e comprendente sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2, ..., L della combinazione, in cui ciascun impulso di ampiezza diversa da 0 assume almeno una fra q diverse possibili ampiezze.
Con riferimento ora alle figure 3a, 3b e 3c lo scopo del selettore di ampiezza 112 è quello di predefinire una funzione Sp tra le posizioni p della forma d'onda del vettore di codice ed i q possibili valori delle ampiezze di impulso.
La funzione predefinita Sp viene ottenuta in funzione del segnale vocale prima della ricerca del codebook.
Più specificatamente, il predefinire questa funzione consiste nel preassegnare, in relazione al segnale vocale, almeno una delle q possibili ampiezze a ciascuna posizione p della forma d'onda (fase 301 di figura 3a).
Per preassegnare una delle q ampiezze a ciascuna posizione p della forma d'onda, un vettore di stima di ampiezze B viene calcolato come risposta al vettore obiettivo D filtrato a posteriori e dal vettore residuo R' di passo rimosso.
Più specificatamente, il vettore di stima delle ampiezze B viene calcolato sommando (sottofase 301-1 di fig. 3b) il vettore obiettivo D filtrato a posteriori nella forma normalizzata:
al vettore residuo R’ a passo rimosso nella forma normalizzata
per ottenere così un vettore di stima B delle ampiezze della forma:
in cui β è una costante avente un valore tipico pari a 1/2 (il valore di β è scelto tra 0 e 1 in funzione della perceptuale di impulsi di ampiezza diversa da 0 utilizzati nel codice algebrico).
Per ciascuna posizione p della forma d'onda, l'ampiezza Sp da preassegnare a quella posizione p viene ottenuta quantizzando una stima di ampiezza corrispondente Bp del vettore B.
Più specificatamente, per ciascuna posizione p della forma d'onda, una stima di ampiezza Bp a picco normalizzato del vettore B viene quantizzata {sottofase 301-2 di figura 3b) utilizzando la seguente espressione:
in cui Q(.) è la funzione di quantizzazione e
è un fattore di normalizzazione che rappresenta un'ampiezza di picco degli impulsi di ampiezza diversa da 0.
Nell'importante caso particolare in cui
- q = 2, cioè le ampiezze di impulso possono assumere soltanto due valori (vale a dire Sp = ±1) e - la densità di impulsi di ampiezza diversa da zero N/L è inferiore o uguale al 15%
il valore di β può essere uguale a 0; quindi, il vettore di stima delle ampiezze B si riduce semplicemente al vettore obiettivo D filtrato a posteriori e conseguentemente Sp = sign(Dp).
Lo scopo del controllore di ottimizzazione 109 è quello di selezionare il miglior vettore di codice Ak dal codebook algebrico.
Il criterio di selezione è fornito nella forma di un rapporto da calcolare per ciascun vettore di codice Ak e da massimizzare per tutti i vettori di codice (fase 303)
in cui D = (XH) e ak<2 >= II A^ II<2>.
Poiché Ak è un vettore di codice avente N impulsi di ampiezza diversa da 0 di ampiezze rispettive SPi,
il numeratore è il quadrato di
ed il denominatore è il termine di energia che può essere espresso come:
dove U(pi,pj) è la correlazione associata ai due impulsi di ampiezza unitaria, uno alla posizione Pi e l'altro alla posizione pj .
Questa matrice è calcolata secondo l’equazione di cui sopra nel caratterizzatore a risposta di filtro 105 e compresa nell’insieme di parametri indicati con FRC nel diagramma a blocchi di figura 1.
Un metodo rapido per calcolare questo denominatore (fase 304) comprende gli anelli N-annidati illustrati in figura 4 in cui la notazione a linea verticale S(i) e SS(ij) viene utilizzata al posto delle rispettive quantità <n>SPi" e "SPiSPj·’.
II calcolo del denominatore a^<2 >è il processo che impiega più tempo.
I calcoli che contribuiscono a a^<2 >che sono realizzati in ciascun anello di figura 4 possono essere scritti su righe separate dall'anello più esterno all’anello più interno nel modo che segue:
in cui pi è la posizione dell'impulso i-esimo di ampiezza diversa da 0.
Si noti che gli anelli N-annidati di figura 4 consentono di limitare gli impulsi di ampiezza diversa da 0 dei vettori di codice Ak in funzione dei codici di permutazione a singolo impulso N-interconnesso.
Nel presente trovato la complessità della ricerca è drasticamente ridotta limitando il sottoinsieme di vettori di codici Ak da ricercare ai vettori di codice dei quali gli N impulsi di ampiezza diversa da 0 rispettano la funzione predefinita nella fase 301 di figura 3a.
La funzione predefinita viene rispettata quando ciascuno degli N impulsi di ampiezza diversa da 0 di un vettore di codice Ak presenta un'ampiezza uguale all'ampiezza preassegnata alla posizione p dell'impulso di ampiezza diverso da 0.
Detta limitazione del sottoinsieme del vettore di codice viene realizzato in primo luogo combinando la funzione prestabilita Sp con gli ingressi della matrice U ( i , j ) ( fase 302 di figura 3a) e quindi utilizzando gli anelli N-annidati di figura 4 con tutti gli impulsi S(i) che si assumono essere fissi, positivi e di ampiezza unitaria (fase 303).
Pertanto, anche se l'ampiezza degli impulsi diversi da 0 può assumere uno qualsiasi tra q possibili valori nel codebook algebrico, la complessità di ricerca viene ridotta al caso di ampiezze di impulso fisse.
Più precisamente, la matrice U(i,j) che viene inviata dal caratterizzatore a risposta di filtri 105 viene combinata con la funzione predefinita in base alla seguente relazione (fase 302):
in cui Si deriva dal metodo di selezione del selettore di ampiezza 112, vale a dire Si è l'ampiezza selezionata per una singola posizione i seguendo la quantizzazione della corrispondente stima di ampiezze.
Con questa nuova matrice il calcolo per ciascun anello dell ' algoritmo rapido può essere scritto su una riga separata , dall ' anello più esterno all ' anello più interno, nel modo che segue :
U' (ΡΝ,ΡΜ) 2U' (ΡΙ,ΡΝ) 2U' (P2,FM) ... 2U’ (ΡΝ-Ι,ΡΝ)
dove px è la posizione dell ’ x-esimo impulso di ampiezza diversa da 0 della forma d ' onda e dove U ' (Ρχ, Ργ) è una funzione dipendente dall ' ampiezza preassegnata ad una posizione px tra le posizioni p e dall'ampiezza <Sp>y preassegnata ad una posizione py tra le posizioni p.
Per ridurre ulteriormente la complessità di ricerca, si può saltare (figura 3c) in particolare ma non esclusivamente l'anello più interno ogni qual volta è vera la seguente diseguaglianza:
dove SPn è l'ampiezza preassegnata alla posizione pn, Dpn è la pn-esima componente del vettore obiettivo D e TD è una soglia relativa al vettore obiettivo D filtrato a posteriori.
Il segnale complessivo di eccitazione E + gCk viene calcolato da un sommatore 120 (figura 1) dal segnale gCk proveniente dal controllore 109 e dall'uscita E proveniente dal predittore 106.
Il modulo estrattore di stato iniziale 110, costituito da un filtro perceptuale con funzione di trasferimento 1/Α(ζγ<_1>) variabile in funzione dei parametri STP, sottrae dal segnale residuo R il segnale di eccitazione E gCk per il solo scopo di ottenere lo stato di filtro finale FS per l'uso come stato iniziale nel filtro 107 e nell'estrattore di passo 104.
L'insieme dei quattro parametri k, g, LTP e STP viene convertito in un opportuno formato di canale numerico da un multiplatore 111 che completa la procedura per la codifica di un blocco S di campioni del segnale vocale.
Sebbene il presente trovato sia stato descritto con riferimento a sue forme di realizzazione preferenziali, queste forme di realizzazione possono essere modificate a piacere nell'ambito delle rivendicazioni allegate senza uscire dallo spirito e dalla natura del suddetto trovato.

Claims (1)

  1. RIVENDICAZIONI 1 - Metodo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, detto codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, detto metodo comprendendo le fasi di: - preselezione da detto codebook di un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e - ricerca soltanto in detto sottoinsieme di combinazioni di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di impulsi del codebook. 2 - Metodo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, detto codebook consistendo in un insieme di combinazioni di ampiezza/posizione di impulsi, ciascuna combinazione di ampiezza/posizione di impulsi definendo L differenti posizioni e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2 , L della combinazione, e ciascun impulso di ampiezza diversa da 0 assumendo almeno una delle q possibili ampiezze, detto metodo comprendendo le fasi di : - preselezione da detto codebook di un sottoinsieme di combinazioni di ampiezza/posizione di impulsi in funzione del segnale sonoro; e - ricerca soltanto in detto sottoinsieme di combinazioni di ampiezza/posizione di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook. 3 - Metodo come alla rivendicazione 2, in cui la fase di preselezione comprende la predefinizione, in funzione del segnale sonoro, di una funzione Sp tra le rispettive posizioni p = 1, 2, ..., L e le q possibili ampiezze; e la fase di ricerca comprende la ricerca delle sole combinazioni di ampiezza/posizione di impulsi di detto codebook aventi impulsi di ampiezza diversa da 0 che rispettano la funzione predefinita. 4 - Metodo come alla rivendicazione 3, in cui lav fase di predefinizione della funzione comprende la fase di preassegnazione, in funzione del segnale sonoro, di una delle q possibili ampiezze a ciascuna posizione p, ed in cui la funzione predefinita viene rispettata quando ciascun impulso di ampiezza diversa da 0 di una combinazione di ampiezza/posizione di impulsi presenta un'ampiezza pari all'ampiezza Sp preassegnata alla posizione p di detto impulso di ampiezza diversa da 0. 5 - Metodo come alla rivendicazione 4, in cui la fase di preassegnazione di una delle q possibili ampiezze a ciascuna posizione p comprende le fasi di: - elaborazione del segnale sonoro per produrre un segnale obiettivo D filtrato a posteriori ed un segnale residuo R' a passo rimosso; calcolo di un vettore di stima delle ampiezze B in risposta al segnale obiettivo D filtrato a posteriori ed al segnale residuo R' a passo rimosso; e per ciascuna di dette posizioni p, quantizzazione della stima delle ampiezze Bp di detto vettore B per ottenere l'ampiezza da selezionare per detta posizione p. 6 - Metodo come alla rivendicazione 5, in cui la fase di calcolo di un vettore di stima delle ampiezze B comprende la fase di sommare il segnale obiettivo D filtrato a posteriori nella forma normalizzata:
    al segnale residuo R' a passo rimosso nella forma normalizzata:
    per ottenere così un vettore di stima delle ampiezze B nella forma:
    in cui β è una costante. 7 - Metodo come alla rivendicazione 6, in cui β è una costante avente un valore compreso tra 0 e 1. 8 - Metodo come alla rivendicazione 5, in cui per ciascuna di dette posizioni p la fase di quantizzazione comprende la quantizzazione di una stima di ampiezza a picco normalizzato Bn di detto vettore B utilizzando la seguente espressione:
    in cui il denominatore
    è un fattore di normalizzazione che rappresenta un'ampiezza di picco degli impulsi di ampiezza diversa da 0. 9 - Metodo come alla rivendicazione 1, in cui ciascuna di dette combinazioni di impulsi comprende un numero N di impulsi di ampiezza diversa da 0, detto metodo comprendendo ulteriormente la fase di limitare le posizioni p degli impulsi di ampiezza diversa da 0 secondo almeno un codice di permutazione a singolo impulso N-interconnesso. 10 - Metodo come alla rivendicazione 5, in cui ciascuna di dette combinazioni di ampiezza/posizione di impulsi comprende un numero N di impulsi di ampiezza diversa da 0, ed in cui la fase di ricerca comprende la fase di massimizzare un dato rapporto avente un denominatore ak<2 >calcolato mediante N anelli annidati in base alla seguente relazione:
    in cui il calcolo per ciascun anello è scritto su una riga separata da un anello più esterno ad un anello più interno degli N anelli annidati, in cui pn è la posizione dell'n-esimo impulso di ampiezza diversa da 0 della combinazione, ed in cui U'(px,Py) è una funzione che dipende dall'ampiezza SPx preassegnata ad una posizione px tra le posizioni p e dall'ampiezza <S>Py preassegnata ad una posizione Py tra le posizioni p. 11 - Metodo come alla rivendicazione 10, in cui la fase di massimizzazione di detto dato rapporto comprende la fase di saltare almeno l'anello più interno degli N anelli annidati ogni qualvolta è vera la seguente diseguaglianza:
    dove SPn è l ' ampiezza preassegnata alla posizione pn, Dpn è la pn-esima componente del vettore obiettivo D e TD è una soglia relativa al vettore obiettivo D filtrato a posteriori . 12 - Dispositivo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, det to codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione , detto dispositivo comprendendo: - mezzi per preselezionare da detto codebook un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e - mezzi per ricercare solo detto sottoinsieme di combinazioni di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook. 13 - Dispositivo per eseguire una ricerca in un codebook allo scopo di codificare un segnale sonoro, detto codebook consistendo in un insieme di combinazioni di ampiezza/posizione di impulsi, ciascuna combinazione di ampiezza/posizione di impulsi definendo L posizioni differenti e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2, ..., L della combinazione, e ciascun impulso di ampiezza diversa da 0 assumendo almeno una delle q possibili ampiezze, detto dispositivo comprendendo: - mezzi per preselezionare da detto codebook un sottoìnsìeme di combinazioni di ampiezza/posizione di impulsi in funzione del segnale sonoro; e - mezzi per ricercare solo detto sottoinsieme di combinazioni di ampiezza/posizione di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook. 14 - Dispositivo come alla rivendicazione 13, in cui: - i mezzi di preselezione comprendono mezzi per predefinire, in funzione del segnale sonoro, una funzione Sp tra le rispettive posizioni p = 1, 2, . .., L e le q possibili ampiezze; e - i mezzi di ricerca comprendono mezzi per limitare la ricerca alle combinazioni di ampiezza/posizione di impulsi di detto codebook aventi impulsi di ampiezza diversa da 0 che rispettano la funzione predefinita. 15 - Dispositivo come alla rivendicazione 14, in cui i mezzi di predefinizìone della funzione comprendono mezzi di preassegnazione, in funzione del segnale sonoro, di una delle q possibili ampiezze a ciascuna posizione p, ed in cui la funzione predefinita viene rispettata quando ciascun impulso di ampiezza diversa da 0 di una combinaz ione di ampiezza/posizione di impulsi presenta un ' ampiezza pari all ' ampiezza Sp preassegnata alla posizione p di detto impulso di ampiezza diversa da 0. 16 - Dispositivo come alla rivendicazione 15, in cui i mezzi di preassegnazione di una delle q possibili ampiezze a ciascuna posizione p comprendono: - mezzi per elaborare il segnale sonoro per produrre un segnale obiettivo D filtrato a posteriori ed un segnale residuo R' a passo rimosso; - mezzi per calcolare un vettore di stima delle ampiezze B in risposta al segnale obiettivo D filtrato a posteriori ed al segnale residuo R' a passo rimosso; e per ciascuna di dette posizioni p, mezzi per quantizzare la stima delle ampiezze Bp di detto vettore B per ottenere l'ampiezza da selezionare per detta posizione p. 17 - Dispositivo come alla rivendicazione 16, in cui detti mezzi per calcolare un vettore di stima delle ampiezze B comprendono mezzi per sommare il segnale obiettivo D filtrato a posteriori nella forma normalizzata:
    al segnale residuo R' a passo rimosso nella forma normalizzata: P Il R * 11 per ottenere così un vettore di stima delle ampiezze B nella forma: ;in cui β è una costante. 18 - Dispositivo come alla rivendicazione 17, in cui β è una costante avente un valore compreso tra 0 e 1. 19 - Dispositivo come alla rivendicazione 16, in cui per ciascuna di dette posizioni p detti mezzi di quantizzazione comprendono mezzi per quantizzare una stima di ampiezza a picco normalizzato Bp di detto vettore B utilizzando la seguente espressione: ;in cui il denominatore ;è un fattore di normalizzazione che rappresenta un'ampiezza di picco degli impulsi di ampiezza diversa da 0. 20 - Dispositivo come alla rivendicazione 12, in cui ciascuna di dette combinazioni di impulsi comprende un numero N di impulsi di ampiezza diversa da 0, detto dispositivo comprendendo ulteriormente mezzi per limitare le posizioni p degli impulsi di ampiezza diversa da 0 secondo almeno un codice di permutazione a singolo impulso N-interconnesso. 21 - Dispositivo come alla rivendicazione 16, in cui ciascuna di dette combinazioni di ampiezza/posizione di impulsi comprende un numero N di impulsi di ampiezza diversa da 0, ed in cui i mezzi di ricerca comprendono mezzi per massimizzare un dato rapporto avente un denominatore a^<2 >e mezzi per calcolare detto denominatore ak<2 >mediante N anelli annidati in base alla seguente relazione: ;in cui il calcolo per ciascun anello è scritto su una riga separata da un anello più esterno ad un anello più interno degli N anelli annidati, in cui pn è la posizione dell'n-esimo impulso di ampiezza diversa da 0 della combinazione, ed in cui U'{px,Py) è una funzione che dipende dall'ampiezza SPx preassegnata ad una posizione px tra le posizioni p e dall'ampiezza preassegnata ad una posizione Py tra le posizioni p. 22 - Dispositivo come alla rivendicazione 21, in cui detti mezzi per calcolare il denominatore a^<2 >comprendono mezzi per saltare almeno l'anello più interno degli N anelli annidati ogni qualvolta è vera la seguente diseguaglianza: ;dove è l'ampiezza preassegnata alla posizione pn, DPn è la pn-esima componente del vettore obiettivo D e TD è una soglia relativa al vettore obiettivo D filtrato a posteriori. 23 - Sistema di comunicazione cellulare per servire una vasta area geografica divisa in una pluralità di celle, comprendente: - unità mobili portatili trasmettitore/ricevitore; - stazioni cellulari base situate rispettivamente in dette celle; - mezzi per il controllo della comunicazione tra le stazioni cellulari base; - un sot tos i s tema di comuni ca z ione radi o bidirezionale tra ciascuna unità mobile situata in una cella e la stazione cellulare base di detta cella , detto sottosistema di comunicazione radio bidirezionale comprendendo sia nell ’ unità mobile che nella stazione cellulare base (a) un trasmettitore comprendente mezzi per la codif ica di un segnale vocale e mezzi per la trasmissione di un segnale vocale codificato, e (b) un ricevitore comprendente mezzi per la ricezione di un segnale vocale codificato trasmesso e mezzi per la decodifica del segnale vocale codificato ricevuto, in cui detti mezzi di codifica del segnale vocale comprendono un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare il segnale vocale, detto; codebook consistendo in un insieme di combinazioni di impulsi e ciascuna combinazione di impulsi definendo una pluralità di posizioni differenti e comprendendo impulsi assegnati a rispettive posizioni della combinazione, detto dispositivo di esecuzione della ricerca comprendendo : - mezzi per preselezionare da detto codebook un sottoinsieme di combinazioni di impulsi in funzione del segnale sonoro; e - mezzi per ricercare solo detto sottoinsieme di combinazioni di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta, nel funzionamento, in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook.. 24 - Sistema di comunicazione cellulare per servire una vasta area geografica divisa in una pluralità di celle, comprendente: - unità mobili portatili trasmettitore/ricevitore; - stazioni cellulari base situate rispettivamente in dette celle; - mezzi per il controllo della comunicazione tra le stazioni cellulari base; - un sottosistema di comunicazione radio bidirezionale tra ciascuna unità mobile situata in una cella e la stazione cellulare base di detta cella, detto sottosistema di comunicazione radio bidirezionale comprendendo sia nell'unità mobile che nella stazione cellulare base (a) un trasmettitore comprendente mezzi per la codifica di un segnale vocale e mezzi per la trasmissione di un segnale vocale codificato, e {b) un ricevitore comprendente mezzi per la ricezione di un segnale vocale codificato trasmesso e mezzi per la decodifica segnale vocale codificato ricevuto, in cui detti mezzi di codifica del segnale vocale comprendono un dispositivo per eseguire una ricerca in un codebook allo scopo di codificare il segnale vocale, detto codebook consistendo in un insieme di combinazioni di ampiezza/posizione di impulsi, ciascuna combinazione di ampiezza/posizione di impulsi definendo L posizioni differenti e comprendendo sia impulsi di ampiezza 0 che impulsi di ampiezza diversa da 0 assegnati a rispettive posizioni p = 1, 2, ..., L della combinazione e ciascun impulso di ampiezza diversa da 0 assumendo almeno una fra q possibili ampiezze, detto dispositivo di esecuzione della ricerca comprendendo: - mezzi per preselezionare da detto codebook un sottoinsieme di combinazioni di ampiezza/posizione di impulsi in funzione del segnale sonoro; e - mezzi per ricercare solo detto sottoinsieme di combinazioni di ampiezza/posizione di impulsi allo scopo di codificare il segnale sonoro; la complessità della ricerca venendo in questo modo ridotta , nel funzionamento , in quanto viene ricercato solo un sottoinsieme delle combinazioni di ampiezza/posizione di impulsi del codebook. 25 - Sistema come alla rivendicazione 24, in cui: - i mezzi di preselezione comprendono mezzi per predefinire, in funzione del segnale sonoro, una funzione Sp tra le rispettive posizioni p = 1, 2, ..., L e le q possibili ampiezze; e - i mezzi di ricerca comprendono mezzi per limitare la ricerca alle combinazioni di ampiezza/posizione di impulsi di detto codebook aventi impulsi di ampiezza diversa da 0 che rispettano la funzione predefinita. 26 - Sistema come alla rivendicazione 25, in cui i mezzi di predefinizione della funzione comprendono mezzi di preassegnazione, in funzione del segnale sonoro di una delle q possibili ampiezze a ciascuna posizione p, ed in cui la funzione predefinita viene rispettata quando ciascun impulso di ampiezza diversa da 0 di una combinazione di ampiezza/posizione di impulsi presenta un'ampiezza pari all'ampiezza Sp preassegnata alla posizione p dì detto impulso di ampiezza diversa da 0. 27 - Sistema come alla rivendicazione 26, in cui i mezzi di preassegnazione di una delle q possibili ampiezze a ciascuna posizione p comprendono: - mezzi per elaborare il segnale vocale per produrre un segnale obiettivo D filtrato a posteriori ed un segnale residuo R' a passo rimosso; - mezzi per calcolare un vettore di stima delle ampiezze B in risposta al segnale obiettivo D filtrato a posteriori ed al segnale residuo R' a passo rimosso; e per ciascuna di dette posizioni p, mezzi per quantizzare la stima delle ampiezze Bp di detto vettore B per ottenere l'ampiezza da selezionare per detta posizione p. 28 - Sistema come alla rivendicazione 27, in cui detti mezzi per calcolare un vettore di stima delle ampiezze B comprendono mezzi per sommare il segnale obiettivo D filtrato a posteriori nella forma normalizzata: ;al segnale residuo R' a passo rimosso nella forma normalizzata: ;per ottenere così un vettore di stima delle ampiezze B nella forma: ;in cui β è una costante. 29 - Sistema come alla rivendicazione 28, in cui β è una costante avente un valore compreso tra 0 e 1. 30 - Sistema come alla rivendicazione 27, in cui per ciascuna di dette posizioni p detti mezzi di quant izzazione comprendono mezzi per quantizzare una stima di ampiezza a picco normalizzato Bp di detto vettore B utilizzando la seguente espressione: ;in cui il denominatore ;è un fattore di normalizzazione che rappresenta un'ampiezza di picco degli impulsi di ampiezza diversa da 0. 31 - Sistema come alla rivendicazione 23, in cui ciascuna di dette combinazioni di impulsi comprende un numero N di impulsi di ampiezza diversa da 0, detto dispositivo comprendendo ulteriormente mezzi per limitare le posizioni p degli impulsi di ampiezza diversa da 0 secondo almeno un codice di permutazione a singolo impulso N-interconnesso . 32 - Sistema come alla rivendicazione 27 , in cui ciascuna di dette combinazioni di ampiezza/posizione di impulso comprende un numero N di impulsi di ampiezza diversa da 0, ed in cui i mezzi di ricerca comprendono mezzi per massimizzare un dato rapporto avente un denominatore ak<2 >e mezzi per calcolare detto denominatore ak<2 >mediante N anelli annidati in base alla seguente relazione: ;U'(PN,PN) 2U’(ΡΙ,ΡΝ) 2U'(3⁄4,3⁄4<) >+ ... 2U'(RH.3⁄4) in cui il calcolo per ciascun anello è scritto su una riga separata da un anello più esterno ad un anello più interno degli N anelli annidati, in cui pn è la posizione dell<1>n-esimo impulso di ampiezza diversa da 0 della combinazione, ed in cui U'(px,Py) è una funzione che dipende dall'ampiezza Spx preassegnata ad una posizione px tra le posizioni p e dall'ampiezza Spy preassegnata ad una posizione Py tra le posizioni p. 33 - Sistema come alla rivendicazione 32, in cui detti mezzi per calcolare il denominatore a*<2 >comprendono mezzi per saltare almeno l'anello più interno degli N anelli annidati ogni qualvolta è vera la seguente diseguaglianza:
    dove Spn è l'ampiezza preassegnata alla posizione pn, Dpn è la Ρη-esima componente del vettore obiettivo D e TD è una soglia relativa al vettore obiettivo D filtrato a posteriori.
IT1996UD000012A 1995-02-06 1996-02-02 Codebook algebrico con ampiezze di impulso selezionate infunzione del segnale per la codifica rapida di un segnale IT1305724B1 (it)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US38396895A 1995-02-06 1995-02-06
US08/508,801 US5754976A (en) 1990-02-23 1995-07-28 Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech

Publications (3)

Publication Number Publication Date
ITUD960012A0 ITUD960012A0 (it) 1996-02-02
ITUD960012A1 true ITUD960012A1 (it) 1997-08-02
IT1305724B1 IT1305724B1 (it) 2001-05-15

Family

ID=27010408

Family Applications (1)

Application Number Title Priority Date Filing Date
IT1996UD000012A IT1305724B1 (it) 1995-02-06 1996-02-02 Codebook algebrico con ampiezze di impulso selezionate infunzione del segnale per la codifica rapida di un segnale

Country Status (25)

Country Link
US (1) US5754976A (it)
EP (2) EP0808496B1 (it)
JP (2) JP3430175B2 (it)
KR (2) KR100388751B1 (it)
CN (2) CN1198262C (it)
AR (1) AR000871A1 (it)
AT (2) ATE230888T1 (it)
AU (1) AU708392C (it)
BR (1) BR9607026A (it)
CA (1) CA2210765C (it)
DE (1) DE19604273C5 (it)
DK (2) DK1225568T3 (it)
ES (1) ES2112807B1 (it)
FI (2) FI117994B (it)
FR (1) FR2730336B1 (it)
GB (1) GB2297671B (it)
IN (1) IN187453B (it)
IT (1) IT1305724B1 (it)
MX (1) MX9705997A (it)
MY (2) MY130529A (it)
NO (1) NO318595B1 (it)
PT (1) PT1225568E (it)
RU (1) RU2142166C1 (it)
SE (1) SE520553C2 (it)
WO (1) WO1996024925A1 (it)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
TW317051B (it) * 1996-02-15 1997-10-01 Philips Electronics Nv
EP1008982B1 (en) * 1997-03-12 2005-12-07 Mitsubishi Denki Kabushiki Kaisha Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
KR100409167B1 (ko) * 1998-09-11 2003-12-12 모토로라 인코포레이티드 정보 신호를 부호화하는 방법 및 장치
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7272553B1 (en) * 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
JP4005359B2 (ja) 1999-09-14 2007-11-07 富士通株式会社 音声符号化及び音声復号化装置
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6728669B1 (en) 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7236928B2 (en) * 2001-12-19 2007-06-26 Ntt Docomo, Inc. Joint optimization of speech excitation and filter parameters
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CN100416652C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
WO2007066771A1 (ja) * 2005-12-09 2007-06-14 Matsushita Electric Industrial Co., Ltd. 固定符号帳探索装置および固定符号帳探索方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
WO2008134974A1 (fr) 2007-04-29 2008-11-13 Huawei Technologies Co., Ltd. Procédé de codage et de décodage, codeur et décodeur
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
JP5264913B2 (ja) * 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
EP2227806A4 (en) * 2007-12-21 2013-08-07 Nvoq Inc DISTRIBUTED DICTÉE / TRANSCRIPTION SYSTEM
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
PL2242045T3 (pl) * 2009-04-16 2013-02-28 Univ Mons Sposób kodowania i syntezy mowy
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140334564A1 (en) * 2013-05-09 2014-11-13 Samsung Electronics Co., Ltd Method and system for providing low-complexity hybrid precoding in wireless communication systems

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
US4486899A (en) * 1981-03-17 1984-12-04 Nippon Electric Co., Ltd. System for extraction of pole parameter values
US4710959A (en) * 1982-04-29 1987-12-01 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
WO1990013891A1 (en) * 1989-05-11 1990-11-15 Telefonaktiebolaget Lm Ericsson Excitation pulse positioning method in a linear predictive speech coder
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE4315313C2 (de) * 1993-05-07 2001-11-08 Bosch Gmbh Robert Vektorcodierverfahren insbesondere für Sprachsignale

Also Published As

Publication number Publication date
DE19604273C2 (de) 2000-06-29
BR9607026A (pt) 1997-11-04
JP4187556B2 (ja) 2008-11-26
EP1225568B1 (en) 2003-08-27
FI973241A7 (fi) 1997-10-06
IT1305724B1 (it) 2001-05-15
FI973241A0 (fi) 1997-08-06
AU708392B2 (en) 1999-08-05
JP3430175B2 (ja) 2003-07-28
JP2003308100A (ja) 2003-10-31
DK0808496T3 (da) 2003-04-22
GB2297671B (en) 2000-01-19
SE520553C2 (sv) 2003-07-22
KR100388751B1 (ko) 2003-11-28
DE19604273A1 (de) 1996-08-29
PT1225568E (pt) 2004-01-30
GB9602391D0 (en) 1996-04-03
MX9705997A (es) 1997-11-29
FI118396B (fi) 2007-10-31
HK1055007A1 (en) 2003-12-19
CA2210765A1 (en) 1996-08-15
IN187453B (it) 2002-04-27
FI117994B (fi) 2007-05-15
CN1198262C (zh) 2005-04-20
DK1225568T3 (da) 2003-11-24
EP0808496B1 (en) 2003-01-08
WO1996024925A1 (en) 1996-08-15
FR2730336B1 (fr) 1997-08-14
MY119038A (en) 2005-03-31
US5754976A (en) 1998-05-19
ES2112807A1 (es) 1998-04-01
GB2297671A (en) 1996-08-07
ATE230888T1 (de) 2003-01-15
DE19604273C5 (de) 2004-05-27
JPH10513571A (ja) 1998-12-22
KR100393910B1 (ko) 2003-08-02
AU4479696A (en) 1996-08-27
CN1410970A (zh) 2003-04-16
EP0808496A1 (en) 1997-11-26
AR000871A1 (es) 1997-08-06
ES2112807B1 (es) 1999-04-16
FI20020320A7 (fi) 2002-02-18
CN1181150A (zh) 1998-05-06
EP1225568A1 (en) 2002-07-24
CN1220178C (zh) 2005-09-21
ITUD960012A0 (it) 1996-02-02
NO973472L (no) 1997-10-06
MY130529A (en) 2007-06-29
KR19980701975A (ko) 1998-06-25
CA2210765C (en) 2001-08-21
NO973472D0 (no) 1997-07-28
SE9600437D0 (sv) 1996-02-06
NO318595B1 (no) 2005-04-18
ATE248423T1 (de) 2003-09-15
AU708392C (en) 2003-01-09
RU2142166C1 (ru) 1999-11-27
HK1002492A1 (en) 1998-08-28
FR2730336A1 (fr) 1996-08-09

Similar Documents

Publication Publication Date Title
ITUD960012A1 (it) Codebook algebrico con ampiezze di impulso selezionate in funzione del segnale per la codifica rapida di un segnale
KR100299408B1 (ko) 음성의고속코딩을위한심도우선대수코드북검색
EP2805324B1 (en) System and method for mixed codebook excitation for speech coding
JPH08234799A (ja) 改良されたベクトル励起源を有するデジタル音声コーダ
US5799271A (en) Method for reducing pitch search time for vocoder
CA2210765E (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
WO2000016501A1 (en) Method and apparatus for coding an information signal
NO322594B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale
JP2004093946A (ja) 音声符号化装置および音声符号化プログラム
WO2000042601A1 (en) A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders