PT89978B - DEVECTOR OF THE VOCAL ACTIVITY AND MOBILE TELEPHONE SYSTEM THAT CONTAINS IT - Google Patents

DEVECTOR OF THE VOCAL ACTIVITY AND MOBILE TELEPHONE SYSTEM THAT CONTAINS IT Download PDF

Info

Publication number
PT89978B
PT89978B PT89978A PT8997889A PT89978B PT 89978 B PT89978 B PT 89978B PT 89978 A PT89978 A PT 89978A PT 8997889 A PT8997889 A PT 8997889A PT 89978 B PT89978 B PT 89978B
Authority
PT
Portugal
Prior art keywords
signal
measure
speech
noise
vocal
Prior art date
Application number
PT89978A
Other languages
Portuguese (pt)
Other versions
PT89978A (en
Inventor
Daniel Kennetw Freeman
Ivan Boyd
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB888805795A external-priority patent/GB8805795D0/en
Priority claimed from GB888813346A external-priority patent/GB8813346D0/en
Priority claimed from GB888820105A external-priority patent/GB8820105D0/en
Application filed by British Telecomm filed Critical British Telecomm
Publication of PT89978A publication Critical patent/PT89978A/en
Publication of PT89978B publication Critical patent/PT89978B/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Voice activity detector (VAD) for use in an LPC coder in a mobile radio system, uses autocorrelation coefficients R0, R1..... of the input signal, weighted and combined, to provide a measure M which depends on the power within that part of the spectrum containing no noise, which is thresholded against a variable threshold to provide a speech/no speech logic output. The measure is <MATH> where Hi are the autocorrelation coefficients of the impulse response of an Nth order FIR inverse noise filter derived from LPC analysis of previous non-speech signal frames. Threshold adaption and coefficient update are controlled by a second VAD responsive to rate of spectral change between frames.

Description

DESCRIÇÃODESCRIPTION

DAGIVES

PATENTE DE INVENÇÃOINVENTION PATENT

N.° 89 978No. 89 978

REQUERENTE: BRITISH TELECOMMUNICATIONS public limited company, britânica, industrial e comercial, com sede em 81 Newgate Street, London EC1A 7AJ, Inglaterra.APPLICANT: BRITISH TELECOMMUNICATIONS public limited company, British, industrial and commercial, based at 81 Newgate Street, London EC1A 7AJ, England.

EPÍGRAFE:TITLE:

APARELHO DETECDOR DA ACTIVADADE VOCAL E APARELHO TELEFÚNICO MOVEL QUE 0 CONTEMVOCAL ACTIVITY DETECTING DEVICE AND MOBILE TELEPHONE DEVICE CONTAINING 0

INVENTORES: Daniel Kennetw Freeman e Ivan Boyd.INVENTORS: Daniel Kennetw Freeman and Ivan Boyd.

Reivindicação do direito de prioridade ao abrigo do artigo 4.° da Convenção de Paris de 20 de Março de 1883.Claim of the right of priority under Article 4 of the Paris Convention of 20 March 1883.

Reino Unido em 11 de Março de 1988,06 deUnited Kingdom on 11 March 1988, 2006

Junho de 1988 e em 24 de Agosto de 1988,sob os n9s......June 1988 and on August 24, 1988, under the n 9 s ......

8805795, 8813346.7 e 88201105.8, respectivamente.8805795, 8813346.7 and 88201105.8, respectively.

INPI. MOD. 113 R F 18732INPI. MOD. 113 R F 18732

Descrição referente à patente de invenção de BRITISH TELECOMMUNICATIONS public limited company, britânica, industrial e comercial, com sede em 81 Newgate Street, London EClA 7AJ, Inglaterra, (inventores: Daniel Kennetw Freeman e Ivan Boyd, residentes na Inglaterra), para APARELHO DETECTOR DA ACTIVIDADE VOCAL E APARELHO TELEFÓNICO MÓVEL QUE O CONTEM.Description referring to the BRITISH TELECOMMUNICATIONS public limited company, British, industrial and commercial patent, based at 81 Newgate Street, London EClA 7AJ, England, (inventors: Daniel Kennetw Freeman and Ivan Boyd, residing in England), for DETECTOR APPLIANCE VOCAL ACTIVITY AND MOBILE TELEPHONE APPLIANCE THAT CONTAINS IT.

Descriçãodescription

Um detector da actividade vocal é um dispositivo ao qual se fornece um sinal com a finalidade de detectar períodos de conversação ou períodos contendo apenas ruido. Embora a presente invenção não se limite a isso, uma aplicação de interes se particular de tais detectores é nos sistemas de radiotelefone móvel, onde o conhecimento da presença ou não de sinais de conversação pode ser explorado por um codificador da fala para melhorar a utilização eficiente do espectro das frequências ;adioeléctricas e onde é também muito provável que o nível de ruido (proveniente de uma unidade montada no veículo) seja elevado .A vocal activity detector is a device to which a signal is provided for the purpose of detecting periods of conversation or periods containing only noise. Although the present invention is not limited to this, an application of particular interest to such detectors is in mobile radiotelephone systems, where knowledge of the presence or absence of conversation signals can be exploited by a speech encoder to improve efficient use of the frequency spectrum, adioelectric and where it is also very likely that the noise level (from a unit mounted on the vehicle) is high.

A essência da detecção da actividade vocal consiste em determinar uma medida que difira apreciavelmente entre os períodos de fala e de ausência de fala. Nos aparelhos que incluem um codificador da fala, está disponível um certo número de parâmetros a partir de um ou outro andar do codificador sendo portanto desejável economizar no processamento necessário pela utilização de alguns desses parâmetros. Em muitos ambientes, as fontes de ruido principais ocorrem em áreas definidas conhecidas do aspectro de frequências. Por exemplo, num automóvel, uma grande parte do ruido (por exemplo ruido do motor) concentra-se nas zonas de baixas frequências do espectro. Quando se dispuser de um tal conhecimento da posição espectral do ruido, é desejável basear a decisão sobre se a fala está presente ou ausente em medidas feitas a partir da porção do espectro que contém relativamente pouco ruido. Seria evidentemente possível na prática pré-filtrar o sinal antes da sua análise para detectar a activada vocal, mas quando o detector de actividade vocal se seguir à saida de um codificador da fala, a pré-filtragem distorce o sinal vocal a codificar.The essence of detecting vocal activity is to determine a measure that differs appreciably between speech and non-speech periods. In devices that include a speech encoder, a number of parameters are available from either stage of the encoder and it is therefore desirable to save on the processing required by using some of these parameters. In many environments, the main noise sources occur in defined areas known from the frequency spectrum. For example, in a car, a large part of the noise (eg engine noise) is concentrated in the low frequency areas of the spectrum. When such knowledge of the spectral position of the noise is available, it is desirable to base the decision on whether speech is present or absent on measurements made from the portion of the spectrum that contains relatively little noise. It would of course be possible in practice to pre-filter the signal prior to its analysis to detect the vocal activation, but when the vocal activity detector follows the output of a speech encoder, pre-filtering distorts the vocal signal to be encoded.

Segundo um primeiro aspecto da presente invenção, proporciona-se um aparelho de detecção da actividade vocal que compreende meios para receber um sinal de entrada, meios para fazer uma estimativa da componente do sinal de ruido no sinal de entrada, meios para formar continuamente uma medida M da semelhança espectral entre uma porção do sinal de entrada e o sinal de ruido e meios para comparar um parâmetro derivado da medida M com um valor de limiar T para produzir uma saida para indicar a presença ou a ausência de fala, em função de esse valor ser ou não excedido.According to a first aspect of the present invention, a device for detecting vocal activity is provided which comprises means for receiving an input signal, means for estimating the noise signal component in the input signal, means for continuously forming a measurement M of the spectral similarity between a portion of the input signal and the noise signal and means to compare a parameter derived from measure M with a threshold value T to produce an output to indicate the presence or absence of speech, depending on that value is exceeded or not.

De acordo com um segundo aspecto da presente invenção proporciona-se um aparelho de detecção da actividade vocal que compreende: meios para formar continuamente uma medida da distorção espectral da semelhança entre uma porção do sinal de entrada e porções mais primitivas do sinal de entrada e meios para comparar o grau de veriação entre valores sucessivos da medi da com um valor de limiar, para produzir uma saida que indica a presença ou a ausência de fala em função de esse valor ser ou não excedido.According to a second aspect of the present invention there is provided an apparatus for detecting vocal activity which comprises: means for continuously forming a measure of the spectral distortion of similarity between a portion of the input signal and more primitive portions of the input signal and means to compare the degree of veriation between successive values of the measure with a threshold value, to produce an output that indicates the presence or absence of speech depending on whether this value is exceeded or not.

De preferência, a medida é a medida da distorção Itakura-Saito.Preferably, the measure is the measure of the Itakura-Saito distortion.

Outros aspectos da presente invenção estão definidos nas reivindicações.Other aspects of the present invention are defined in the claims.

Vão agora descrever-se algumas formas de realização da presente invenção, a título de exemplo, com referência aos desenhos anexos, cujas figuras representam:Some embodiments of the present invention will now be described, by way of example, with reference to the accompanying drawings, the figures of which represent:

A fig. 1, um esquema de blocos de uma primeira formaFig. 1, a block diagram of a first form

BAD ORIGINALORIGINAL BAD

de realização da presente invenção;of carrying out the present invention;

A fig. 2, uma segunda forma de realização da presente invenção;Fig. 2, a second embodiment of the present invention;

A fig. 3, uma terceira forma preferida de realização da presente invenção.Fig. 3, a third preferred embodiment of the present invention.

princípio geral subjacente a um primeiro detector de actividade vocal segundo uma primeira forma de realização da presente invenção é o seguinte.general principle underlying a first vocal activity detector according to a first embodiment of the present invention is as follows.

De uma trama de n amostras do sinal o' Sl' S2' S3' ., sn_jJ, quando passar através de um filtro digital com resposta finita ao impulso unitário (FIR) de quarta ordem ideal, com a resposta ao impulso unitário (1, h^, h^, h2, h^), resultará um sinal filtrado (ignorando as amostras de tramas anteriores) ' = <s0>From a plot of n samples of the signal the ' S l' S 2 ' S 3'., S n_jJ, when passing through a digital filter with finite response to the ideal fourth-order unitary impulse (FIR), with the response to the impulse unitary (1, h ^, h ^, h 2 , h ^), a filtered signal will result (ignoring previous frame samples) '= < s 0>

(s. (s. (s + hoso), + 'Vl hiso’ + h0s2 + hlSl + h2sQ), + h0s3 + 1>Λ + + ·νο>, (S5 + h0SS + hlS3 + h?S7 + hri’· (sl (s(s. (s. (s + h o s o ), + ' Vl h i s o' + h 0 s 2 + h lSl + h 2 s Q ), + h 0 s 3 + 1> Λ + + · νο >, (S 5 + h 0 S S + h l S 3 + h ? S 7 + h ri '· (s l (s

0’’5 + + h2s3 0''5 + + h 2 s 3

1' ^3S2 ) ' coeficiente de autocorrelação de ordem zero é a soma de cada termo elevado ao quadrado, que pode ser normalizado, isto é, dividido pelo número total de termos ( para comprimentos constantes das tramas é mais fácil omitir a divisão); o valor do sinal filtrado será assim o1 '^ 3 S 2)' zero order autocorrelation coefficient is the sum of each term squared, which can be normalized, that is, divided by the total number of terms (for constant lengths of the frames it is easier to omit the division ); the value of the filtered signal will thus be

(s sendo este valor portanto uma medida da potência do sinal filtrado ideal s1 - por outras palavras, da parte do sinal s_ que cai na banda de passagem do filtro ideal.(so this value is therefore a measure of the power of the ideal filtered signal s 1 - in other words, of the part of the signal s_ that falls in the pass band of the ideal filter.

Desenvolvendo e desprezando os 4 primeiros termosDeveloping and neglecting the first 4 terms

R1 = (s + h s + h.s„ + h.,s. hos ' 0 4 03 1 2 2130R 1 = (s + hs + hs „+ h., S. H o s' 0 4 03 1 2 2130

+ is,. + hQs4 + his3 + h2s2 + h3Sl?+ is ,. + h Q s 4 + h i s 3 + h 2 s 2 + h 3 S l?

+ ...+ ...

+ ++ +

+ ++ +

2 S42 S 4 + + h0S4S3 h 0 S 4 S 3 + + hls4s2 h l s 4 s 2 + + h2S4Sl h 2 S 4 S l + + h3S4S0 h 3 S 4 S 0 h0s4S3 h 0 s 4 S 3 4- 4- h0s0 h 0 s 0 + + VlS3s2Vl S 3 s 2 + + h0h2s3sl h 0 h 2 s 3 s l + + h0h3s3SC h 0 h 3 s 3 S C hls4s2 h l s 4 s 2 + + h0hlS3S2 h 0 h l S 3 S 2 + + u2 2 hls2u2 2 h l s 2 + + hlh2s2sl h l h 2 s 2 s l + + hlh3s2sC h l h 3 s 2 s C h2s4sl h 2 s 4 s l + + h0hLS3Sl h 0 h L S 3 S l + + hlh2S2sl h l h 2 S 2 s l + + .2 2 h2sl.2 2 h 2 s l + + h2h3SlS0 h 2 h 3 S l S 0 h3 = 4S,l h 3 = 4 S , l + + h0h3S3S0 h 0 h 3 S 3 S 0 + + hlh3s2s0 h l h 3 s 2 s 0 + + h2h3sls0 h 2 h 3 s l s 0 2 2 h3s02 2 h 3 s 0

R0 (1 + h0+ hl+ h2+ h3^ + R ( -h0 + 2hQhi + 2hih2 + 2h2h3^ R 0 ( 1 + h 0 + h l + h 2 + h 3 ^ + R (- h 0 + 2h Q h i + 2h i h 2 + 2h 2 h 3 ^

4- R2 (2h^ + 2h3h3 + 2hQh2) + (2h2 + 2h9h3^4- R 2 (2h ^ + 2h 3 h 3 + 2h Q h 2 ) + ( 2h 2 + 2h 9 h 3 ^

R4 '2h3)R 4 '2h 3 )

Assim, R’q pode ser obtido a partir de uma combinação dos coeficientes de autocorrelação R^, ponderados por meio das constantes entre parênteses que determinam a banda de frequências a que responde o valor de R'q- De facto, os termos entre parênteses são os coeficientes de autocorrelação da resposta do filtro ideal ao impulso unitário, de modo que a expressão anterior pode simplificar-se paraThus, R'q can be obtained from a combination of the autocorrelation coefficients R ^, weighted by means of the constants in parentheses that determine the frequency band to which the value of R'q responds - In fact, the terms in parentheses are the autocorrelation coefficients of the ideal filter response to the unit impulse, so that the previous expression can be simplified to

N_ R’o = RoHo + 2T~ ríhí- (1) i = 1 onde N é a ordem do filtro e H. são coeficientes de autocorre1 lação (não normalizados) da resposta do filtro ao impulso unitário .N_ R 'o = R o H o + 2 T ~ r í h í- (1) i = 1 where N is the order of the filter and H. are self-correcting coefficients (non-normalized) of the filter response to the unit impulse .

Por outras palavras, o efeito nos coeficientes de autocorrelação do sinal da filtragem de um sinal pode ser simulado pela produção de uma soma ponderada dos coeficientes de auto4In other words, the effect on the signal autocorrelation coefficients of the filtering of a signal can be simulated by producing a weighted sum of the auto coefficients4

correlação do sinal (não filtrado), usando a resposta ao impulso que teria o filtro requerido.correlation of the signal (unfiltered), using the impulse response that the required filter would have.

Assim, um algoritmo relativamente simples, envolvendo um pequeno número de operações de multiplicação, pode simular o efeito de um filtro digital que exige tipicamente cem vezes este número de operações de multiplicação.Thus, a relatively simple algorithm, involving a small number of multiplication operations, can simulate the effect of a digital filter that typically requires a hundred times this number of multiplication operations.

Esta operação de filtragem pode em alternativa ser vista como uma forma de comparação de espectros, sendo o espectro do sinal comparado com um espectro de referência (o inverso da resposta do filtro ideal). Como o filtro ideal nesta aplicação é escolhido de modo a aproximar-se do inverso do espectro do ruido, esta operação pode ser considerada como uma comparação espectral entre os espectros da fala e do ruido e o coeficiente de autocorrelação de ordem zero assim gerado (isto é, a energia do sinal inverso filtrado) como uma medida da dissemelhança entre os espectros. Usa-se a medida da distorção Itakura-Saito na LPC para estabelecer a adaptação entre o filtro preditor e o espectro de entrada, sendo numa forma expressa porThis filtering operation can alternatively be seen as a way of comparing spectra, with the signal spectrum being compared with a reference spectrum (the inverse of the ideal filter response). As the ideal filter in this application is chosen in order to approximate the inverse of the noise spectrum, this operation can be considered as a spectral comparison between the speech and noise spectra and the zero order autocorrelation coefficient thus generated (this ie, the filtered reverse signal energy) as a measure of the dissimilarity between the spectra. The Itakura-Saito distortion measure in the LPC is used to establish the adaptation between the predictor filter and the input spectrum, in a form expressed by

Μ = R„A„ + 2 i=l onde Αθ ... são os coeficientes de autocorrelação do conjunto dos parâmetros da LPC. Ver-se-á que isto é muito semelhante à relação atrás deduzida e, se se recordar que os coeficientes da LPC são as derivações de um filtro FIR que possui a resposta espectral inversa do sinal de entrada de modo que o conjunto dos coeficientes da LPC é a resposta ao impulso do filtro da LPC inversa, será evidente que a medida da distorção Itakura-Saito é de facto simplesmente uma forma da equação (1), sendo a resposta H do filtro o inverso da forma espectral do modelo com todos os polos do sinal de entrada.Μ = R „A„ + 2 i = l where Αθ ... are the autocorrelation coefficients of the set of LPC parameters. It will be seen that this is very similar to the relation deduced above and, if we remember that the LPC coefficients are the derivations of a FIR filter that has the inverse spectral response of the input signal so that the set of the LPC coefficients is the impulse response of the inverse LPC filter, it will be evident that the measure of the Itakura-Saito distortion is in fact simply a form of equation (1), with the H response of the filter being the inverse of the spectral shape of the model with all poles of the input signal.

De facto, é também possível transpor o espectro usando os coeficientes da LPC do espectro de ensaio e os coeficientes de autocorrelação do espectro de referência para obter uma medida diferente da semelhança espectral.In fact, it is also possible to transpose the spectrum using the LPC coefficients of the test spectrum and the autocorrelation coefficients of the reference spectrum to obtain a different measure of spectral similarity.

A medida da distorção I-S está discutida com pormenorThe measurement of I-S distortion is discussed in detail

em Speech Coding based upon Vector Quantisation por A. Buzo, A.H. Gray, R. M. Gray e J.D. Markel, IEEE Trans. on ASSP, Vol. ASSP-28, N° 5, Outubro de 1980.in Speech Coding based upon Vector Quantisation by A. Buzo, A.H. Gray, R. M. Gray and J.D. Markel, IEEE Trans. on ASSP, Vol. ASSP-28, N ° 5, October 1980.

Como as tramas do sinal têm apenas um comprimento finito e se despreza um certo número de termos (N, sendo N a ordem do filtro), o resultado anterior é apenas uma aproximação; ele dá no entanto um indicador surpreendentemente bom da presença ou ausência de fala e pode portanto ser usado como medida M na detecção da fala. Num ambiente em que o espectro do cuido é bem conhecido e -estacionário, é muito possível simplesmente usar coeficientes h^, h^, ... fixos para o modelo de filtro de ruido inverso.As the signal frames are only finite in length and a number of terms are neglected (N, where N is the order of the filter), the previous result is only an approximation; it does however provide a surprisingly good indicator of the presence or absence of speech and can therefore be used as measure M in speech detection. In an environment where the care spectrum is well known and stationary, it is very possible to simply use fixed coefficients h ^, h ^, ... for the reverse noise filter model.

Porém, um aparelho que possa adaptar-se a diferentes ambientes de ruido é muito mais útil.However, a device that can adapt to different noise environments is much more useful.

Com referência à fig. 1, nuaa primeira forma de realização, um sinal proveniente de um microfone (não representado) é recebido numa entrada (1) e convertido em amostras digitais _s com uma frequência de amostragem apropriada por meio de um conversor analógico-digital (2) (ADC). Uma unidade (3) de análise da codificação LPC (num codificador LPC de tipo conhecido) deduz então, para tramas sucessivas de n (por exemplo 160) amostras, um conjunto de N (por exemplo 8 ou 12) coeficientes do filtro LPC, que são transmitidos para representar a fala na entrada. O sinal de fala _s entra também numa unidade correlacionadora (ACF) (4) (normalmente fazendo parte do codificador LPC (3), visto que o vector de autocorrelação R^ da fala é também produzido como uma fase da análise da LPC, embora se compreenda que pode proporcionar-se um correlacionador separado). O correlacionador (4) produz o vector de autocorrelação R^, incluindo o coeficiente de correlação de ordem zero Ρθ e pelo menos mais dois coeficientes de autocorrelação R^, R2 , R^. Estes são depois fornecidos a uma unidade multiplicadora (5).With reference to fig. 1, in the first embodiment, a signal from a microphone (not shown) is received at an input (1) and converted into digital samples _s with an appropriate sampling frequency via an analog-to-digital converter (2) (ADC ). An LPC encoding analysis unit (3) (in an LPC encoder of known type) then deducts, for successive frames of n (eg 160) samples, a set of N (eg 8 or 12) LPC filter coefficients, which are transmitted to represent speech at the entrance. The speech signal _s also enters a correlating unit (ACF) (4) (normally part of the LPC encoder (3), since the speech autocorrelation vector R ^ is also produced as a phase of the LPC analysis, although understand that a separate correlator can be provided). The correlator (4) produces the autocorrelation vector R ^, including the zero order correlation coefficient Ρθ and at least two more autocorrelation coefficients R ^, R 2 , R ^. These are then supplied to a multiplier unit (5).

Uma segunda entrada (11) está ligada a um segundo microfone situado distante do locutor de modo a receber apenas ruido de fundo. A entrada deste microfone é convertida numa série de amostras de entrada digitais, pelo conversor analógico-digital ADC (12), e analisada para a LPC por um segundo anali6A second input (11) is connected to a second microphone located far from the speaker in order to receive only background noise. The input of this microphone is converted into a series of digital input samples, by the analog-to-digital converter ADC (12), and analyzed for the LPC by a second analysis.

_ sador LPC (13). Os coeficientes LPC do ruido produzidos pelo analisador LPC (13) passam para o correlacionador (14) e o vector de autocorrelação assim produzido é multiplicado termo-a-termo pelos coeficientes de autocorrelação R do sinal de entrada proveniente do microfone da fala, no multiplicador (5), e os coeficientes ponderados assim produzidos são combinados no adicionador (6) de acordo com a equação 1 de modo a aplicar um filtro com a forma inversa da do espectro do ruido proveniente do microfone que capta apenas o ruido (que na prática é a mesma forma do espectro do ruido no microfone que capta o sinal mais o ruido), filtrando assim a maior parte do ruido. A medida M resultante é sujeita a um limiar no circuito de limiar (7) para produzir uma saida lógica (8) que indica a presença ou a ausência da fala; se M tiver o nível elevado, admite-se que está presente a fala._ LPC user (13). The noise LPC coefficients produced by the LPC analyzer (13) pass to the correlator (14) and the autocorrelation vector thus produced is multiplied term-by-term by the autocorrelation coefficients R of the input signal from the speech microphone, in the multiplier. (5), and the weighted coefficients thus produced are combined in the adder (6) according to equation 1 in order to apply a filter with the inverse form of the noise spectrum coming from the microphone that captures only the noise (which in practice it is the same shape as the noise spectrum in the microphone that captures the signal plus the noise), thus filtering out most of the noise. The resulting measure M is subjected to a threshold in the threshold circuit (7) to produce a logic output (8) that indicates the presence or absence of speech; if M has a high level, it is assumed that speech is present.

No entanto, esta forma de realização exige dois microfones e dois analisadores LPC, o que aumenta o custo e n complexidade do equipamento.However, this embodiment requires two microphones and two LPC analyzers, which increases the cost and complexity of the equipment.

Em alternativa, uma outra forma de realização utiliza uma medida correspondente formada utilizando as autocorrelações do microfone (11) que capta só ruido e os coeficientes LPC provenientes do microfone principal (L), de modo que é necessário um autocorrelacionador extra, em vez de um outro analisador LPC.Alternatively, another embodiment uses a corresponding measure formed using the autocorrelations of the microphone (11) that captures only noise and the LPC coefficients coming from the main microphone (L), so that an extra autocorrelator is needed, instead of a another LPC analyzer.

Estas formas de realização podem portanto operar com ambientes diferentes tendo ruidos com frequências diferentes ou num espectro de ruido que varia num ambiente dado.These embodiments can therefore operate in different environments having noises with different frequencies or in a noise spectrum that varies in a given environment.

Fazendo agora referência à fig. 2, na forma de realização preferida da presente invenção, proporciona-se uma memória tampão (15) que armazena um conjunto de coeficientes LPC (ou o vector de autocorrelação do conjunto) deduzidos a partir da entrada (1) do microfone num período identificado como sendo um período com ausência de fala (isto é, apenas com ruido). Estes coeficientes são depois usados para deduzir uma medida utilizando a equação 1, o que evidentemente também corresponde à • medida de distorção Itakura-Saito, excepto que apenas se utili. za uma única trama registada na memória de coeficientes LPC cor7 respondentes a uma aproximação do espectro de ruido inverso, em vez da trama piresente de coeficientes LPC.Referring now to fig. 2, in the preferred embodiment of the present invention, a buffer (15) is provided which stores a set of LPC coefficients (or the set's autocorrelation vector) deduced from the microphone input (1) in a period identified as being a period with no speech (that is, only with noise). These coefficients are then used to deduce a measure using equation 1, which of course also corresponds to the Itakura-Saito distortion measure, except that it is only used. a single frame is recorded in the memory of LPC coefficients cor7 corresponding to an approximation of the inverse noise spectrum, instead of the piresent frame of LPC coefficients.

O vector L. dos coeficientes LPC saido do analisador 1 (3) é também encaminhado para um correlacionador (ACF) (14), que produz o vector de autocorrelação do vector de coeficientes LPC. A memória tampão (15) é controlada pela saída de presença/ausência da fala do circuito de limiar (7), de modo tal que durante as tramas de fala a memória tampão retém os coeficientes de autocorrelação de ruido, mas durante as tramas de ruido pode usac-se um novo conjunto de coeficientes LPC para actualizar a memória tampão, por exemplo por um interruptor múltiplo (16), através do qual as saidas do correlacionador (14), que transmitem cada um dos coeficientes de autocorrelação, são ligadas à memória tampão (15). Compreender-se-á que o correlacionador (14) pode ser colocado depois da memória tampão (15). Além disso, a descisão da presença/ausência da fala para a actualização dos coeficientes não necessita de ser derivada da saída (8), podendo ser ( e é, de preferência) derivada de outro modo.The L vector of the LPC coefficients left from analyzer 1 (3) is also routed to a correlator (ACF) (14), which produces the autocorrelation vector of the LPC coefficient vector. The buffer memory (15) is controlled by the speech presence / absence output of the threshold circuit (7), so that during speech frames the buffer memory retains the noise autocorrelation coefficients, but during noise frames a new set of LPC coefficients can be used to update the buffer, for example by a multiple switch (16), through which the outputs of the correlator (14), which transmit each of the autocorrelation coefficients, are connected to the memory buffer (15). It will be understood that the correlator (14) can be placed after the buffer (15). In addition, the decision of the presence / absence of speech to update the coefficients does not need to be derived from the output (8), but can (and is, preferably) derived in another way.

Como ocorrem períodos frequentes sem fala, os coeficientes LPC armazenados na memória tampão são actualizados de tempos a tempos, de modo que o aparelho é assim capaz de seguir alterações do espectro do ruido. Compreender-se-á que uma tal actualização da memória tampão pode ser necessária apenas ocasionalmente ou pode ocorrer apenas uma vez no início do funcionamento do detector, se (como sucede muitas vezes) o espectro no ruido for relativamente estacionário no tempo, mas no caso de um ambiente de radiotelefone móvel prefere-se a actualização frequente.As frequent speechless periods occur, the LPC coefficients stored in the buffer are updated from time to time, so that the device is thus able to follow changes in the noise spectrum. It will be understood that such an update of the buffer may be necessary only occasionally or may occur only once at the beginning of the detector's operation, if (as often happens) the noise spectrum is relatively stationary in time, but in the case of a mobile radiotelephone environment, frequent updating is preferred.

Numa modificação desta forma de realização, o sistema inicialmente utiliza a equação 1 com termos dos coeficientes correspondentes a um filtro passa-alto fixo simples e depois começa a adaptar-se, por comutação, à utilização dos coeficientes LPC dos períodos de ruido. Se, por qualquer razão, falhar a detecção da fala, o sistema pode regressar à utilização do filtro passa-alto simples.In a modification of this embodiment, the system initially uses equation 1 with terms of the coefficients corresponding to a simple fixed high-pass filter and then begins to adapt, by switching, to the use of the LPC coefficients of the noise periods. If, for any reason, speech detection fails, the system can return to using the simple high-pass filter.

É possível normalizar a medida anterior dividindo por Rq, de modo que a expressão a submeter ao circuito de limiar tem a formaIt is possible to normalize the previous measure by dividing by Rq, so that the expression to be submitted to the threshold circuit has the form

N = A0 + 2T~ i = i RqN = A 0 + 2 T ~ i = i Rq

Esta medida é independente da energia total do sinal numa trama e é assim compensada para grandes variações de nível, mas dá um contraste um tanto menos marcado entre ruido e fala, não sendo por isso de preferência usada em ambiente de nível elevado.This measure is independent of the total signal energy in a frame and is thus compensated for wide variations in level, but it gives a somewhat less marked contrast between noise and speech, and is therefore not preferably used in a high level environment.

Em vez de utilizar a análise LPC para deduzir os coeficientes do filtro inferso do sinal de ruido (a partir de períodos do microfone de ruido ou de períodos só com ruido, como nas várias formas de realização anteriores), é possível modelar o espectro inverso do ruido usando um filtro adaptativo de tipo conhecido; como o espectro do ruido se altera apenas lentamente (como adiante se discute) é aceitável uma taxa de adaptação dos coeficientes relativamente lenta comum para esses filtros. Numa forma de realização, que corresponde à fig. 1, a unidade de análise LPC (13) e simplesmente substituída por um filtro adaptativo (por exemplo um filtro FIR transversal ou um filtro em rede) ligado de modo a tornar o ruido ruido branco na entrada por modelação do filtro inverso, e sendo os seus coeficientes fornecidos como anteriormente ao autocorrelacionador (14) .Instead of using the LPC analysis to deduce the coefficients of the inverted filter of the noise signal (from periods of the noise microphone or from periods with only noise, as in the various previous embodiments), it is possible to model the inverse spectrum of the noise using an adaptive filter of known type; as the noise spectrum changes only slowly (as discussed below), a relatively slow adaptation rate of the coefficients common for these filters is acceptable. In an embodiment, which corresponds to fig. 1, the LPC analysis unit (13) is simply replaced by an adaptive filter (for example a transverse FIR filter or a mesh filter) connected in order to make the noise white at the input by modeling the reverse filter, and the its coefficients provided as before to the autocorrelator (14).

Numa segunda forma de realização, correspondente à fig. 2, o dispositivo de análise LPC (3) é substituído por um tal filtro adaptativo, omitindo-se a memória tampão (15), mas o interruptor (16) funciona para impedir que o filtro adaptativo adapte os seus coeficientes durante os períodos de fala.In a second embodiment, corresponding to fig. 2, the LPC analysis device (3) is replaced by such an adaptive filter, omitting the buffer memory (15), but the switch (16) works to prevent the adaptive filter from adapting its coefficients during speech periods .

Vai agora descrever-se um segundo detector de actividade da fala de acordo com um outro aspecto da presente invenção.A second speech activity detector will now be described in accordance with another aspect of the present invention.

Do que atrás se expôs, será evidente que o vector dos coeficientes LPC é simplesmente a resposta ao impulso de um fil- 9 -From the above, it will be evident that the vector of the LPC coefficients is simply the response to the impulse of a 9-

tro FIR que tem uma resposta que se aproxima da forma espectral inversa do sinal de entrada. Quando se forma a medida da distorção Itakura-Saito entre tramas adjacentes, ela é de facto igual à potência do sinal, como é filtrado pelo filtro LPC da trama anterior. Assim, se os espectros das tramas adjacentes diferirem pouco, uma porção correspondente pequena da potência espectral de uma trama escarpar-se-à à filtragem e a medida será baixa. Correspondentemente, uma diferença espectral inter-tramas grande produz uma medida alta da distorção Itakura-Saito, de modo que a medida reflecte a semelhança espectral das tramas adjacentes. Num codificador da fala, é desejável minimizar a taxa de transmissão de dados, de modo que a duração da trama é feita o maior possível; por outras palavras, se a duração da trama for suficientemente grande, então um sinal de fala apresenta uma variação espectral significativa de trama para trama (se não for assim, a codificação é redundante).another FIR that has a response that approximates the inverse spectral shape of the input signal. When the Itakura-Saito distortion measure is formed between adjacent frames, it is in fact equal to the signal strength, as it is filtered by the LPC filter of the previous frame. Thus, if the spectra of the adjacent frames differ little, a correspondingly small portion of the spectral power of a frame will be escorted to the filtering and the measurement will be low. Correspondingly, a large inter-frame spectral difference produces a high measure of the Itakura-Saito distortion, so that the measurement reflects the spectral similarity of the adjacent frames. In a speech encoder, it is desirable to minimize the data transmission rate, so that the duration of the frame is made as long as possible; in other words, if the frame duration is long enough, then a speech signal presents a significant spectral variation from frame to frame (if not, the coding is redundant).

Por outro lado, o ruido tem uma variação espectral lenta de trama para trama e assim, num período em que a fala está ausente do sinal, a medida da distorção Itakura-Saito será correspondentemente baixa - visto que a aplicação do filtro LPC inverso a partir da trama anterior separa por filtragem a maior parte da potência do ruido.On the other hand, the noise has a slow spectral variation from frame to frame and thus, in a period when speech is absent from the signal, the measure of the Itakura-Saito distortion will be correspondingly low - since the application of the inverse LPC filter from of the previous plot separates by filtration most of the power of the noise.

Tipicamente, a medida da distorção Itakura-Saito entre tramas adjacentes de um sinal com ruido contendo fala intermitente é mais elevada durante os períodos de fala que nos períodos de ruido; o grau de variação (tal como é ilustrado pelo desvio padrão) é mais elevado e menos variável intermitentemente .Typically, the measure of Itakura-Saito distortion between adjacent frames of a noise signal containing intermittent speech is higher during speech periods than during noise periods; the degree of variation (as illustrated by the standard deviation) is higher and less variable intermittently.

Nota-se que o desvio padrão de M é também uma medida fiável; o efeito de tomar cada desvio padrão é essencialmente tornar a medida mais uniforme.Note that the standard deviation of M is also a reliable measure; the effect of taking each standard deviation is essentially to make the measurement more uniform.

Nesta segunda forma do detector de actividade vocal, o parâmetro medido usado para decidir se a fala está presente é preferivelmente o desvio padrão da medida da distorção Itakura-Saito, podendo no entanto usar-se outras medidas de variância e outras medidas da distorção espectral (com base, por exemplo, na análise FFT (Fast Fourier Transform- Transformação deIn this second form of the vocal activity detector, the measured parameter used to decide whether speech is present is preferably the standard deviation of the Itakura-Saito distortion measure, although other measures of variance and other measures of spectral distortion can be used ( based, for example, on the FFT (Fast Fourier Transform)

Fourier rápida)). Verificou-se ser vantajoso utilizar um limiar adaptativo na detecção da actividade vocal. Tais limiares não precisam de ser ajustados durante os períodos de fala ou o sinal de fala será eliminado por um limiar. É portanto necessário controlar o adaptador de limiar usando um sinal de controlo da presença/ausência da fala, sendo preferível que este sinal de controlo seja independente da saida do adaptador de limiar.Fast Fourier)). It has been found to be advantageous to use an adaptive threshold in the detection of vocal activity. Such thresholds do not need to be adjusted during speech periods or the speech signal will be eliminated by a threshold. It is therefore necessary to control the threshold adapter using a signal to control the presence / absence of speech, it being preferable that this control signal is independent of the output of the threshold adapter.

limiar T é ajustado adaptativamente de modo a manter o nível do limiar precisamente acima do nível da medida M quando apenas estiver presente o ruido. Como a medida variará em geral aleatoriamente quando o ruido está presente, a variação do limiar faz-se determinando um nível médio estendido a um certo número de blocos e ajustando o limiar a um nível proporcional a esta média. Num ambiente ruidoso isso não é no entanto suficiente, sendo assim também levada em conta uma determinação do grau de variação do parâmetro em vérios blocos.threshold T is adjusted adaptively so as to maintain the threshold level precisely above the level of measure M when only noise is present. As the measurement will generally vary randomly when noise is present, the threshold variation is made by determining an average level extended to a certain number of blocks and adjusting the threshold to a level proportional to this average. In a noisy environment, however, this is not enough, so a determination of the degree of variation of the parameter in several blocks is also taken into account.

O valor de limiar T é portanto preferivelmente calculado de acordo comThe threshold value T is therefore preferably calculated according to

T = M' + K.d sendo Μ' o valor médio da medida sobre um certo número de tramas consecutivas, d o desvio padrão da medida nessas tramas e K uma constante (que pode ter tipicamente o valor 2).T = M '+ K.d where Μ' is the average value of the measure over a number of consecutive frames, gives the standard deviation of the measure in these frames and K is a constant (which can typically be 2).

Na prática é preferido não retomar a adaptação imedia tamente depois de ter sido indicada a ausência da fala, mas sim esperar para garantir que a queda é estável (para impedir a comutação rápida repetida entre os estados de adaptação e de não adaptação).In practice, it is preferred not to resume adaptation immediately after the absence of speech has been indicated, but rather to wait to ensure that the fall is stable (to prevent repeated rapid switching between the adaptation and non-adaptation states).

Fazendo agora referência à fig. 3, numa forma preferida de realização da presente invenção, que incorpora os aspec tos anteriores, uma entrada (1) recebe um sinal que é explorado e digitalizado pelo conversor analógico-digital (ADC) (2), e fornecido à entrada de um analisador de filtro inverso (3), que na prática faz parte de um codificador da fala com o qual o detector da actividade vocal tem de trabalhar e que gera coeficientes (tipicamente 8) de um filtro correspondente ao inverso do espectro do sinal de entrada. O sinal digitalizado é também fornecido a um autocorrelacionador (4) ACF (que faz parte do analisador (3)) que gera o vector R^ de autocorrelação do sinal de entrada (ou pelo menos tantos termos de ordem inferior quantos os coeficientes LPC). 0 funcionamento destas partes do aparelho é como se descreveu para as fig. 1 e 2. De preferência, os coeficientes de autocorrelação são então transformados nu ma média estendida a várias tramas de fala sucessivas (tipicamente com uma duração de 5 a 20 ms) para melhorar a sua fiabili_ dade. Isso pode conseguir-se armazenando cada conjunto de coef_i cientes de autocorrelação pelo autocorrelacionador (4) numa memória tampão (4a) e utilizando um calculador de médias (4b) (AV) para produzir uma soma ponderada dos coeficientes de autocorrelação correntes R. e os das tramas anteriores armazenadas na me í — mória tampão (4a) e por ela fornecidas. A média Ra^ dos coefic_i entes de autocorrelação assim obtida é fornecida a um meio de ponderação e adição (5,6) que recebe também o vector de autocor relação A dos coeficientes do filtro inverso no período com ruído memorizados, a partir do autocorrelacionador (14) através da memória tampão (15), formando a partir de Ra^ e de A^ uma me dida M de preferência definida porReferring now to fig. 3, in a preferred embodiment of the present invention, which incorporates the above aspects, an input (1) receives a signal that is scanned and digitized by the analog-to-digital converter (ADC) (2), and supplied to the input of an analyzer reverse filter (3), which in practice is part of a speech encoder that the vocal activity detector has to work with and that generates coefficients (typically 8) of a filter corresponding to the inverse spectrum of the input signal. The digitized signal is also supplied to an autocorrelator (4) ACF (which is part of the analyzer (3)) that generates the vector R ^ of autocorrelation of the input signal (or at least as many lower order terms as the LPC coefficients). The operation of these parts of the apparatus is as described for figs. 1 and 2. Preferably, the autocorrelation coefficients are then transformed into an average spanning several successive speech frames (typically 5 to 20 ms in duration) to improve their reliability. This can be achieved by storing each set of autocorrelation coefficients by the autocorrelator (4) in a buffer (4a) and using an averaging calculator (4b) (AV) to produce a weighted sum of the current autocorrelation coefficients R. and the of the previous frames stored in the buffer memory (4a) and supplied by it. The mean Ra ^ of the autocorrelation coefficients thus obtained is provided to a weighting and addition medium (5,6) which also receives the autocolor vector A of the inverse filter coefficients in the memorized noise period, from the autocorrelator ( 14) through the buffer memory (15), forming from Ra ^ and A ^ a measure M preferably defined by

NN

M = An + 2> Ra.A.M = A n + 2> Ra.A.

/ li/ li

Esta medida é depois sujeita a um circuito de limiar (7) de comparação com um certo nível de limiar, proporcionando o resultado lógico uma indicação da presença ou ausência da fala na saída (8) .This measurement is then subjected to a threshold circuit (7) for comparison with a certain threshold level, the logical result providing an indication of the presence or absence of speech at the output (8).

Para que os coeficientes do filtro inverso correspondam a uma estimativa boa do inverso do espectro do ruído, é desejável actualizar estes coeficientes durante períodos de ruí. do (e, evidentemente, não os actualizar durante os períodos de fala),. É no entanto preferível que a decisão presença/ausência de fala em que se baseia a actualização não dependa do resultado da actualização ou então uma trama do sinal única erradamente iiidentifiçada pode ter como consequência que o detector de actividade vocal se desprenda e identifique erradamente asIn order for the coefficients of the inverse filter to correspond to a good estimate of the inverse of the noise spectrum, it is desirable to update these coefficients during periods of noise. do (and, of course, do not update them during speech periods) ,. However, it is preferable that the decision presence / absence of speech on which the update is based does not depend on the result of the update, or else a single signal frame that is wrongly identified may result in the vocal activity detector being detached and mistakenly identifying the

tramas seguintes. Portanto, de preferência proporciona-se um circuito gerador de sinais de controlo (20), efectivamente um detector de actividade vocal separado, que forma um sinal de controlo independente que indica a presença ou a ausência da fala para controlar o analisador de filtro inverso (3) (ou a memória tampão (8)), de modo que os coeficientes de correlação do filtro inverso usados para formar a medida M apenas são actualizados durante os períodos de ruido. O circuito gerador do sinal de controlo (20) inclui o analisador LPC (21) (que mais uma vez faz parte de um codificador da fala e, especificamente, pode ser o analisador (3) ) que produz um conjunto de coeficientes NL da LPC correspondentes ao sinal de entrada e um autocorrelacionador ACF (21a) (que pode ser o autocorrelacionador (3a)) que deduz os coeficientes de autocorrelação de PL .following plots. Therefore, preferably a control signal generator circuit (20) is provided, effectively a separate vocal activity detector, which forms an independent control signal that indicates the presence or absence of speech to control the reverse filter analyzer ( 3) (or the buffer (8)), so that the correlation coefficients of the inverse filter used to form the measure M are only updated during the noise periods. The control signal generator circuit (20) includes the LPC analyzer (21) (which again is part of a speech encoder and, specifically, it can be the analyzer (3)) which produces a set of LL coefficients of the LPC corresponding to the input signal and an autocorrelator ACF (21a) (which can be the autocorrelator (3a)) that deducts the autocorrelation coefficients of PL.

Se o analisador (21) for o analisador (3), então M.=L. e B.=A..If the analyzer (21) is the analyzer (3), then M. = L. and B. = A ..

11111111

Estes coeficientes de autocorrelação são depois fornecidos a um dispositivo de ponderação e adição (22,23) (equivalentes ao (5,6)) que recebe também o vector de autocorrelação FL do sinal de entrada proveniente do autocorrelacionador (4). Calcula-se assim uma medida da semelhança espectral entre a trama de fala de entrada e a trama de fala anterior; essa medida pode ser a medida da distorção Itakura-Saito entre R^ da trama presente e da trama anterior, como atrás se explicou, ou em vez disso, pode ser derivada pelo cálculo da medida de distorção Itakura-Saito para e da trama presente, e subtraindo (no subtractor (25)) a medida corresponde para a trama anterior armazenada na memória tampão (24) para gerar um sinal de diferença espectral (em qualquer dos casos, a medida é de preferência normalizada relativamente à energia, dividindo por R^). Como é evidente, a memória tampão (24) é depois actualizada. Este sinal de diferença espectral, quando sujeito ao circuito de limiar (26), como atrás de descreveu, é um indicador da presença ou ausência da fala. Verificou-se no entanto que embora esta medida seja excelente para distinguir o ruido da fala não vocal (um problema que os sistemas da técnica anterior são em geral incapazes de resolver) é em geral menos apto para distinguir o ruido da fala vocal. Por conseguinte é preferivelmente proporcionado além disso, no circuito (20), um circuito de detecçãoThese autocorrelation coefficients are then supplied to a weighting and addition device (22,23) (equivalent to (5,6)) which also receives the autocorrelation vector FL from the input signal from the autocorrelator (4). Thus, a measure of the spectral similarity between the incoming speech frame and the previous speech frame is calculated; this measure can be the measure of the Itakura-Saito distortion between R ^ of the present frame and the previous frame, as explained above, or instead, it can be derived by calculating the Itakura-Saito distortion measure for and from the present frame, and subtracting (in the subtractor (25)) the measurement corresponds to the previous frame stored in the buffer (24) to generate a signal of spectral difference (in any case, the measurement is preferably normalized with respect to energy, dividing by R ^ ). Of course, the buffer (24) is then updated. This signal of spectral difference, when subjected to the threshold circuit (26), as described above, is an indicator of the presence or absence of speech. However, it has been found that although this measure is excellent for distinguishing noise from non-vocal speech (a problem that systems in the prior art are generally unable to resolve) it is in general less able to distinguish noise from vocal speech. Therefore, in addition, in the circuit (20) it is preferably provided with a detection circuit

da fala vocal que compreende um analisador das alturas do som (27) (que na prática pode fazer parte de um codificador da fala e em particular pode medir o valor do atraso do preditor a longo prazo produzido num codificador LPC multi-impulsos). 0 analisador (27) produz um sinal lógico que é verdadeiro quando se detecta a fala vocal, sendo este sinal, juntamente com a medida sujeita ao circuito de limiar derivada do circuito de limiar (26) (que será em geral verdadeiro quando estiver presente a fala não vocal), levado às entradas de uma porta NOR (28) para gerar um sinal que é falso quando estiver presente a fala e verdadeiro quando estiver presente o ruido. Este sinal é fornecido à memória tampão (8) (ou ao analisador de filtro inverso (3)) de modo que os coeficientes do filtro inverso L^ são actualizados apenas durante os períodos de ruido.of vocal speech comprising a pitch pitch analyzer (27) (which in practice can be part of a speech encoder and in particular can measure the value of the long-term predictor delay produced in a multi-pulse LPC encoder). The analyzer (27) produces a logical signal that is true when vocal speech is detected, this signal, together with the measurement subject to the threshold circuit derived from the threshold circuit (26) (which will generally be true when the non-vocal speech), taken to the inputs of a NOR gate (28) to generate a signal that is false when speech is present and true when noise is present. This signal is supplied to the buffer memory (8) (or to the inverse filter analyzer (3)) so that the inverse filter coefficients L ^ are updated only during the noise periods.

O adaptador de limiar (29) está também ligado para receber a saida de controlo do sinal de ausência de fala do circuito (20). A saida do adaptador de limiar (29) é fornecida ao circuito de limiar (7),. O adaptador de limiar opera para incrementar ou decrementar ou decrementar o limiar, por degraus que são proporcionais ao valor instantâneo do limiar, até que o limiar se aproxime do nível da potência de ruido (que pode ser convenientemente derivado, por exmeplo, dos circuitos de ponderação e adição (22,23)). Quando o sinal de entrada for muito baixo, pode ser desejável que o limiar seja ajustado automaticamente a um nível fixo, baixo, visto que aos níveis do sinal baixos o efeito da quantificação do sinal produzido pelo conversor analógico-digital (2) pode produzir resultados pouco fiáveis.The threshold adapter (29) is also connected to receive the control output of the speechless signal of the circuit (20). The output of the threshold adapter (29) is supplied to the threshold circuit (7) ,. The threshold adapter operates to increase or decrease or decrease the threshold, by steps that are proportional to the instantaneous value of the threshold, until the threshold approaches the level of the noise power (which can be conveniently derived, for example, from the weighting and addition (22,23)). When the input signal is very low, it may be desirable for the threshold to be automatically adjusted to a fixed, low level, since at low signal levels the effect of quantifying the signal produced by the analog-to-digital converter (2) can produce results unreliable.

Pode ainda proporcionar-se um dispositivo de retenção (30), que funciona para medir a duração das indicações de fala depois do circuito de limiar (7) e, quando a presença de fala tiver sido indicada durante um período de tempo constante pré-determinado, a saida é retida durante um curto tempo de retenção. Deste modo impede-se a supressão das sequências de dados de fala de baixo nível, a meio, evitando uma selecção apropriada da constante de tempo o disparo do gerador de retenção (30) por picos de curta duração que seja falsamente indica14 dos como fala. Evidentemente que se compreende que todas as fun ções anteriores podem ser executadas por um dispositivo de processamento digital único programado de maneira adequada, por exemplo um processador de sinais digitais formado numa plaqueta DSP (Digital Signal Processing), fazendo parte de um codificador-descodificador LPC assim realizado (sendo essa a forma de realização preferida), ou como um microcomputador ou uma microcontrolador numa plaqueta com o dispositivo de memória associado .A retention device (30) can also be provided, which works to measure the duration of the speech indications after the threshold circuit (7) and, when the presence of speech has been indicated for a predetermined period of time , the output is retained for a short retention time. This prevents the suppression of low-level speech data streams in the middle, preventing an appropriate selection of the time constant from triggering the retention generator (30) by short-term peaks that are falsely indicated as speech. Of course, it is understood that all of the above functions can be performed by a single digital processing device programmed in an appropriate manner, for example a digital signal processor formed on a DSP (Digital Signal Processing) plate, forming part of an LPC encoder-decoder. thus carried out (this being the preferred embodiment), or as a microcomputer or a microcontroller on a nameplate with the associated memory device.

Convenientemente, como atrás se descreveu, o aparelho de detecção vocal pode ser realizado na prática como parte de um codec LPC. Em alternativa, quando os coeficien tes de autocorrelação do sinal ou as medidas relacionadas (correlação parcial ou coeficientes parcor) forem transmitidos a uma estação distante, a detecção vocal pode fazer-se a distância a partir do codec.Conveniently, as described above, the voice detection apparatus can be carried out in practice as part of an LPC codec. Alternatively, when signal autocorrelation coefficients or related measures (partial correlation or plot coefficients) are transmitted to a distant station, voice detection can be done at a distance from the codec.

Claims (1)

REIVINDICAÇÕES - la Aparelho detector da actividade vocal, caracteri zado por compreender meios para receber um sinal de entrada, meios para fazer adaptativamente a estimativa da componente do sinal de ruído no sinal de entrada, meios para formar periódica mente uma medida M da similaridade espectral entre uma porção do sinal de entrada e a componente do sinal de ruído, e meios para comparar um parâmetro derivado da medida M com um valor de limiar T, e meios para produzir uma saída para indicar a presen ça ou a ausência de fala em função de esse valor ser ou não excedido .- Apparatus for detecting vocal activity, characterized by comprising means for receiving an input signal, means for adaptively estimating the noise signal component in the input signal, means for periodically forming a measure M of the spectral similarity between a portion of the input signal and the noise signal component, and means for comparing a parameter derived from measure M with a threshold value T, and means for producing an output to indicate the presence or absence of speech as a result of that value is exceeded or not. - 2â Aparelho de acordo com a reivindicação 1, caracterizado por os meios adaptativos para fazer a estimativa do ruído compreenderem meios para calcular os coeficientes da correlação da resposta ao impulso unitário de um filtro FIR que tem uma resposta que se aproxima do inverso do espectro de curto prazo da componente do sinal de ruido, e por os meios para formar a medida compreenderem meios para calcular os coeficientes de autocorrelação R^ do sinal, meios ligados para receber F ε A., e para calcular M a partir dos mesmos, sendo o parâmetro o valor de M.- Apparatus according to claim 1, characterized in that the adaptive means for estimating noise comprise means for calculating the correlation coefficients of the response to the unit impulse of a FIR filter that has a response that approximates the inverse of the spectrum. short-term component of the noise signal, and the means for forming the measurement comprise means for calculating the autocorrelation coefficients R ^ of the signal, connected means for receiving F ε A., and for calculating M from them, the parameter the value of M. - 3â Aparelho de acordo com a reivindicação 2, caracterizado por ser- Apparatus according to claim 2, characterized in that it is M = R„A0 + RiAi M = R „A 0 + R i A i - 4ã Aparelho de acordo com a reivindicação 2, caracterizado por serApparatus according to claim 2, characterized by being M = A + 25 R . A .M = A + 25 R. THE . 0 Z , 1 1 R0 0 Z, 1 1 R 0 - 5a Aparelho de acordo com qualquer das reivindicações 2 a 4, caracterizado por compreender além disso uma entrada disposta para recebe: um segundo sinal, analogamente sujeito a ruido, do qual está ausente o sinal vocal, compreendendo os meios de cálculo dos A. meios de análise LPC para derivar valores de A^ a partir do segundo sinal.Apparatus according to any of claims 2 to 4, characterized in that it further comprises an input arranged to receive: a second signal, similarly subject to noise, from which the vocal signal is absent, comprising the means of calculating the means. LPC analysis to derive A ^ values from the second signal. - 6ã Aparelho de acordo com qualquer das reivindicações 2 a 4, caracterizado por compreender ainda uma memória tampão ligada para armazenar dados a partir dos quais podem ser derivados os coeficientes de autocorrelação A^ da referida resposta do filtro, sendo a referida resposta do filtro calculada perio16 dicamente a partir do sinal pelos meios de análise LPC, sendo o aparelho ligado e controlado de modo tal que a medida M é calculada usando os referidos dados armazenados e sendo os referidos dados armazenados actualizados apenas a partir de períodos em que se verifica estar ausente a fala.Apparatus according to any of claims 2 to 4, characterized in that it further comprises a connected buffer for storing data from which the autocorrelation coefficients A ^ of said filter response can be derived, said filter response being calculated periodically16 from the signal by the means of analysis LPC, the apparatus being connected and controlled in such a way that measure M is calculated using said stored data and said stored data being updated only from periods when it is found to be absent speech. - 7ã Aparelho de acordo com qualquer das reivindicações 1 a 4, caracterizado por os meios para fazer a estimativa do ruido incluírem um filtro adaptativo.Apparatus according to any of claims 1 to 4, characterized in that the means for estimating noise include an adaptive filter. - 8â Aparelho de acordo com qualquer das reivindicações 2 a 6, caracterizado por os meios para o cálculo dos coeficientes de autocorrelação do sinal estarem dispostos para fazer esse cálculo em função dos coeficientes de autocorrelação de várias porções sucessivas do sinal.Apparatus according to any of claims 2 to 6, characterized in that the means for calculating the autocorrelation coefficients of the signal are arranged to make this calculation according to the autocorrelation coefficients of several successive portions of the signal. - 9a Aparelho de acordo com a reivindicação 1, caracterizado por a medida M ser uma medida de distorção espectral.Apparatus according to claim 1, characterized in that the measure M is a measure of spectral distortion. - lOã Aparelho de acordo com a reivindicação 9, caracterizado por a medida M ser a medida de distorção Itakura-Saito.- Apparatus according to claim 9, characterized in that measure M is the measure of distortion Itakura-Saito. - llâ Aparelho de acordo com qualquer das reivindicações anteriores, caracterizado por compreender além disso meios para ajustar o referido limiar pré-determinado T durante períodos em que se verifica estar ausente a fala.Apparatus according to any of the preceding claims, characterized in that it further comprises means for adjusting said predetermined threshold T during periods when speech is found to be absent. cr'cr ' 123123 Aparelho de acordo com a reivindicação 11, caracterizado além disso por compreender segundos meios de detecção da actividade vocal dispostos para impedir o ajustamen to do valor do limiar quando estiver presente a fala.Apparatus according to claim 11, further characterized in that it comprises second means of detecting vocal activity arranged to prevent the adjustment of the threshold value when speech is present. - 133 Aparelho de acordo com as reivindicações 11 ou 12, caracterizado por o valor do limiar T, quando ajustado, ser ajustado para ser igual ã média da medida mais um termo que é função do desvio padrão da medida.Apparatus according to claim 11 or 12, characterized in that the threshold value T, when adjusted, is adjusted to be equal to the measurement mean plus a term that is a function of the measurement standard deviation. - 143 Aparelho de acordo com a reivindicação 6, caracterizado por compreender além disso meios para indicar a ausência de fala para controlar a actualização dos referidos dados armazenados, sendo os meios para indicar a ausência de fa la constituídos por um segundo dispositivo de detecção da actividade vocal.Apparatus according to claim 6, characterized in that it further comprises means for indicating the absence of speech to control the updating of said stored data, the means for indicating the absence of speech consisting of a second device for detecting activity vocal. - 153 Aparelho de acordo com as reivindicações 13 e 14, caracterizado por o segundo dispositivo de detecção da actividade vocal controlar quer a adaptação do limiar quer a actualização dos dados.Apparatus according to claims 13 and 14, characterized in that the second vocal activity detection device controls both the adaptation of the threshold and the updating of the data. - 163 Aparelho de acordo com as reivindicações 13 a 15 ou 17, caracterizado por o referido segundo dispositivo de detecção da actividade vocal compreender meios para gerar uma medida da semelhança espectral entre uma parte do sinal de entrada e porções anteriores do sinal de entrada.Apparatus according to claims 13 to 15 or 17, characterized in that said second vocal activity detection device comprises means for generating a measure of the spectral similarity between a part of the input signal and previous portions of the input signal. 17â17th Aparelho de acordo com a reivindicação 16, caracterizado por os meios para gerar a medida da semelhança compreenderem meios para proporcionar uma medida presente da distorção a partir dos dados do filtro da codificação linear preditiva (LPC) e dos dados da autocorrelação referentes a uma parte presente do sinal de entrada, meios para proporcionar uma medida da distorção equivalente de uma trama passada correspondente a uma porção anterior do sinal de entrada e meios para ge rar um sinal que indica o grau de semelhança entre os mesmos como indicador da presença ou ausência de sinais vocais.Apparatus according to claim 16, characterized in that the means for generating the measure of similarity comprises means for providing a present measure of distortion from the data of the predictive linear encoding (LPC) filter and the autocorrelation data referring to a present part of the input signal, means for providing a measure of the equivalent distortion of a passed frame corresponding to a previous portion of the input signal and means for generating a signal indicating the degree of similarity between them as an indicator of the presence or absence of signals vocals. - 18§ Aparelho de acordo com as reivindicações 16 ou 17, caracterizado por os referidos meios de detecção da actividade vocal compreenderem meios de detecção de sinais vocais que compreendem meios de análise da altura dos sons para gerar um sinal indicativo da presença de sinais vocais de que também depende a saída dos referidos meios de detecção da actividade vocal.Apparatus according to claim 16 or 17, characterized in that said means of detecting vocal activity comprise means of detecting vocal signals which comprise means of analyzing the pitch of the sounds to generate a signal indicative of the presence of vocal signals of which also depends on the output of said means of detecting vocal activity. - 19§ Processo para a detecção da actividade vocal num sinal, caracterizado por compreender as fases de comparar o espectro do sinal com um espectro de ruído estimado, for mar uma medida variável da similaridade espectral entre os mesmos e comparar essa medida com um limiar.- 19§ Process for the detection of vocal activity in a signal, characterized by comprising the phases of comparing the signal spectrum with an estimated noise spectrum, forming a variable measure of the spectral similarity between them and comparing that measure with a threshold. - 20â Aparelho para codificação de sinais da fala, caracterizado por incluir aparelhos de acordo com qualquer das reivindicações anteriores.- Device for encoding speech signals, characterized in that it includes devices according to any of the preceding claims. 21â21st Aparelho telefónico móvel, caracteriza do por incluir aparelhos de acordo com qualquer das reivindica ções anteriores.Mobile telephone apparatus, characterized in that it includes apparatus according to any of the preceding claims. 0 requerente declara que os primeiros pedidos desta patente foram apresentados no Reino Unido em 11 de Março de 1988, 6 de Junho de 1988 e em 24 de Agosto de 1988 sob os NQs. 8805795, 8813346.7 e 8820105.8, respectivamente.The applicant declares that the first applications for this patent were filed in the United Kingdom on 11 March 1988, 6 June 1988 and 24 August 1988 under the NQs. 8805795, 8813346.7 and 8820105.8, respectively. Lisboa, 10 de Março de 1989.Lisbon, March 10, 1989.
PT89978A 1988-03-11 1989-03-10 DEVECTOR OF THE VOCAL ACTIVITY AND MOBILE TELEPHONE SYSTEM THAT CONTAINS IT PT89978B (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB888805795A GB8805795D0 (en) 1988-03-11 1988-03-11 Voice activity detector
GB888813346A GB8813346D0 (en) 1988-06-06 1988-06-06 Voice activity detection
GB888820105A GB8820105D0 (en) 1988-08-24 1988-08-24 Voice activity detection

Publications (2)

Publication Number Publication Date
PT89978A PT89978A (en) 1989-11-10
PT89978B true PT89978B (en) 1995-03-01

Family

ID=27263821

Family Applications (1)

Application Number Title Priority Date Filing Date
PT89978A PT89978B (en) 1988-03-11 1989-03-10 DEVECTOR OF THE VOCAL ACTIVITY AND MOBILE TELEPHONE SYSTEM THAT CONTAINS IT

Country Status (16)

Country Link
EP (2) EP0335521B1 (en)
JP (2) JP3321156B2 (en)
KR (1) KR0161258B1 (en)
AU (1) AU608432B2 (en)
BR (1) BR8907308A (en)
CA (1) CA1335003C (en)
DE (2) DE68910859T2 (en)
DK (1) DK175478B1 (en)
ES (2) ES2188588T3 (en)
FI (2) FI110726B (en)
HK (1) HK135896A (en)
IE (1) IE61863B1 (en)
NO (2) NO304858B1 (en)
NZ (1) NZ228290A (en)
PT (1) PT89978B (en)
WO (1) WO1989008910A1 (en)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435458B1 (en) * 1989-11-28 1995-02-01 Nec Corporation Speech/voiceband data discriminator
CA2040025A1 (en) * 1990-04-09 1991-10-10 Hideki Satoh Speech detection apparatus with influence of input level and noise reduced
US5241692A (en) * 1991-02-19 1993-08-31 Motorola, Inc. Interference reduction system for a speech recognition device
FR2697101B1 (en) * 1992-10-21 1994-11-25 Sextant Avionique Speech detection method.
SE470577B (en) * 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Method and apparatus for encoding and / or decoding background noise
JPH06332492A (en) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd Method and device for voice detection
SE501305C2 (en) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Method and apparatus for discriminating between stationary and non-stationary signals
EP0633658A3 (en) * 1993-07-06 1996-01-17 Hughes Aircraft Co Voice activated transmission coupled AGC circuit.
IN184794B (en) * 1993-09-14 2000-09-30 British Telecomm
SE501981C2 (en) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Method and apparatus for discriminating between stationary and non-stationary signals
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FR2727236B1 (en) * 1994-11-22 1996-12-27 Alcatel Mobile Comm France DETECTION OF VOICE ACTIVITY
GB2317084B (en) * 1995-04-28 2000-01-19 Northern Telecom Ltd Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
GB2306010A (en) * 1995-10-04 1997-04-23 Univ Wales Medicine A method of classifying signals
FR2739995B1 (en) * 1995-10-13 1997-12-12 Massaloux Dominique METHOD AND DEVICE FOR CREATING COMFORT NOISE IN A DIGITAL SPEECH TRANSMISSION SYSTEM
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
CN1225736A (en) * 1996-07-03 1999-08-11 英国电讯有限公司 Voice activity detector
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
DE10052626A1 (en) * 2000-10-24 2002-05-02 Alcatel Sa Adaptive noise level estimator
CN1617606A (en) * 2003-11-12 2005-05-18 皇家飞利浦电子股份有限公司 Method and device for transmitting non voice data in voice channel
US7155388B2 (en) * 2004-06-30 2006-12-26 Motorola, Inc. Method and apparatus for characterizing inhalation noise and calculating parameters based on the characterization
US7139701B2 (en) * 2004-06-30 2006-11-21 Motorola, Inc. Method for detecting and attenuating inhalation noise in a communication system
FI20045315A (en) * 2004-08-30 2006-03-01 Nokia Corp Detection of voice activity in an audio signal
US8708702B2 (en) * 2004-09-16 2014-04-29 Lena Foundation Systems and methods for learning using contextual feedback
US8775168B2 (en) * 2006-08-10 2014-07-08 Stmicroelectronics Asia Pacific Pte, Ltd. Yule walker based low-complexity voice activity detector in noise suppression systems
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8175871B2 (en) 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8275136B2 (en) 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
WO2009130388A1 (en) 2008-04-25 2009-10-29 Nokia Corporation Calibrating multiple microphones
ES2371619B1 (en) * 2009-10-08 2012-08-08 Telefónica, S.A. VOICE SEGMENT DETECTION PROCEDURE.
WO2011049516A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Detector and method for voice activity detection
CN108985277B (en) * 2018-08-24 2020-11-10 广东石油化工学院 Method and system for filtering background noise in power signal

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3509281A (en) * 1966-09-29 1970-04-28 Ibm Voicing detection system
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS5636246A (en) * 1979-08-31 1981-04-09 Nec Corp Stereo signal demodulating circuit
JPS59115625A (en) * 1982-12-22 1984-07-04 Nec Corp Voice detector
EP0127718B1 (en) * 1983-06-07 1987-03-18 International Business Machines Corporation Process for activity detection in a voice transmission system
JPS6196817A (en) * 1984-10-17 1986-05-15 Sharp Corp Filter

Also Published As

Publication number Publication date
FI115328B (en) 2005-04-15
NO903936L (en) 1990-11-09
FI110726B (en) 2003-03-14
BR8907308A (en) 1991-03-19
EP0335521A1 (en) 1989-10-04
NO304858B1 (en) 1999-02-22
DE68910859T2 (en) 1994-12-08
DK215690D0 (en) 1990-09-07
NZ228290A (en) 1992-01-29
KR900700993A (en) 1990-08-17
EP0548054B1 (en) 2002-12-11
KR0161258B1 (en) 1999-03-20
ES2047664T3 (en) 1994-03-01
DE68929442T2 (en) 2003-10-02
WO1989008910A1 (en) 1989-09-21
NO316610B1 (en) 2004-03-08
DK215690A (en) 1990-09-07
NO982568L (en) 1990-11-09
HK135896A (en) 1996-08-02
NO903936D0 (en) 1990-09-10
DK175478B1 (en) 2004-11-08
EP0548054A3 (en) 1994-01-12
PT89978A (en) 1989-11-10
DE68929442D1 (en) 2003-01-23
JPH03504283A (en) 1991-09-19
FI904410A0 (en) 1990-09-07
CA1335003C (en) 1995-03-28
JP2000148172A (en) 2000-05-26
IE61863B1 (en) 1994-11-30
FI20010933A (en) 2001-05-04
JP3321156B2 (en) 2002-09-03
DE68910859D1 (en) 1994-01-05
EP0335521B1 (en) 1993-11-24
EP0548054A2 (en) 1993-06-23
NO982568D0 (en) 1998-06-04
JP3423906B2 (en) 2003-07-07
ES2188588T3 (en) 2003-07-01
AU608432B2 (en) 1991-03-28
AU3355489A (en) 1989-10-05
IE890774L (en) 1989-09-11

Similar Documents

Publication Publication Date Title
PT89978B (en) DEVECTOR OF THE VOCAL ACTIVITY AND MOBILE TELEPHONE SYSTEM THAT CONTAINS IT
US5276765A (en) Voice activity detection
KR100742443B1 (en) A speech communication system and method for handling lost frames
US4630304A (en) Automatic background noise estimator for a noise suppression system
KR100278423B1 (en) Identification of normal and abnormal signals
US6453289B1 (en) Method of noise reduction for speech codecs
JP3224132B2 (en) Voice activity detector
FI123708B (en) Method and apparatus for selecting coding speed in a variable speed vocoder
KR950000842B1 (en) Pitch detector
KR20170060108A (en) Neural network voice activity detection employing running range normalization
KR20010075343A (en) Noise suppression for low bitrate speech coder
RU2010101881A (en) METHOD AND DEVICE FOR DETECTING AUDIO ACTIVITY AND CLASSIFICATION OF AUDIO SIGNALS
JP2000503837A (en) Method and apparatus for calculating an echo measure
US5579432A (en) Discriminating between stationary and non-stationary signals
JP2738533B2 (en) Speech synthesis using multi-level filter excitation
US5632004A (en) Method and apparatus for encoding/decoding of background sounds
JP3418005B2 (en) Voice pitch detection device
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
JP2656069B2 (en) Voice detection device
JP2892462B2 (en) Code-excited linear predictive encoder
JPH087596B2 (en) Noise suppression type voice detector
Cole et al. A real-time floating point variable frame rate LPC vocoder

Legal Events

Date Code Title Description
FG3A Patent granted, date of granting

Effective date: 19940801

PC3A Transfer or assignment

Free format text: LG ELECTRONICS INC. KR

Effective date: 20040804

MM4A Annulment/lapse due to non-payment of fees, searched and examined patent

Free format text: MAXIMUM VALIDITY LIMIT REACHED

Effective date: 20090801