PT88589B - Processo para a compensacao dos ruidos perturbadores para sistemas de reconhecimento da fala instalados em automoveis - Google Patents

Processo para a compensacao dos ruidos perturbadores para sistemas de reconhecimento da fala instalados em automoveis Download PDF

Info

Publication number
PT88589B
PT88589B PT8858988A PT8858988A PT88589B PT 88589 B PT88589 B PT 88589B PT 8858988 A PT8858988 A PT 8858988A PT 8858988 A PT8858988 A PT 8858988A PT 88589 B PT88589 B PT 88589B
Authority
PT
Portugal
Prior art keywords
analysis
speech
analysis parameters
correction values
parameters
Prior art date
Application number
PT8858988A
Other languages
English (en)
Other versions
PT88589A (pt
Inventor
Hartmut Elbert
Original Assignee
Siemens Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Ag filed Critical Siemens Ag
Publication of PT88589A publication Critical patent/PT88589A/pt
Publication of PT88589B publication Critical patent/PT88589B/pt

Links

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Selective Calling Equipment (AREA)

Description

DESCRIÇÃO
D.D.
A presente invenção refere-se a um processo para a compensação de ruidos perturbadores, para os sistemas de reconhecimento da fala instalados em automóveis, no qual, depois de fazer uma análise de sinais da fala em ligação com uma redução de dados, ficam disponíveis para um processamento ulterior parâmetros de análise correspondentes aos sinais acústicos iniciais.
Por exemplo, os sistemas de reconhecimento da fala dependentes do locutor trabalham em princípio de um modo tal que se efectua uma primeira entrada da fala, dentro de uma fase de aprendizagem, na qual são analisadas as características das palavras a reconhecer, as quais são carregadas numa memória de referência. Nas chamadas fases ulteriores de reconhecimento, comparam-se as características relevantes das palavras introduzidas, os chamados parâmetros de análise, com os padrões de re ferência registados na memória e determina-se em cada caso o grau, de semelhança. No interior de um ambiente no qual os ruidos perturbadores são reduzidos, os sistemas de reconhecimento da fala actuais trabalham satisfatoriamente. Mas a taxa de reconhecimento dos sistemas de reconhecimento da fala actuais cai drasticamente quando os ruidos ambientes durante a fase de aprendizagem e a fase de reconhecimento diferem snbstancialmente. Ê o que sucede, por exemplo, num automóvel, no qual são pos síveis diversos tipos de funcionamento, desde o funcionamento fixo até ao funcionamento em autoestrada, com as mais diferentes cargas de ruido.
objecto da presente invenção consiste em proporcionar um processo do tipo indicado na introdução que tome po^ sível o emprego de sistemas de reconhecimento da fala, por exem pio em automóveis.
Segundo a presente invenção, o problema resolve-se sujeitando, em cada activação do sistema de reconhecimento da fala, antes da entrada da própria fala, os sinais de ruido actuais a uma análise de fala e memorizando os parâmetros de análise que representam os sinais de ruido como valores de correcção, subtraindo durante a entrada da fala estes valores de correcção respectivamente dos parâmetros de análise que representam o espectro resultante do sinal de ruido e do sinal da fala, e tomando como base para o reconhecimento propriamente dito das palavras os parâmetros de análise assim corrigidos.
Por meio do processo segundo a presente invenção consegue-se que, num ambiente com ruido que se mantenha aproximadamente constante enquanto durar a entrada de uma palavra, s_e jam utilizados para o reconhecimento propriamente dito das pala vras os parâmetros de análise libertos de sinais perturbadores. Visto que, como valores de correcção se utilizam em cada caso os parâmetros de análise dos sinais perturbadores actuais, dispõe—se para o reconhecimento propriamente dito das palavras dos sinais da fala puros, de modo que o ruido perturbador não tem qualquer acção na avaliação. 0 emprego de um sistema de reconhe
cimento da fala no qual é utilizado o processo segundo a presen te invenção, pode fazer—se por exemplo para o comando de um auto telefone, donde resulta para o condutor um alívio considerável da carga para a operação do aparelho, associado a um aumento da segurança da condução.
ί
No processo segundo a presente invenção é vantajoso prever, para a análise da fala, uma análise por um conjunto de filtros, uma análise por transformação de Fourier rápida ou processos de análise semelhantes, nos quais os parâmetros de a nálise representam o espectro do sinal de entrada. Além disso, com a finalidade de obter um custo de processamento o menor po_s sível, é judicioso utilizar um conversor analógico-digital linear.
Outras variantes vantajosas do processo segundo a i presente invenção resultam da leitura das reivindicações secundárias .
Descreve-se a seguir com mais pormenor a presente invenção, com base num exemplo de realização representado no d_e senho anexo.
A figura ilustra a constituição de princípio de um Η sistema de reconhecimento da fala dependente do locutor com um circuito de correcção adicional (KS), por meio do qual pode rea lizaj>-se o processo segundo a presente invenção.
No seguimento apenas resumidamente se entra na cons tituição exacta do sistema de reconhecimento da fala, visto que essa constituição não é o objecto da presente invenção e deve ser conhecida pelos técnicos especialistas da matéria. Um sistema de reconhecimento da fala dependente do locutor é constituído essencialmente por três componentes: um pré-amplificador (VB), um andar de análise (A) e um circuito de detecção (EWE), em ligação com uma memória de referência (RSp). 0 sistema de re conhecimento da fala e comandado pelo sistema do utilizador em questão através de instruções de ajustamento do ganho, de apren dizagem e de reconhecimento. No pré-amplificador (VB) faz-se uma adaptação do nível do sinal à intensidade da fala individual.
- 3 Ί
Um sistema de reconhecimento da fala dependente do locutor neces sita de uma fase de aprendizagem, na qual as características das j palavras a reconhecer são analisadas e carregadas na memória de referência. Na fase de reconhecimento, as características relevantes da palavra inscrita são comparadas com os padrões de re; ferência registados em memória e é determinado o grau de semelhai I ça.
!
No amplificador prévio (VB) faz-se o ajustamento do ganho, bem como uma regeneração espectral e uma limitação da ga ma de frequências do sinal da fala a, por exemplo, 5 KHz, como condição prévia para uma digitalização subsequente do sinal da fala. No andar de análise (A) efectua-se uma análise dos sinais a cústicos de entrada, de acordo com processos de análises determi I nados. Durante a análise, por exemplo de 10 em 10 milissegundos, emite-se um conjunto de valores de intensidade espectrais, os l quais são levados ao circuito de detecção (EWE). 0 circuito de detecção efectua, além da detecção dos limites das palavras, entre outras coisas a comparação dos padrões da fala entrados com os padrões da fala armazenados na memória de padrões de referência (RSp). Além disso, o circuito de detecção (EWE) comanda os outros andares e emite os resultados respectivos de reconhecimen to das palavras individuais para o sistema do utilizador.
Descreve-se a seguir o processo segundo a presente invenção em ligação com o circuito de correcção (KS), com mais pormenor. Antes de se iniciar a entrada propriamente dita da fa la, o sinal perturbador actual é levado, através do microfone e do pré-amplificador (VB), ao andar de análise (A). 0 conjunto de parâmetros de análise assim determinado do sinal perturbador actual é levado, por meio do comutador (s), à memória (Sp) dos valores de correcção e nela armazenado. Antes, o parâmetro de a nálise respectivo é digitalizado por meio do conversor analógico/digital (AD). Neste caso escolhe-se um conversor analógico/digital linear, visto que os sinais perturbadores actuam de maneira aditiva em relação aos sinais da fala. Os parâmetros de análi se são emitidos, em cada caso, durante um intervalo de tempo de! terminado, por exemplo 10 milissegundos. No caso do processo segundo a presente invenção, os valores de correcção são formados
- 4 <κ;
b por um único conjunto dos parâmetros de análise do sinal pertur bador actual ou escolhem—se como valores de correcção os valores médios de um número determinado de conjuntos de parâmetros de análise do sinal perturbador. A formação de um tal valor médio seria então realizada num circuito (M) apropriado.
Durante a entrada dos sinais de fala propriamente ditos, os parâmetros de análise calculados individualmente pelo andar de análise (A) são levados, através do comutador (s), directamente ao circuito de subtracção (SU). Neste circuito de subtracção (SU) subtrai-se cada um dos parâmetros de análise dos sinais da fala afectados pelos sinais perturbadores do valor de correcção, isto é do parâmetro de análise do sinal perturbador actual. Deste modo, fica disponível para o reconhecimento da pa lavra no circuito de detecção (EWE) um conjunto de parâmetros de análise sem influência dos sinais perturbadores. 0 pressupojq to para este modo de funcionamento é que durante uma entrada da fala se mantenha constante o nível de ruido perturbador. Na uti lização da presente invenção salientou-se a utilização da entra da da fala em combinação com um autotelefone para aliviar o con dutor da operação do aparelho. Mas pode conceber-se a utilização do processo segundo a presente invenção com um sistema de reconhecimento da fala em ligação com outros sistemas do utilizador.
Mediante o emprego da entrada de palavras nos autotelefones reduz-se o processo de selecção a levantar o aparelho do descanso e em seguida pronunciar o nome do assinante ou os algarismos do número do assinante. Depois de feito o reconhecimento, o sistema estabelece automaticamente a ligação telefónica correspondente, de modo que o condutor durante toda a operação pode dar toda a atenção ao tráfego rodoviário sem limites. Uma repetição da marcação no caso de uma chamada sem êxito pode também ser activada por uma entrada falada.

Claims (4)

  1. REIVINDICAÇÕES
    - lâ -
    Processo para a compensação dos ruídos perturbadores para sistemas de reconhecimento da fala instalados em autc> móveis, no qual, depois da realização de uma análise da fala em ligação com uma redução de dados, ficam disponíveis, para o pro cessamento ulterior, parâmetros de análise correspondentes aos sinais acústicos iniciais, caracterizado por, em cada activação do sistema de reconhecimento de fala, antes da entrada da própria fala, os sinais de ruido actuais serem sujeitos a uma aná lise de fala e os parâmetros de análise que representam os sinais de ruido serem memorizados, como valores de correcção, por durante a entrada dos sinais da fala estes valores de correcção serem subtraídos dos parâmetros de análise que representam o e_s pectro resultante do sinal de ruido e do sinal da fala, e por se tomarem como base para o reconhecimento propriamente dito das palavras os parâmetros de análise assim corrigidos.
    -
  2. 2S -
    Processo de acordo com a reivindicação 1, caracterizado por se determinar, nas pausas da pronúncia da palavra en trada, um outro conjunto actual de valores de correcção para a compensação de ruidos perturbadores, que se alteram durante a palavra introduzida.
    -
  3. 3a _
    Processo de acordo com as reivindicações 1 ou 2, ca racterizado por o conjunto de valores de correcção resultar da formação do valor médio de um determinado número de conjunto de parâmetros de análise.
    _ 4a _
    Processo de acordo com uma das reivindicações 1 a 3, caracterizado por, para a análise da fala, se prever um processo de análise no qual os parâmetros de análise representam o es
    - 6 pectro do sinal inicial, por exemplo a análise com um conjunto de filtros e a análise pela transformação cie Fourier rápida.
    - 5â Processo de acordo com uma das reivindicações 1 a
  4. 4, caracterizado por, antes ou depois da realização da análise da fala e da redução de dados, os dados serem levados a um coni versor analógico/digital linear.
    A requerente declara que 03 primeiros pedidos desta patente foram apresentados na República Federal Alemã em 28 de Setembro de 1987 e em 16 de Novembro de 1987, sob os n^s. 23732624.4 e P3738871.1, respectivamente.
PT8858988A 1987-09-28 1988-09-26 Processo para a compensacao dos ruidos perturbadores para sistemas de reconhecimento da fala instalados em automoveis PT88589B (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE3732624 1987-09-28
DE3738871 1987-11-16

Publications (2)

Publication Number Publication Date
PT88589A PT88589A (pt) 1989-07-31
PT88589B true PT88589B (pt) 1993-10-29

Family

ID=25860222

Family Applications (1)

Application Number Title Priority Date Filing Date
PT8858988A PT88589B (pt) 1987-09-28 1988-09-26 Processo para a compensacao dos ruidos perturbadores para sistemas de reconhecimento da fala instalados em automoveis

Country Status (3)

Country Link
DK (1) DK535488A (pt)
NO (1) NO884299L (pt)
PT (1) PT88589B (pt)

Also Published As

Publication number Publication date
PT88589A (pt) 1989-07-31
DK535488A (da) 1989-03-29
NO884299L (no) 1989-03-29
NO884299D0 (no) 1988-09-28
DK535488D0 (da) 1988-09-27

Similar Documents

Publication Publication Date Title
DE60217444T2 (de) Sprachgesteuertes elektronisches Gerät
US7016836B1 (en) Control using multiple speech receptors in an in-vehicle speech recognition system
EP1182647B1 (de) Verfahren zum Steuern von Geräten mittels Sprachsignalen in Umgebungen mit hohem Geräuschpegel
US6411928B2 (en) Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
KR20080026456A (ko) 음신호 처리 방법, 음신호 처리 장치 및 기록 매체
DE69920461D1 (de) Verfahren und Vorrichtung zur robusten Merkmalsextraktion für die Spracherkennung
KR101630155B1 (ko) 잡음 제거 장치, 잡음 제거 방법, 잡음 제거 장치를 이용하는 음성 인식 장치 및 음성 인식 장치가 설치된 차량
PT88589B (pt) Processo para a compensacao dos ruidos perturbadores para sistemas de reconhecimento da fala instalados em automoveis
JP3257832B2 (ja) 音声認識装置用騒音低減回路
JP2008070878A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
DE102019213329A1 (de) Verfahren zum Bereitstellen eines modifizierten akustischen Signals zur Wiedergabe in einem Innenraum eines Fahrzeugs
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
JPH04240700A (ja) 環境により誘起された発音変化に対する基準スピーチパターンの適合
JP3350106B2 (ja) 音声認識装置
EP0100773B1 (en) Speech recognition system for an automotive vehicle
WO2018198150A1 (en) System for recognizing an emergency vehicle from the sound emitted from a siren of said emergency vehicle and method thereof
JP2003509730A (ja) 信号場における妨害雑音の低減方法
KR100215668B1 (ko) 잡음원 코드북을 이용한 잡음제거 방법
JP4173978B2 (ja) 雑音除去装置、及び、音声認識装置、並びに音声通信装置
JP3410789B2 (ja) 音声認識装置
Hanai et al. Robust speech recognition in the automobile.
JPH1011084A (ja) 車載用ナビゲーションシステムの音声入力装置
KR960004392Y1 (ko) 음성등록 확인장치
JPS58202498A (ja) 車載機器用音声認識操作方式
JPH06208393A (ja) 音声認識装置

Legal Events

Date Code Title Description
FG3A Patent granted, date of granting

Effective date: 19930408

MM3A Annulment or lapse

Free format text: LAPSE DUE TO NON-PAYMENT OF FEES

Effective date: 19941031