JPH0627991A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0627991A
JPH0627991A JP4184989A JP18498992A JPH0627991A JP H0627991 A JPH0627991 A JP H0627991A JP 4184989 A JP4184989 A JP 4184989A JP 18498992 A JP18498992 A JP 18498992A JP H0627991 A JPH0627991 A JP H0627991A
Authority
JP
Japan
Prior art keywords
voice
noise level
input
noise
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4184989A
Other languages
English (en)
Inventor
Akira Nakayama
昭 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP4184989A priority Critical patent/JPH0627991A/ja
Publication of JPH0627991A publication Critical patent/JPH0627991A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】Lombard効果による音声の変形に起因す
る認識性能の劣化を改善し、高騒音環境下でも高精度な
認識性能が発揮できるようにする。 【構成】音声入力マイクロフォン1を通して入力された
認識対象となる音声を、入力音声フィードバック部2に
より、増幅器21、イヤホン22を介して発声者自身の
耳にフィードバックする構成とする。また、装置周囲の
騒音を周囲騒音測定マイクロフォン23を通して入力
し、その騒音レベルnを騒音レベル測定部24にて測定
し、その測定値に応じて、増幅器21のゲインGをフィ
ードバック調整部25により調整する構成とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は騒音環境下での使用に好
適な音声認識装置に関する。
【0002】
【従来の技術】音声認識の技術は、優れたマンマシン・
インタ−フェ−スを実現する上での重要な役割を担って
いる。音声認識装置の実用化を考えた場合、高騒音環境
下での認識性能劣化に対する耐騒音性の向上は重要な課
題である。
【0003】高騒音環境下での音声認識において認識性
能劣化の原因となるものにLombard効果と呼ばれ
るものが知られている(例えば、Lombard,E. : Le sign
e dele elevation de la voix. Ann Mal. Oreil,Laryn
x,37,101-119,1911 、 D.B.Pisoni, R.H.Bernacki, H.
C.Nusbaum, M.Yuchtman : “SOME ACOUSTIC-PHONETICCO
RRELATES OF SPEECH PRODUCED IN NOISE ”, Proc. of
ICASSP,1581-1584,1985など)。
【0004】Lombard効果とは、高騒音環境で発
声された音声では、騒音レベルの上昇に伴う、発声レベ
ルの上昇、ピッチ周波数の上昇、およびスペクトル包絡
の変形が観測される現象である。したがって、高騒音環
境下で使用される音声認識装置は、Lombard効果
による音声の変形によって、認識性能の劣化が生じると
いう問題がある。
【0005】そこで従来の音声認識装置、例えば特定話
者音声認識装置では、Lombard効果に対する対策
として、音声の標準パターンを登録する際に、Lomb
ard効果が生じる様な高騒音下で音声の登録を行う方
式が適用されていた。即ち従来は、Lombard効果
が反映された標準パターンを作成することで、上記問題
を回避してきた。
【0006】しかし、上述した従来の方式では、装置が
使用される環境の騒音レベルが登録の際と異なる場合に
は、Lombard効果による認識性能劣化の改善は期
待できないという問題があった。また、音声の標準パタ
ーンの登録を必要としない不特定話者音声認識装置で
は、Lombard効果による認識性能劣化を回避する
ことは非常に困難であった。
【0007】
【発明が解決しようとする課題】このように従来にあっ
ては、高騒音環境下で発声される音声の変形(Lomb
ard効果)に起因する認識性能劣化の問題が残されて
おり、効果的な解決方法がないのが実状であった。これ
は装置の実用化に際しては最も重要な問題の一つとな
る。
【0008】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、Lombard効
果による音声の変形に起因する認識性能の劣化を改善
し、高騒音環境下でも高精度な認識性能を有する音声認
識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明は、Lombar
d効果が生じる原因は、発声者の音声が発声者自身にフ
ィードバックされる経路が騒音のために絶たれるためで
あることに着目し、発声者からの入力音声を発声者にフ
ィードバックする入力音声フィードバック手段を設けた
ことを特徴とするものである。
【0010】また本発明は、装置周囲の騒音レベルを測
定する騒音レベル測定手段を更に設け、この測定された
騒音レベルに応じて入力音声フィードバック手段のゲイ
ンを調整するようにしたことをも特徴とする。
【0011】
【作用】上記の構成においては、発声者によって発声さ
れて音声認識装置に入力された音声が、入力音声フィー
ドバック手段により例えばイヤホンを通して発声者の耳
にフィードバックされるので、高騒音下でのLomba
rd効果による発声の変形を抑えることが可能となり、
従来と比較して装置の性能劣化が改善され、認識精度が
格段に向上する。ここで、フィードバックゲインを固定
せず、装置周囲の騒音レベルに応じて調整することによ
り、発声者は騒音レベルの変動を意識せずに済み、Lo
mbard効果による発声の変形を一層効果的に抑える
ことが可能となる。
【0012】
【実施例】以下、本発明を単語音声認識に適用した一実
施例につき図面を参照して説明する。
【0013】図1は本発明の一実施例に係る音声認識装
置の概略構成を示すブロック図である。図1において、
1は認識の対象となる音声を入力するためのマイクロフ
ォン(音声入力マイクロフォン)、2はマイクロフォン
1を介して入力された音声を発声者にフィードバックす
る入力音声フィードバック部である。
【0014】入力音声フィードバック部2は、マイクロ
フォン1を介して入力された音声の信号を増幅する増幅
器21、同増幅器21で増幅された音声信号を音声に変
換するイヤホン22、周囲騒音測定マイクロフォン2
3、同マイクロフォン23を介して入力された周囲騒音
のレベルnを測定する騒音レベル測定部24、およびフ
ィードバック調整部25から構成される。このフィード
バック調整部25は、騒音レベル測定部24で測定され
た騒音レベルnに応じて増幅器21のゲインGを調整す
る。
【0015】3はマイクロフォン1を介して入力された
音声を音響分析してその特徴パラメ−タを求める音響分
析部、4は認識対象カテゴリの標準パターンセットが予
め登録された標準パターン記憶部である。5は音響分析
部3によって求められた特徴パラメ−タと標準パターン
記憶部4に登録されている標準パターンセットとの間で
類似度を計算する類似度計算部、6は類似度計算部5で
得られる類似度計算結果から認識結果を出力する識別部
である。
【0016】次に、図1に示す構成の音声認識装置の動
作につき、本発明に直接関係する入力音声フィードバッ
ク部2の動作を中心に説明する。まず、図1の装置が高
騒音環境下にある状態で、利用者(発声者)が音声入力
マイクロフォン1に向かって(認識の対象となる)音声
を発声するものとする。この際、利用者(発声者)は、
入力音声フィードバック部2が有するイヤホン22を自
身の耳に装着する。
【0017】さて、利用者(発声者)が発声した音声は
マイクロフォン1により入力され、その音声信号が入力
音声フィードバック部2に導かれる。入力音声フィード
バック部2は、マイクロフォン1からの入力音声信号を
内蔵の増幅器21により増幅し、イヤホン22にて音声
に変換する。即ち入力音声フィードバック部2は、発声
者がマイクロフォン1を通して発した音声を、増幅器2
1およびイヤホン22を介して、発声者自身の耳にフィ
ードバックする。
【0018】この際の増幅器21のゲインGは、入力音
声フィードバック部2内蔵のフィードバック調整部25
によって次のように調整される。まず、入力音声フィー
ドバック部2に設けられた周囲騒音測定マイクロフォン
23によって、装置周囲の騒音が入力され、その騒音レ
ベルnが騒音レベル測定部24によって測定される。フ
ィードバック調整部25は、騒音レベル測定部24によ
り測定された装置周囲の騒音のレベルnに応じて増幅器
21のゲインGを調整する。この騒音レベルnとゲイン
Gとの関係の一例を図2に示す。図2の例では、騒音レ
ベルnがn1 より小さい範囲では最小ゲインGmin が、
n2 (但しn2 >n1 )より大きい範囲では最大ゲイン
Gmax が、そしてn1 とn2 との間の範囲ではGmin ,
Gmax 間を騒音レベルnに比例して増加させるような値
が、ゲインGとして設定される。
【0019】さて、マイクロフォン1を通して入力され
た音声は、音響分析部3にも導かれる。音響分析部3
は、この入力音声を音響分析してその特徴パラメ−タを
抽出する。類似度計算部5は、音響分析部3によって抽
出された入力音声の特徴パラメ−タと標準パターン記憶
部4に登録されている標準パターンセットとの間で類似
度を計算する。識別部6は、類似度計算部5の類似度計
算結果を受け、類似度の最上位あるいは上位複数個のカ
テゴリ名あるいはカテゴリ番号などの認識結果を出力す
る。
【0020】なお、前記実施例では、フィードバック音
声が周囲の騒音レベルに応じて(フィードバック調整部
25により)自動調整されるものとして説明したが、こ
れに限るものではない。例えば、音量調整用のボリュー
ムを設け、イヤホン22の音量を発声者自身が手動で調
整するようにしてもよい。このボリュームを用いた手動
調整と、前記実施例における自動調整とを併用するよう
にしてもよい。
【0021】
【発明の効果】以上説明したように本発明によれば、本
音声認識装置の利用者が発声した認識の対象となる音声
が、入力音声フィードバック手段により、その利用者
(発声者)自身の耳にフィードバックされる構成とした
ので、従来であれば、高騒音環境下において発声者の音
声が発声者自身にフィードバックされる経路が騒音によ
り絶たれるために生じていたLombard効果が起こ
らなくなり、したがってLombard効果による音声
変形を抑えて、この音声変形に起因する認識性能の劣化
を回避することができる。
【0022】更に本発明によれば、フィードバック音声
が装置周囲の騒音レベルに応じて自動調整される構成と
することにより、利用者は騒音レベルの変動を意識する
必要がないという使い勝手を有し、Lombard効果
による音声変形を一層確実に抑えることができる。
【0023】このように本発明によれば、Lombar
d効果による音声変形を効果的に抑えて、これに起因す
る認識性能の劣化を回避することができるようになり、
本装置の認識性能、信頼性の向上を図り得る等の実用上
多大なる効果が奏せられる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声認識装置の概略構
成を示すブロック図。
【図2】騒音レベルとゲインとの関係の一例を示す図。
【符号の説明】
1…音声入力マイクロフォン、2…入力音声フィードバ
ック部、3…音響分析部、4…標準パターン記憶部、5
…類似度計算部、6…識別部、21…増幅器、22…イ
ヤホン、23…周囲騒音測定マイクロフォン、24…騒
音レベル測定部、25…フィードバック調整部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を認識する音声認識装置におい
    て、 前記入力音声を発声者にフィードバックする入力音声フ
    ィードバック手段を備えたことを特徴とする音声認識装
    置。
  2. 【請求項2】 装置周囲の騒音レベルを測定する騒音レ
    ベル測定手段を更に備え、前記騒音レベル測定手段によ
    って測定された騒音レベルに応じて前記入力音声フィー
    ドバック手段のゲインを調整することを特徴とする請求
    項1記載の音声認識装置。
JP4184989A 1992-07-13 1992-07-13 音声認識装置 Pending JPH0627991A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4184989A JPH0627991A (ja) 1992-07-13 1992-07-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4184989A JPH0627991A (ja) 1992-07-13 1992-07-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0627991A true JPH0627991A (ja) 1994-02-04

Family

ID=16162850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4184989A Pending JPH0627991A (ja) 1992-07-13 1992-07-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0627991A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023984A1 (en) * 1998-10-16 2000-04-27 Dragon Systems Uk Research & Development Limited Speech processing
KR101151571B1 (ko) * 2010-07-21 2012-05-31 포항공과대학교 산학협력단 음성 대화 시스템을 위한 음성 인식 환경 제어 장치 및 그 방법
US9959888B2 (en) 2016-08-11 2018-05-01 Qualcomm Incorporated System and method for detection of the Lombard effect

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023984A1 (en) * 1998-10-16 2000-04-27 Dragon Systems Uk Research & Development Limited Speech processing
KR101151571B1 (ko) * 2010-07-21 2012-05-31 포항공과대학교 산학협력단 음성 대화 시스템을 위한 음성 인식 환경 제어 장치 및 그 방법
US9959888B2 (en) 2016-08-11 2018-05-01 Qualcomm Incorporated System and method for detection of the Lombard effect

Similar Documents

Publication Publication Date Title
CN108630202B (zh) 语音识别装置、语音识别方法以及记录介质
JP2654503B2 (ja) 無線端末装置
EP0077194B1 (en) Speech recognition system
US8755546B2 (en) Sound processing apparatus, sound processing method and hearing aid
US9830924B1 (en) Matching output volume to a command volume
US20080147411A1 (en) Adaptation of a speech processing system from external input that is not directly related to sounds in an operational acoustic environment
IL125649A (en) Method and device for detecting signal of a sound sampled from noise
JPH08110793A (ja) 特性ベクトルの前端正規化による音声認識の改良方法及びシステム
WO1999034353A1 (en) Feedback modification for accent reduction
US20050108008A1 (en) System and method for audio signal processing
KR20190102454A (ko) 소음 적응적으로 음량을 제어하는 방법 및 이를 구현하는 장치
US6768801B1 (en) Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same
JPH0627991A (ja) 音声認識装置
JP2867425B2 (ja) 音声認識用前処理装置
JPS6257040B2 (ja)
JPH02232697A (ja) 音声認識装置
KR100587260B1 (ko) 음향 기기의 음성인식장치
JP2966452B2 (ja) 音声認識装置の雑音除去システム
JP2975808B2 (ja) 音声認識装置
Raman et al. Robustness issues and solutions in speech recognition based telephony services
JPH05265484A (ja) 閾値可変型音声認識装置
JPH0814760B2 (ja) スペクトル正規化装置
JP3032551B2 (ja) 音声標準パターン登録方法
JPH10254493A (ja) 録音音声の音量正規化方法およびこの方法を実施する装置
JPH0690631B2 (ja) 音声認識方法