JPH01316799A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01316799A
JPH01316799A JP63149594A JP14959488A JPH01316799A JP H01316799 A JPH01316799 A JP H01316799A JP 63149594 A JP63149594 A JP 63149594A JP 14959488 A JP14959488 A JP 14959488A JP H01316799 A JPH01316799 A JP H01316799A
Authority
JP
Japan
Prior art keywords
gain
speech
recognition
input signal
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63149594A
Other languages
English (en)
Inventor
Motoaki Koyama
元昭 児山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63149594A priority Critical patent/JPH01316799A/ja
Publication of JPH01316799A publication Critical patent/JPH01316799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声入力信号の音声内容の認識を行う音声認
識装置に係り、特に音声認識手段の前段で音声入力信号
に対する利得調節が可能な利得調節器を有する音声認識
装置に関する。
(従来の技術) 従来の音声認識装置には、音声入力信号に対する利得調
節を行わない方式のものと行う方式のものとがある。前
者の方式のものでは、話者が入れ替わったり、マイクロ
ホンと話者の口との距離が変動したり、マイクロホンの
種類が変化したり、声の大きさが変化したりして音声入
力信号のレベルが変動したときに、認識性能が一定にな
らずに変動していた。このため、高い認識性能が得られ
る音声入力信号レベルの範囲が限られており、その用途
がかなり制限されるという問題点があった。
また、音声入力信号に対してA/D (アナログ/デジ
タル)変換器によりA/D変換を行った後にデジタル的
にパワーの正規化を行っているものでは、以下の問題点
があった。第1に、小さすぎる音声入力信号に対しては
、デジタル的に「0」に近くなったり「0」になるので
、正規化を行っても誤差が大きくなったり、正規化が不
可能になる。第2に、大きすぎる音声入力信号に対して
は、A/D変換器のダイナミックレンジを超えてしまい
、オーバーフローあるいは非線形歪を生じるので、パワ
ーの正規化が有効に働かなくなる。
一方、後者の方式のうち、AGC(自動利得制御)回路
を内蔵するものでは、音声本来のパワーの大小やデイツ
プまでをも利得制御により平滑化してしまい、音声パタ
ーンが変形してしまい、認識率が低下するという問題点
があった。
(発明が解決しようとする課題) 本発明は、上記したように音声入力信号に対してAGC
回路を動作させることによって音声パターンが変形して
認識性能が低下するという問題点を解決すべくなされた
もので、音声入力信号のレベル変動に影響されずに音声
入力信号に対して高い認識性能を有する音声認識装置を
提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明の音声認識装置は、利得調節指令を受けて音声人
力信号に対する利得調節を行う利得調節器と、この利得
調節器の出力に対して利得調節を行うことなく音声認識
を行う音声認識手段と、前記利得調節器の出力のレベル
を検出し、このレベル検出結果に応じて前記利得:Am
器の利得を調節する人力レベル検出器とを具備すること
を特徴とする。
(作用) 先ず、音声人力信号に対して利得調節を行わないままで
そのレベルを検出すると共に音声認識を行うことができ
、音声入力信号の、レベル変動の影響によって認識率が
低下することは防止される。
そして、この音声認識の結果、利得調節指令を出して上
記レベル検出結果に応じて前記利得調節器の利得を調節
し、以後の音声入力信号に対して適正な利得制御を行う
ことが可能になる。この場合、例えば音声区間の検出が
終了するまでは利得を一定に制御すれば音声波形のパタ
ーンの特徴が失われることはなく、認識率が良くなる。
また、音声認識手段でのA/D変換を行う前に利得を調
節することによってA/D変換器のダイナミックレンジ
を有効に使えるので、認識率が良くなる。従って、高い
認識性能が得られる音声入力信号レベルの範囲が広くな
る。
(実施例) 以下、図面を参照して本発明の一実施例を詳細に説明す
る。第1図に示す音声認識装置において、1は利得調節
指令を受けて音声入力信号に対する利得調節を行う利得
調節器、2は上記利得調節器の出力に対して利得調節を
行うことなく音声認識を行う音声認識手段、3は前記利
得調節器の出力のレベルを検出し、このレベル検出結果
に応じて前記利得調節器の利得を調節するための制御信
号を出力する入力レベル検出器、4は全体的な制御を行
う制御部(マイクロプロセッサ)である。
第2図(a)は前記音声認識手段2の一例を示しており
、人力信号の特徴を抽出する特徴抽出回路11と、この
特徴抽出回路11の出力信号をA/D変換するA/D変
換器12と、このA/D変換器12の出力信号をパター
ンメモリ13に格納されている標準パターンデータとの
間でパターン比較を行うパターン比較器14と、このパ
ターン比較器14の、比較出力に基すいて音声認識を行
う音声認識処理部15とからなる。上記特徴抽出回路1
1は、バンドパスフィルタ、フーリエ変換回路、ケプス
トラム変換回踏、自己相関計算回路などを用いることが
できる。また、上記パターン比較器14および音声認識
処理部15はマイクロコンピュータが用いられる。
第2図(b)は前記音声認識手段2の他の例を示してお
り、上記第2図(a)の音声認識手段2に比べて特徴抽
出回路11とA/D変換器12とが入れ替わっている。
第3図は前記利得調節器1の一例を示しており、入力信
号を反転増幅する反転増幅器21と、この反転増幅器2
1の入力側に挿入された入力抵抗素子Riと、この反転
増幅器21の入力端と出力端との間に選択的に接続され
る複数の抵抗素子Ra〜Rnと、この複数の抵抗素子R
a −Rnを切り換え接続するためのスイッチ素子Sa
と、上記反転増幅器21の出力端または音声入力端を選
択して出力信号を取り出すスイッチ素子sbとからなる
次に、上記実施例の音声認識装置の動作について第4図
に示す利得調節のためのフローチャート、第5図に示す
利得調節のためのタイミング、および第6図に示すレベ
ル検出のためのフローチャートを参照しながら説明する
。利得調節器1は、先ず、音声入力信号に対して利得調
節を行わないまま(利得固定のまま)で出力する。入力
レベル検出器3は上記出力のレベルを検出し、音声認識
手段2は上記出力を受けて音声区間を検出して音声認識
を行う。即ち、上記検出された区間の音声について標準
パターンデータとの間でパターン比較を行い、最も類似
度の高い、或いは、距離の短いパターンを認識結果とし
て求める。その後、認識結果が雑音であるか音声である
かを判断し、音声であると判断した場合で利得調節が必
要であれば、前記利得調節器1に利得調節指令信号を出
す。この場合、音声認識手段2は利得調節を行うことな
く音声認識を行うので、音声入力信号のレベル変動の影
響によって認識率が低下することは防止される。
利得調節器1は上記利得調節指令信号を受けると、前記
人力レベル検出器3からのレベル検出結果に応じてスイ
ッチ素子Saにより選択される抵抗素子(Ra −Rn
のうちの1つ)と入力抵抗素子Riとの抵抗値比によっ
て利得を調節しく小さすぎる場合は大きくし、大きすぎ
る場合は小さくする)、以後の音声人力信号に対して適
正な利得制御を行うことが可能になる。このような利得
調節を行えば、音声区間の検出が終了するまでは利得が
一定であるので、音声波形のパターンの特徴が失われる
ことはなく、認識率が良くなる。また、音声認識手段2
でA/D変換を行う前に利得を調節しており、A/D変
換器12のダイナミックレンジを有効に使えるので、認
識率が良くなる。
従って、音声入力信号のレベル変動があっても、音声入
力波形のパターンを歪ませることなく利得を適正な値に
調節することが可能になるので、音声入力信号に対して
高い認識性能を有することが可能になる。
また、前記認識結果が雑音であって認識結果をリジェク
トする場合、或いは、音声であると判断した場合でも、
利得調節が必要でないと判断した場合には、前記利得調
節指令信号を出すことなく終了する。
また、前記入力レベル検出器3による入力レベル検出は
、先ず、音声区間中のパワーの最大値Pmaxを検出し
、このPmaxがある閾値θaよりも小さい場合には小
さいと判定し、上記Pma xがある閾値θbを越えた
フレーム数Fov fがある閾値θCよりも大きい場合
には大きいと判定し、音声区間中のパワーの積分値があ
る閾値θdよりも大きい場合には大きいと判定している
。このような判定の順序はどの様な順序でも良く、各判
定を並列に行うようにしても良い。
なお、第7図乃至第11図は、前記第4図に示した利得
調節のためのフローチャートの変形例を示しており、第
4図の場合に比べて次の点が異なる。即ち、第7図の場
合は、認識結果のりジエクト処理を行わない。第8図の
場合は、認識結果が音声であると判断した場合には必ず
利得調節を行なうものであり、利得調節器1のスイッチ
素子sbは不要になる。第9図の場合は、認識結果のり
ジエクト処理を行わないと共に必ず利得調節を行なうも
のであり、利得調節器1のスイッチ素子sbは不要にな
る。第10図の場合は、前記第7図の場合に比べて音声
区間の検出を終了した後に認識結果のりジエクト処理を
行わないで利得調節を行なう点が異なり、第11図の場
・合は、前記第9図の場合に比べて音声区間の検出を終
了した後に利得調節を行なう点が異なるものである。こ
の第10図の場合および第11図の場合は、利得調節を
音声認識処理と並行して行うことができる。
さらに、前記利得調節器1の利得が使用者が満足し得る
所定の適正値に調節された後は、その利得を変動させな
ための制御入力を使用者が与えることができるようにす
れば、雑音などによって利得が不用意に悪化する恐れが
なくなり、使用者の使い勝手が良くなる。
[発明の効果] 上述したように本発明の音声認識装置によれば、音声入
力信号のレベル変動があっても音声パターンを変形させ
ることなく利得を調節することが可能になるので、音声
人力信号に対して高い認識性能を有することが可能にな
る。
【図面の簡単な説明】
第1図は本発明の音声認識装置の一実施例を示すブロッ
ク図、第2図(a)および(b)は第1図中の音声認識
手段の具体例を示すブロック図、第3図は第1図中の利
得調節器を示す構成説明図、第4図および第5図は第1
図中の音声認識手段における利得調節のためのフローチ
ャートおよびタイミング、第6図は第1図中の入力レベ
ル検出器におけるレベル検出のためのフローチャート、
第7図乃至第11図はそれぞれ第4図のフローチャート
の変形例を示すフローチャートである。 1・・・利得調節器、2・・・音声認識手段、3・・・
人力レベル検出器。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第3図 第4図 第5図 第6図 第7図 第8図 第11図

Claims (3)

    【特許請求の範囲】
  1. (1)利得調節指令を受けて音声入力信号に対する利得
    調節を行う利得調節器と、 この利得調節器の出力に対して利得調節を行うことなく
    音声認識を行う音声認識手段と、前記利得調節器の出力
    のレベルを検出し、このレベル検出結果に応じて前記利
    得調節器の利得を調節する入力レベル検出器と を具備することを特徴とする音声認識装置。
  2. (2)前記音声認識手段が音声区間を検出中は前記利得
    調節器の利得を変動させないように制御することを特徴
    とする請求項1記載の音声認識装置。
  3. (3)前記利得調節器の利得を所定の適正値に調節した
    後はその利得を変動させないように制御することを特徴
    とする請求項1記載の音声認識装置。
JP63149594A 1988-06-17 1988-06-17 音声認識装置 Pending JPH01316799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63149594A JPH01316799A (ja) 1988-06-17 1988-06-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63149594A JPH01316799A (ja) 1988-06-17 1988-06-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01316799A true JPH01316799A (ja) 1989-12-21

Family

ID=15478618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63149594A Pending JPH01316799A (ja) 1988-06-17 1988-06-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01316799A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04293939A (ja) * 1991-03-25 1992-10-19 Asahi Chem Ind Co Ltd 多孔膜の改質方法
WO1997048182A1 (de) * 1996-06-12 1997-12-18 GÖHRUM, Angelika Spracherkennungssystem

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04293939A (ja) * 1991-03-25 1992-10-19 Asahi Chem Ind Co Ltd 多孔膜の改質方法
WO1997048182A1 (de) * 1996-06-12 1997-12-18 GÖHRUM, Angelika Spracherkennungssystem

Similar Documents

Publication Publication Date Title
US4610023A (en) Speech recognition system and method for variable noise environment
EP0248609B1 (en) Speech processor
US4455676A (en) Speech processing system including an amplitude level control circuit for digital processing
US4597098A (en) Speech recognition system in a variable noise environment
JPS61101107A (ja) 通話信号に対する減少した感度を有する雑音依存音量調節
JPH01316799A (ja) 音声認識装置
EP1300832A1 (en) Speech recognizer, method for recognizing speech and speech recognition program
CA2257461C (en) Hearing aid with improved percentile estimator
JPS6257040B2 (ja)
CN113555033A (zh) 语音交互系统的自动增益控制方法、装置及系统
JPH02230896A (ja) 音響信号入力装置
JPH0548475A (ja) スケルチ回路
JPS6195398A (ja) 音声認識装置
JP2594028B2 (ja) 音声認識装置
JPH04330498A (ja) 音声認識装置
JPH056926U (ja) 音声認識装置用音量調整回路
JPH0535294A (ja) 音声認識装置
JPH01185011A (ja) デジタル信号処理装置
JPH0343639B2 (ja)
JP2712708B2 (ja) 音声検出装置
JPH04369697A (ja) 音声認識装置
JPH01236000A (ja) 音声認識装置
JPH04340598A (ja) 音声認識装置
JPS6272214A (ja) 車載用オ−デイオ機器における自動音量調整装置
JPH06175676A (ja) 音声検出器