JPS61121090A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61121090A JPS61121090A JP59241787A JP24178784A JPS61121090A JP S61121090 A JPS61121090 A JP S61121090A JP 59241787 A JP59241787 A JP 59241787A JP 24178784 A JP24178784 A JP 24178784A JP S61121090 A JPS61121090 A JP S61121090A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- standard
- threshold
- unit
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声を自動的に認識する音声認識装置に関し
、特に、属性ごとに発声の変動を考慮した適正な閾値を
もって認識結果の妥当圧を判断する能力をもった音声認
識装置に関する。
、特に、属性ごとに発声の変動を考慮した適正な閾値を
もって認識結果の妥当圧を判断する能力をもった音声認
識装置に関する。
従来から音声認識の一方法としてパターンマツチング法
が用いられている。パターンマツチング法による音声認
識では、入力パターンと複数個の標準パターンの間で比
較操作を行い、相互に類似する度合いを表わす尺度(以
下、類似度と呼ぶ)を算出し、最も類似度の蔦い標準パ
ターンを選び出し、その類似度がろる一定の閾値以上で
あるか否かを比較し、閾値以上であるならその標準パタ
ーンの属性を妥当な認識結果としている。
が用いられている。パターンマツチング法による音声認
識では、入力パターンと複数個の標準パターンの間で比
較操作を行い、相互に類似する度合いを表わす尺度(以
下、類似度と呼ぶ)を算出し、最も類似度の蔦い標準パ
ターンを選び出し、その類似度がろる一定の閾値以上で
あるか否かを比較し、閾値以上であるならその標準パタ
ーンの属性を妥当な認識結果としている。
さらに発声の変動、たとえば同一の言葉を繰り返し発声
すると、発声の度にイントネーションや発声時間長が異
なるといった問題を解決するために、一つの属性に関し
複数個の標準パターンを準備するのが一般的である。
すると、発声の度にイントネーションや発声時間長が異
なるといった問題を解決するために、一つの属性に関し
複数個の標準パターンを準備するのが一般的である。
しかし、この場合、言葉によって発声の変動度が異なる
ため、一定の閾値をもって類似度の妥当性を判断しよう
とすると複数個の標準パターンをもってしてもその判断
を誤ってしまうことがある。
ため、一定の閾値をもって類似度の妥当性を判断しよう
とすると複数個の標準パターンをもってしてもその判断
を誤ってしまうことがある。
このような問題に対しては、予め発声変動の大きい言葉
については、よシ多重に標準パターンを準備し、変動要
素を吸収するといった方法も考えられるが、標準パター
7登録部のハードウェアメモリ容量が増大するという欠
点が6D、かつ個人ごとに発声変動の大きい言葉が異な
るという点から、予めそれを予測することが困難であり
、実用性に欠けるといった問題点を有していた。
については、よシ多重に標準パターンを準備し、変動要
素を吸収するといった方法も考えられるが、標準パター
7登録部のハードウェアメモリ容量が増大するという欠
点が6D、かつ個人ごとに発声変動の大きい言葉が異な
るという点から、予めそれを予測することが困難であり
、実用性に欠けるといった問題点を有していた。
本発明は、上記の問題点に鑑みてなされたもので、音声
信号を特徴ベクトルの時系列である入力パターン、及び
標準パターンに変換するパターン作成部と、複数個の標
準パターンを記憶する標準パターン登録部とを有し、入
力パターンと標準パターンとのパターンマツチングを行
って入力音声を判定する音声認識装置において、認識に
先立って各属性について多重に標準パターン登録部に記
憶されている標準パターンから各属性ごとに適正な閾値
を算出する閾値作成部と、入力パターン比較部からの出
力と閾値作成部からの閾値とを比較して認識結果の妥当
性を評価する閾値判定部とで構成しである。
信号を特徴ベクトルの時系列である入力パターン、及び
標準パターンに変換するパターン作成部と、複数個の標
準パターンを記憶する標準パターン登録部とを有し、入
力パターンと標準パターンとのパターンマツチングを行
って入力音声を判定する音声認識装置において、認識に
先立って各属性について多重に標準パターン登録部に記
憶されている標準パターンから各属性ごとに適正な閾値
を算出する閾値作成部と、入力パターン比較部からの出
力と閾値作成部からの閾値とを比較して認識結果の妥当
性を評価する閾値判定部とで構成しである。
以下、本発明を図面を参照しながら詳細に説明する。
発声された音声信号はマイクロホンlからパターン作成
部2へ入る。パターン作成部2の出力はスイッチ3によ
って分岐されていて、標準パターンの作成時には標準パ
ターン登録部4へ接続され、認識動作時には入力パター
ン比較部6へ接続される。スイッチ3は制御部8によっ
て制御される。
部2へ入る。パターン作成部2の出力はスイッチ3によ
って分岐されていて、標準パターンの作成時には標準パ
ターン登録部4へ接続され、認識動作時には入力パター
ン比較部6へ接続される。スイッチ3は制御部8によっ
て制御される。
登録時においては、同一属性について複数個の標準パタ
ーンを登録し標準パターン登録部4へ蓄わえる。このよ
うにして、多重に登録された標準パターンから閾値作成
部5に、おいて各属性ごとに固有の閾値が算出される。
ーンを登録し標準パターン登録部4へ蓄わえる。このよ
うにして、多重に登録された標準パターンから閾値作成
部5に、おいて各属性ごとに固有の閾値が算出される。
閾値作成部5においては、制御部80制御下で登録済の
多重の標準パターン間の類似度t−算出する。すなわち
、同一属性の全ての標準パターン相互間の類似度を算出
し、そのなかで最も低い類似度の値を該属性の閾値とす
る。この場合、もともと該属性の言葉が髪動度の入きい
ものであれば、多重登録されている標準パターン同志の
類似度も低く、結局他の属性に比べて相対的に小さい閾
値が得られる。すなわち、登録時の発声は明らかに該属
性に属していることが前提であるから、このような同一
属性の標準パターン間の類似度の最も低い値はそのまま
発声変動の大きさを表わすものと考えられ、発声変動の
大きいほど低い類似度の値、すなわち小さい閾値が得ら
れることになシ、認識時の発声が相対的に低い類似証で
あったとしても閾値金層えることが容易になる。
多重の標準パターン間の類似度t−算出する。すなわち
、同一属性の全ての標準パターン相互間の類似度を算出
し、そのなかで最も低い類似度の値を該属性の閾値とす
る。この場合、もともと該属性の言葉が髪動度の入きい
ものであれば、多重登録されている標準パターン同志の
類似度も低く、結局他の属性に比べて相対的に小さい閾
値が得られる。すなわち、登録時の発声は明らかに該属
性に属していることが前提であるから、このような同一
属性の標準パターン間の類似度の最も低い値はそのまま
発声変動の大きさを表わすものと考えられ、発声変動の
大きいほど低い類似度の値、すなわち小さい閾値が得ら
れることになシ、認識時の発声が相対的に低い類似証で
あったとしても閾値金層えることが容易になる。
認識時においては、パターン作成部2の出力がスイッチ
3を径て入力パターン比較部6において、標準パターン
登録部4の全ての属性の標準パターンと比較操作され相
互の類似Kが算出される。そして、そのうち最も類似贋
が高い標準パターンとその標準パターンを有する属性が
決定されて、この結果は閾値判定部7へ送られる。閾値
判定部7では、別途人カバターン比較部6の出力結果を
受けて制御部8が閾値作成部5から読み出した該属性の
閾値を用いて比較操作を行い、入力パターン比較部6の
出力である認識結果の妥当性を評価する。
3を径て入力パターン比較部6において、標準パターン
登録部4の全ての属性の標準パターンと比較操作され相
互の類似Kが算出される。そして、そのうち最も類似贋
が高い標準パターンとその標準パターンを有する属性が
決定されて、この結果は閾値判定部7へ送られる。閾値
判定部7では、別途人カバターン比較部6の出力結果を
受けて制御部8が閾値作成部5から読み出した該属性の
閾値を用いて比較操作を行い、入力パターン比較部6の
出力である認識結果の妥当性を評価する。
こうして、総合的な結果は認識結果処理部9へ送られる
が、その後の処理については任意である。すなわち、類
似度が閾値を超えたか否かの情報を付加して認識結果を
上位計算機へ送出したり、あるいは一意的に良否判断を
行い、類似度が閾値を超えないときは認識不能として再
度発声を要求するなど、該音声認識装置の応用のされが
たによって様々の方法が可能である。
が、その後の処理については任意である。すなわち、類
似度が閾値を超えたか否かの情報を付加して認識結果を
上位計算機へ送出したり、あるいは一意的に良否判断を
行い、類似度が閾値を超えないときは認識不能として再
度発声を要求するなど、該音声認識装置の応用のされが
たによって様々の方法が可能である。
以上述べたごとく、本発明によれば、属性ごとにその言
葉の発声変動が吸収できるため、認識結果についての妥
当性の評価が属性ごとに適正に行われる。このことによ
シ、ひいては該音声認識装置を応用したシステム全体の
入力速度と、操作性の向上に大きく寄与する効果がある
。
葉の発声変動が吸収できるため、認識結果についての妥
当性の評価が属性ごとに適正に行われる。このことによ
シ、ひいては該音声認識装置を応用したシステム全体の
入力速度と、操作性の向上に大きく寄与する効果がある
。
第1図は本発明の一構成例を示す図である。
■・・・マイクロホン 2・・・パターン作成部3・
・・スイッチ 4・・・標準パターン登録部 5・・・閾値作成部 6・・・入力パターン比較部 7・・・閾値判定部 8・・・、制御部9・・・認
識結果処理部
・・スイッチ 4・・・標準パターン登録部 5・・・閾値作成部 6・・・入力パターン比較部 7・・・閾値判定部 8・・・、制御部9・・・認
識結果処理部
Claims (1)
- 音声信号を特徴ベクトルの時系列である。入力パターン
及び標準パターンに変換するパターン作成部と、複数個
の標準パターンを記憶する標準パターン登録部とを有し
、入力パターンと標準パターンとのパターンマッチング
を行つて入力音声を判定する音声認識装置において、認
識に先立つて各属性について多重に標準パターン登録部
に記憶されている標準パターンから各属性ごとに適正な
閾値を算出する閾値作成部と、入力パターン比較部から
の出力と閾値作成部からの閾値とを比較して認識結果の
妥当性を評価する閾値判定部とからなることを特徴とし
た音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59241787A JPS61121090A (ja) | 1984-11-16 | 1984-11-16 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59241787A JPS61121090A (ja) | 1984-11-16 | 1984-11-16 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61121090A true JPS61121090A (ja) | 1986-06-09 |
Family
ID=17079511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59241787A Pending JPS61121090A (ja) | 1984-11-16 | 1984-11-16 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61121090A (ja) |
-
1984
- 1984-11-16 JP JP59241787A patent/JPS61121090A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2982870B2 (ja) | 話者識別方法および話者認識装置 | |
JP3789246B2 (ja) | 音声区間検出装置、音声区間検出方法、音声認識装置、音声認識方法および記録媒体 | |
JPS58130393A (ja) | 音声認識装置 | |
JPS61121090A (ja) | 音声認識装置 | |
JP3251460B2 (ja) | 話者照合方法および装置 | |
JPS63157199A (ja) | 話者照合装置 | |
JP2989231B2 (ja) | 音声認識装置 | |
JPS6126678B2 (ja) | ||
JP2655637B2 (ja) | 音声パターン照合方式 | |
JP2000148187A (ja) | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 | |
JPS59111697A (ja) | 音声認識方式 | |
CN117351945A (zh) | 身份鉴权方法、装置及介质 | |
JPH0256680B2 (ja) | ||
JPS58159599A (ja) | 単音節音声認識方式 | |
JPS60198598A (ja) | 音声認識方式 | |
JPS58159598A (ja) | 単音節音声認識方式 | |
JPS5934597A (ja) | 音声認識処理装置 | |
JPS61281298A (ja) | 音声認識装置 | |
JPS60166996A (ja) | 音声標準パタン登録方法 | |
JPS595294A (ja) | 音声認識装置 | |
JPS6167898A (ja) | パタ−ン作成方式 | |
JPS61200596A (ja) | 連続音声認識装置 | |
JPS6165298A (ja) | 音声認識装置 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS6051899A (ja) | 音声認識装置 |