JPS60260096A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS60260096A JPS60260096A JP59116002A JP11600284A JPS60260096A JP S60260096 A JPS60260096 A JP S60260096A JP 59116002 A JP59116002 A JP 59116002A JP 11600284 A JP11600284 A JP 11600284A JP S60260096 A JPS60260096 A JP S60260096A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- series
- data
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、データ入力などに使用する音声認識装置にお
ける音声区間検出しきい値の補正方式に関する。
ける音声区間検出しきい値の補正方式に関する。
データ入力などに使用する音声認識装置は音声入力装置
と呼ばれ、比較的限定された単語の入力音声を認識して
データ入力とするものである。一般に、不特定の話者の
音声を対象とする場合には、その単語に特有であって、
総ての人について共通なあらゆる特徴を抽出して認識し
、誤認識を減少させなければならないが、これは認識処
理そのものだけではなく、その前段階の処理である音声
区間検出処理などにおいても、同様にいえることである
。
と呼ばれ、比較的限定された単語の入力音声を認識して
データ入力とするものである。一般に、不特定の話者の
音声を対象とする場合には、その単語に特有であって、
総ての人について共通なあらゆる特徴を抽出して認識し
、誤認識を減少させなければならないが、これは認識処
理そのものだけではなく、その前段階の処理である音声
区間検出処理などにおいても、同様にいえることである
。
[従来の技術]
第2図は、データ入力などに使用する音声認識装置の代
表的な構成ブロック図である。図において、1は前処理
部、2はパラメータ抽出部、3は音声区間抽出部、4は
照合部、5は認識辞書、6は判定部をそれぞれ示す。
表的な構成ブロック図である。図において、1は前処理
部、2はパラメータ抽出部、3は音声区間抽出部、4は
照合部、5は認識辞書、6は判定部をそれぞれ示す。
入力された音声信号は、前処理部1においてアナログ/
ディジタル変換され、パラメータ抽出部2において1フ
レーム(例えば15+ns )ごとにケプストラム・デ
ータその他のパラメータの抽出が行われる。
ディジタル変換され、パラメータ抽出部2において1フ
レーム(例えば15+ns )ごとにケプストラム・デ
ータその他のパラメータの抽出が行われる。
次いで、音声区間抽出部3において、音声パワーを一定
に設定されたしきい値と比較し゛て、これを越えたとき
に音声区間として抽出して、照合部4に特徴データを送
り、照合部4においてはその特徴データと認識辞書5と
の比較、照合を行い、判定部6において音声の判定を行
い出力する。
に設定されたしきい値と比較し゛て、これを越えたとき
に音声区間として抽出して、照合部4に特徴データを送
り、照合部4においてはその特徴データと認識辞書5と
の比較、照合を行い、判定部6において音声の判定を行
い出力する。
従来の装置においては、音声区間検出しきい値は、最初
に設定されると終了まで一定のものであった。
に設定されると終了まで一定のものであった。
[発明が解決しようとする問題点]
一般にi系の単語(例えば「イチ」 「二J)は他の単
語(例えばrサン」「コンJ)に比べて音声パワーが低
く、音声区間検出しきい値が一定である従来装置におい
ては、i系単語については音声区間検出しきい値が高す
ぎる状態とな、す、欠落などを生じて誤認識となること
が多かった。
語(例えばrサン」「コンJ)に比べて音声パワーが低
く、音声区間検出しきい値が一定である従来装置におい
ては、i系単語については音声区間検出しきい値が高す
ぎる状態とな、す、欠落などを生じて誤認識となること
が多かった。
[問題点を解決するための手段]
上記問題点は、i系の音声入力があったとき、i系の単
語であることを判断する手段を設け、i系の単語と判断
したときは、音声区間検出しきい値のレベルを下げて音
声認識を行うよう構成した本発明によって達成される。
語であることを判断する手段を設け、i系の単語と判断
したときは、音声区間検出しきい値のレベルを下げて音
声認識を行うよう構成した本発明によって達成される。
また、i系判断手段としては、音声パワーが最大である
フレームのケプストラム・データにおいて、2次/3次
/4次のデータの合計値を指定した一定値と比較し、こ
れを越えたことによってi系単語と判断するものである
。
フレームのケプストラム・データにおいて、2次/3次
/4次のデータの合計値を指定した一定値と比較し、こ
れを越えたことによってi系単語と判断するものである
。
これは本発明者が、ケプストラム・データにおける、2
次73次/4次データの合計値を調べた結果、i系の音
声においては他の音声に比べて格段に大きいことを確認
したことによってなされたものである。
次73次/4次データの合計値を調べた結果、i系の音
声においては他の音声に比べて格段に大きいことを確認
したことによってなされたものである。
[作用コ
上記手段によって、音声パワーの低いi系の音声が入力
されたときは、i系判断手段によって、i系の単語であ
ることを判断して、音声区間検出しきい値を下げて音声
認識処理を行うことによって、誤認識を減少することが
可能となる。
されたときは、i系判断手段によって、i系の単語であ
ることを判断して、音声区間検出しきい値を下げて音声
認識処理を行うことによって、誤認識を減少することが
可能となる。
[実施例]
以下第1図に示す実施例によって、本発明の要旨を具体
的に説明する。図において、符号1〜6は前記第2図と
同一の対象物を示し、7はi系判定部、8はしきい値操
作部を示す。
的に説明する。図において、符号1〜6は前記第2図と
同一の対象物を示し、7はi系判定部、8はしきい値操
作部を示す。
入力された音声信号は、前処理部1においてアナログ/
ディジタル変換され、パラメータ抽出部2において1フ
レームごとにケプストラム・データその他のパラメータ
の抽出が行われる。
ディジタル変換され、パラメータ抽出部2において1フ
レームごとにケプストラム・データその他のパラメータ
の抽出が行われる。
次いで、i系判定部7においては入力音声の最大パワー
であるフレームを検出すると、ケプストラムの2次/3
次/4次データの合計値を予め設定した基準値と比較す
ることによって、i系であるか否かを判定し、i系であ
った場合は、しきい値操作部8に信号を送り、しきい値
操作部8がらの操作によって、音声区間検出部3の音声
区間検出しきい値を、予め設定した基準に基づいて下げ
る。
であるフレームを検出すると、ケプストラムの2次/3
次/4次データの合計値を予め設定した基準値と比較す
ることによって、i系であるか否かを判定し、i系であ
った場合は、しきい値操作部8に信号を送り、しきい値
操作部8がらの操作によって、音声区間検出部3の音声
区間検出しきい値を、予め設定した基準に基づいて下げ
る。
音声区間抽出部3においては下げられた音声区間検出し
きい値によって音声区間を判定し、音声区間と判定した
とき、照合部4に特徴データを送り、照合部4において
はその特徴データと認識辞書5との比較、照合を行い、
判定部6において音声の判定を行い出力する。
きい値によって音声区間を判定し、音声区間と判定した
とき、照合部4に特徴データを送り、照合部4において
はその特徴データと認識辞書5との比較、照合を行い、
判定部6において音声の判定を行い出力する。
[発明の効果]
以上説明したように、本発明によって、音声パワーの低
いi系の音声が入力されたときも、高い認識率で認識処
理を行うことができ、その工業的効果は大きい。
いi系の音声が入力されたときも、高い認識率で認識処
理を行うことができ、その工業的効果は大きい。
第1図は本発明による音声認識装置の回路構成ブロック
図、 第2図は従来の代表的な音声認識装置の回路構成ブロッ
ク図である。 図面において、 1は前処理部、 2はパラメータ抽出部、3は音声区間
抽出部 4は照合部、 5は認識辞書、 6は判定部、 7はi系判定部、 8はしきい値操作部をそれぞれ示す
。 牟 1 図 る 芽 2 目
図、 第2図は従来の代表的な音声認識装置の回路構成ブロッ
ク図である。 図面において、 1は前処理部、 2はパラメータ抽出部、3は音声区間
抽出部 4は照合部、 5は認識辞書、 6は判定部、 7はi系判定部、 8はしきい値操作部をそれぞれ示す
。 牟 1 図 る 芽 2 目
Claims (2)
- (1)音声認識装置において、母音イを含む音声(以下
i系と略称する)入力があったとき、i系の単語である
ことを判断する手段を設け、i系の単語と判断したとき
は、音声区間検出しきい値のレヘルを下げて音声認識を
行うよう構成したことを特徴とする音声認識における音
声区間検出しきい値の補正方式。 - (2)上記のi系の単語であると判断する手段が、音声
パワーが最大であるフレーム(音声信号処理の単位時間
)のケプストラム(音声パワー・スペクトルの対数の逆
フーリエ変換)・データにおいて2次/3次/4次のデ
ータの合計値が一定値以上であることをもって判断する
ことを特徴とする特許請求の範囲第1項記載の音声認識
における音声区間検出しきい値の補正方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59116002A JPS60260096A (ja) | 1984-06-06 | 1984-06-06 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59116002A JPS60260096A (ja) | 1984-06-06 | 1984-06-06 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60260096A true JPS60260096A (ja) | 1985-12-23 |
Family
ID=14676404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59116002A Pending JPS60260096A (ja) | 1984-06-06 | 1984-06-06 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60260096A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06507507A (ja) * | 1992-02-28 | 1994-08-25 | ジュンカ、ジャン、クロード | 音声信号中の独立単語境界決定方法 |
-
1984
- 1984-06-06 JP JP59116002A patent/JPS60260096A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06507507A (ja) * | 1992-02-28 | 1994-08-25 | ジュンカ、ジャン、クロード | 音声信号中の独立単語境界決定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
JPS62217295A (ja) | 音声認識方式 | |
JPS62232691A (ja) | 音声認識装置 | |
US4856067A (en) | Speech recognition system wherein the consonantal characteristics of input utterances are extracted | |
JPS60260096A (ja) | 音声認識装置 | |
JPS584198A (ja) | 音声認識装置における標準パタ−ン登録方式 | |
JPH021317B2 (ja) | ||
JPS61180297A (ja) | 話者照合装置 | |
JPH0754434B2 (ja) | 音声認識装置 | |
JPS63306499A (ja) | 不特定話者音声認識装置 | |
JPS5936299A (ja) | 音声認識装置 | |
KR950009328B1 (ko) | 단음절단위의 음성인식방법 | |
JPH0376471B2 (ja) | ||
JPS59105697A (ja) | 音声認識装置 | |
JP2891259B2 (ja) | 音声区間検出装置 | |
JPH0316038B2 (ja) | ||
JPH0567039B2 (ja) | ||
JPS6285300A (ja) | 単語音声認識装置 | |
JPH0443277B2 (ja) | ||
JP2901976B2 (ja) | パターン照合予備選択方式 | |
JPS6173200A (ja) | 音声認識装置 | |
JPS59211098A (ja) | 音声認識装置 | |
JPS62255999A (ja) | 単語音声認識装置 | |
JPS61113099A (ja) | 音声認識装置における音声区間検出方式 | |
JPS58159598A (ja) | 単音節音声認識方式 |