JPS58159598A - 単音節音声認識方式 - Google Patents
単音節音声認識方式Info
- Publication number
- JPS58159598A JPS58159598A JP57033345A JP3334582A JPS58159598A JP S58159598 A JPS58159598 A JP S58159598A JP 57033345 A JP57033345 A JP 57033345A JP 3334582 A JP3334582 A JP 3334582A JP S58159598 A JPS58159598 A JP S58159598A
- Authority
- JP
- Japan
- Prior art keywords
- monosyllabic
- speech
- verification
- candidates
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(a) 発明の技術分野
音声を認識させる単音節音声認識方式に関する。
(b) 技術の背景
認識する場合、認w&誤りの少い音声認識装置の出現が
望まれている。音声認識方式は主として話者の単音節音
声を予め特徴パラメータに変換して記憶させておき、未
知入力単音節音声の特徴パラメータと予め記憶させた特
徴パラメータとを照合して最も似ているものを該当する
単音節音声として認識するものであるが、同じ単音節音
声でも発声の仕方では特徴パラメータは変化し、例え同
一単音節音声を何回か発声方法を変えて登録しておいて
も誤りを零にすることは困難である。特に認識誤りを生
じ易い特徴パラメータを有する単音節音声は照合方法を
考慮しないと認識率の向上を計ることが出来ない。この
ため予め登録しである総ての単音節音声と話者の単音節
音声とを照合した後、該照合結果に基づき未知入力単音
節音声に最も似ている単音節音声から順に順次複数の再
照合候補り未知入力単音節音声と該複数の再照合候補と
を式が提案されているoしかし上記再照合方式には改善
の余地がありその対策が望壕れている。
望まれている。音声認識方式は主として話者の単音節音
声を予め特徴パラメータに変換して記憶させておき、未
知入力単音節音声の特徴パラメータと予め記憶させた特
徴パラメータとを照合して最も似ているものを該当する
単音節音声として認識するものであるが、同じ単音節音
声でも発声の仕方では特徴パラメータは変化し、例え同
一単音節音声を何回か発声方法を変えて登録しておいて
も誤りを零にすることは困難である。特に認識誤りを生
じ易い特徴パラメータを有する単音節音声は照合方法を
考慮しないと認識率の向上を計ることが出来ない。この
ため予め登録しである総ての単音節音声と話者の単音節
音声とを照合した後、該照合結果に基づき未知入力単音
節音声に最も似ている単音節音声から順に順次複数の再
照合候補り未知入力単音節音声と該複数の再照合候補と
を式が提案されているoしかし上記再照合方式には改善
の余地がありその対策が望壕れている。
(C) 発明の目的
本発明の目的は上記要望に基づき上記再照合方式の単音
節音声認識方式に於て、再照合候補の数を絞って再照合
に要する時間を短縮すると共に装置の構成を簡易化し経
済性の向上を計るものである0 (d) 発明の構成 本発明の構成は予め単音節音声を登録しておき、未知入
力単音節音声の%徴パラメータと予め登録された総ての
単音節音声の特徴パラメータをDP照合して最も良く似
ているものから上位順に順次複数の再照合候補を該登録
済単音節音声より選別し、該複数の再照合候補の組合せ
に応じて定まる再照合パラメータにより未知入力単音節
音声と該再照合候補とを再照合して、その結果最も良く
似ている再照合候補を該当単音節音声として認識するが
、該複数の再照合候補を選別する際にDP照合時の類似
度が比較的太きく計算され易い再照合候補には大きな閾
値を与え、比較的小さく計算され易い再照合候補には小
さな閾値を与えて選別し7、該閾値以下の再照合候補は
除外する様にしたものである。
節音声認識方式に於て、再照合候補の数を絞って再照合
に要する時間を短縮すると共に装置の構成を簡易化し経
済性の向上を計るものである0 (d) 発明の構成 本発明の構成は予め単音節音声を登録しておき、未知入
力単音節音声の%徴パラメータと予め登録された総ての
単音節音声の特徴パラメータをDP照合して最も良く似
ているものから上位順に順次複数の再照合候補を該登録
済単音節音声より選別し、該複数の再照合候補の組合せ
に応じて定まる再照合パラメータにより未知入力単音節
音声と該再照合候補とを再照合して、その結果最も良く
似ている再照合候補を該当単音節音声として認識するが
、該複数の再照合候補を選別する際にDP照合時の類似
度が比較的太きく計算され易い再照合候補には大きな閾
値を与え、比較的小さく計算され易い再照合候補には小
さな閾値を与えて選別し7、該閾値以下の再照合候補は
除外する様にしたものである。
(e) 発明の実施例
図は本発明の一実施例を示す回路のブロック図である。
先ず話者は予め単音節音声を登録するため制御部8の制
御により切替部3をパラメータ格納部4に接続し、単音
節音声を入力より加える。
御により切替部3をパラメータ格納部4に接続し、単音
節音声を入力より加える。
前処理部1け音声レベル調整及びアナログディジタル変
換等を行ないパラメータ抽出部2へ送出し、パラメータ
抽出部2は前記単音節音声の特徴パラメータを抽出しパ
ラメータ格納部4へ格納スる0次に単音節音声の認識を
行なわせるため、話者は制御部8の制御に工−り切替部
3を記憶部5へ接続し、単音節音声を発声する。前記同
様の動作により前処理部1、パラメータ抽出部2、切替
部3を経て記憶部5へ入った未知入力単音節音声の特徴
パラメータは制御部8の制御によりパラメータ格納部4
に格納されている全単音節音声の特徴パラ3− メータと照合部6に於てDP照合され、該全単音節音声
の特徴パラメー・夕中で最も良く似た特徴パラメータを
持つ単音節音声が再照合の第一候補として選出され、続
いて順次複数の再照合候補が選出され判定′@S7へ送
られる。判定部7では照合部6で計算される未知入力単
音節音声と再照合候補との距離により類似度を判定する
0即ち照合部6で前記第一候補として選出された再照合
候補で予め定められている閾値、又は前記複数の再照合
候補の組合せにより予め定められている閾値と比較し、
前記距離の計算値が大きく類似度が非常に小さくて未知
入力単音節音声と判定され得る可能性が殆どない前記再
照合候補は除外し、残された再照合候補のみ制御部8へ
送出する。制御部8は該再照合候補に和尚する特徴パラ
メータをパラメータ格納部4より乗算器10へ、記憶部
5に入っている未知入力単音節音声の特徴パラメータを
乗算器11へ夫々送出させ、判定部7は該再照合候補に
より定まる再照合パラメータ、即ち再照合候補4− 送出させる0又判定部7は該再照合候補に応じて定まる
最適の照合区間を決定するパラメータである閾値を閾値
記憶部13より再照合部9へ送出させる。再照合部9は
乗算器10.11の出力と該閾値記憶部13よりの閾値
とにより再照合する。前記第一候補より順に複数の再照
合候補が未知入力単音節音声と再照合され最も良く似た
再照合候補が認識結果として制御部8よQ出力へ送出さ
れる〇若し前記類似度の判定により再照合候補が第一候
補のみで第二位以下が総て除外された場合、制御部8は
再照合動作を行なわせることなく第一候補を認識結果と
して出力に送出する。
換等を行ないパラメータ抽出部2へ送出し、パラメータ
抽出部2は前記単音節音声の特徴パラメータを抽出しパ
ラメータ格納部4へ格納スる0次に単音節音声の認識を
行なわせるため、話者は制御部8の制御に工−り切替部
3を記憶部5へ接続し、単音節音声を発声する。前記同
様の動作により前処理部1、パラメータ抽出部2、切替
部3を経て記憶部5へ入った未知入力単音節音声の特徴
パラメータは制御部8の制御によりパラメータ格納部4
に格納されている全単音節音声の特徴パラ3− メータと照合部6に於てDP照合され、該全単音節音声
の特徴パラメー・夕中で最も良く似た特徴パラメータを
持つ単音節音声が再照合の第一候補として選出され、続
いて順次複数の再照合候補が選出され判定′@S7へ送
られる。判定部7では照合部6で計算される未知入力単
音節音声と再照合候補との距離により類似度を判定する
0即ち照合部6で前記第一候補として選出された再照合
候補で予め定められている閾値、又は前記複数の再照合
候補の組合せにより予め定められている閾値と比較し、
前記距離の計算値が大きく類似度が非常に小さくて未知
入力単音節音声と判定され得る可能性が殆どない前記再
照合候補は除外し、残された再照合候補のみ制御部8へ
送出する。制御部8は該再照合候補に和尚する特徴パラ
メータをパラメータ格納部4より乗算器10へ、記憶部
5に入っている未知入力単音節音声の特徴パラメータを
乗算器11へ夫々送出させ、判定部7は該再照合候補に
より定まる再照合パラメータ、即ち再照合候補4− 送出させる0又判定部7は該再照合候補に応じて定まる
最適の照合区間を決定するパラメータである閾値を閾値
記憶部13より再照合部9へ送出させる。再照合部9は
乗算器10.11の出力と該閾値記憶部13よりの閾値
とにより再照合する。前記第一候補より順に複数の再照
合候補が未知入力単音節音声と再照合され最も良く似た
再照合候補が認識結果として制御部8よQ出力へ送出さ
れる〇若し前記類似度の判定により再照合候補が第一候
補のみで第二位以下が総て除外された場合、制御部8は
再照合動作を行なわせることなく第一候補を認識結果と
して出力に送出する。
(f) 発明の詳細
な説明した如く本発明は再照合方式を用いる単音節音声
認識方式に於て、再照合候補の数を絞って再照合に要す
る時間を短縮し、且つ再照合動作に関連する構成機器を
簡易化することが可能でけ大なるものがある。
認識方式に於て、再照合候補の数を絞って再照合に要す
る時間を短縮し、且つ再照合動作に関連する構成機器を
簡易化することが可能でけ大なるものがある。
図は本発明の一実施例を示す回路のブロック図である。
14−1.前処理部、2はパラメータ抽出部、3に′i
切替部、4はパラメータ格納部、5は記憶部、6は照合
部、7は判定部、8は制御部、9は再照合部、10.1
1乗算器、12は周波数ウェイト記憶部、13け閾値記
憶部である。
切替部、4はパラメータ格納部、5は記憶部、6は照合
部、7は判定部、8は制御部、9は再照合部、10.1
1乗算器、12は周波数ウェイト記憶部、13け閾値記
憶部である。
Claims (1)
- 予め登録された総ての単音節音声と未知入力単音節音声
とを照合した後、該照合結果に基づき複数の再照合候補
を登録済の単音節音声より選出し、該再照合候補の組合
せごとに再照合パラメータを選定して未知入力単音節音
声と再照合する音声認識装置に於て、前記再照合候補を
所定の数だけ選出する際に類似度が予め該再照合候補ご
とに定められた閾値以下のものは除外することを特徴と
する単音節音声認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57033345A JPS58159598A (ja) | 1982-03-03 | 1982-03-03 | 単音節音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57033345A JPS58159598A (ja) | 1982-03-03 | 1982-03-03 | 単音節音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58159598A true JPS58159598A (ja) | 1983-09-21 |
Family
ID=12383973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57033345A Pending JPS58159598A (ja) | 1982-03-03 | 1982-03-03 | 単音節音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58159598A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59204896A (ja) * | 1983-05-09 | 1984-11-20 | カシオ計算機株式会社 | 音声認識における候補選定方法 |
JPS6340200A (ja) * | 1986-08-06 | 1988-02-20 | 日本電信電話株式会社 | 単語音声予備選択装置 |
-
1982
- 1982-03-03 JP JP57033345A patent/JPS58159598A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59204896A (ja) * | 1983-05-09 | 1984-11-20 | カシオ計算機株式会社 | 音声認識における候補選定方法 |
JPH0354359B2 (ja) * | 1983-05-09 | 1991-08-19 | ||
JPS6340200A (ja) * | 1986-08-06 | 1988-02-20 | 日本電信電話株式会社 | 単語音声予備選択装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6751595B2 (en) | Multi-stage large vocabulary speech recognition system and method | |
US8731925B2 (en) | Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack | |
US7050973B2 (en) | Speaker recognition using dynamic time warp template spotting | |
Dey et al. | Exploiting sequence information for text-dependent speaker verification | |
JPS58159598A (ja) | 単音節音声認識方式 | |
US7085718B2 (en) | Method for speaker-identification using application speech | |
JP2853418B2 (ja) | 音声認識方法 | |
JP2000099090A (ja) | 記号列を用いた話者認識方法 | |
JP2001265387A (ja) | 話者照合装置及び方法 | |
JPH0119599B2 (ja) | ||
JPS58159599A (ja) | 単音節音声認識方式 | |
JP3100208B2 (ja) | 音声認識装置 | |
JPS58159597A (ja) | 単音節音声認識方式 | |
JPS5934595A (ja) | 音声認識処理方式 | |
JP2989231B2 (ja) | 音声認識装置 | |
JP3291073B2 (ja) | 音声認識方式 | |
JPS58159595A (ja) | 単音節音声認識方式 | |
JPS62255999A (ja) | 単語音声認識装置 | |
JPH1185182A (ja) | 話者認識方法及び装置 | |
JPS58159590A (ja) | 単音節音声認識方式 | |
JP2655637B2 (ja) | 音声パターン照合方式 | |
JPS6131878B2 (ja) | ||
JPH0469959B2 (ja) | ||
JPS60147797A (ja) | 音声認識装置 | |
JPS607492A (ja) | 単音節音声認識方式 |