JPS61200596A - 連続音声認識装置 - Google Patents
連続音声認識装置Info
- Publication number
- JPS61200596A JPS61200596A JP3773885A JP3773885A JPS61200596A JP S61200596 A JPS61200596 A JP S61200596A JP 3773885 A JP3773885 A JP 3773885A JP 3773885 A JP3773885 A JP 3773885A JP S61200596 A JPS61200596 A JP S61200596A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- consonant
- matching
- pattern
- vowels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は母音、子音および母音からなる系列を単位と
して構成された標準パターンを利用したパターン・マツ
チングに基づいて連続音声の識別を行う連続音声認識装
置に関し、とくに子音部に関連する領域に強い重みを付
して認識率を向上させようとするものである。
して構成された標準パターンを利用したパターン・マツ
チングに基づいて連続音声の識別を行う連続音声認識装
置に関し、とくに子音部に関連する領域に強い重みを付
して認識率を向上させようとするものである。
[開示の概要]
この発明の連続音声認識装置は母音、子音および母音か
らなる系列を単位として音声認識を行うに際し、子音区
間を入力特徴パターンから直接に求めておき、この子音
区間を強調する態様でパターン・マツチングを行ってい
る。この発明では前後の母音のゆらぎにうもれがちな子
音情報をより正しくに識別結果に反映させることができ
る。
らなる系列を単位として音声認識を行うに際し、子音区
間を入力特徴パターンから直接に求めておき、この子音
区間を強調する態様でパターン・マツチングを行ってい
る。この発明では前後の母音のゆらぎにうもれがちな子
音情報をより正しくに識別結果に反映させることができ
る。
[従来技術]
日本語の連続音声は子音および母音の繰り返しで構成さ
れている。たとえば「浦和」を例に挙げるとのように母
音U−子音r−母音a−子音w −母音aの構成になっ
ている。したがって、このような音声を認識するに際し
、(1)子音または母音、すなわち音素を単位として扱
う、(2)子音および母音の組み合わせ、すなわち音節
を単位として扱う、(3)母音、子音、および母音の組
み合わせを単位として扱うという3つの手法が考えられ
る。この中で(3)の方式(以後vCv方式と呼ぶ)は
、とくに連続音声において起きる調音結合の問題に対処
しやすいと考えられ、このため広く研究されている。こ
こで、調音結合とは子音の発声が連続音声中で、前後の
母音の影響をうけて変化することを指している。しかし
、このvCv方式では、その組み合わせが、拗音を含ま
ない場合でも、6通り(/a/、/i/、/u/、/e
/。
れている。たとえば「浦和」を例に挙げるとのように母
音U−子音r−母音a−子音w −母音aの構成になっ
ている。したがって、このような音声を認識するに際し
、(1)子音または母音、すなわち音素を単位として扱
う、(2)子音および母音の組み合わせ、すなわち音節
を単位として扱う、(3)母音、子音、および母音の組
み合わせを単位として扱うという3つの手法が考えられ
る。この中で(3)の方式(以後vCv方式と呼ぶ)は
、とくに連続音声において起きる調音結合の問題に対処
しやすいと考えられ、このため広く研究されている。こ
こで、調音結合とは子音の発声が連続音声中で、前後の
母音の影響をうけて変化することを指している。しかし
、このvCv方式では、その組み合わせが、拗音を含ま
ない場合でも、6通り(/a/、/i/、/u/、/e
/。
/ o / 、 / N / ) X 68単音節z4
00通りにもなるため、テンプレート登録時の話者の負
担が増大するという問題やマツチングの計算時間が増え
るという問題等が起きる。そのため、従前ではVCvテ
ンプレート全部を用いるかわりに、vCvの一部とCV
(子音および母音)との組合せを用いる方法が工夫され
てきている。すなわち、従前ではテンプレート数の削減
に注意が注がれ、認識率の向上を意図するものが少なか
った。
00通りにもなるため、テンプレート登録時の話者の負
担が増大するという問題やマツチングの計算時間が増え
るという問題等が起きる。そのため、従前ではVCvテ
ンプレート全部を用いるかわりに、vCvの一部とCV
(子音および母音)との組合せを用いる方法が工夫され
てきている。すなわち、従前ではテンプレート数の削減
に注意が注がれ、認識率の向上を意図するものが少なか
った。
なおりCv方式の詳細についてはたとえば田嶋等の「標
準パターンの重ね合わせ引き離しによる連続単語音声認
識J (PRL83−74、pp’7l−78)を参
照されたい。
準パターンの重ね合わせ引き離しによる連続単語音声認
識J (PRL83−74、pp’7l−78)を参
照されたい。
[発明が解決しようとする問題点]
本発明者等はvCv方式の連続音声認識の研究を進める
につれ、上述のようなテンプレート数が多いことに起因
する問題は今後のハードウェアの進歩により克服しうろ
ことであり、むしろ認識精度を向上させることが先決で
あるという認識をもつにいたった。この発明の目的は認
識率の向上したvCv方式の連続音声認識装置を提供す
ることにある。
につれ、上述のようなテンプレート数が多いことに起因
する問題は今後のハードウェアの進歩により克服しうろ
ことであり、むしろ認識精度を向上させることが先決で
あるという認識をもつにいたった。この発明の目的は認
識率の向上したvCv方式の連続音声認識装置を提供す
ることにある。
[問題点を解決するための手段]
この発明では以上の目的を達成するために、入力連続音
声中から子音部を検出し、この子音部に関連する領域を
強調して音声の認識を行うようにしている。
声中から子音部を検出し、この子音部に関連する領域を
強調して音声の認識を行うようにしている。
すなわち、vCv方式ではパターン・マツチングの単位
として母音、子音および母音の系列を用い、その単位に
おいて母音定常部が半分以上を占めてしまう。このため
パターンマツチングの類似度に含まれる子音の情報は少
なく、この結果、誤認識を招来するおそれがある。とく
に、 / p / */l/、/に/等、発声時間の短
かい子音ではこの傾向が顕著となる。この発明では、v
Cv方式特有の調音結合部分の情報を損うことなく、子
音部の情報を強調することにより、このような誤認識に
対処できる。
として母音、子音および母音の系列を用い、その単位に
おいて母音定常部が半分以上を占めてしまう。このため
パターンマツチングの類似度に含まれる子音の情報は少
なく、この結果、誤認識を招来するおそれがある。とく
に、 / p / */l/、/に/等、発声時間の短
かい子音ではこの傾向が顕著となる。この発明では、v
Cv方式特有の調音結合部分の情報を損うことなく、子
音部の情報を強調することにより、このような誤認識に
対処できる。
[実施例]
以下この発明の一実施例について図面を参照しながら説
明しよう。なお、この実施例では、入力連続音声から得
た入力特徴パターンを、事前知識に基づいて、複数の実
現可能な態様でvCv単位に分割しておき、そののち最
もゆう度の高い分割態様をダイナミック・プログラミン
グにより選定するようにしている。ここでは以下の説明
の理解を容易にするためにこの最適単位分割に簡単に触
れておくことにする。この単位分割の手順は以下のとお
りである。
明しよう。なお、この実施例では、入力連続音声から得
た入力特徴パターンを、事前知識に基づいて、複数の実
現可能な態様でvCv単位に分割しておき、そののち最
もゆう度の高い分割態様をダイナミック・プログラミン
グにより選定するようにしている。ここでは以下の説明
の理解を容易にするためにこの最適単位分割に簡単に触
れておくことにする。この単位分割の手順は以下のとお
りである。
(1)入力特徴パターンに含まれる母音の候補を判別し
、それらの中心点を求める。
、それらの中心点を求める。
(2)入力特徴パターンからvCv単位の切り出しを行
う。この際隣接する母音候補の中心点の間にvCvが存
在すると考えるのは合理的である。
う。この際隣接する母音候補の中心点の間にvCvが存
在すると考えるのは合理的である。
ただし半母音や子音定常部を誤って母音定常部と判別す
ることがあるので、このようなことを考慮に入れて複数
の実現可能な態様でvCv単位の切り出しを行う。
ることがあるので、このようなことを考慮に入れて複数
の実現可能な態様でvCv単位の切り出しを行う。
(3)切り出した■Cv単位と標準パターンとの間のD
Pマツチング(ダイナミック・プログラミングに基礎を
置くパターン・マツチング)を行う。この際、上述(1
)の母音候補に基づいて標準パターンを絞り込むことが
できる。
Pマツチング(ダイナミック・プログラミングに基礎を
置くパターン・マツチング)を行う。この際、上述(1
)の母音候補に基づいて標準パターンを絞り込むことが
できる。
(4)上述(2)の分割の態様のうち最もゆう度の高い
ものをダイナミック・プログラミングで求める。
ものをダイナミック・プログラミングで求める。
(5)上述(4)の最適分割で切り出されたVCv単位
に最適にマツチングした標準パターンの結果を連結して
識別結果とする。
に最適にマツチングした標準パターンの結果を連結して
識別結果とする。
さて第1図は実施例の概略を示しており、この第1図に
おいて、話者が発声した音声はマイクロフォン1により
電気信号に変換され、この信号が音響分析部2に供給さ
れる。この音声分析部2は音声信号に基づいてN次元の
特徴ベクトルの時系列al(i=1.2、・・・・L)
を生成する。この特徴ベクトル時系列alは母音候補判
定部3に供給され、ここで特徴ベクトル時系列子lが母
音定常部の特徴パターンと照合され、入力音声中の母音
候補が決定される。母音定常部の特徴パターンは標準母
音パターンストア部4にストアされている。
おいて、話者が発声した音声はマイクロフォン1により
電気信号に変換され、この信号が音響分析部2に供給さ
れる。この音声分析部2は音声信号に基づいてN次元の
特徴ベクトルの時系列al(i=1.2、・・・・L)
を生成する。この特徴ベクトル時系列alは母音候補判
定部3に供給され、ここで特徴ベクトル時系列子lが母
音定常部の特徴パターンと照合され、入力音声中の母音
候補が決定される。母音定常部の特徴パターンは標準母
音パターンストア部4にストアされている。
たとえば母音/a/、/i/、/u/、/e/。
10/、/N/の定常部からとりだした特徴ベクトルを
それら母音の各々に対し、1フレームずつストアしてお
く。この場合定常部の最も母音らしさを表わしたフレー
ムをとる必要がある。そして入力特徴パターンiいi2
、・・・・TLに対し各母音フレーム■1、v2、・・
・・、vs(それぞれ/a/。
それら母音の各々に対し、1フレームずつストアしてお
く。この場合定常部の最も母音らしさを表わしたフレー
ムをとる必要がある。そして入力特徴パターンiいi2
、・・・・TLに対し各母音フレーム■1、v2、・・
・・、vs(それぞれ/a/。
/i/、/u/、/e/、10/、/N/に対応する)
との距離d (ai、vj)(i=1.2・・・・L
及びJ=1*2+・・・・6)を求める。つぎにiフレ
ーム(i=1.2・・・・、L)の各々に対しd(at
svj)が最小となるj (即ちそれに対応する母音)
を求めておく。ただし、d (ai、vj)がどれもあ
らかじめ定めた閾値を越える時は、r該当母音なし」と
いうことにする。つまり、このときは、母音定常フレー
ムではないと思われる。
との距離d (ai、vj)(i=1.2・・・・L
及びJ=1*2+・・・・6)を求める。つぎにiフレ
ーム(i=1.2・・・・、L)の各々に対しd(at
svj)が最小となるj (即ちそれに対応する母音)
を求めておく。ただし、d (ai、vj)がどれもあ
らかじめ定めた閾値を越える時は、r該当母音なし」と
いうことにする。つまり、このときは、母音定常フレー
ムではないと思われる。
閾値をうまく決めることによって入力音声中の母音定常
部の候補が検出できる。
部の候補が検出できる。
このようにして母音候補を決定したのち、これら母音候
補の間に狭まれた入力音声ベクトル列の部分列をv1C
v21Cv2特徴ベクトル取り出し、これをvCvC億
単位マツチングに供給する。ここでVl、 V、はそれ
ぞれ先行する母音、後続の母音を示し、/a/、/i/
、/i/、/e/、10/および/N/のいずれかであ
る。なお上述したとおり、この実施例では部分列の切り
出しに柔軟性を付与しており、部分列を継続させてでき
る系列には複数個の態様があることに留意されたい。マ
ツチング部5では、とり出されたv1Cv2特徴ベクト
ルと、予め標準vCvパターンストア部6に登録されて
いるV□Cvユ標準テンプレートのベクトル列との間の
DPマツチングを行い、その結果得られた累積距離を類
似度と考える。類似度のすなわち累積距離の最も小さい
標準テンプレートが入力特徴ベクトル列の部分列を表わ
す。このような操作を各部分列について行う。
補の間に狭まれた入力音声ベクトル列の部分列をv1C
v21Cv2特徴ベクトル取り出し、これをvCvC億
単位マツチングに供給する。ここでVl、 V、はそれ
ぞれ先行する母音、後続の母音を示し、/a/、/i/
、/i/、/e/、10/および/N/のいずれかであ
る。なお上述したとおり、この実施例では部分列の切り
出しに柔軟性を付与しており、部分列を継続させてでき
る系列には複数個の態様があることに留意されたい。マ
ツチング部5では、とり出されたv1Cv2特徴ベクト
ルと、予め標準vCvパターンストア部6に登録されて
いるV□Cvユ標準テンプレートのベクトル列との間の
DPマツチングを行い、その結果得られた累積距離を類
似度と考える。類似度のすなわち累積距離の最も小さい
標準テンプレートが入力特徴ベクトル列の部分列を表わ
す。このような操作を各部分列について行う。
各部分列についてのDPマツチングの結果は最適vCv
列決定部7に順次供給されていく。ここでは各部分列を
代表する標準テンプ−レートおよびこれに関連する類似
度に基づいて最適707列を決定する、すなわち上述し
た複数の態様がある部分列の系列ごとに類似度の総和を
求め、この総和すなわち累積距離の総和が最小となるよ
うなVCv系列を認識結果とするのである。この場合に
もダイナミック・プログラミングを利用する。この認識
結果はモニタ8等に表示される。
列決定部7に順次供給されていく。ここでは各部分列を
代表する標準テンプ−レートおよびこれに関連する類似
度に基づいて最適707列を決定する、すなわち上述し
た複数の態様がある部分列の系列ごとに類似度の総和を
求め、この総和すなわち累積距離の総和が最小となるよ
うなVCv系列を認識結果とするのである。この場合に
もダイナミック・プログラミングを利用する。この認識
結果はモニタ8等に表示される。
−列として「浦和」が入力音声として発声された場合を
考えよう。これを第2図に示す、まず、母音の候補とし
て/ u / 、 /a/ 、 / o / 、 /a
/が検出される。ここでは子音/W/が/ o /とじ
て検出されたことにしている。母音候補に応じてV、
CV、の部分列、すなわちパスに対し各標準V、CV、
テンプレートのDPマツチングが行なわれる。ここでは
、バスの長さに、あらかじめ制限を設けているために、
最初の/U/と最後の/a/に関するマツチングなどは
除外される。次に、V工Cv2の部分列の継続した系列
として(パス■+パス■)、(パス■+パス■)、(パ
ス■+パス■+パス■)が候補として上げられその各々
に対し総累積距離を求め、最小となる(パス■+バス■
)が最適vCv系列として出力される。
考えよう。これを第2図に示す、まず、母音の候補とし
て/ u / 、 /a/ 、 / o / 、 /a
/が検出される。ここでは子音/W/が/ o /とじ
て検出されたことにしている。母音候補に応じてV、
CV、の部分列、すなわちパスに対し各標準V、CV、
テンプレートのDPマツチングが行なわれる。ここでは
、バスの長さに、あらかじめ制限を設けているために、
最初の/U/と最後の/a/に関するマツチングなどは
除外される。次に、V工Cv2の部分列の継続した系列
として(パス■+パス■)、(パス■+パス■)、(パ
ス■+パス■+パス■)が候補として上げられその各々
に対し総累積距離を求め、最小となる(パス■+バス■
)が最適vCv系列として出力される。
さて、次に本発明の中心課題となる子音区間決定方法お
よび重み関数について説明する。第3図は第1図のvC
vC億単位マツチングの構成を示す。第3図において、
入力音声中の71072部分列はal、ai+t、−a
j (1<i<j<L)なるN次元特徴ベクトル列で表
わされている。そして、τiは母音Vいajは母音v2
を表わす特徴ベクトル列になっていることから、al、
ajを母音テンプレートとみなして、入力音声中のV、
CV2部分列との距離をとる。つまり、d (・、・)
を特徴ベクトルの距離として、 d工(ar、 ak) dz (aj−ak) をに=1.2・・・・、Lについてすべて計算する。
よび重み関数について説明する。第3図は第1図のvC
vC億単位マツチングの構成を示す。第3図において、
入力音声中の71072部分列はal、ai+t、−a
j (1<i<j<L)なるN次元特徴ベクトル列で表
わされている。そして、τiは母音Vいajは母音v2
を表わす特徴ベクトル列になっていることから、al、
ajを母音テンプレートとみなして、入力音声中のV、
CV2部分列との距離をとる。つまり、d (・、・)
を特徴ベクトルの距離として、 d工(ar、 ak) dz (aj−ak) をに=1.2・・・・、Lについてすべて計算する。
特徴ベクトル列ai、a工や0、・・・・ajは母音V
□から子音Cへそして、さらに母音v2へと変化する特
徴ベクトルを表わしていることから、上で求めた距離d
工、d2は、まさにその変化量となっている。この2つ
の量を第4図に示す。母音から子音へ変化するところで
距離d1、d2は急に変化するため、この図に示される
特性を利用することで子音区間を検出することができる
。
□から子音Cへそして、さらに母音v2へと変化する特
徴ベクトルを表わしていることから、上で求めた距離d
工、d2は、まさにその変化量となっている。この2つ
の量を第4図に示す。母音から子音へ変化するところで
距離d1、d2は急に変化するため、この図に示される
特性を利用することで子音区間を検出することができる
。
すなわち、71072部分列を模式的に示すと第5図の
ようになる。ここで斜線領域は母音定常部、散点領域は
子音部、白抜きの領域は母音および子音の間の過渡部を
示す。母音定常部では特徴パラメータが安定しており、
このためvlの母音定常部の特徴パラメータ7にと母音
特徴パラメータ丁lとの間の距離は一定して小さく、他
方V□の母音定常部を外れて過渡部にいたるほどその特
徴パラメータakと母音特徴パラメータa1との間の距
離が大きくなる。このことはv2に対しても言える。
ようになる。ここで斜線領域は母音定常部、散点領域は
子音部、白抜きの領域は母音および子音の間の過渡部を
示す。母音定常部では特徴パラメータが安定しており、
このためvlの母音定常部の特徴パラメータ7にと母音
特徴パラメータ丁lとの間の距離は一定して小さく、他
方V□の母音定常部を外れて過渡部にいたるほどその特
徴パラメータakと母音特徴パラメータa1との間の距
離が大きくなる。このことはv2に対しても言える。
このような見地に立つと、所定のしきい値を設けて得た
点P1、P2(第4図)を子音の始点および終点と考え
る事ができる。そして、これら点P工、P2の中点Pを
子音中心とする。
点P1、P2(第4図)を子音の始点および終点と考え
る事ができる。そして、これら点P工、P2の中点Pを
子音中心とする。
つぎに重み関数について説明する。第6図はこの重み関
数を示す。この図から明らかなように。
数を示す。この図から明らかなように。
子音に関連する領域において重みが1であり、他の領域
で0になっている。この例ではvlCv2部分列の全長
を1としたとき、APを0.2、PBを0.3とするよ
うにしている。PBの方がAPより長いのは後続母音の
方が子音との調音結合が強いことを考慮したものである
。重みが1となる区間AP、PBの長さを絶対的にする
のでなく、V、CV、部分列の長さに応するようにして
いるので、重みの正規化を行う必要がない。たとえば重
み1の区間の長さを固定のものにするとVlCV。
で0になっている。この例ではvlCv2部分列の全長
を1としたとき、APを0.2、PBを0.3とするよ
うにしている。PBの方がAPより長いのは後続母音の
方が子音との調音結合が強いことを考慮したものである
。重みが1となる区間AP、PBの長さを絶対的にする
のでなく、V、CV、部分列の長さに応するようにして
いるので、重みの正規化を行う必要がない。たとえば重
み1の区間の長さを固定のものにするとVlCV。
部分列の数に応じて全系列にわたる重み1の区間が変化
してしまう。これに対し、この例のように重み1の区間
AP、PBを70072部分列の長さの0゜2倍、0.
3倍というように相対的なものとすれば、全系列にわた
る重み1の区間もたとえば全系列の0.5倍というよう
に一定のものとなり、これは部分列の個数によって変化
しない。たとえば第2図において部分列の系列として(
パスの+パス■)、(パス■+パス■)および(パス■
+パス■+パス■)が考えられるがどの系列に対しても
重みが1となる区間長は等しくなる。
してしまう。これに対し、この例のように重み1の区間
AP、PBを70072部分列の長さの0゜2倍、0.
3倍というように相対的なものとすれば、全系列にわた
る重み1の区間もたとえば全系列の0.5倍というよう
に一定のものとなり、これは部分列の個数によって変化
しない。たとえば第2図において部分列の系列として(
パスの+パス■)、(パス■+パス■)および(パス■
+パス■+パス■)が考えられるがどの系列に対しても
重みが1となる区間長は等しくなる。
この実施例にしたがって97都市名の音声認識率を求め
たところ93%となり、子音強調をしばい場合に比して
10%の向上がみられた。
たところ93%となり、子音強調をしばい場合に比して
10%の向上がみられた。
なお、上述の実施例では子音区間を判別するのに、母音
特徴パターンT□、ajと瞬時の特徴パターンakとの
距離を利用したけれども、他の手法で子音区間を判別す
るようにしてもよい。
特徴パターンT□、ajと瞬時の特徴パターンakとの
距離を利用したけれども、他の手法で子音区間を判別す
るようにしてもよい。
たとえば差分ベクトルを用いることもできる。
すなわち、入力音声中からとりだしたV工Cv2パター
ン(特徴ベクトルで表わすと11、T1゜い・・・・、
aj)において、隣りあうベクトル間の距離a (am
、akt1)Nc=i* i+1. ・、−)は第7図
に示すような形になることが知られている(山が2つに
なるか1つになるかは子音の種類による)、つまり、母
音の定常部が終り、子音へと移っていくところで距離d
(akt ak+z)は大きくなる。時間的に長い子
音/s/、/z/などでは、子音の中央部あたりで、変
化が少ないために上図のようにくぼみができる。ともか
く、このような情報を利用して子音部をみつけることが
可能である。
ン(特徴ベクトルで表わすと11、T1゜い・・・・、
aj)において、隣りあうベクトル間の距離a (am
、akt1)Nc=i* i+1. ・、−)は第7図
に示すような形になることが知られている(山が2つに
なるか1つになるかは子音の種類による)、つまり、母
音の定常部が終り、子音へと移っていくところで距離d
(akt ak+z)は大きくなる。時間的に長い子
音/s/、/z/などでは、子音の中央部あたりで、変
化が少ないために上図のようにくぼみができる。ともか
く、このような情報を利用して子音部をみつけることが
可能である。
またvCvマツチングにおけるダイナミック・プログラ
ミングの最適パス上の局所距離の分布を利用することも
できる。すなわち、入力音声中から切り出したV、CV
、パターンとあらかじめ登録しておいたviCv2標準
パターンとのDPマツチングを行なった時、その最適パ
ス上の局所距離は第8A図、第8B図に示すようになる
。入力V1Cv2パターンの子音が/p/たった時を例
に説明すると、/ p /は無声破裂音であるため/p
/。
ミングの最適パス上の局所距離の分布を利用することも
できる。すなわち、入力音声中から切り出したV、CV
、パターンとあらかじめ登録しておいたviCv2標準
パターンとのDPマツチングを行なった時、その最適パ
ス上の局所距離は第8A図、第8B図に示すようになる
。入力V1Cv2パターンの子音が/p/たった時を例
に説明すると、/ p /は無声破裂音であるため/p
/。
/l/、/に/など(7) V、 CV、テンプレート
とマツチングを行なうと第8B図のように子音部がくぼ
む。それに反し/ s / 、 / z /など種類の
異なるV1CV2テンプレートとマツチングを行なうと
第8A図のように子音部が凸部となる。このような情報
を用いて子音部を検出することができる。
とマツチングを行なうと第8B図のように子音部がくぼ
む。それに反し/ s / 、 / z /など種類の
異なるV1CV2テンプレートとマツチングを行なうと
第8A図のように子音部が凸部となる。このような情報
を用いて子音部を検出することができる。
また、上述実施例では矩形の重み関数を用いたけれども
、三角形や台形等積々の重み関数を用いてよいことはも
ちろんである。
、三角形や台形等積々の重み関数を用いてよいことはも
ちろんである。
[発明の効果]
以上説明したようにこの発明によればvCv方式の連続
音声認識において入力音声から得た入力特徴パターンか
ら子音区間を直接に検出し、この検出結果に基づいて子
音に関連のある領域に他の領域より重い重み付けを付し
てパターン・マツチングを行うようにしているので、従
前前後の母音のゆらぎにうもれがちな子音情報を良好に
用いることができ、この結果、認識率を向上させること
ができる。
音声認識において入力音声から得た入力特徴パターンか
ら子音区間を直接に検出し、この検出結果に基づいて子
音に関連のある領域に他の領域より重い重み付けを付し
てパターン・マツチングを行うようにしているので、従
前前後の母音のゆらぎにうもれがちな子音情報を良好に
用いることができ、この結果、認識率を向上させること
ができる。
第1図はこの発明の一実施例を示すブロック図。
第2図は第1図実施例における入力特徴パターンの70
7部分列への分割を説明するための図、第3図は第1図
実施例の要部を示すブロック図、第4図および第5図は
ともに第3図の子音区間検出部51を説明するための図
、第6図は第3図の重み付きDPマツチング計算部52
を説明するための図、第7図は第1図実施例の変形例を
説明するための図、第8A図および第8B図は第1図実
施例の他の変形例を説明するための図である。 1・・・・マイクロフォン、2・・・・音響分析部、3
・・・・母音侯補判定部、4・・・・標準母音パターン
・ストア部、5・・・・vCv単位マツチング部、6・
・・・標準vC■パターン・ストア部、7・・・・最適
VCv列決定部、8・・・・モニタ、51・・・・子音
区間検出部、52・・・・重み付きDPマツチング計算
部。 略同□ URAWA(浦和) 第3図 18向 第4図 第5図 第6図 vI CV2 V!向 (フレーム番号) 第7図 1b直パス上のイ立1【 最電パス上の位置
7部分列への分割を説明するための図、第3図は第1図
実施例の要部を示すブロック図、第4図および第5図は
ともに第3図の子音区間検出部51を説明するための図
、第6図は第3図の重み付きDPマツチング計算部52
を説明するための図、第7図は第1図実施例の変形例を
説明するための図、第8A図および第8B図は第1図実
施例の他の変形例を説明するための図である。 1・・・・マイクロフォン、2・・・・音響分析部、3
・・・・母音侯補判定部、4・・・・標準母音パターン
・ストア部、5・・・・vCv単位マツチング部、6・
・・・標準vC■パターン・ストア部、7・・・・最適
VCv列決定部、8・・・・モニタ、51・・・・子音
区間検出部、52・・・・重み付きDPマツチング計算
部。 略同□ URAWA(浦和) 第3図 18向 第4図 第5図 第6図 vI CV2 V!向 (フレーム番号) 第7図 1b直パス上のイ立1【 最電パス上の位置
Claims (1)
- 母音、子音および母音からなる系列を単位として標準パ
ターンを構成し、連続して発声した未知入力音声から得
られる入力特徴パターンに上記標準パターンを所望の個
数だけ継続してマッチングさせ、継続してマッチングさ
せられる上記標準パターンの系列と上記入力特徴パター
ンとの間の類似度に基づいて上記未知入力音声の識別を
行う連続音声認識装置において、上記入力特徴パターン
の中から予め子音部を検出し、この子音部に関連の強い
部分に対し他の部分より大きな重み付けを行いながら、
上記マッチングを行うことを特徴とする連続音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3773885A JPS61200596A (ja) | 1985-02-28 | 1985-02-28 | 連続音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3773885A JPS61200596A (ja) | 1985-02-28 | 1985-02-28 | 連続音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61200596A true JPS61200596A (ja) | 1986-09-05 |
Family
ID=12505825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3773885A Pending JPS61200596A (ja) | 1985-02-28 | 1985-02-28 | 連続音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61200596A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013190473A (ja) * | 2012-03-12 | 2013-09-26 | Brother Ind Ltd | 発声特定装置、プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS52101902A (en) * | 1976-02-20 | 1977-08-26 | Nec Corp | Continuous sound recognizing device |
JPS5756898A (en) * | 1980-09-22 | 1982-04-05 | Tokyo Shibaura Electric Co | Voice recognition device |
JPS59198A (ja) * | 1982-06-25 | 1984-01-05 | 中川 聖一 | パタ−ン比較装置 |
-
1985
- 1985-02-28 JP JP3773885A patent/JPS61200596A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS52101902A (en) * | 1976-02-20 | 1977-08-26 | Nec Corp | Continuous sound recognizing device |
JPS5756898A (en) * | 1980-09-22 | 1982-04-05 | Tokyo Shibaura Electric Co | Voice recognition device |
JPS59198A (ja) * | 1982-06-25 | 1984-01-05 | 中川 聖一 | パタ−ン比較装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013190473A (ja) * | 2012-03-12 | 2013-09-26 | Brother Ind Ltd | 発声特定装置、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0319140B1 (en) | Speech recognition | |
EP0109190B1 (en) | Monosyllable recognition apparatus | |
EP0103258B1 (en) | Pattern matching apparatus | |
JPS61200596A (ja) | 連続音声認識装置 | |
JPH0247758B2 (ja) | ||
JPH0361957B2 (ja) | ||
JP2547541B2 (ja) | 単音節音声認識装置 | |
JPS63148299A (ja) | 単語音声認識方法および装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JPS6346499A (ja) | 大語▲い▼単語音声認識方式 | |
JPH0320759B2 (ja) | ||
JPH0632006B2 (ja) | 音声認識装置 | |
JPH0668679B2 (ja) | パタンマッチング装置 | |
JPS6310840B2 (ja) | ||
JPH06100919B2 (ja) | 音声認識装置 | |
JPS6247100A (ja) | 音声認識装置 | |
JPS6027000A (ja) | パタンマツチング方法 | |
JPH07104680B2 (ja) | パタンマツチング装置 | |
JPS6175982A (ja) | パタン認識装置 | |
JPH067359B2 (ja) | 音声認識装置 | |
JPH0534677B2 (ja) | ||
JPS5926800A (ja) | 音声認識装置 | |
JPS63223694A (ja) | 単音節登録・認識方式 | |
JPS6147994A (ja) | 音声認識方式 | |
JPS60150098A (ja) | 音声認識装置 |