JPS63259598A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS63259598A JPS63259598A JP62093613A JP9361387A JPS63259598A JP S63259598 A JPS63259598 A JP S63259598A JP 62093613 A JP62093613 A JP 62093613A JP 9361387 A JP9361387 A JP 9361387A JP S63259598 A JPS63259598 A JP S63259598A
- Authority
- JP
- Japan
- Prior art keywords
- distance
- cumulative
- input
- speech
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001186 cumulative effect Effects 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、標準パターンと入力音声パターンとのパター
ンマツチングにより認識結果を導き出す音声認識装置に
関するものである。
ンマツチングにより認識結果を導き出す音声認識装置に
関するものである。
従来の技術
一般に、音声認識装置では、入力音声パターンと辞書に
蓄えられた各標準パターンとの類似度を計算し、類似度
の最大となる標準パターンを認識結果とする方法が行な
われている。
蓄えられた各標準パターンとの類似度を計算し、類似度
の最大となる標準パターンを認識結果とする方法が行な
われている。
以下図面を参照しながら、従来の音声認識装置の一例に
ついて説明する。第3図は従来の音声認識装置の一例を
示すブロック図である。第3図において、31は入力音
声を分析する音声分析部、32は入力音声の特徴ベクト
ルの時系列を記憶する入力パターンメモリ、33は標準
パターンの特徴ベクトルの時系列を記憶する標準パター
ンメモリ、34は入力音声と各標準パターン間の距離を
計算する累積距離計算部、36は認識候補音声を導き出
す認識結果判定部である。
ついて説明する。第3図は従来の音声認識装置の一例を
示すブロック図である。第3図において、31は入力音
声を分析する音声分析部、32は入力音声の特徴ベクト
ルの時系列を記憶する入力パターンメモリ、33は標準
パターンの特徴ベクトルの時系列を記憶する標準パター
ンメモリ、34は入力音声と各標準パターン間の距離を
計算する累積距離計算部、36は認識候補音声を導き出
す認識結果判定部である。
以上のように構成された音声認識装置について以下その
動作を説明する。
動作を説明する。
まず、入力された音声は音声分析部31で特徴ベクトル
の時系列に変換され入力パターンメモリ32に記憶され
る。次に累積距離計算部34で入力音声と標準パターン
メモリ33に記憶された各標準パターンとの間で両者間
の距離を計算し、認識結果判定部35で得られた距離値
の中で最小値を与える標準パターンを認識候補音声とし
て出力する。
の時系列に変換され入力パターンメモリ32に記憶され
る。次に累積距離計算部34で入力音声と標準パターン
メモリ33に記憶された各標準パターンとの間で両者間
の距離を計算し、認識結果判定部35で得られた距離値
の中で最小値を与える標準パターンを認識候補音声とし
て出力する。
発明が解決しようとする問題点
しかしながら上記の音声認識装置では、入力音声と標準
パターン全てとの間で入力音声の最終フレームまで距離
計算を行わなければならず、特に動的計画法を用いたパ
ターンマツチングを行う場合には累積距離計算に多くの
時間を費やし、標準パターンが増大すると実時間処理が
難しくなるという間7頂点を有していた。
パターン全てとの間で入力音声の最終フレームまで距離
計算を行わなければならず、特に動的計画法を用いたパ
ターンマツチングを行う場合には累積距離計算に多くの
時間を費やし、標準パターンが増大すると実時間処理が
難しくなるという間7頂点を有していた。
本発明は上記問題点に鑑み、認識性能はそのままでパタ
ーンマツチングに要する処理時間を大幅に短縮できる音
声認識装置を提供するものである。
ーンマツチングに要する処理時間を大幅に短縮できる音
声認識装置を提供するものである。
問題点を解決するだめの手段
上記問題点を解決するために本発明の音声認識装置は入
力音声から特徴ベクトルの時系列を出力する音声分析部
と、入力音声の各フレームごとに標準パターンとの累積
距離を計算する累積距離計算部と、累積距離計算部で得
られた整合窓内の累積距離がすべて、これまでに得ら庇
た最小累積距離と予め与えられたしきい値との最小値を
超えた時点で距離計算を中止し次の標準パターンとの距
離計算に移る距離比較部と、最後まで計算された標準パ
ターンとその距離値を記憶する最小距離記憶部とを備え
たものである。
力音声から特徴ベクトルの時系列を出力する音声分析部
と、入力音声の各フレームごとに標準パターンとの累積
距離を計算する累積距離計算部と、累積距離計算部で得
られた整合窓内の累積距離がすべて、これまでに得ら庇
た最小累積距離と予め与えられたしきい値との最小値を
超えた時点で距離計算を中止し次の標準パターンとの距
離計算に移る距離比較部と、最後まで計算された標準パ
ターンとその距離値を記憶する最小距離記憶部とを備え
たものである。
作 用
本発明は上記に述べた構成によって、入力音声の各フレ
ームごとに、得られた距離値が、現在までの最小累積距
離値と最初に与えられたしきい値の小さい方の値を超え
た時点で距離計算を中止し次の標準パターンとの距離計
算に移り、また入力音声の最終フレームまで計算された
標準パターンとその距離値を最小距離としてそのつど記
憶することにより、すべての標準パターンと最後まで距
・イf計算を行う必要がなく、またすべての標準パター
ンとの処理が終了した時点で認識結果が得られることに
なり、認識処理に要する時間を大幅に短縮できる音声認
識装置を提供することができる。
ームごとに、得られた距離値が、現在までの最小累積距
離値と最初に与えられたしきい値の小さい方の値を超え
た時点で距離計算を中止し次の標準パターンとの距離計
算に移り、また入力音声の最終フレームまで計算された
標準パターンとその距離値を最小距離としてそのつど記
憶することにより、すべての標準パターンと最後まで距
・イf計算を行う必要がなく、またすべての標準パター
ンとの処理が終了した時点で認識結果が得られることに
なり、認識処理に要する時間を大幅に短縮できる音声認
識装置を提供することができる。
実施例
以下本発明の一実施例の音声認識装置について、図面を
参照しながら説明する。
参照しながら説明する。
第1図は本発明の一実施例における音声認識装置のブロ
ック図である。第1図において、1は音声分析部で、入
力された音声を分析し特徴ベクトルの時系列に変換する
。2は音声分析部1で得られた入力音声の特徴ベクトル
の時系列を記憶する入力パターンメモリ、3はあらかじ
め登録音声の特徴ベクトルの時系列を記憶しておく標準
パターンメモリである。4は入力音声の各フレームごと
に標準パターンとの累積距離を計算する累積距離計算部
、5は入力音声の現在のフレームでの距離値と、これま
での最小累積距離値と前もって与えられている距離しき
い値の小さい方の値とを比較し、距離計算を続行するか
どうかを判定する距離比較部、6はこれまでに得られた
最小距離値とその距離値を与える標準パターンを記憶す
る最小距離記憶部、7は累積距離計算を途中で中止する
かを判定するために予め設定された距離しきい値を記憶
するしきい値記憶部、8は入力パターンメモリ2、標準
パターンメモリ3、累積距離計算部4、距離比較部6、
最小距離記憶部6、しきい値記憶部7の動作を制御する
制御部である。
ック図である。第1図において、1は音声分析部で、入
力された音声を分析し特徴ベクトルの時系列に変換する
。2は音声分析部1で得られた入力音声の特徴ベクトル
の時系列を記憶する入力パターンメモリ、3はあらかじ
め登録音声の特徴ベクトルの時系列を記憶しておく標準
パターンメモリである。4は入力音声の各フレームごと
に標準パターンとの累積距離を計算する累積距離計算部
、5は入力音声の現在のフレームでの距離値と、これま
での最小累積距離値と前もって与えられている距離しき
い値の小さい方の値とを比較し、距離計算を続行するか
どうかを判定する距離比較部、6はこれまでに得られた
最小距離値とその距離値を与える標準パターンを記憶す
る最小距離記憶部、7は累積距離計算を途中で中止する
かを判定するために予め設定された距離しきい値を記憶
するしきい値記憶部、8は入力パターンメモリ2、標準
パターンメモリ3、累積距離計算部4、距離比較部6、
最小距離記憶部6、しきい値記憶部7の動作を制御する
制御部である。
第2図は第1図の音声認識装置の動作概念を説明する為
の図である。
の図である。
以上のように構成された音声認識装置について、以下第
1図及び第2図を用いてその動作を詳細に説明する。
1図及び第2図を用いてその動作を詳細に説明する。
まず、マイクロホン等を通して入力された音声は音声分
析部1に入力され特徴ベクトルの時系列(例えば、10
次元の線形予測係数)に変換された後、入力パターンメ
モリ2に記憶される。次に入力パターンメモリ2に記憶
された入力音声と標準パターンメモリ3に記憶された標
準パターンとの間でパターンマツチングを開始する。
析部1に入力され特徴ベクトルの時系列(例えば、10
次元の線形予測係数)に変換された後、入力パターンメ
モリ2に記憶される。次に入力パターンメモリ2に記憶
された入力音声と標準パターンメモリ3に記憶された標
準パターンとの間でパターンマツチングを開始する。
なお予め累積距離のしきい値S1の値がしきい値記憶部
7に記憶されている。Slの値は、累積距離値がこれ以
上になると類似度が小さいため、この時の標準パターン
は認識結果ではありえないことを判定するため予め与え
られた距離性のしきい値である。
7に記憶されている。Slの値は、累積距離値がこれ以
上になると類似度が小さいため、この時の標準パターン
は認識結果ではありえないことを判定するため予め与え
られた距離性のしきい値である。
始めに最小距離記憶部6に最小距離の初期値として非常
に大きな値をセットする。即ち最小距離値を52として S2=■ とする。さらに 5=81とする。(SはSlと52と
の最小値である。) その後書標準パターンと入力パターンの第1フレームか
ら順番に累積距離計算部4で距離を計算する。
に大きな値をセットする。即ち最小距離値を52として S2=■ とする。さらに 5=81とする。(SはSlと52と
の最小値である。) その後書標準パターンと入力パターンの第1フレームか
ら順番に累積距離計算部4で距離を計算する。
ここで入力音声のフレーム長を工、現在処理を行ってい
る標準パターンのフレーム長を1、パターンマツチング
を行う整合窓の幅をRとし、またパターンマツチング処
理は現在入力音声の第1フレーム1で進んできているも
のとする。これらの様子は第2図に示しである。距離計
算のだめの漸化式は第2図のDPババス代表されるよう
な非対称型のものを使用する。
る標準パターンのフレーム長を1、パターンマツチング
を行う整合窓の幅をRとし、またパターンマツチング処
理は現在入力音声の第1フレーム1で進んできているも
のとする。これらの様子は第2図に示しである。距離計
算のだめの漸化式は第2図のDPババス代表されるよう
な非対称型のものを使用する。
まず累積距離計算部4で入力音声の第1フレームについ
て整合窓@R内の累積距離を計算する。
て整合窓@R内の累積距離を計算する。
ここで得られた各距離値をDl、D2.・・・・・−・
・DR(第2図で斜線内の各点での累積距離)とする。
・DR(第2図で斜線内の各点での累積距離)とする。
次に距離比較部5で、累積距離計算部4で得られた各累
積距離値とSとを比較し、 DK(K=1、・・・・・・・・R):)S ・山
・・・・・(1)の条件を満足するとこれ以降のパター
ンマツチング処理を中断し、次の標準パターンとのマツ
チング処理に移る。(1)式の条件を満たさなければ、
入力音声の第i+1フレーム以降について同様の処理を
続ける。
積距離値とSとを比較し、 DK(K=1、・・・・・・・・R):)S ・山
・・・・・(1)の条件を満足するとこれ以降のパター
ンマツチング処理を中断し、次の標準パターンとのマツ
チング処理に移る。(1)式の条件を満たさなければ、
入力音声の第i+1フレーム以降について同様の処理を
続ける。
また(1)式の条件を満たさずに入力音声の最終フレー
ム1まで処理を完了したときは、得られた累積距離値は
これまでの最小距離値を与えることになるので、その距
離値及びその距離値を与える標準パターンを最小距離記
憶部6に記憶させS2の値を更新する。さらにSlと8
2の値を比較し、小さい方の値をSとする。
ム1まで処理を完了したときは、得られた累積距離値は
これまでの最小距離値を与えることになるので、その距
離値及びその距離値を与える標準パターンを最小距離記
憶部6に記憶させS2の値を更新する。さらにSlと8
2の値を比較し、小さい方の値をSとする。
上記の処理を標準パターンメモリ3に記憶されたすべて
の標準パターンについて処理し終わると、その時に得ら
れている最小距離記憶部6の82の距離値を与える標準
パターンを認識候補音声として、制御部γから外部に出
力する。
の標準パターンについて処理し終わると、その時に得ら
れている最小距離記憶部6の82の距離値を与える標準
パターンを認識候補音声として、制御部γから外部に出
力する。
以上のように本実施例によれば、入力音声の各フレーム
ごとに標準パターンとの累積距離を計算する累積距離計
算部4と、現在まで処理し終わった標準パターンのうち
最小距離を与える標準パターンとその距離値を記憶する
最小距離記憶部6と、累積距離計算部4で得られた整合
窓幅内の累積距離と予め与えられた距離しきい値を超え
た時点でマツチング処理を中断する距離比較部5とを設
けたことにより、すべての標準パターンと入力音声の最
終7レームまで処理をする必要がなく、パターンマツチ
ングに要する処理時間を大幅に短縮することかできる。
ごとに標準パターンとの累積距離を計算する累積距離計
算部4と、現在まで処理し終わった標準パターンのうち
最小距離を与える標準パターンとその距離値を記憶する
最小距離記憶部6と、累積距離計算部4で得られた整合
窓幅内の累積距離と予め与えられた距離しきい値を超え
た時点でマツチング処理を中断する距離比較部5とを設
けたことにより、すべての標準パターンと入力音声の最
終7レームまで処理をする必要がなく、パターンマツチ
ングに要する処理時間を大幅に短縮することかできる。
発明の効果
以上のように本発明は入力音声の特徴ベクトルの時系列
を出力する音声分析部と、入力音声の各フレームごとに
整合窓幅分の標準パターンとの累積距離を計算する累積
距離計算部と、累積距離計算部で得られた整合窓内の累
積距離がすべて、現在までに得られている最小累積距離
と予め与えられている距離しきい値との最小値を超えた
時点でマツチング処理を中断し次の標準パターンとの距
離計算に移る距離比較部と、距離比較部で処理を中断せ
ずに最後まで計算された標準パターンとその累積距離値
を現在までの最小距離値として記憶する最小距離記憶部
とを設けることにより、登録された全標準パターンと入
力音声の最終フレームまで距離計算を行う必要がなく、
まだ全標準パターンとのパターンマツチング処理が終了
した時点で最小距離を与える標準パターンが既に最小距
離記憶部に得られることになり、パターンマツチングに
要する時間を大幅に短縮でき標準パターンが増加しても
実時間処理に十分に耐えうる音声認識装置を提供するこ
とができる。
を出力する音声分析部と、入力音声の各フレームごとに
整合窓幅分の標準パターンとの累積距離を計算する累積
距離計算部と、累積距離計算部で得られた整合窓内の累
積距離がすべて、現在までに得られている最小累積距離
と予め与えられている距離しきい値との最小値を超えた
時点でマツチング処理を中断し次の標準パターンとの距
離計算に移る距離比較部と、距離比較部で処理を中断せ
ずに最後まで計算された標準パターンとその累積距離値
を現在までの最小距離値として記憶する最小距離記憶部
とを設けることにより、登録された全標準パターンと入
力音声の最終フレームまで距離計算を行う必要がなく、
まだ全標準パターンとのパターンマツチング処理が終了
した時点で最小距離を与える標準パターンが既に最小距
離記憶部に得られることになり、パターンマツチングに
要する時間を大幅に短縮でき標準パターンが増加しても
実時間処理に十分に耐えうる音声認識装置を提供するこ
とができる。
第1図は本発明の一実施例における音声認識装置の構成
を示すブロック図、第2図は第1図の処理概念を説明す
るだめの状態図、第3図は従来の音声認識装置の構成を
示すブロック図である。 1・・・・・・音声分析部、2・・・・・・入力パター
ンメモリ、3・・・・・標準パターンメモリ、4・・・
・・・累積距離計算部、5・・・・・・距離比較部、6
・・・・・・最小距離記憶部、7・・・・・・しきい値
記憶部、8・・・・・・制御部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名りト ー くPゆ七瓢 w& 串状やく
を示すブロック図、第2図は第1図の処理概念を説明す
るだめの状態図、第3図は従来の音声認識装置の構成を
示すブロック図である。 1・・・・・・音声分析部、2・・・・・・入力パター
ンメモリ、3・・・・・標準パターンメモリ、4・・・
・・・累積距離計算部、5・・・・・・距離比較部、6
・・・・・・最小距離記憶部、7・・・・・・しきい値
記憶部、8・・・・・・制御部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名りト ー くPゆ七瓢 w& 串状やく
Claims (1)
- 入力音声から特徴ベクトルの時系列を出力する音声分析
部と、前記音声分析部で分析された入力音声パターンと
あらかじめメモリに記憶された各標準パターンとの累積
距離を入力パターンの各フレームごとに計算する累積距
離計算部と、前記累積距離計算部で得られた整合窓内の
累積距離値が、これまでに得られた最小累積距離とあら
かじめ与えられたしきい値との小さい方の値をすべて超
えた時点で累積距離計算を中止する距離比較部と、前記
距離比較部で距離計算を中止されずに入力音声の最終フ
レームまで処理を終了した標準パターンと、その時の距
離値を現在までの最小距離として更新し記憶する最小距
離記憶部とを備えたことを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62093613A JPS63259598A (ja) | 1987-04-16 | 1987-04-16 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62093613A JPS63259598A (ja) | 1987-04-16 | 1987-04-16 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63259598A true JPS63259598A (ja) | 1988-10-26 |
Family
ID=14087180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62093613A Pending JPS63259598A (ja) | 1987-04-16 | 1987-04-16 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63259598A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07287717A (ja) * | 1994-02-28 | 1995-10-31 | Fujitsu Ltd | 共通構造抽出装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56823A (en) * | 1979-04-26 | 1981-01-07 | Gen Electric | Manufacture of copolyester carbonate |
JPS57102698A (en) * | 1980-12-18 | 1982-06-25 | Matsushita Electric Ind Co Ltd | Pattern matching apparatus |
JPS5870288A (ja) * | 1981-10-22 | 1983-04-26 | 株式会社東芝 | 音声認識装置 |
-
1987
- 1987-04-16 JP JP62093613A patent/JPS63259598A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56823A (en) * | 1979-04-26 | 1981-01-07 | Gen Electric | Manufacture of copolyester carbonate |
JPS57102698A (en) * | 1980-12-18 | 1982-06-25 | Matsushita Electric Ind Co Ltd | Pattern matching apparatus |
JPS5870288A (ja) * | 1981-10-22 | 1983-04-26 | 株式会社東芝 | 音声認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07287717A (ja) * | 1994-02-28 | 1995-10-31 | Fujitsu Ltd | 共通構造抽出装置 |
US6453064B1 (en) * | 1994-02-28 | 2002-09-17 | Fujitsu Limited | Common structure extraction apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2815579B2 (ja) | 音声認識における単語候補削減装置 | |
JPS6360919B2 (ja) | ||
JPS63259598A (ja) | 音声認識装置 | |
JPS6123560B2 (ja) | ||
JPS6114520B2 (ja) | ||
JPS63163497A (ja) | 音声認識装置 | |
JPS58159598A (ja) | 単音節音声認識方式 | |
JPS6344699A (ja) | 音声認識装置 | |
JP3100208B2 (ja) | 音声認識装置 | |
JPS61123889A (ja) | 音声認識装置 | |
JPS62255999A (ja) | 単語音声認識装置 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
JPS6356585B2 (ja) | ||
JPH0573037B2 (ja) | ||
JP3707809B2 (ja) | 音声認識方法及び音声認識システム | |
JP3473704B2 (ja) | 音声認識装置 | |
JPS6136797A (ja) | 音声セグメンテ−シヨン法 | |
JPH0651793A (ja) | 音声認識装置 | |
JPS60147797A (ja) | 音声認識装置 | |
JPH0217038B2 (ja) | ||
JPH03155599A (ja) | 音声認識装置 | |
JPH05197397A (ja) | 音声認識方法及びその装置 | |
JPH06118988A (ja) | 音声対話処理装置 | |
JPH03149598A (ja) | 音声認識装置 | |
JPS6258515B2 (ja) |