JPS61290496A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61290496A JPS61290496A JP60132836A JP13283685A JPS61290496A JP S61290496 A JPS61290496 A JP S61290496A JP 60132836 A JP60132836 A JP 60132836A JP 13283685 A JP13283685 A JP 13283685A JP S61290496 A JPS61290496 A JP S61290496A
- Authority
- JP
- Japan
- Prior art keywords
- feature data
- data
- frame
- pattern
- trajectory length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、例えば特定話者の音声を単語単位で認識す
るのに適用される音声認識装置に関する。
るのに適用される音声認識装置に関する。
この発明は、例えば特定話者の音声を単語単位で認識す
るのに適用される音声認識装置において、#数的な周波
数スペクトルにより表現される多次元ベクトルの軌跡の
長さに応じて分割数を可変にし、語数が少ない音声に対
しては、少ない分割数で抽出したフレームデータを特徴
データブロックとし、語数が多い音声に対しては、多い
分割数で抽出したフレームデータを特徴データブロック
として熱々音声の語数に応じたデータ量として登録する
ことにより、メモリ量を低減させ、また、マツチングの
際には、入力データから得られる入力特徴データ量又は
その分割数に類似する登録パターンと入カバターンとの
間においてのみ、パターンマツチングを行うことにより
、短い処理時間で認識結果を得るようにし、然も認識率
が高くなるようにしたものである。
るのに適用される音声認識装置において、#数的な周波
数スペクトルにより表現される多次元ベクトルの軌跡の
長さに応じて分割数を可変にし、語数が少ない音声に対
しては、少ない分割数で抽出したフレームデータを特徴
データブロックとし、語数が多い音声に対しては、多い
分割数で抽出したフレームデータを特徴データブロック
として熱々音声の語数に応じたデータ量として登録する
ことにより、メモリ量を低減させ、また、マツチングの
際には、入力データから得られる入力特徴データ量又は
その分割数に類似する登録パターンと入カバターンとの
間においてのみ、パターンマツチングを行うことにより
、短い処理時間で認識結果を得るようにし、然も認識率
が高くなるようにしたものである。
本191出1gff人により、先に捉案されている音声
認識装置(特願昭59−106177号)は、音声人力
部としてのマイクロホン、前処理回路、音響分析器、特
徴データ抽出部、登録パターンメモリ及びパターンマツ
チング判定器等により構成されている。
認識装置(特願昭59−106177号)は、音声人力
部としてのマイクロホン、前処理回路、音響分析器、特
徴データ抽出部、登録パターンメモリ及びパターンマツ
チング判定器等により構成されている。
マイクロホンから入力される音声信号が前処理回路にお
いて雑音が除去され、音声認識に必要とされる帯域に制
限され、A/ D変換器によりディジタル音声信号とさ
れる。このディジタル音声信号が音響分析器に供給され
る。
いて雑音が除去され、音声認識に必要とされる帯域に制
限され、A/ D変換器によりディジタル音声信号とさ
れる。このディジタル音声信号が音響分析器に供給され
る。
音響分析器において、音声信号が周波数スペクトルに変
換され、例えば対数軸上で一定間隔となるように周波数
スペクトルのレベルが正規化され、離散的な周波数スペ
クトルデータが発生される。
換され、例えば対数軸上で一定間隔となるように周波数
スペクトルのレベルが正規化され、離散的な周波数スペ
クトルデータが発生される。
この周波数スペクトルデータ列が単位時間(フレーム周
期)毎に1つのフレームデータとして出力される。即ち
、フレーム周期毎に音声信号が、例えばNチャンフルの
周波数スペクトルデータとした場合、N次元ベクトルに
より表現されるパラメータとして切り出され、特徴デー
タ抽出部に供給される。
期)毎に1つのフレームデータとして出力される。即ち
、フレーム周期毎に音声信号が、例えばNチャンフルの
周波数スペクトルデータとした場合、N次元ベクトルに
より表現されるパラメータとして切り出され、特徴デー
タ抽出部に供給される。
特徴データ抽出部において、隣り合うフレームデータの
距離が計算される。例えば、i番目のフレームと、(i
+1)番目のフレームと距離DIを絶対値距離により算
出する場合には、で求められ、前後する同一チャンネル
のスペクトルデータの差の絶対イ1σが夫々求められ、
その総和がフレーム距離D□とされる。
距離が計算される。例えば、i番目のフレームと、(i
+1)番目のフレームと距離DIを絶対値距離により算
出する場合には、で求められ、前後する同一チャンネル
のスペクトルデータの差の絶対イ1σが夫々求められ、
その総和がフレーム距離D□とされる。
更に、夫々のフレーム距離り、の総和が求められ、音声
信号の始端(第Oフレーム)から終端(第1−1フレー
ム)までのN次元ベクトルの軌跡長Tが で求められる。そして最も語数が多く長い音声の場合に
特1攻を抽出するのに必要な所定の分割数Mでもって軌
跡長Tが等分割され、その分割点に対応したフレームデ
ータのみが特徴データとして抽出される。
信号の始端(第Oフレーム)から終端(第1−1フレー
ム)までのN次元ベクトルの軌跡長Tが で求められる。そして最も語数が多く長い音声の場合に
特1攻を抽出するのに必要な所定の分割数Mでもって軌
跡長Tが等分割され、その分割点に対応したフレームデ
ータのみが特徴データとして抽出される。
特徴データの抽出部の動作について、理解を容易とする
ため、第6図及び第7図を参照して説明する。
ため、第6図及び第7図を参照して説明する。
先ず、フレーム距#DIが求められる。第6図に一例と
して隣り合うフレームデータの距離り。
して隣り合うフレームデータの距離り。
の変化量が示される。第6図に示すように、一般的に始
端側の過渡部及び終端側の過渡部に狭まれた形で定常部
が存在している。
端側の過渡部及び終端側の過渡部に狭まれた形で定常部
が存在している。
音声の発音速度変動は、単語中の母音部の発生区間の長
さに起因するもので、母音の安定部においては、スペク
トル形状の変化が少ないために、フレーム間の距離の変
化が少なく定常部となる。
さに起因するもので、母音の安定部においては、スペク
トル形状の変化が少ないために、フレーム間の距離の変
化が少なく定常部となる。
即ち、発生速度が変動しても同一の単語が発声された場
合には軌跡長は略々等しいものとなる。
合には軌跡長は略々等しいものとなる。
求められた軌跡長′Fが所定の分割数Mで等分割され、
分割点に対応したフレームデータが特徴データとして抽
出される。即ち、音声の発生速度変動に対する軌跡長の
不変性に着目して時間軸が正規化される。第7図は、例
えば分割数Mを9として第6図に対応して特徴データを
抽出した一例を示している。第7図に示すように、過渡
部に存在する最も音声信号の特徴を顕著に示すであろう
部分のフレームデータが多く抽出され、1個のフレーム
データにより形成されていた音声信号データが主として
定常部のフレームデータの間引きにより9個のフレーム
データに圧縮される。即ち、話者の音声の発生速度変動
に影響されることがないように時間軸が正規化され、フ
レームデータが特徴データとして抽出される。
分割点に対応したフレームデータが特徴データとして抽
出される。即ち、音声の発生速度変動に対する軌跡長の
不変性に着目して時間軸が正規化される。第7図は、例
えば分割数Mを9として第6図に対応して特徴データを
抽出した一例を示している。第7図に示すように、過渡
部に存在する最も音声信号の特徴を顕著に示すであろう
部分のフレームデータが多く抽出され、1個のフレーム
データにより形成されていた音声信号データが主として
定常部のフレームデータの間引きにより9個のフレーム
データに圧縮される。即ち、話者の音声の発生速度変動
に影響されることがないように時間軸が正規化され、フ
レームデータが特徴データとして抽出される。
この特徴データが登録時においては、9録パターンメモ
リに登録特徴データブロックとして記憶される。認識時
においては、入力音声信号が前述した処理を経て、人力
特徴データブロックとされ、パターンマツチング判定器
に供給され、人力特徴データブロックと登録特徴データ
ブロックとの間のパターンマツチングにより、認識結果
が得られる。
リに登録特徴データブロックとして記憶される。認識時
においては、入力音声信号が前述した処理を経て、人力
特徴データブロックとされ、パターンマツチング判定器
に供給され、人力特徴データブロックと登録特徴データ
ブロックとの間のパターンマツチングにより、認識結果
が得られる。
前述した従来の音声認、識装置の特徴データ抽出部にお
ける分割数Mは、最も語数が多い、即ち軌跡長が最も長
い音声を認識するために必要な所定数とされていた。従
って、少ない分割数で充分な語数が少ない、即ち軌跡長
が短い音声に対しても同様にM個のフレームデータを抽
出して特徴データとして登録していた。このため登録パ
ターンメモリのメモリ量が膨大なものとなる問題点があ
った。
ける分割数Mは、最も語数が多い、即ち軌跡長が最も長
い音声を認識するために必要な所定数とされていた。従
って、少ない分割数で充分な語数が少ない、即ち軌跡長
が短い音声に対しても同様にM個のフレームデータを抽
出して特徴データとして登録していた。このため登録パ
ターンメモリのメモリ量が膨大なものとなる問題点があ
った。
また、パターンマツチング時においても、常にM個のフ
レーム間においてマツチング距離の計算を行わなければ
ならず、処理時間が長くなる欠点があった。然も全ての
登録パターンとマツチング距離の計算をしなければなら
ないために、登録パターンの数が多くなればなるほど認
識率が低下し、また、認識結果を得るまでの処理時間が
長くなる問題があった。
レーム間においてマツチング距離の計算を行わなければ
ならず、処理時間が長くなる欠点があった。然も全ての
登録パターンとマツチング距離の計算をしなければなら
ないために、登録パターンの数が多くなればなるほど認
識率が低下し、また、認識結果を得るまでの処理時間が
長くなる問題があった。
従って、この発明の目的は、軌跡長と略々比例する分割
数でもって、特徴データを抽出することによりe録パタ
ーンを記憶するためのメモリの容量を低減できる音声認
5itliW置を堤供することにある。
数でもって、特徴データを抽出することによりe録パタ
ーンを記憶するためのメモリの容量を低減できる音声認
5itliW置を堤供することにある。
この発明の他の目的は、分割数をパターンマツチング時
にマツチング判定時のパラメータとして使用することに
よりマツチング処理時間の短縮及びマツチング精度の向
上を図ることができる音声君恩m装置を提イ共すること
にある。
にマツチング判定時のパラメータとして使用することに
よりマツチング処理時間の短縮及びマツチング精度の向
上を図ることができる音声君恩m装置を提イ共すること
にある。
この発明は、入力音声信号をスペクトル変換等音声認識
に必要な前処理を行う音響分析手段5と、音響分析手段
5の出力データが供給され、出力データの軌跡長に略々
比例する適応な分割数によって時間軸の正規化処理を行
い、特徴データを抽出する特徴データ抽出手段6と、 特徴データが標準パターンとして記憶されるメモリ7と
、 特徴データ抽出手段6からの入カバターンとメモリ7か
ら読み出された標準パターンとのパターンマツチングに
よりマツチング判定するパターンマツチング判定手段8
と、 からなることを特徴とする音声LQ m装置である。
に必要な前処理を行う音響分析手段5と、音響分析手段
5の出力データが供給され、出力データの軌跡長に略々
比例する適応な分割数によって時間軸の正規化処理を行
い、特徴データを抽出する特徴データ抽出手段6と、 特徴データが標準パターンとして記憶されるメモリ7と
、 特徴データ抽出手段6からの入カバターンとメモリ7か
ら読み出された標準パターンとのパターンマツチングに
よりマツチング判定するパターンマツチング判定手段8
と、 からなることを特徴とする音声LQ m装置である。
特徴データ抽出部6において、離散的な周波数スペクト
ルデータ、即ち、多次元ベクトルによって示される音声
信号の軌跡長Tが求められ、その軌跡長に略々比例した
分割数Mが決定され、分割点が求められる。■フレーム
データ毎に、軌跡長が計算されて累算され、分割点に一
敗またはその近傍に対応するフレームデータが抽出され
て特徴データとされ、分割数M、スペクトルデータ量を
示す定数、軌跡長の係数等のパラメータデータと共に、
特徴データがパターンマツチング判定器に出力される。
ルデータ、即ち、多次元ベクトルによって示される音声
信号の軌跡長Tが求められ、その軌跡長に略々比例した
分割数Mが決定され、分割点が求められる。■フレーム
データ毎に、軌跡長が計算されて累算され、分割点に一
敗またはその近傍に対応するフレームデータが抽出され
て特徴データとされ、分割数M、スペクトルデータ量を
示す定数、軌跡長の係数等のパラメータデータと共に、
特徴データがパターンマツチング判定器に出力される。
以下、この発明の一実施例を図面を参照して説明する。
第1図は、この発明の一実施例を示すもので、第1図に
おいて、1が音声人力部としてのマイクロホンを示して
いる。
おいて、1が音声人力部としてのマイクロホンを示して
いる。
マイクロホンlからのアナログ音声信号がフィルタ2に
供給される。フィルタ2は、例えばカットオフ周波数7
.5に11□のローパスフィルタであり、音声信号がフ
ィルタ2において、音声認識に必要とされる7、581
1□以下の帯域に制限され、この音声信号がアンプ3を
介してA/ D変換器4に供給される。
供給される。フィルタ2は、例えばカットオフ周波数7
.5に11□のローパスフィルタであり、音声信号がフ
ィルタ2において、音声認識に必要とされる7、581
1□以下の帯域に制限され、この音声信号がアンプ3を
介してA/ D変換器4に供給される。
A/ D変換器4は、例えば、サンプリング周波数12
.5Klhの8ビツトA/ D変換器であり、音声信号
がA/ D変換器4において、アナログ−ディジタル変
換されて、8ビツトのディジタル信号とされ、音響分析
器5に供給される。
.5Klhの8ビツトA/ D変換器であり、音声信号
がA/ D変換器4において、アナログ−ディジタル変
換されて、8ビツトのディジタル信号とされ、音響分析
器5に供給される。
音響分析器5は、音声信号を周波数スペクトルに変換し
て、例えば、Nチャンネルのスペクトルデータ列を発生
するものである。音響分析器5において、音声信号が演
算処理により周波数スペクトルに変換され、例えば対数
軸上で一定間隔となるN個の周波数を代表値とするスペ
クトルデータ列が得られる。従って、音声信号がNチャ
ンネルの離散的な周波数スペクトルの大きさによって表
現される。そして、単位時間(フレーム周期)毎にNチ
ャンネルのスペクトルデータ列が一つのフレームデータ
として出力される。即ち、フレーム周期毎に音声信号が
N次元ベクトルにより表現されるパラメータとして切り
出され、特徴データ抽出部6に供給される。
て、例えば、Nチャンネルのスペクトルデータ列を発生
するものである。音響分析器5において、音声信号が演
算処理により周波数スペクトルに変換され、例えば対数
軸上で一定間隔となるN個の周波数を代表値とするスペ
クトルデータ列が得られる。従って、音声信号がNチャ
ンネルの離散的な周波数スペクトルの大きさによって表
現される。そして、単位時間(フレーム周期)毎にNチ
ャンネルのスペクトルデータ列が一つのフレームデータ
として出力される。即ち、フレーム周期毎に音声信号が
N次元ベクトルにより表現されるパラメータとして切り
出され、特徴データ抽出部6に供給される。
第2図は、特徴データ抽出部6の一例を示す。
音響分析器5から供給されるフレームデータがメモリ1
1に供給される。メモリ11において時系列のフレーム
データが順次取り込まれ、記憶される。
1に供給される。メモリ11において時系列のフレーム
データが順次取り込まれ、記憶される。
例えば、単語区間の終端に対応するフレームを(1−1
)とした場合、第3図に示すように、各々が0〜(N−
1)チャンネルのデータにより構成されるフレームデー
タが0フレームから(1−1)フレームまでメモリ11
に記憶される。
)とした場合、第3図に示すように、各々が0〜(N−
1)チャンネルのデータにより構成されるフレームデー
タが0フレームから(1−1)フレームまでメモリ11
に記憶される。
このlブロックのデータがメモリllから軌跡長計算回
路12に供給される。軌跡長計算回路12において、隣
り合うフレームの距離が計算され、史に、各フレームデ
ータにより表現されるN次元ベクトルの軌跡長が求めら
れ、軌跡長データが発生される。lブロックのデータと
共にこの軌跡長データが分割数計算回路13に供給され
る。
路12に供給される。軌跡長計算回路12において、隣
り合うフレームの距離が計算され、史に、各フレームデ
ータにより表現されるN次元ベクトルの軌跡長が求めら
れ、軌跡長データが発生される。lブロックのデータと
共にこの軌跡長データが分割数計算回路13に供給され
る。
分割数計算回路13において、略々軌跡長に比例した分
割数が決定されると共に分割点が計算され、lブロック
のデータと共に、この分割点データが特徴データ抽出計
算回路14に供給される。
割数が決定されると共に分割点が計算され、lブロック
のデータと共に、この分割点データが特徴データ抽出計
算回路14に供給される。
特徴データ抽出計算回路14において、分割点データに
基づいて、それら分割点に対応するフレームデータが時
系列1111¥に抽出され、特徴データとして出力され
る。この特徴データがモード切替回路15に供給される
。モード切替回路15により、登録時に特徴データがe
録パターンメモリ7に供給され、認識時に特徴データが
パターンマツチング判定器8に供給される。
基づいて、それら分割点に対応するフレームデータが時
系列1111¥に抽出され、特徴データとして出力され
る。この特徴データがモード切替回路15に供給される
。モード切替回路15により、登録時に特徴データがe
録パターンメモリ7に供給され、認識時に特徴データが
パターンマツチング判定器8に供給される。
上述のこの発明の一実施例における特徴データ抽出部6
の動作を第4図に示すフローチャートを参照して説明す
る。
の動作を第4図に示すフローチャートを参照して説明す
る。
メモリ11から、前述の第3図に示す時系列のフレーム
データが軌跡長計算回路12に供給される。軌跡長計算
回路12において、第4図におけるステップ■の処理が
行われる。つまり、n (N−1≧n≧0)番目のチャ
ンネル、1(1−1≧i≧O)番目のフレームのスペク
トルデータを89、と表現すると、i番目のフレームと
(i+1)番目のフレームとの間の距離DI (絶対
値距離)は、 で求められる。前後するフレームの同一のチャンネルの
スペクトルデータの差の絶対値の総和がフレーム距i%
I D + とされる。史に、夫々のフレーム距離り、
の総和、即ち、N次元ベクトルの軌跡長Tは、 で求められる。
データが軌跡長計算回路12に供給される。軌跡長計算
回路12において、第4図におけるステップ■の処理が
行われる。つまり、n (N−1≧n≧0)番目のチャ
ンネル、1(1−1≧i≧O)番目のフレームのスペク
トルデータを89、と表現すると、i番目のフレームと
(i+1)番目のフレームとの間の距離DI (絶対
値距離)は、 で求められる。前後するフレームの同一のチャンネルの
スペクトルデータの差の絶対値の総和がフレーム距i%
I D + とされる。史に、夫々のフレーム距離り、
の総和、即ち、N次元ベクトルの軌跡長Tは、 で求められる。
分割数計算回路13において、第4図におけるステップ
■及び■の処理が行われる。まず、ステ、ノブ■におい
て、軌跡長Tの分割数Mが、M=a+T/b により決定される。bは所定の定数であり、aは整数化
するための定数である。次に、軌跡長TがM分割され、
分割点(m、、m、、・・・・・mj、・・・・・m、
−、)が求められる(ステップ■)。
■及び■の処理が行われる。まず、ステ、ノブ■におい
て、軌跡長Tの分割数Mが、M=a+T/b により決定される。bは所定の定数であり、aは整数化
するための定数である。次に、軌跡長TがM分割され、
分割点(m、、m、、・・・・・mj、・・・・・m、
−、)が求められる(ステップ■)。
特徴データ抽出計算回路14において、第4図における
ステップ■〜qΦの処理が行われる。
ステップ■〜qΦの処理が行われる。
最初に、フレーム番号を示す変数iの値がOに初期設定
されると共に、分割点を示す変数jの値が0に初期設定
される(ステップ■)。
されると共に、分割点を示す変数jの値が0に初期設定
される(ステップ■)。
次に、■フレーム毎にフレーム距離り、が求められ、寡
フレームまでの軌跡長]゛4が累算により求められる(
ステップ■)。この値T、がステップ■において、分割
点m、と比較され、分割点m、未満の場合には、iがス
テップ■においてインクリメントされ、フレーム距離D
1の累算が続けられる。分割点m1以上となる場合には
、その時のフレームデータS n iが抽出データS
njとされる(ステップ■)。次のステップ■におい・
で、lと最大フレーム数■との比較がなされ、iが1未
満の場合には、Jがステップ[相]においてインクリメ
ントされる。そして、同様の計算が続けられ、iが最大
フレーム数1以上になると、特徴データの抽出処理が終
了する・。
フレームまでの軌跡長]゛4が累算により求められる(
ステップ■)。この値T、がステップ■において、分割
点m、と比較され、分割点m、未満の場合には、iがス
テップ■においてインクリメントされ、フレーム距離D
1の累算が続けられる。分割点m1以上となる場合には
、その時のフレームデータS n iが抽出データS
njとされる(ステップ■)。次のステップ■におい・
で、lと最大フレーム数■との比較がなされ、iが1未
満の場合には、Jがステップ[相]においてインクリメ
ントされる。そして、同様の計算が続けられ、iが最大
フレーム数1以上になると、特徴データの抽出処理が終
了する・。
特徴データ抽出計算回路14により、上述のように抽出
された特徴データが登録時においては、モード切替回路
15を介して登録パターンメモリ7に供給され、登録特
徴データブロックとして、記憶される。また、認識時に
おいては、特徴データ抽出計算回路14により抽出され
た特徴データがモード切替回路15を介してパターンマ
ツチング判定器8に供給され、入力特徴データブロック
とされる。この人力特徴データフロックとメモリ7に記
憶されている登録特徴データブロックとの間でパターン
マツチングの判定がなされる。
された特徴データが登録時においては、モード切替回路
15を介して登録パターンメモリ7に供給され、登録特
徴データブロックとして、記憶される。また、認識時に
おいては、特徴データ抽出計算回路14により抽出され
た特徴データがモード切替回路15を介してパターンマ
ツチング判定器8に供給され、入力特徴データブロック
とされる。この人力特徴データフロックとメモリ7に記
憶されている登録特徴データブロックとの間でパターン
マツチングの判定がなされる。
上述の特徴データ抽出部6の出力データは、第5図に示
すように、分割数M、スペクトルデータ置を示す数、全
軌跡長、重み係数等のパラメータデータが特徴データに
付加さたものである。パターンマツチング判定器8は、
入力特徴データブロック中のパラメータデータと登録特
徴データブロック中のパラメータデータとを比較し、両
者のパラメータデータが一致又は近似している登録特徴
データブロックに関してのみ、入力特徴データブロック
との間のマツチング距離の演算を行う。そして、マツチ
ング距離が最小で十分に距離が近いものと判断される登
録特徴データブロックに対応する単語が認識結果として
出力される。
すように、分割数M、スペクトルデータ置を示す数、全
軌跡長、重み係数等のパラメータデータが特徴データに
付加さたものである。パターンマツチング判定器8は、
入力特徴データブロック中のパラメータデータと登録特
徴データブロック中のパラメータデータとを比較し、両
者のパラメータデータが一致又は近似している登録特徴
データブロックに関してのみ、入力特徴データブロック
との間のマツチング距離の演算を行う。そして、マツチ
ング距離が最小で十分に距離が近いものと判断される登
録特徴データブロックに対応する単語が認識結果として
出力される。
尚、この発明の一実施例において、特徴データ抽出等に
必要な計算処理は、ハードワイヤードの構成に限らず、
マイクロコンピュータ又はストアードプログラム方式の
構成で行うようにしても良い。
必要な計算処理は、ハードワイヤードの構成に限らず、
マイクロコンピュータ又はストアードプログラム方式の
構成で行うようにしても良い。
この発明では、特徴データ抽出部において離散的な周波
数スペクトルデータ、即ち、多次元ベクトルによって示
される音声信号の軌跡長が求められ、その軌跡長に略々
比例した分割数でもって、分割点が決定される。そして
、■フレームデータ毎に軌跡長が計算されて累算され、
分割数に一致または、その近傍に対応するフレームデー
タが特徴データとして抽出され、分割数M、スペクトル
データ量を示す定数、軌跡長の係数等のパラメータデー
タと共に、特徴データが出力される。
数スペクトルデータ、即ち、多次元ベクトルによって示
される音声信号の軌跡長が求められ、その軌跡長に略々
比例した分割数でもって、分割点が決定される。そして
、■フレームデータ毎に軌跡長が計算されて累算され、
分割数に一致または、その近傍に対応するフレームデー
タが特徴データとして抽出され、分割数M、スペクトル
データ量を示す定数、軌跡長の係数等のパラメータデー
タと共に、特徴データが出力される。
従って、この発明に依れば、語数が少ない軌跡長が短い
音声においては、少ない分割数で特徴データが抽出され
るため、登録パターンメモリの容量を低減することがで
きる。
音声においては、少ない分割数で特徴データが抽出され
るため、登録パターンメモリの容量を低減することがで
きる。
また、この発明に依れば、パターンマツチング時に分割
数等をパラメータとして使用してパラメータが一致また
は近接した登録パターンとの間においてのみ、マツチン
グ距離計算を行なうことによりマツチング処理時間の短
縮及びマツチング精度の向上を図ることができる。
数等をパラメータとして使用してパラメータが一致また
は近接した登録パターンとの間においてのみ、マツチン
グ距離計算を行なうことによりマツチング処理時間の短
縮及びマツチング精度の向上を図ることができる。
第1図はこの発明の一実施例のブロック図、第2図はこ
の発明の一実施例における特徴データ抽出部のブロック
図、第3図はこの発明の一実施例におけるデータ構成の
説明に用いる路線図、第4図はこの発明の一実施例にお
ける特i′li、データ抽出部の動作説明に用いるフロ
ーチャート、第5図はこの発明の一実施例における特徴
データブロックのデータ構成の説明に用いる路線図、第
6図及び第7図は従来の音声認識装置の説明に用いる路
線図。 図面における主要な符号の説明 ■=マイクロホン、 5:音響分析器、6:特徴デー
タ抽出部、7:e録パターンメモリ、8:パターンマツ
チング判定器、 12:軌跡長計算回路、 13;分割数計算回路、14
:特徴データ抽出計算回路。
の発明の一実施例における特徴データ抽出部のブロック
図、第3図はこの発明の一実施例におけるデータ構成の
説明に用いる路線図、第4図はこの発明の一実施例にお
ける特i′li、データ抽出部の動作説明に用いるフロ
ーチャート、第5図はこの発明の一実施例における特徴
データブロックのデータ構成の説明に用いる路線図、第
6図及び第7図は従来の音声認識装置の説明に用いる路
線図。 図面における主要な符号の説明 ■=マイクロホン、 5:音響分析器、6:特徴デー
タ抽出部、7:e録パターンメモリ、8:パターンマツ
チング判定器、 12:軌跡長計算回路、 13;分割数計算回路、14
:特徴データ抽出計算回路。
Claims (1)
- 【特許請求の範囲】 入力音声信号をスペクトル変換等音声認識に必要な前処
理を行う音響分析手段と、 上記音響分析手段の出力データが供給され、上記出力デ
ータの軌跡長に略々比例する適応な分割数によって時間
軸の正規化処理を行い、特徴データを抽出する特徴デー
タ抽出手段と、 上記特徴データが標準パターンとして記憶されるメモリ
と、 上記特徴データ抽出手段からの入力パターンと上記メモ
リから読み出された上記標準パターンとのパターンマッ
チングによりマッチング判定するパターンマッチング判
定手段と、 からなることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60132836A JPS61290496A (ja) | 1985-06-18 | 1985-06-18 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60132836A JPS61290496A (ja) | 1985-06-18 | 1985-06-18 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61290496A true JPS61290496A (ja) | 1986-12-20 |
Family
ID=15090657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60132836A Pending JPS61290496A (ja) | 1985-06-18 | 1985-06-18 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61290496A (ja) |
-
1985
- 1985-06-18 JP JP60132836A patent/JPS61290496A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR910002198B1 (ko) | 음성인식방법과 그 장치 | |
US4720863A (en) | Method and apparatus for text-independent speaker recognition | |
JPS5844500A (ja) | 音声認識方式 | |
JPS61290496A (ja) | 音声認識装置 | |
JPS61292695A (ja) | 音声認識装置 | |
JPH04261591A (ja) | 自動採譜装置 | |
JPS625298A (ja) | 音声認識装置 | |
JPS60166993A (ja) | 単語音声認識装置 | |
JP2577891B2 (ja) | 単語音声予備選択装置 | |
JPH0461359B2 (ja) | ||
JPS6126680B2 (ja) | ||
JPS6210697A (ja) | 音声認識装置 | |
JPH0441357B2 (ja) | ||
JPS62105199A (ja) | 音声認識装置 | |
JP3083855B2 (ja) | 音声認識方法及び装置 | |
JPS62159195A (ja) | 音声パタン作成方法 | |
JPH0221598B2 (ja) | ||
JPH0816186A (ja) | 音声認識装置 | |
JPS63121100A (ja) | 音声認識装置における特徴パタ−ン抽出方法 | |
JPH0546558B2 (ja) | ||
JPH0552509B2 (ja) | ||
JPH02141800A (ja) | 音声認識装置 | |
JPH054679B2 (ja) | ||
JPS60200296A (ja) | 音声認識装置 | |
JPS6227798A (ja) | 音声認識装置 |