JP2569304B2 - 声音認識装置 - Google Patents

声音認識装置

Info

Publication number
JP2569304B2
JP2569304B2 JP60195784A JP19578485A JP2569304B2 JP 2569304 B2 JP2569304 B2 JP 2569304B2 JP 60195784 A JP60195784 A JP 60195784A JP 19578485 A JP19578485 A JP 19578485A JP 2569304 B2 JP2569304 B2 JP 2569304B2
Authority
JP
Japan
Prior art keywords
frame
standard pattern
pattern
memory
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60195784A
Other languages
English (en)
Other versions
JPS6256996A (ja
Inventor
俊夫 上村
吉明 北爪
利之 井関
利一 安江
一広 山畳
古木  仁
嘉広 深尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60195784A priority Critical patent/JP2569304B2/ja
Publication of JPS6256996A publication Critical patent/JPS6256996A/ja
Application granted granted Critical
Publication of JP2569304B2 publication Critical patent/JP2569304B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、記憶しておいた標準パターンを入力音声パ
ターンと比較することにより該音声の認識を行なう音声
認識装置における前記標準パターンの記憶方式に関する
ものであり、更に詳しくは、標準パターンを記憶するた
めの所要のメモリ容量を、音声認識率の低下を招くこと
なしに、削減可能にするための記憶方式に関するもので
ある。
〔発明の背景〕
従来のかかる音声認識装置では、標準パターンとして
記憶する音声データの圧縮が十分でなく、各種業務に用
いようとしてフロッピーディスクなどの補助記憶装置に
標準パターンを記憶しようとすると、記憶すべき標準パ
ターンのデータ量が膨大となり、フロッピーディスクな
どを用いるのでは1枚の媒体に記録可能なパターン数が
少なくなり、音声認識装置として充分な機能を期待でき
ないという欠点があった。
また上位計算機に設けた補助記憶装置に標準パターン
データを格納する形態もよくとられるが、上位計算機か
らのデータ転送時間が大きくなりシステム運用上の問題
があった。
また、特開昭57-178300号公報に記載の発明「音声自
動認識方式」にみられるように、入力音声情報を圧縮し
て記録する例も一部あるが、それらは、入力音声のサン
プル情報を入力音声の語,句,音韻の長さ及び音声の時
間変化,音量の時間変化に関係なく、一定数のセグメン
トにグループ化するように圧縮するものであったから認
識率の低下がみられ実用的でないという恐れがあった。
〔発明の目的〕
本発明の目的は、上述した従来技術における問題点を
解消し、認識率を低下させることなく、記憶すべき標準
パターンのデータ量を低減することが可能で、かつ、複
数の標準パターンの復元処理を高速化できる音声認識装
置を提供することにある。
〔発明の概要〕
上記目的を達成するため、本発明においては、記憶し
ておいた標準パターンを復元して入力音声パターンと比
較することにより該入力音声の認識を行う音声認識装置
であって、 基本と成る音声分析用の特徴パラメータをフレーム単
位で所定種類だけ予め用意して基本フレームFfとして記
憶する第1のテーブルと、 記憶すべき標準パターンを、個々の標準パターン毎
に、当該パターンを構成するフレームの個数(以下フレ
ーム長という)を表すフレーム長情報FLと、当該パター
ンを構成する各フレームに含まれる特徴パラメータが該
第1のテーブルにおけるどの基本フレームに対応するも
のであるかを表す対応情報RIと、を標準パターンを復元
する補助情報として各標準パターン毎にフレーム長情報
FLを先頭に次いで対応情報RIをフレーム順に記憶する第
2のテーブルと、 第N標準パターンの第τフレームf(N,τ)を復元処
理するために(ここでN,τは任意の自然数)、第2のテ
ーブルの第N標準パターンの補助情報先頭アドレスSIMA
(N)に(τ+1)を足したアドレス(SIMA(N)+
(τ+1))にある基本フレーム対応情報RI(N,τ)を
用いて第1のテーブルに対応する基本フレームFf(RI
(N,τ))を参照取得することにより、第N標準パター
ンの第τフレームf(N,τ)を復元し、第2のテーブル
の第N標準パターンの補助情報先頭アドレスSIMA(N)
に第N標準パターンのフレーム長情報FL(N)を足しさ
らに1を足すことにより、第2のテーブルの第(N+
1)標準パターンの補助情報先頭アドレスSIMA(N+
1)を求め、順次各標準パターンの各フレームの復元処
理を行う情報復元手段と、 復元した各標準パターンと入力音声パターンとを比較
する手段と、 を有するので、本発明は、比較の基準と成る標準パター
ンを表す音声データを基本フレームを用い、かつ基本フ
レームをフレーム長情報と対応情報で参照取得すること
により、少量のデータとして標準パターンとしてメモリ
に格納することが可能で、かつ、複数の標準パターンの
復元処理を高速化できる音声認識装置を実現したのであ
る。〔発明の実施例〕 次に図を参照して本発明の実施例を説明する。
第5図は本発明の実施対象となる音声認識装置の全体
構成の一例を示したブロック図である。
同図において、1はマイコン、2は標準パターンメモ
リ(兼中間結果メモリ)、3はマイコンインタフェー
ス、4は入力フレームメモリ、5は距離計算部、6はメ
モリインタフェース部、7は制御部、8照合部、9は各
部へ供給するクロックパルスの発生器(CPG)、10は判
定部、(1−a)はアドレスバス、(1−b)はデータ
バス、である。
図から明らかなように、この音声認識装置は、マイコ
ン1の制御により動作するもので、具体的には、上述の
2〜10の要素から成るものである。
そして、制御部7にマイクロプログラムを内蔵してお
り、予め設定された標準パターンデータが格納されてい
る基本フレームメモリ(標準パターンメモリ2)の先頭
アドレス,標準パターン数,照合処理内容,判定閾値な
どのパラメータに応じ、所定のプログラムに沿って分岐
し、処理を行なう。
入力音声パターンの特徴パラメータは、図示していな
い音声入力部及び分析部、データバス(1−b)を経由
してマイコン1に転送され、マイコン1によりマイコン
インタフェース3を経由してデータバス(1−e)を介
し、入力フレームメモリ4に入力フレームデータとして
転送される。
次に、このようにして入力フレームデータが入力フレ
ームメモリ4に設定されたことを制御信号(1−m−
1)を介し制御部7で検出し、音声認識のためのパター
ンマッチング処理に分岐移行する。
ここでパターンマッチング処理とは、入力音声パター
ンの特徴パラメータと標準パターンの特徴パラメータと
のフレーム対応の距離計算処理と、単語全体としての照
合処理の双方を総称するものである。
そこで制御部7は、メモリインタフェース部6を、標
準パターンデータが格納されているメモリ2をアクセス
する状態に転じて、標準パターンデータYj kを該メモリ
2から順次読み出すとともに、制御信号(1−m−2)
により距離計算部5を駆動し、標準パターンの特徴パラ
メータのメモリ2からの読み出しと同期して入力フレー
ムメモリ4より特徴パラメータXi kを読み出して所定の
処理、例えば次式に示すようなチエビシェフ距離を求め
るための処理を行なう。
ここで dij:入力iフレームと標準jフレームとの距離計算値 Xi k:入力フレームの特徴パラメータ第kチャネルのデ
ータ Yj k:標準jフレームの特徴パラメータ第kチャネルの
データ dijは入力音声パターンと標準パターン間のフレーム
毎の特徴量の差を示すものである。dijは照合部8に送
出され、単語としての照合処理を行ないマッチング値を
求め、さらにマッチング値は判定部10に送出され、標準
パターンとして記憶されていた全単語の中から認識結果
となるべき候補を求める。
照合部8,判定部10については、本発明とは直接関係の
ない要素であるから、その説明は省くが、必要があれば
例えば、特開昭57-83880号公報「マッチング方式切換制
御方法」を参照されたい。
本発明に関係する標準パターンの記憶方式は、具体的
には、標準パターンデータを格納した標準パターンメモ
リ2の構成に関係している。すなわち、標準パターンメ
モリを、基本フレームメモリと補助情報メモリとで構成
し、基本フレームメモリには、基本となる音声分析用の
特徴パラメータをフレーム単位で所定種類だけ基本パラ
メータとして予め記憶させておき、他方、補助情報メモ
リには、本来記憶すべき標準パターンの代わりに、当該
パターンを構成するフレームの個数(これをフレーム長
という)を表わすフレーム長情報と、その各フレームに
含まれる特徴パラメータが前記基本フレームメモリに含
まれるどの基本パラメータに対応するものであるかを表
わす対応情報とを記憶しておく。
そしてメモリインタフェース部6に付加した情報復元
手段を用い、前記基本フレームメモリと補助情報メモリ
にそれぞれ記憶された内容から、指定された標準パター
ンを復元、再生して出力するようにしている。
このようにすることにより、標準パターンメモリ2
に、標準パターンデータをそのままの形式で格納する従
来方式による場合よりも、所要のメモリ容量を大幅に低
減することが可能になるわけである。
以下、順に追って詳しく説明する。
第1図は、本発明の一実施例における記憶方式の原理
説明図である。
第1図(イ)は、標準パターンとなるべき音声波形W1
とW2を、横軸に時間をとり、縦軸に振幅なら振幅をとっ
て表わした波形図である。音声波形W1はこの場合、,
,…の5つのフレームに分割され、音声波形W2は4
つのフレームに分割されることができる。
第1図(ロ)は、音声波形W1のフレームからにつ
いて、それぞれのフレーム(標準パターン・フレーム)
における特徴パラメータf11,f12,…f15を模式的に示し
た説明図であり、音声波形W2についても同様に、各フレ
ーム毎の特徴パラメータf21,f22,…f24を模式的に示し
ている。
他方、第1図(ハ)は、基本となる音声分析用の特徴
パラメータをフレーム単位で所定種類だけ、Ff1,Ff2
…Fflの如く模式的に配列して示した説明図である。こ
こで、Ff1,Ff2,…Fflなどのそれぞれを今後、基本フレ
ームの特徴パラメータまたは単に特徴量と呼ぶ。
ここで、基本フレームとは、音声パターンを構成する
フレーム群を、フレームにおける特徴量分布の類似性に
より大別した場合の代表(基本)となりうるフレームの
ことである。
すなわち、音声情報処理では、通常その特徴量を抽出
する手段として、複数チャネルのバンドパスフィルタを
用いており、音声パターンの各周波数帯域に含まれる成
分をとり出して特徴量として出力している。したがって
音声波形を構成する各フレームでは、それぞれの音の性
質に応じたバンドパスフィルタの出力が求められ各チャ
ネルの特徴量分布が形成される。この場合、ある単語た
とえば東京などと発声した場合に、その音声パターンに
おいて、類似性の高いフレームが何個所かに現われるこ
とが多く、これらを整理して代表(基本)となり得るも
のを定めて、それを基本フレームと呼んでいる。
次に、第1図(ニ)について説明する。
第1図(ロ)に示す標準パターンの各フレームと第1
図(ハ)に示す基本フレームの各々との間で特徴パラメ
ータの差を求め、その差がある閾値以下になったとき
に、当該標準パターン・フレームを対応する基本フレー
ムで置換して配列して示した説明図が第1図(ニ)であ
る。
具体的に述べると、次式に示すようにして、標準パタ
ーン・フレームと基本フレームとの特徴量の差(Δi n
を求め、その差と予め定めた或る閾値(θ)との間に、
Δi nθの条件が満たされるとき、標準パターン・フレ
ームの特徴パラメータfiを基本フレームのそれFfnで置
換して表示したのが第1図(ニ)というわけである。
ここで、 f :標準パターン・フレームの特徴量(特徴パラメー
タ) F :基本フレームの特徴量(特徴パラメータ) fn:n番目の基本フレームであることを示す番号 i :入力フレーム番号 k :チャネル数 説明が若干、重複するかも知れないが、第1図全体を
通してもう一度説明する。
第1図(イ)に示すような標準パターンとなるべき音
声波形W1が与えられた時、これを時間方向にフレーム単
位で(唯今の場合、〜の如く)分割する。次に、各
フレームにおける特徴量を求めると、(ロ)のようにな
る。(ロ)において、ハッチングの種類が異なるものは
特徴量分布の異なることを表わしており、結局、f11〜f
15の5フレームの特徴量で、標準パターン(音声波形
W1)が表わされる。
次に、(ロ)における各フレームの特徴量fi(但し、
i=11,12,…23,24…)と(ハ)に示す基本フレームの
特徴量Ffnとの間の特徴量分布の類似性を求め、標準パ
ターン・フレーム特徴量fiを、類似性の高い基本フレー
ム特徴量Ffnにより表現して(ニ)を得る。すなわち、f
11〜f15の5フレームの特徴量が、Ff1,Ff3,Ff4,Ff5の4
つの基本フレームの特徴量の組合せにより、(ニ)に示
すように表現される。
以上、音声波形W1について説明したが、音声波形W2
表現する場合も同様であり、音声波形W1の表現に用いた
基本フレームFfnを用いる事もある。
なお第1図で、(ロ)と(ハ)、(ハ)と(ニ)をフ
レーム単位で対応づけている斜線は、(ロ)と(ハ)で
はその標準パターン・フレームの特徴量fiと類似する基
本フレームの特徴量Ffnの対応を示し、(ハ)と(ニ)
では、(ニ)の標準パターン・フレームの特徴量が、
(ハ)のどの基本フレーム特徴量で表現されているかを
示している。
以上説明した如き記憶方式の原理に立って、以下、標
準パターンデータの具体的な格納方式について第2図を
参照して説明する。
第2図は本発明の一実施例における標準パターンデー
タのメモリ内格納方式の説明図である。同図に見られる
ように、本方式においては、基本フレームメモリ11と補
助情報メモリ12を用意する。
基本フレームメモリ11には、第1図の(ハ)に示した
通りの内容、つまり基本フレームとしての特徴量をもつ
フレームが予め選択された種類だけ、格納されている。
他方、補助情報メモリ12には、標準パターンデータが、
メモリ11に格納されている基本フレームとの関連におい
て、格納されている。
例えば、補助メモリ12において、FL(1)とあるの
は、第1の標準パターンのフレーム長情報(該標準パタ
ーンを構成するフレームの数として、それが5ならば5
という数)を表わしている。次にRI[1,1]〜RI[1,5]
とあるのは、第1の標準パターンを復元するのに用いる
復元情報を示している。第1の標準パターンは、フレー
ム長が5であるから、第1フレームから第5フレームま
であり、その各フレームが、メモリ11に格納されている
どの基本フレームに対応するものか、を基本フレームの
アドレス(或いは番号)で表わしたのがRI[1,1]〜RI
[1,5]である。
具体的に説明すると、RI[1,1]は、第1の標準パタ
ーンの第1のフレームは、基本フレームFf5に対応する
ものであることを、該基本フレームFf5のアドレス(或
いは番号)を記憶することによって表わしているもので
ある。同様に、RI[1,2]は、第1の標準パターンの第
2のフレームは、基本フレームFf1に対応するものであ
ることを、該基本フレームFf1のアドレス(或いは番
号)を記憶することによって表わしている。対応関係
は、補助情報メモリ12と基本フレームメモリ11との間で
図上で線を引くことによって、便宜上、ここでは表現し
ている。
従って、標準パターンの復元(再生)は、補助情報メ
モリ12を参照すれば、そのフレーム長と、各フレームの
基本フレームとの対応関係が分かり、基本フレームメモ
リ11を参照すれば、対応する基本フレームの特徴量が分
かるので、結局、補助情報メモリ12と基本フレームメモ
リ11を参照することによって可能になることが理解され
であろう。
なお、第2図において、基本フレームFf1は、更に数
チャネル(CH)分の特徴量から構成されており、このこ
とがFf(1,1)〜Ff(1,CH)なる表示によって表わされ
ているわけである。他の基本フレームについても同様で
ある。
次に、補助情報メモリ12と基本フレーム11を参照して
得たデータから実際に標準パターンを復元する手段につ
いて説明する。
第3図は、かかる復元に用いるハード構成を示したブ
ロック図である。同図において、15〜29は、それぞれ、
以下の要素を示しており、第5図で云うと、メモリイン
タフェース部6内に存在する。
15はFFMSAR(基本フレームメモリスタートアドレスレ
ジスタ)、16はSIMSAR(補助情報メモリスタートアドレ
スレジスタ)、17はFFMAR(各基本フレームの基本フレ
ームメモリアドレスレジスタ)、18はSIMAR(各標準パ
ターンの補助情報メモリアドレスレジスタ)、19AはSPN
R(標準パターン番号レジスタ)、19BはSPNC(標準パタ
ーン番号カウンタ)、20AはFLP(フレーム長レジス
タ)、20BはFLC(フレーム長カウンタ)、21はRIP(補
助情報レジスタ)、22はYR(復元したフレームレジス
タ)である。
そのほか、23はアキュムレータA、24はアキュムレー
タB、25はシフト装置、26は補数器、27は全加算器、2
8,29はそれぞれコンパレータ、であり、これらの要素
は、所要の演算または論理判断を行ってその結果を出力
するためのものであり、演算に必要なシフト信号、補数
信号、キャリ・イン(Ci)信号、演算の結果出力される
キャリ・アウト(Co)信号、コンパレータ28,29の出力
信号等は、制御部7とつながっているものである。
第4図は標準パターンの復元処理動作の流れを示すフ
ローチャートである。同チャートは、図示の如く、〜
のステップから成っている。
第3図、第4図を参照して標準パターンの復元処理動
作を各ステップ毎に説明する。但し、予めマイコン1に
よりFFMSA(基本フレームメモリスタートアドレス),SI
MSA(補助メモリスタートアドレス)及びSPN(標準パタ
ーン番号)が、夫々FFMSAR15,SIMSAR16及びSPNR19Aに設
定済であるとする。
ステップにおいて、FFMSAR15及びSIMSAR16の内容
を、FFMAR17及びSIMAR18に入れる。
ステップにおいて、SPNC19Bを1にする。
ステップにおいて、コンパレータ28を用いて、全標
準パターンの復元処理終了か否かを判定する。否なら、
ステップの処理に移る。イエス(処理終了)ならば復
元処理を終了する。
ステップにおいて、FLC20Bを1にする。
続いてステップにおいて、SIMAR16の内容が示すア
ドレスの内容を、FLR20Aに入れる。
ステップにおいて、コンパレータ29を用いて標準パ
ターン毎の全フレームの復元処理終了か否かを判定す
る。否ならば、ステップの処理をする。イエス(処理
終了)ならば、ステップの処理に移る。
ステップにおいて、SIMAR16の内容とFLC20Bの内容
を足した値が示すアドレスの内容を、RIR21に入れる。
この足し算に全加算器27等が用いられることは述べるま
でもないであろう。
ステップにおいて、FFMAR17の内容とRIR21の内容と
の和が示すアドレスの内容を、CH(チャネル)分だけYR
22に入れる。
ステップにおいて、FLC20Bをインクリメントし、ス
テップの処理に移る。
他方、ステップにおいて、SPNC19Bをインクリメン
トする。
そしてステップにおいて、SIMAR18の内容とFLR20A
の内容と1を足した値をSIMAR18に入れ、ステップの
処理に移る。
ステップにおいて、YR22に復元されたフレームは、
距離計算部5へ送られる。
以上説明した復元法は、要約すると、第N標準パター
ンの第τフレームを復元する時、補助情報メモリ12から
第N標準パターンの第τフレームの復元情報を読み出
し、基本フレームメモリスタートアドレスとの和が示す
アドレスの基本フレームを基本フレームメモリ11からチ
ャネル分だけ読み出し、これを第N標準パターンの第τ
フレームとする。
さらに、次の第(N+1)標準パターンの復元のた
め、第N標準パターンのフレーム長情報に1を足した値
と、第N標準パターンの補助情報メモリスタートアドレ
スとを足した値を、第(N+1)標準パターンの補助情
報メモリスタートアドレスとし、順次、標準パターンの
復元処理を行なう方法であると云える。
すなわち、次式に示すアルゴリズムにより復元してい
くことになる。
FFMA=FFMSA 〔第1標準パターンについて〕 SIMA(1)=SIMSA FL(1)=〔SIMA(1)〕 RI(1,τ)=〔SIMA(1)+τ〕 Y(1,τ)=〔FFMA(1)+RI(1,τ)〕 〔第N標準パターンについて〕 SIMA(N)=SIMA(N−1)+FL(N−1)+1 FL(N)=〔SIMA(N)〕 RI(N,τ)=〔SIMA(N)+τ)〕 Y(N,τ)=〔FFMA(N)+RI(N,τ)〕 次に、本発明の第2の実施例を第6図〜第8図により
説明する。
本発明の第2の実施例が、先に説明した第1の実施例
とは相違する点は、基本フレームの定め方にある。すな
わち、第1の実施例では、先ず基本フレームが予め用意
されていたが、第2の実施例では、基本フレームは予め
定めるのではなく、各標準パターン毎に、該標準パター
ンを構成する諸フレームを調べて、それから決定するよ
うにしている。
以下、順を追って説明する。
第6図は本発明の第2の実施例における記憶方式の原
理説明図である。すなわち、所与の標準パターン毎に、
該標準パターンを構成する諸フレームの中から基本フレ
ームを決定し、次に標準パターンデータを該基本フレー
ムとの関連で表現し、記憶するというのが、これら説明
する実施例の概要であり、第6図は、そのことの説明図
である。
換言すると、本実施例では、標準パターンを構成する
諸フレームの中の先頭フレームを先ず基本フレームと定
め、その基本フレームと先頭フレームに続くフレームと
の特徴パラメータの差を求め、その差がある閾値以下の
時には、両者は同じ特徴パラメータをもつものと判定
し、基本フレームとなった先頭フレームに続くフレーム
をその基本フレームで表現し、その差がある閾値より大
きい時は、両者は別の特徴パラメータをもつものと判定
し、先頭フレームに続く当該フレームを他の基本フレー
ムと定め、上述の処理を繰り返していくわけである。
具体的には、先に述べた実施例の場合と同様、基本フ
レームとなったフレームとそれに続くフレームとの間の
特徴パラメータの差を前記(2)式で求めて、その結果
により、基本フレームとするか否かを決定するのであ
る。
第6図を参照する。同図(イ)は、残る標準パターン
の波形がフレーム〜から構成される場合を一例とし
て説明している。同図(ロ)は、先頭の標準パターン・
フレームf1から最後の同フレームf8について特徴パラメ
ータを調べてみると、f1の1個と、f2からf4までの3個
と、f5およびf6の2個と、f7およびf8の2個が、それぞ
れ、同じ特徴パラメータをもつものであった場合を、一
例として示している。
その結果、同図(ハ)に示すように、基本フレームと
しては、先頭の標準パターン・フレームf1を第1の基本
フレームFf1,2番目の標準パターン・フレームf2を第2
の基本フレームFf2,5番目の標準パターン・フレームf5
を第3の基本フレームFf3,7番目の標準パターン・フレ
ームf7を第4の基本フレームFf4と定めることになる。
そこで、標準パターンを構成する8フレームを改めて基
本フレームを用いて表現し直すと、第6図(ニ)に示す
如くなるわけである。
なお、第6図では、1個の標準パターン波形を示し、
それについて説明した訳であるが、第2,第3…の標準パ
ターン波形が示されている場合も、各波形毎に全く同様
である。
第7図は本発明の第2の実施例における標準パターン
データのメモリ内格納方式の説明図である。
同図において、基本フレームメモリ11には、第6図
(ハ)に示した通りの内容のものが、標準パターン波形
の第1の波形分として(第6図では標準パターン波形は
1個分しか図示していないが)、Ff(1,1)〜Ff(1,4)
の如く先ず格納され、続いて第2の波形分以下につい
て、同様にして求める基本フレームが格納されている。
他方、補助情報メモリ12には、第1の標準パターンの
フレーム長情報FL(1)(この場合は8であるが)と、
第1の標準パターンを復元するのに用いる復元情報RI
[1,1]〜RI[1,8]が先ず格納されており、続いて、第
2の標準パターン(第6図には図示せず)用のそれら
が、以下、格納されている。なお、これらについての具
体的説明は、先に第2図を参照して行った説明から類推
的に容易に明らかであると思われるので、ここでは繰り
返さない。
第8図は、本発明の第2の実施例における標準パター
ンの復元処理動作の流を示すフローチャートである。
以下、第8図ならびに第3図のハード構成を参照して
標準パターンの復元動作について説明する。
尚、ここで用いる略称は、先に述べた実施例で用いた
ものと同じである。また、予めマイコン1によりFFMSA
(基本フレームメモリスタートアドレス),SIMSA(補助
メモリスタートアドレス)及びSPN(標準パターン番
号)が、夫々FFMSAR15,SIMSAR16及びSPNR19Aに設定され
ているものとする。
ステップにおいて、FFMSAR15の内容からチャネル
(CH)を引いた値をFFAR17に入れ、SIMSAR16の内容をSI
MAR18に入れる。
次にステップにおいて、SPNC19Bを1にする。
続いてステップにおいて、コンパレータ28を用いて
全標準パターンの復元処理終了か否かを判定する。否な
らば、ステップの処理に移る。イエス(処理終了)な
らば、復元処理を終了する。
ステップにおいて、FLC20Bを1にする。
続くステップにおいて、SIMAR18の内容が示すアド
レスの内容を、FLR20Aに入れる。
ステップにおいて、コンパレータ29を用いて標準パ
ターン毎の全フレームの復元処理終了か否かを判定す
る。否ならばステップの処理に移る。イエス(復元処
理終了)ならばステップの処理に移る。
ステップにおいて、SIMAR18の内容とFLC20Bの内容
を足した値が示すアドレスの内容をRIR21に入れる。
ステップにおいて、FFMAR17の内容と、RIR21の内容
をチャネル(CH)倍した値とを足した値が示すアドレス
の内容を、チャネル(CH)分だけYR22に入れる。
ステップにおいて、FLC20Bをインクリメントし、ス
テップの処理に移る。
ステップにおいて、SPNC19Bをインクリメントす
る。
ステップにおいて、SIMAR18の内容とFLR20Aの内容
及び1とを足した値を、SIMAR18に入れる。
ステップにおいて、FFMAR17の内容と、RIR21の内容
をチャネル(CH)倍した値とを足した値をFFMAR17に入
れる。
以上説明した復元法を要約すると、各標準パターンの
基本フレームメモリスタートアドレスからチャネル(C
H)を引いた値を各標準パターンの基本フレームメモリ
スタートアドレスとする。
ここで、第N標準パターンの第τフレームを復元する
時、補助情報メモリ12から第N標準パターンの第τフレ
ームの復元情報を読み出し、その値をチャネル(CH)倍
した値と、各標準パターンの基本フレームメモリスター
トアドレスとを足した値が示すアドレスの基本フレーム
をチャネル分だけ読み出し、これを第N標準パターンの
第τフレームとする。
さらに、次の第(N+1)標準パターンの復元のた
め、第N標準パターンのフレーム長情報に1を足した値
と、第N標準パターンの補助情報メモリスタートアドレ
スとを足した値を、第(N+1)標準パターンの補助情
報メモリスタートアドレスとする。また、第N標準パタ
ーンの最終復元情報、すなわち第N標準パターンのもつ
基本フレーム数をチャネル(CH)倍した値と、第N標準
パターンの基本フレームメモリスタートアドレスとを足
した値を、第(N+1)標準パターンの基本フレームメ
モリスタートアドレスとし、順次、標準パターンの復元
処理を行なう方法であると云える。
すなわち、次式に示すアルゴリズムにより復元してい
くことになる。
〔第1標準パターンについて〕 FFMA(1)=FFMSA−CH SIMA(1)=SIMSA FL(1)=〔SIMA(1)〕 RI(1,τ)=〔SIMA(1)+τ〕 Y(1,τ)=〔FFMA(1)+RI(1,τ)×CH〕 〔第N標準パターンについて〕 FFMA(N)=FFMSA(N−1)+RI(N−1, FL(N−1))×CH SIMA(N)=SIMA(N−1)+FL(N−1)+1 FL(N)=〔SIMA(N)〕 RI(N,τ)=〔SIMA(N)+τ〕 Y(N,τ)=〔FFMA(N)+RI(N,τ)〕 以上、述べてきた実施例は、各標準パターンの全フレ
ームを順次復元していくパターンマッチング法、すなわ
ち連続単語認識時の標準パターン復元法を述べたもので
あるが、或る整合窓を設けて各標準パターンの特定数の
フレームを復元していくパターンマッチング法、すなわ
ち離散単語認識時の標準パターン復元法については、第
5図及び第8図より容易に類推できるであろう。
〔発明の効果〕 以上説明したように、本発明によれば、比較の基準と
なる標準パターンを表わす音声データを基本フレームを
用いて表現することにより、少量のデータとして標準パ
ターンをメモリに格納しておくことが可能で、かつ、複
数の標準パターンの復元処理を高速化できるので、これ
故に音声認識装置の小型化及び高性能化、ホストコンピ
ュータとの間の転送に要する時間の短縮を図ることがで
きる。
また前記音声認識装置においては、基本フレームで表
現された音声データを復元し、パターンマッチングを行
ない、これにより音声の認識率低下を防止することがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例における記憶方式の原理説明
図、第2図は本発明の一実施例における標準パターンデ
ータのメモリ内格納方式の説明図、第3図は標準パター
ンの復元に用いるハード構成を示したブロック図、第4
図は標準パターンの復元処理動作の流れを示すフローチ
ャート、第5図は本発明の実施対象となる音声認識装置
の全体構成の一例を示したブロック図、第6図は本発明
の他の実施例における記憶方式の原理説明図、第7図は
本発明の他の実施例における標準パターンデータのメモ
リ内格納方式の説明図、第8図は本発明の他の実施例に
おける標準パターンの復元処理動作の流れを示すフロー
チャート、である。 符号の説明 1……マイコン、2……標準パターンメモリ兼中間結果
メモリ、3……マイコンインタフェース、4……入力フ
レームメモリ、5……距離計算部、6……メモリインタ
フェース部、7……制御部、8……照合部、9……クロ
ックパルス発生器、11……基本フレームメモリ、12……
補助情報メモリ、15……基本フレームメモリスタートア
ドレスレジスタ(FFMSAR)、16……補助情報メモリスタ
ートアドレスレジスタ(SIMSAR)、17……基本フレーム
メモリアドレスレジスタ(FFMAR)、18……補助情報メ
モリアドレスレジスタ(SIMAR)、19A……標準パターン
番号レジスタ(SPNR)、19B……標準パターン番号カウ
ンタ(SPNC)、20A……フレーム長レジスタ(FLR)、20
B……フレーム長カウンタ(FLC)、21……補助情報レジ
スタ(RIR)、22……復元したフレームレジスタ(Y
R)、23……アキュムレータA、24……アキュムレータ
B、25……シフト装置、26……補数器、27……全加算
器、28,29……コンパレータ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 北爪 吉明 横浜市戸塚区吉田町292番地 株式会社 日立製作所マイクロエレクトロニクス機 器開発研究所内 (72)発明者 井関 利之 横浜市戸塚区吉田町292番地 株式会社 日立製作所マイクロエレクトロニクス機 器開発研究所内 (72)発明者 安江 利一 横浜市戸塚区吉田町292番地 株式会社 日立製作所マイクロエレクトロニクス機 器開発研究所内 (72)発明者 山畳 一広 勝田市市毛1070番地 株式会社日立製作 所水戸工場内 (72)発明者 古木 仁 小平市上水本町1479番地 日立マイクロ コンピユータエンジニアリング株式会社 内 (72)発明者 深尾 嘉広 小平市上水本町1479番地 日立マイクロ コンピユータエンジニアリング株式会社 内 (56)参考文献 特開 昭55−105300(JP,A) 特開 昭57−177198(JP,A) 特開 昭57−63600(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】記憶しておいた標準パターンを復元して入
    力音声パターンと比較することにより該入力音声の認識
    を行う音声認識装置であって、 基本となる音声分析用の特徴パラメータをフレーム単位
    で所定種類だけ予め用意して基本フレームFfとして記憶
    する第1のテーブルと、 記憶すべき標準パターンを、個々の標準パターン毎に、
    当該パターンを構成するフレームの個数(以下フレーム
    長という)を表すフレーム長情報FLと、当該パターンを
    構成する各フレームに含まれる特徴パラメータが該第1
    のテーブルにおけるどの基本フレームに対応するもので
    あるかを表す対応情報RIと、を標準パターンを復元する
    補助情報として各標準パターン毎にフレーム長情報FLを
    先頭に次いで対応情報RIをフレーム順に記憶する第2の
    テーブルと、 第N標準パターンの第τフレームf(N,τ)を復元処理
    するために(ここでN,τは任意の自然数)、第2のテー
    ブルの第N標準パターンの補助情報先頭アドレスSIMA
    (N)に(τ+1)を足したアドレス(SIMA(N)+
    (τ+1))にある基本フレーム対応情報RI(N,τ)を
    用いて第1のテーブルに対応する基本フレームFf(RI
    (N,τ))を参照取得することにより、第N標準パター
    ンの第τフレームf(N,τ)を復元し、第2のテーブル
    の第N標準パターンの補助情報先頭アドレスSIMA(N)
    に第N標準パターンのフレーム長情報FL(N)を足しさ
    らに1を足すことにより、第2のテーブルの第(N+
    1)標準パターンの補助情報先頭アドレスSIMA(N+
    1)を求め、順次各標準パターンの各フレームの復元処
    理を行う情報復元手段と、 復元した各標準パターンと入力音声パターンとを比較す
    る手段と、 を有することで入力音声の認識をすることを特徴とする
    音声認識装置。
JP60195784A 1985-09-06 1985-09-06 声音認識装置 Expired - Fee Related JP2569304B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60195784A JP2569304B2 (ja) 1985-09-06 1985-09-06 声音認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60195784A JP2569304B2 (ja) 1985-09-06 1985-09-06 声音認識装置

Publications (2)

Publication Number Publication Date
JPS6256996A JPS6256996A (ja) 1987-03-12
JP2569304B2 true JP2569304B2 (ja) 1997-01-08

Family

ID=16346908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60195784A Expired - Fee Related JP2569304B2 (ja) 1985-09-06 1985-09-06 声音認識装置

Country Status (1)

Country Link
JP (1) JP2569304B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55105300A (en) * 1979-02-07 1980-08-12 Nippon Telegraph & Telephone Standard sound phythum learning unit

Also Published As

Publication number Publication date
JPS6256996A (ja) 1987-03-12

Similar Documents

Publication Publication Date Title
EP1099216B1 (en) Audio signal time scale modification
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
DE10040214B4 (de) Verfahren und System zur automatischen Erkennung einer Aktualisierung eines Sprachmodells in einem Spracherkennungssystem
US4962535A (en) Voice recognition system
JPS62133500A (ja) 音響信号から導かれた電気信号を区分する方法及び装置
US5671330A (en) Speech synthesis using glottal closure instants determined from adaptively-thresholded wavelet transforms
EP0218421B1 (en) Pattern recognition and learning apparatus
JP2569304B2 (ja) 声音認識装置
CN105161096A (zh) 基于垃圾模型的语音识别处理方法及装置
EP3706113B1 (en) Editing of midi files
JPS6123560B2 (ja)
CN1084916C (zh) 半导体存储卡的数据记录设备和方法
JPH07272447A (ja) 音声データ編集システム
JPH0262879B2 (ja)
JP3516470B2 (ja) 信号処理装置
JPS61148497A (ja) 標準パタン作成装置
JPS63281199A (ja) 音声セグメンテ−ション装置
JPS6125199A (ja) 音声認識方式
JP2022150777A (ja) 区間抽出装置およびプログラム
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPH07261779A (ja) 音節認識装置
JPS6265095A (ja) 音声認識装置
JPS5882300A (ja) 音声認識方式
JPH04128800A (ja) パターンマッチング制御回路
JPS60237494A (ja) パタ−ンマツチング方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees