JPS59204894A - 音声認識装置における段階dpマツチング方式 - Google Patents

音声認識装置における段階dpマツチング方式

Info

Publication number
JPS59204894A
JPS59204894A JP58080435A JP8043583A JPS59204894A JP S59204894 A JPS59204894 A JP S59204894A JP 58080435 A JP58080435 A JP 58080435A JP 8043583 A JP8043583 A JP 8043583A JP S59204894 A JPS59204894 A JP S59204894A
Authority
JP
Japan
Prior art keywords
calculation
output
memory
clock
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58080435A
Other languages
English (en)
Inventor
二ノ宮 正生
進 高島
福島 一雄
将美 湯山
和幸 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP58080435A priority Critical patent/JPS59204894A/ja
Priority to US06/608,279 priority patent/US4712243A/en
Publication of JPS59204894A publication Critical patent/JPS59204894A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声認識装置に係り、特に動的計画法(Dyn
amic Programming ;以下DP法と呼
ぶ)において段階マツチングを行なう音声認識装置にお
ける段階DPマツチング方式に関する。
〔従来技術〕
一般的に音声認識装置は、入力された音声の特徴パラメ
ータを抽出し、あらかじめ記憶されているパターンとパ
ターンマツチングを行ない、最も類似度の高いものを選
択して認識している。
前述の音声の特徴パラメータは音声の周波数スペクトラ
ムが多く用いられており、多数のノ\ンドパスフィルタ
ーによる方法や高速フーリエ変換によってスペクトラム
が求め゛ハ′れている。そして。
これらの方法によって求められた音声の周波数スペクト
ラムを前述した様にあらかじめ登録されているパターン
との比較すなわち標準パターンとの類似性を求め、入力
データに一番近い標準パターンが入力データであるとし
てその結果を出力する。
前述の入力データを登録しているパターンと比較すると
き、これらの間には必ずしも時間軸が1対1で対応する
とは限らず2前後の言葉の関係あるいは長音の長さ等に
よって変化する。この様に時間軸等が1対1に対応しな
いパターン間の類似性を求める方法すなわちパターンマ
ツチング法としてDP法がある。(一般的に、二つのパ
ターン間の類似性は距離として表わされる。)このDP
法はそれぞれの特徴点間の最小距離を全てにわたって求
める為に、特徴点の数が増加するほどその演算時間は増
大する欠点を有している。
DP法による前述の欠点を補う為、一般的には次の方法
が用いられている。先ずパターン自体を線形伸縮し、線
形マツチングによる予備選択を行ない、それによって選
択された標準パターンについてDP法によって最小距離
の標準パターンを求める方法である。
〔従来技術の問題点〕
線形マツチング法はDP法と比べその処理速度が速いの
で、前述の方法もその処理速度は全ての標準パターンに
ついてDP法を行なった場合と比べ速い。畳かしながら
この方法はパターンを線形圧縮している為、DP法本来
の時間軸の非線形圧縮の性質が薄れてしまう欠点を有し
ている。さらに、予備選択に用いられている線形マツチ
ングは継続時間の長い単語に対してはDP法に比べて誤
認識が多く予備選択において目的の標準パターンを選択
できない場合があるという問題を有している。
〔発明の目的〕
本発明は前記問題点に鑑みなされたものであり。
その目的は複数の標準パターンからDP法を用いて入カ
バターンに対して最小距離のものを検出し。
その処理速度は従来のDP法に比べはるかに速い音声認
識装置における段階DPマツチング方式を提供すること
にある。
(発明の要点〕 本発明の特徴とするところは音声信号をデジタルデータ
に変換する変換手段と、前記変換手段の出力を第1のメ
モリに格納するとともに前記変換手段の出力とあらかじ
め第2のメモリに格納されている複数の標準パターンデ
ータとをそれぞれ時間軸で選択的にDP演算する第1の
演算手段と。
前記第1の演算手段の結果より前記第2のメモリに格納
されている複数の標準パターンデータを選−択する選択
手段と、前記選択手段によって選択された標準パターン
データと前記第1のメモリに格納されたデータとをDP
演算する第2の演算手段より成る音声認識装置における
段階D Pマツチング方式にある。
〔発明の実施例〕
以下9図面を用いて本発明の詳細な説明する。
第1図はプロセッサを用いた本発明の第1の実施例の構
成図である。マイクロホン1はAGC回路2を介してB
PF回路3に接続されている。そしてBPF回路3の出
力はA/Dコンバータ4に加わる。プロセッサ(CPU
)6に接続しているパスライン7には前述のA/Dコン
バータ4の他にリードオンリメモリ (ROM)8.、
  ランダムアクセスメモリ (RAM)9.入出力コ
ントロールシステム(IOC3)10が接続されている
。そして入出力コントロールシステム(IOC3)10
は他の装置たとえばパーソナルコンピュータ11に接続
されている。マイクロホン1に入った音声は音声信号す
なわち電気信号に変換される。
この電気信号は人の話す声の大きさあるいは話す人の口
とマイクの距離によってそのレベルが異なるので、はぼ
一定のレベルとする為、AGC回路2に入力する。AG
C回路はその出力がほぼ一定となる様に利得が変化する
回路である。AGC回路2の出力すなわち一定のレベル
となった音声信号はBPF回路3に加わる。BPF回路
3はたとえば音声帯域を8分割する様に複数のバンドパ
スフィルタを有し、このBPF回路3によって特定の帯
域に8分割される。帯域別に8分割された音声信号はA
/Dコンバータ4に加わり、各帯域の音声信号のたとえ
ばパワーをデジタル量に変換する。A/Dコンバータ4
はBPF回路3の出力の1帯域すなわち1チヤンネルに
対し8bitのデータに変換するので合計(i4bit
のデータがたとえば8bit単位でパスライン7に出力
される。
前述のA/Dコンバータ4はハスライン7を介してプロ
セッサ(CPU)6によって制御されており、前述の6
4bitのデータはチャンネル単位で分割されてランダ
ムアクセスメモリ (RAM)9に記憶される。
プロセッサ(CPU)6は前述のA/Dコンバータ4の
制御とデータの格納の他にDP法における計算処理すな
わちDP演算とパーソナルコンピュータ11に結果を入
出力コントロールシステム(IOC3)10を介して出
力する制御を行なう。
これらの演算と制御↓まリードオンリメモリ (ROM
)8にあらかじめ格納されているプログラムをプロセッ
サ(CPU)6が実行することによってなされる。そし
てランダムアクセスメモリ (RAM)9はその時のワ
ークエリアとしても使用される。
第2図は前述のDP演算処理を説明するフローチャート
図である。A/Dコンバータ4よりデータが入力すると
DP演算処理がスタート12 L。
先ず、前段DP演算13を行なう。この前段DP演算1
3ばあらかじめRAM9に格納されている標準データと
の距離を求めるものである。しかしながらこの演算はす
べての入力データに対して行なうのではなく、特定のデ
ータ間隔たとえば、入力するデータのうち3回に1回行
なう。尚1回の測定データは前述した様に全部で54b
itより成る。特定の時間たとえば1単語の音声データ
が全て入力し:それに対応した演算が全て終了すると2
次の候補選定処理14を実行する。先に実行した前段D
P演算13は3回のうち1回の入力データに対してDP
演算を行なったものであり、その演算は当然ながら確実
さを欠いている。その為に特定の範囲に入ったた距離結
果の標準パターンデータに対して再度DP演算を行なう
為の選定処理を行なう。この選定処理が候補選定処理1
4である。しかしながら前段DP法W、13によって1
個の標準バクーンデータのみの距離があらかじめ定めた
距離内に入っている場合には再度DP演算を行なわず、
その標準パターンが入力データであると決定15し、第
1図に示した入出力コントロールシステム(IOC3)
1.0を介しパーソナルコンピュータ11に出力する。
また、あらかじめ定めた距離内に入ったものがない場合
には入力したデータは認識できないとして無効16とす
る。
さらに、前述の特定の距離内に複数の標準パターンを用
いた演算結果が入りさらに第1の候補との距離の差が特
定の範囲に入った場合には最小距離のパターンからたと
えば五番口までを候補として選定する。尚、第1の候補
との距離の差が特定範囲に5個以下しか入らなかった場
合にはその数のものだけを候補として選定する。 候補
を決定すると、候補選定処理14を終了し1次の後段D
P演算17を実行する。前段DP演算13においては入
力したデータ並びに時間に対応して並んでいる標準パタ
ーンデータを3回に1回用いて演算しているが、後段D
P演算17は選択された標準パターンデータのそれぞれ
の全てのデータに対しての最小距離を求める。そしてそ
れぞれの選定された標準パターンデータに対応して最小
距離の中で最も小さい値の標準パターンを入力したデー
タと一致しているとして決定15し出力する。
第2図において、標準パターンの時間に対応した全ての
データについて行なうのは後段DP演算17であり、そ
の時の標準パターンは最大五個であるので、この演算時
間は全ての標準パターンに対して行なう演算と比べはる
かに速い、たとえば標準パターンが64個あった場合に
は最大で5/64に短縮される。また前段DP演算は3
回に1回の割合で行なうので1個の標準パターンの全て
のデータに対して行なうのに比べその演算処理ははるか
に少ない。
第3図は本発明の第2の実施例の回路構成図である。第
1図に示した本発明の実施例はプロセッサにおいて演算
とその制御を行なっているが、第3図の実施例は全て回
路によって制御され、さらに演算も回路によってなされ
る。A/Dコンバータ18には第1図に示したBPF回
路3の出力が加わり、その出力はパラメータ正規化圧縮
部19を介してレベル検出部21.入カバターンメモリ
20に入力する。レベル検出部21の検出出力はタイミ
ング制御部22に加わる。そしてタイミング制御部22
の制御出力はA/Dコンバータ18゜パラメータ正規化
圧縮部19.フレームカウンタ23、制御部24に入力
する。入カバターンメモリ20.標準パターンメモリ2
5.ワークエリアメモリ26.最小距離メモリ27には
制御部24より出力されるアドレス出力が加わる。
距離演算部28には入カバターンメモリ20゜標準パタ
ーンメモリ25の出力が加わり、その出力は部分和演算
部29を介してワークエリアメモリ26に入力する。ワ
ークエリアメモリ26の出力は部分和演算部29と最小
距離算出部30に加わる。最小距離算出部30にはこの
他に標準パターンフレーム長メモリ31の出力、フレー
ムカウンタ23の出力がゲート回路32を介して、なら
びにゲート回路33とフレーム数補正部34を介して加
わる。最小距離算出部30の出力端子は最小距離メモリ
270入力端子に接続されており。
最小距離メモリ27の出力端子は候補選択部35の入力
端子に接続される。候補選択部35の出力は候補番号メ
モリ36と制御部24に加わる。そしてさらに決定結果
37として出力される。候補番号メモリ36は制御部2
4に接続される゛。制御部24の制御出力は距離演算部
281部分和演算部29.最小距離算出部30.tas
パターンフレーム長メモリ31.候補選択部35に加わ
る。さらに制御部24からはゲート回路32の制御端子
に、またイ・ンハータ38を介してゲート回路33の制
御端子に制御信号が入力する。尚2図中Aは接続されて
いることを示すシンボルである。
A /’Dコンバーク18に加わるそれぞれの帯域分割
された信号はデジタル量に変換されパラメータ正規化圧
縮部19に入力する。パラメータ正規化圧縮部19にお
いては最大値に1を加算した値で入力データを正規化し
、処理に必要なビット数に変換、すなわち有効ビット数
以下を切りすてる。
また最大値が特定の値以外の時には特定値で入力データ
を正規化し、前述と同様に処理に必要なビット故に変換
する。これによって特定のビット故に変換されたデータ
は入カバターンメモリ20に格納される。レベル検出部
21ば前述のパラメータ正規化圧縮部によって処理され
たデータが特定の値すなわちスレソシホールドレベルT
H以上であるか否かを検出する。このレベル検出部21
によって得られた結果によってタイミング信号を切換え
る動作をタイミング制御部22は行なう。これはA/D
コンバータ18.パラメータ正規化圧縮部19が動作す
る場合に音声区間TSのスタートを早く検出する為に行
なうものである。これによって入力したバラメークすな
わちデータDaがスレッシホールドレベルTH以下の時
には高速のクロックTpsにおいて゛、スレッシホール
ドレベルTH以上の時すなわち音声区間に入ると特定の
遅いクロックでA、/ Dコンバータ18並びにパラメ
ータ正規化圧縮部19が動作する。前述の動作によって
得られたデータは音声区間TSにおいて入カバターンメ
モリに格納される。 前述した第1図のプロセッサを用
いた処理装置の処理と同様に第3図の実施例は前段DP
演算と後段DP演算とを行なうがその処理は第3図の本
発明の実施例の回路においては同じ回路でなされる。そ
してその前段DP演算であるか後段DP演算であるかは
制御部24の制御によって決まる。すなわち前段DP−
演算と後段DP演算は入カバターンメモリ20゜標準パ
ターンメモリ25.ワークエリアメモリ26のアクセス
が異なるのみでDP演算に関係する距離演算部281部
分和演算部29.最小距離算出部30は゛全く同じ動作
となる。第1図の説明において述べた様に、その異なる
点は前段DP/Jli算においては全てのデータに対し
てDP演算を行なうのではなく3(固に11固の演算と
なることであり。
これは制御部24より発生する各メモリのアドレス値が
異なるだけである。
距離演算部281部分和演算部29.最小距離算出部3
0は前述した様にDP演算に関係する回路部である。先
ずDP演算について式を用いて説明する。
入カバターンA、標準パターン旧をそれぞれA= AX
+、A2.・・・・・・・・・・・・八j−(1)lB
=lB+、IB2.・・・・旧・・・・・IB i −
−H21とする。A1〜Aj 、 IB +〜IBj 
 ばある時間における特徴ベクトルである。このある時
間における特徴ベクトルはたとえば本発明の実施例にお
いては8次元(音声帯域を8分割)の特徴ベクトルであ
り。
Aj=   (a、H+     、   aj!  
   、   ◆−・ ass     ン  −(3
ンlB1− (Jl   、  Jz  、  ・・・
bけ )−m−(4)で表わされる。
DP演算における部分和g (t、j)は一般的に g  (1,1)  −2d (1,1)j−dw≦i
≦j+dw 5)で 表わされる。ここでd (i、  j)は各特徴ベクト
ル間の距離であり。
d (t、  j) =Σ1b、K −−ajK 1−
H5)′で定義される。またdwは片側の窓幅であり窓
幅をWとするならばW=Z dW+1となる。
前述の(5)式はDP演算における部分和を表わす式で
あり、パターン間距離はg (I、J)で得られる。一
方、音声認識等の場合には入カバターンデータ並びに標
準パターンデータはそれぞれ入力時間が異なる。すなわ
ち、 (1)(21式におけるI、  Jが一定ではな
いので、サンプル数で正規化しな(ではならない。本発
明の実施例においてはこのサンプル数が入カバターンデ
ータ、標準パターンデータでそれぞれ異なるので、最終
パターン間距離G(I、J)は 訃 G (I、J)=  □・g (I 、  J) −(
611十J         、’ となる。
一方9本発明の第3図の実施例においては変数変換して
演算を行なっている。すなわち。
i = m + j −d w −1−−H7)ただし
1≦m≦W β=j        −一刊8) 12 ’ = j−1−−H9) としてm、β、β′に関係する式を用いて演算を行なう
。(7)〜(9)式をT5)、 (6)式に代入し、変
換すると。
e  (dw+1.1)−2d  (1,1)−一10
)el  (m、1) −Q=oo  mf−dw+l
1≦m≦w −−101’ ρ=j β′−j  −1(11) となる。そして変換後の最終パターン量比IiIltE
(M、 L)は 但し M= I−J+dw+1          (13)
L=J                  (14)
で表わされる。
00)1式において、m+dw+l、l≦m≦Wでばe
(m、1)は無限大としている。これは後述するが、メ
モリ内において(11)式の最小値を格納する為に00
1式の演算と同時あるいはその演算の前に最大値をメモ
リに格納する。
第3図についてさらに説明を続ける。距離演算部28は
前述の特徴ベクトル間の距離d  (i、j)を求める
回路である。すなわち、入カバターンメモリ20と標準
パターンメモリ25より入力する各データよ゛す(5)
1式の演算を行なう。そしてその演算結果を部分和演算
部29に出力する。部分和演算部29は距離演算部28
より得られる演算結果とワークエリアメモリ26より得
られるデータより(10)  (11)式の演算を行な
う。
第4図は前述のワークエリアメモリ26の内容を示すデ
ータ構成図である。尚、データの内容は前段DP演算の
結果である。前段DP演算は入力データすなわち前述各
特徴ベクトルのうち3個に1個の割合で演算を行なって
いる。すなわち、入力データのA I + ’ A a
・・・・・・・・・Aヨ用に関してのみ演算する。標準
パターンデータも同様に3個に1個の割合で標準パター
ンメモリ25からIB I。
IB a・・・・・・・・・旧BP′++ が読出され
て演算に用いられる。
A1が入力し、入カバターンメモリ20に格納されると
同時に距離演算部28に入力し、/に+とlB+の距離
が求められる。その結果は部分和演算部29を介してワ
ークエリアメモリ26のm列の位置に格納される。標準
パターンメモリ25は複数(n個)のパターンデータを
記憶しているので。
1〜n行のm列にそれぞれの対応する結果すなわちe’
  (m、1)・・・・・・e (m、1)が格納され
る(第4図(1))。そしてA2.A3がさらに入力し
入カバターンメモリ20に格納されるが、前段DP演算
では3個に1個の割合で計算するので演算はなされない
。そして次のA4において、演算すなわち、  d (
m、  β)が求められ1部分和演算部29に出力され
る。部分和演算部29はワークエリアメモリ26より前
述のm列のデータを用いてそれぞれに対して(11)式
の演算を行なう。前述した様にA4の演算ではワークエ
リアメモリ26のmu列以外最大値が格納されているの
で mo−1,mo+1列は当然なかりe(mo−1,
2)・・・・・・e”(mol、2)とe (mo+1
.2)−−−・−e”(mo+1.2)が格納される(
第4図(2))。部分和演算部29は(11)式の演算
を行なう。
すなわちe (m−1,jlり +d (m、  A)
 、  e (m、  j2 ’) +2d (m、 
 #) 、  e (rn+1.  It、’) +d
 (m、  42)の最小値をe(m、  β)とする
ので、当然ながらこの時m+1.またはm−1の演算の
どちらか一方が最大値Qであっても残る二式のうちの一
方が最小となり、Qが書きかえられる。
そして、順次大カバターンデータすなわちAが入力し、
距離演算部28で距離が求められ、さらに部分和演算に
よってe (m、n)が求められる。
前述の演算も標準パターンデータの全種類(1〜n)に
対してなされる(第4図(3))。尚、第4図e”  
(m、s)はn番目の標準パターンに対する距離を表わ
している。
最小距離算出部30は後述する音声区間終了後に動作す
る回路である。この最小距離算出部30はワークエリア
メモリ26内の距離データから各標準パターンデータの
最小値を求める。すなわち。
前述(12)式のE (M、L)を求める回路である。
先ず、前述(13) 、  (14)式を満たすM、L
に該当するe (M、L)をワークエリアメモリ26よ
り求める。さらに標準パターンフレーム長メモリ31よ
り出力されるIとフレームカウンタ23より出力される
データJを加算し、その結果でe(M、L)を割る。そ
してその結果を最小距離メモリ27に格納する。但し、
前段処理の場合、入カバターン、標準パターンのフレー
ム長はほぼ3分の1になっているが、I、  Jは整数
であり、3で割切れるとは限らないのでI、Jが3の倍
数の時(1/3)+1.  (J/3)+1とし、  
I、 Jが3の倍数プラス1の時[(1−1)/3) 
+1゜((J−1)/31 +1とし、  j、  J
が3の倍数プラス2の時((1−2)/3) +L  
((J−2)/3) +1として各々標準パターン長メ
モリ31、フレーム数補正部 34から出力される。
このように、I/3.J/3は前段処理の場合であり、
後段処理の場合には標準バクーンフレーム長メモリ31
からはIが、フレームカウンタ2候補選択部35は最小
距離メモリ27に格納された各標準パターンデータに対
する最小距離の中から、さらに最小値を有するものを求
め、候補番号メモリ36に標準パターンデータに対応し
たパターンナンバー(第4図における1〜n)を格納す
る。候補選択部35は前述したプロセッサを用いた2段
DP演算と同様に1条件によって候補番号メモリ36に
格納する動作が異なる。前段DP演算13によって1個
の標準パターンデータのみの距離があらかじめ定めた距
離内に入っている場合には決定として端子37に決定結
果たとえばパターンナンバーを出力する。またこの結果
は制御部24を介して入出力制御システム(IOC3)
10に出力される。この時には制御部24は後段DP演
算処理の制御は行なわず次の入カバターンデータが入力
するのを待つ。またあらかじめ定めた距離内に入ったも
のがない場合には入力したデータは認識できないとして
制御部24に出力する。
この場合にも制御部24は認識不可能であることを入出
力制御システム(IOC3)10に出力する。さらに前
述の特定距離内に複数の標準パターンを用いた演算結果
が入りさらに第1の候補との距離の差が特定の範囲に入
った場合には最小距離のパターンからたとえば三番目ま
でを候補として選定する。尚、第1の候補との距離の差
が特定範囲に5個以下しか入らなかった場合にはその数
のものだけを候補として選定する。すなわち、この場合
には候補番号メモリ36には2〜5個の番号が格納され
る。尚、候補番号メモリ36への番号の格納は前段処理
を行なった場合にのみ格納されるものであり、後段演算
においてはこの候補選択部は最小値を検出後そのナンバ
ー(1〜n)を制御部24に出力する。 前述の距離演
算部28゜部分和演算部29.最小距離算出部30.候
補選択部35はそれぞれ前段DP演算、後段DP演算の
場合に共通に使用されるものである。
レベル検出部21ば前述した様にパラメータ正規化圧縮
部19のレベルすなわちパラメータDaが特定値(スレ
ッシホールトレベルTl1)以上であるか否かを判別す
る回路であり、スレッシホールドレベルTl1以上の検
出でクロックTPSがTs  に変化してDP演算処理
を開始させるが、逆に演算処理中にパラメータDaが特
定値より小であることを検出した場合には候補の待避を
行なわせる。タイミング制御部22はこれらのタイミン
グを制御する回路である。第5図はタイミング制御部2
2の回路構成図である。レベル検出部21からの検出信
号はフリップフロップ40のセント端子S、カウンタ5
1のリセット端子Rとインバータ41を介してアンドゲ
ート42.43のゲートに加わる。
フリップフロップ40の出力Qはアンドゲート44.4
5とインバータ46を介してアンドゲート47に接続さ
れる。タイミング発生部48のクロック出力TS、’ 
TPSはアンドゲート45,47を介してオアゲート4
9に入力する。オアゲート49の出力ばA/Dコンバー
タ18及びパラメータ正規化圧縮部19に接続される。
アンドゲート45の出力T5′は3進のカウンタ50の
入力とアンドゲート42,44のゲートに加わる。アン
ドゲート44の出力ばフレームカウンタ23に接続され
る。
アントゲ−1・42の出力はカウンタ51に加わり。
そのカウンタ51のN007出力はフリップフロップ4
0のリセット端子Rに加わるとともに終端出力として制
御部24に出力される。タイミング発生部48のクロッ
ク出力、アンドゲート43の出力、フリップフロップ4
0の出力Qは制御部24に加わる。カウンタ50のNo
、2出力はタイミング発生部48とアンドゲート43に
接続される。
第6図はタイミング制御部22のタイミングチャート図
である。以下第6図を用いてタイミング制御部22の動
作を説明する。
フリップフロップ40がリセット状態の時にはその出力
Qはローレベル(Lレベル)であるのでアンドゲート4
4,45はオフとなる。しかしながら、その信号はイン
バータ46に加わっているので、インパーク46の出力
はハイレベル(Hレベル)となる。インバータ46の出
力はアンドゲート47に加わっているので、アンドゲー
ト47がオンとなり、タイミング発生部48より発生ず
るクロックT、Sがアンドゲート47.オアゲート49
を介して出力される。第6図におけるクロックT PS
’ばアンドゲート47の出力を示す信号である。パラメ
ータDaがスレッシボールドレベルより大となると、レ
ベル検出部21の出力はHレベルとなりフリップフロッ
プ40をセットするとともにカウンタ51をリセットす
る。これによってフリップフロップ40の出力ばI(レ
ベルとなり。
カウンタ51のカウント値は0となる。フリップフロッ
プ40の出力がHレベルとなるとアンドゲート47はオ
フとなりアンドゲート41,45がオンとなる。これに
よってタイミング発生部48より発生するクロックTs
 がアンドゲート45゜オアゲート49を介して出力さ
れる。第6図におけるクロックのTs′はアンドゲート
45の出力を示す信号である。オアゲート49の出力は
A/Dコンバーク18並びにパラメータ正規化圧縮部1
9のそれぞれのクロック端子に加わっているので。
スレッシボールドレベル以下ではそのタイミングはTp
sで行なわれ9以上ではTsとなる。たとえばTsとT
psのクロック周波数の関係を1:3としておけば、 
Tsの3倍のクロックで低レベルを読出し。
スレッシボードレベル以上になるとTsのクロックでザ
ンブリングを行ないDP演算用のデータとして取込まれ
る。アンドゲート45の出力すなわちクロックTはカウ
ンタ5oにも加わっているので。
カウンタ50の出力すなわち、カウンタ5oは3進カウ
ンタであるので1/3分周された信号がタイミング発注
部48を介してインバートされTF9Fの信号として制
御部24に加わる。TFDP信号はそのタイミングで第
3図に示した回路がDP演算を行なうクロックとなる。
またアンドゲート44もオンとなるので、クロックTe
’が出力され、フレームカウンタ23に加わる。また、
フリップフロップ40の出力Qは制御部24の始端信号
端子に加わっているので、制御部24はフリップフロッ
プ40がHレベルとなった時に前段DP演算の制御を開
始する。
一方、音声信号等は一時的にその信号レベルが低下する
場合がある。たとえばガラコラ(学校)の様に「ン」の
音はつまる音であり、音声としてはそのレベルは低下し
ている。しがしながら、これを終点としてしまうと誤認
識をともなうので。
特定の時間レベルが低下したことを検出して認識を行な
う。この特定の時間を検出するのがカウンタ51である
。フリップフロップ4oがセーノト状態でレベル検出部
2工がローレベルとなるとカウンタ5’lは/l”y)
が解除され、インバータ41を介してHレベルが加わり
アンドゲート42がオンとなる。これによってアンドゲ
ート45より発生するクロックがアンドゲート42を介
してカウンタ51に加わる。カウンタ51は8進カウン
クであり、リセット解除後クロックが7クロソク入力す
ることによってNo、7出方がHレベルとなる。7クロ
ソク以前で再度レベル検出部21がHレベルとなるとカ
ウンタ51はリセットされる。
そして次にレベル検出部21よりλカする信号がLレベ
ルになるとまた同様の動作をくりがえす。
カウンタ51が7クロツクをカウントすると、N007
出力がHレベルとなるので、フリップフリツブ40はリ
セットされ、初期状態となる。カウンタ51のNO7出
力は制御部24の終端決定の端子に加わっており、制御
部24は後段のDP演算制御を行なう。一方、レベル検
出部21の信号はインバータ41を介してゲート43に
も加わっているので、レベル検出部21の信号がLレベ
ルとなるとゲート43にはHレベルが加わりカウンタ5
0の出力が待避信号として制御部24に加わる。 待避
信号すなわちアンドゲート43の出力信号はレベル検出
部21がLの状態ではカウンタ50の出力に同期して制
御部24に出力される。
そして制御部24では候補の待避を行なう。待避とはワ
ークエリアメモリ26に格納されているDP演算におけ
る部分和演算結果よりデータを読出し、最小距離算出部
30で最終的な演算を標準パターン数(1〜n)行ない
最小距離メモリ27に格納しさらに候補選択部35での
候補決定を行ない候補番号メモリ36に格納する動作を
示している。この待避はレベル検出部21の出力がLレ
ベルになってから7クロソクCTs)後に行なうことも
可能である。しかし、この待避をLレベル検出部間すな
わち前述の7クロック期間に行なうことによって終端決
定がなされると同時に後段DP演算を実行することが可
能となるので2本発明の実施例ではそ′の全処理におけ
る時間はさらに短くなる。第6図に示したタイミングチ
ャートにおいては音声区間で一時的なレベル低下が検出
され、待避を行なりでいるが、さらに続くレベルがHレ
ベルとなるので、再度、前段DIJQ算処理を実行する
。そして無音区間TSnにおいて再度候補の待避を行な
い7クロソク目で終端を検出し、候補が決定する。前述
の音声区間TSと無音区間TSnが前段DP演算であり
、候補決定から単語決定の間で後段DP演算がなされる
。この区間の単語決定区間TJとなる。クロックTBl
)F + TFCIPは前段後段DP演算のクロ・7り
であり、制御部24ばこのクロックに同期して各演算部
を制御する。
第3図にもどってさらに説明する。タイミング制御部2
2より発生しフレームカウンタ23に入力するクロック
は、フレームカウンタ23においてカウントされる。こ
のカウンタによって入カバタ・−ンデータのフレーム数
が求められる。フレームカウンタ23の出力はゲート回
路32.33に加わる。制御部24の出力信号はゲート
32の制御端子とインバータ38を介してゲート33の
制御端子妄加わっているのでゲー)32.33は常時ど
ちらか一方がオンとなる構成となっている。
前段DP演算の場合にはLレベルが制御部24より出力
されるのでゲート33がオンとなりフレームカウンタ2
3の出力はゲート33を介してフレーム数補正部34に
加わる。フレーム数補正部34は前述した様にフレーム
カウンタの値をほぼ1/3にする回路であり、入力Jが
30(Uは整数)の時、  (J/3) +1を出力、
入力、夏が3U+1の時((J−1)/3) +1を出
力、入力Jが3U+2の時((J−2)/3) +1を
出力する。
この出力が前段DP演算において最小距離算出部30に
おいて使用される。一方3後段DP演算の時にはゲート
32がオン、ゲート33がオフとなり、フレームカウン
タ23の出力Jがそのまま最小距離算出部30に加わる
また、標準パターンフレーム長メモリ31は前述した様
に制御部24において前段DP演算であるか後段DP演
算であるかが制御されており、最小距離算出部30には
それに対応した各標準パターンのフレーム数■に関係し
た値すなわち、前段DP演算の時にはIが3U’  (
U’は整数)の時(■/3)+1.■が3U’ +1の
時((1−1) /3) +1..1が3U’ +2の
時((1−2)/3) +1を出力し、後段DP演算の
時には■をそのまま出力する。尚、■は標準パターンメ
モリ25に格納された標準パターンデータ(1−n)に
対応して変化するものである。
第7図(A)、  (B>、  (C)は入カバ、ター
ンメモリ20.標準パターンメモリ25.最小距離メモ
リ27の内容を示すデータ構成図である。
第71m (A)において入カバターンデータの各特徴
ベクトルA1〜AjはクロックTs’で順次格納された
ものである。標準パターンメモリ25はあらかじめ求め
られている標準パターンのデータがn個格納されている
。前述した回路動作によっそ前段DP演算ではA+、A
4.A7.・・・・・・A3unとB冒IB A 、 
IB ’r =・・= [8;u’++  、  さら
に1B 7 、 IB S、 IB ニー・・・1Bi
u”++  −−IB ++ 1841[B?・・・・
・・IBmU−・・。1 との距離が特徴ベクトルAn
が取り込まれるたびに求められ部分和演算かなされて第
4図に示した構成でワークエリアメモリ26に格納され
る。尚、前述のIBで の上部数字nは標準パターンの
番号に対応する。さらに、標準パターンメモリ25は第
7図(B)に示す様に1〜nの標準パターンのグループ 二個の標準パターンのグループ■より成る。グループI
は前述した2段DPマツチングに用いられる標準パター
ンであり,グループ■は三者選択たとえば「はい」 「
いいえ」等の判別を行なう時の標準パターンである。グ
ループ■が用いられる場合は制御部24において,グル
ープ■が選択され。
候補選択並びに後段pp演算は行なわれず,最小距離を
有するパターンが選択されてその番号が結果とし“C出
力される。このワークエリアメモリ26に格納された部
分和演算の結果は終端検出のたびに第7図(C)に示す
ごとく最小距離算出がなされて最小距離メモリ27に格
納される。尚。
E“の上部数字nは標準パターンの番号に対応する。
〔発明の効果〕
以上述べた様に本発明は前後2段によるDP演算を行な
うものであり,前段は候補選択を行なうための処理であ
り,後段は高精度に前段によって得られた候補からその
目的のパターンを検出する処理である。前段は全てのデ
ータに対して処理するのではなくたとえば測定ポイント
に対して1回の距離演算を行なうのでその処理速度は速
くまた。
多くのワークメモリを必要としない。また同様に後段に
おいては,特定数の候補にたいしてのみDP演算を行な
うので多くのメモリを必要とせず処理時間は短い。
すなわぢ、本発明によれば短い時間でDP6A算処理炉
処理となり,その処理に必要とするメモリの容器も少な
くてすむ効果が発生ずる。さらに。
前段DP演算においてはそのフレーム周期が長くとれる
ので.各フレームすなわちサンプル点間で距離演算が可
能となり.結果的にはデータを取込む時間と数個の標準
パターンに対するDP演算時間で多数のDP演算を行な
ったと同等の認識率を得ることができる。
【図面の簡単な説明】
第1図はプロセッサを用いた本発明の第1の実施例の構
成図.第2図はDP演算処理を説明するフローチャート
図.第3図は本発明の第2の実施例の回路構成図,第4
図はワークエリアメモリの内容を示すデータ構成図,第
5.6図はタイミング制御部の回路構成図とタイミング
チャート図。 第7図(A)、  (B)、  (C)は大カバクーン
メモリ,標準パターンメモリ、最小距離メモリの内容を
示すデータ構成図である。 1・・・マイクロボン、   2・・・AGC回路, 
  3・・・BPF回路,    4.18・・・AD
コンバータ、    6・・・ブ.ロセソザ,    
 8・・−リードオンリメモリ。 9・・・ランダムアクセスメモリ、     10・・
・入出力コントロールシステム,    13・・・前
段DP演算   14・・・候補選定処理15・・・後
段DP演算   19・・・パラメーダ正規化圧縮部,
     20・・・入カバターンメモリ、    2
1・・・レベル検出部22・・・タイミング制御部,2
3 ・・・フレームカウンタ、    24・・・制御部,
    25・・・標準パターンメモリ、26°°°ワ
ークエリアメモリ、    27・・・最小距離メモリ
、    28・・・距離演算部,29・・・部分和演
算部,     30・’・・最小距離)E出9r+.
     31・・・標準パターンフレーム長メモリ、
     32.33・・・ゲート回路。 34・・・フレーム数補正部。 35・・・候補選択部,    36・・・(t= ?
ili番号メモリ、     40・・・フリップフロ
ップ41、46・・・インバータ、’   42,43
。 44、  45,  4.7・・・アンドゲート。 48・・・タイミング発生部,    49・・・オア
ゲート、     50.51・・・カゲンタ特許出願
人   カシオ計算機株式会社代理人弁理士  大 菅
 義 之 第1頁の続き 0発 明 者 黒沢和幸 東京都西多摩郡羽村町栄町3丁 目2番1号カシオ計算機株式会 社羽村技術センター内

Claims (6)

    【特許請求の範囲】
  1. (1) 音声信号をデジタルデータに変換する変換手段
    と、前記変換手段の出力を第1のメモリに格納するとと
    もに前記変換手段の出力とあらかじめ第2のメモリに格
    納されている複数の標準パターンデータとをそれぞれ時
    間軸で選択的にDP演算する第1の演算手段と、前記第
    1の演算手段の結果より前記第2のメモリに格納されて
    いる複数の標準パターンデータを選択する選択手段と、
    前記選択手段によって選択された標準パターンデータと
    前記第1のメモリに格納されたデータとをDP演算する
    第2の演算手段より成る音声認識装置における段階DP
    マツチング方式。
  2. (2) 前記第1の演算手段は前記変換手段のクロック
    の整数分の1で前記変換手段の出力ならびに第2のメモ
    リに格納されている複数の標準パターンデータを読出し
    てDP演算することを特徴とする特許請求の範囲第1項
    記載のDPマツチング方式。
  3. (3) 前記第1.第2の演算手段は演算結果を格納す
    る第3のメモリを共有することを特徴とする特許請求の
    範囲第1項記載のDPマツチング方式。
  4. (4) 前記変換手段は音声信号を複数の周波数帯域に
    分割するフィルタと前記フィルタの出力レベルをデジタ
    ルデータに変換するA/Dコンバータと、前記A/Dコ
    ンバータのデジタルデータのレベルを検出するレベル検
    出手段とタイミング制御手段より成り、前記検出手段の
    出力によって前記タイミング制御手段のクロックを制御
    し、前記クロックで前記A/Dコンバータは音声信号を
    デジタルデータに変換することを特徴とする特許請求の
    範囲第1項記載の音声認識装置における段階DPマツチ
    ング方式。
  5. (5) 前記タイミング制御手段は第1、第2のクロッ
    クを発生するクロック発生手段と、フリツプフロツプと
    カウンタとを有し、前記レベル検出手段の出力によって
    前記フリップフロップをセ・ノドし、前記制御手段は前
    記フリップフロップがセントされている時には第1のク
    ロックを出力し、リセ、7トされている時には第2のク
    ロックを出力し、前記カウンタは前記第1のクロックを
    カウントし、前記カウンタの出力は前記フリップフロッ
    プをリセットすることを特徴とする特許請求の範囲第4
    項記載の音声認識装置における段階DPマツチング方式
  6. (6) 前記カウンタは前記レベル検出手段の出力によ
    ってリセットすることを特徴とする特許請求の範囲第5
    項記載の音声認識装置における段階DPマツチング方式
JP58080435A 1983-05-09 1983-05-09 音声認識装置における段階dpマツチング方式 Pending JPS59204894A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP58080435A JPS59204894A (ja) 1983-05-09 1983-05-09 音声認識装置における段階dpマツチング方式
US06/608,279 US4712243A (en) 1983-05-09 1984-05-08 Speech recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58080435A JPS59204894A (ja) 1983-05-09 1983-05-09 音声認識装置における段階dpマツチング方式

Publications (1)

Publication Number Publication Date
JPS59204894A true JPS59204894A (ja) 1984-11-20

Family

ID=13718182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58080435A Pending JPS59204894A (ja) 1983-05-09 1983-05-09 音声認識装置における段階dpマツチング方式

Country Status (1)

Country Link
JP (1) JPS59204894A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56101199A (en) * 1980-01-16 1981-08-13 Matsushita Electric Ind Co Ltd Voice identifier
JPS58136099A (ja) * 1982-02-08 1983-08-12 富士通株式会社 音声認識システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56101199A (en) * 1980-01-16 1981-08-13 Matsushita Electric Ind Co Ltd Voice identifier
JPS58136099A (ja) * 1982-02-08 1983-08-12 富士通株式会社 音声認識システム

Similar Documents

Publication Publication Date Title
US4712243A (en) Speech recognition apparatus
JP2595495B2 (ja) パタンマッチング装置
JPH096394A (ja) 音声認識装置及び音声認識方法
USRE38889E1 (en) Pitch period extracting apparatus of speech signal
EP1300832A1 (en) Speech recognizer, method for recognizing speech and speech recognition program
JPS59204894A (ja) 音声認識装置における段階dpマツチング方式
JPH05181498A (ja) パターン認識装置
JP3042585B2 (ja) 音声認識装置
JPH04218100A (ja) パターン認識装置
JPH0354359B2 (ja)
JPS59204895A (ja) 音声認識装置
CN112542159B (zh) 一种数据处理方法以及设备
JP3102553B2 (ja) 音声信号処理装置
JPS6232799B2 (ja)
JP3027389B2 (ja) 2値化パターン生成方式
JPS6172299A (ja) 音声認識装置
JP2008107706A (ja) 話速変換装置およびプログラム
JPH0575117B2 (ja)
JPS61123897A (ja) 音声の始端決定装置
KR100298118B1 (ko) Hmm모델의유사성을이용한음성인식장치및방법
JPH0247698A (ja) 音声区間検出方式
JPS62159195A (ja) 音声パタン作成方法
JPH0894731A (ja) 音源方向検出方法及び装置
JPS59204900A (ja) パラメ−タ正規化圧縮方式
JPH02189600A (ja) 音声認識装置