JPH0346839B2 - - Google Patents

Info

Publication number
JPH0346839B2
JPH0346839B2 JP59267830A JP26783084A JPH0346839B2 JP H0346839 B2 JPH0346839 B2 JP H0346839B2 JP 59267830 A JP59267830 A JP 59267830A JP 26783084 A JP26783084 A JP 26783084A JP H0346839 B2 JPH0346839 B2 JP H0346839B2
Authority
JP
Japan
Prior art keywords
word
state
block
pattern
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59267830A
Other languages
English (en)
Other versions
JPS61145599A (ja
Inventor
Masao Watari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59267830A priority Critical patent/JPS61145599A/ja
Priority to US06/809,968 priority patent/US4792976A/en
Priority to DE8585116153T priority patent/DE3582150D1/de
Priority to EP85116153A priority patent/EP0188761B1/en
Priority to CA000497938A priority patent/CA1241118A/en
Publication of JPS61145599A publication Critical patent/JPS61145599A/ja
Publication of JPH0346839B2 publication Critical patent/JPH0346839B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は連続音声認識装置に関し、特に文法に
従つて連続発生された文音声を高速認識する高認
識率の連続音声認識装置に関する。
(従来技術) 音声認識装置の中でも文法に従つて発生された
文音声を認識する装置は、計算機プログラムや限
定業務用文章あるいは航空管制や各種機器の制御
指令などの認識ができ広範囲な応用分野を有して
いる。文法の拘束が与えられている場合には、そ
の文法規則を利用することによつて誤認識を防止
できることが原理的に知られている。特に連続数
字認識において入力音声に桁数の規則がある場
合、その制約を規則化することにより認識率を改
善することができる。
このような文法に従つて連続に発生された文音
声を認識する手法が特願59−068015号明細書『連
続音声認識装置』に記載されている。この原理は
大略次のようである。文法をオートマトンαで表
現し、そのオートマトンαを次のように定義す
る。
α=〈K、Σ、Δ、p0、F〉 ……(1) ここで、 K:状態Pの集合{P|P=1、2……π Σ:入力単語nの集合{n|n=1、2…N} Δ:状態遷移規則{(p、q、n)}ここで、(p、
q、n)はpn → qなる状態遷移を意味する。
P0:初期状態、以後はP=0で示す。
F:最終状態集合F⊂K 次に前記オートマトンαに従つて単語n∈Σを
連続して発声して得られる音声パタンAを A=a1、a2、…ai、…aI ……(2) で示し、これを(未知)入力パタンと呼ぶ。各単
語n∈Σに対して標準的パタン Bn=bn j、…bn Jo ……(3) を用意しこれを単語標準パタンと呼ぶ。この単語
標準パタンBnをオートマトンαに従つて接続す
ることによつて得られる連続音声標準パタンC=
Bn1、Bn2、…Bnxと入力パタンAとのDPマツ
チングを行い、2つのパタンの相互に異なる度合
を表わす量(以下相異度と称す)を算出し、最小
の相異度を与える単語系列を認識結果とする。
ここで最小の相異度を次のような動的計画の手
法で求める。初期条件を T(0、0)=0 T(m、q)=∞、m≠0、q≠0 G(p、n、j)=∞ ……(4) とし、b=1よりI/BL(ここでI/BLは説明
の簡単のため割り切れるとする。)まで順次(5)、
(6)式境界条件を基に(7)式の漸化式を(p、q、
n)∈Δなるすべての対(p、n)について計算
する。すなわち、境界条件を g(m−1、0)=T(m−1、
p) m=msp、…mep h(m−1、0)=m−1 m=msp、…mep ただしmsp=(b−1)・BL+1、mep=b・BL ……(5) とし、j=、…Jnなる各標準パタン時刻jについ
て msj=msp=[j・a] mej=msj=BL−1 ただし[x]はxより小さな最大の整数 とし、境界条件 g(msj−1、j)=G(p、n、j) h(msj−1、j)=H(p、n、j) ……(6) とし、漸化式 g(m、j)=d(m、j)+g(m−1、j^ h(m、j)=h(m−1、j^ ただし d(m、j)=Dis(an、bj n) j^=argming(m−1、j′) j−2j′j ……(7) を時刻m=msjよりmejまで計算し、境界値である
g(mej、j)、h(mej、j)をそれぞれテーブル
記憶G(p、n、j)H(p、n、j)へ格納す
る。
(8)式の計算が標準パタン時刻j=Jnまでの終了
した後、単語境界における最小化として if T(m、q)>0(m、Jn) then T(m、q)=g(m、Jn) N(m、q)=n P(m、q)=p L(m、q)=h(m、Jn) ただしm=ms、…me ms=msp+[Jn・a] me=ms+IL−1 ……(8) を計算する。
入力パタンの認識結果は判定処理として次のよ
うな手続きにより求められる。
初期条件q^=argmin[T(I、q)] ……(9) q∈F q=q^、m=I ……(10) 認識単語n^=H(m、q) 単語始点l^=L(m、q) 状態遷移q^=P(m、q) ……(11) を求める。
もしl^>0ならばq=q^、m=l^として(11)式
を繰り返す。l^=0ならば終了。
以上述べたように最小値の計算は第2図に示す
ように入力パタンのBLフレーム分をブロツク化
し、さらに斜めに傾斜させたブロツクごとに算出
している。
(発明が解決しようとする問題点) 前記特願昭59−068015号記載の方法では、入力
パタンのBLフレーム分をブロツク化し、さらに
斜めの度合いaである斜めに傾斜させたブロツク
ごとに計算を進めているので、同一出願人による
特願昭58−239303号に記載されている方法による
メモリアクセス時間の削減という利点を保持する
とともに、オートマトンの状態遷移にループが許
されないという欠点が解消している。
しかしながら、斜めブロツクの幅BLは JnioBL・aDP ……(12) ただしJnio:標準パタン最小フレーム長、 aDP:DPの傾斜制限(DPマツチングの経路の傾
き制限のことで、aDP11/aであり、第10図の 場合、aDP=2である) によつて制限され、短い標準パタンが1つでもあ
るとそれによつて斜めブロツクの幅BLが小さい
値に押されられる。メモリの読出し、書込み回数
は1/BLに比例するため、斜めブロツク幅BLが
小さい程メモリアクセス回数は大きいという欠点
があつた。すなわち、通常のメモリ素子を使用す
ればメモリアクセス時間が大きくなり、一定時間
内に認識できる単語数が小さくなる。一方、単語
数を大きくするためには高速のメモリ素子が必要
となり、回路が複雑、高価となる。
本発明の目的は、BLの整数倍の幅をもつ斜め
ブロツク単位に計算を実行することにより上記欠
点を解決し、多様な文法によつて発声された文音
声を高速に認識できるようにした連続音声認識装
置を提供することにある。
(問題点を解決するための手段) 本発明は、入力音声を特徴の時系列A=a1
a2、…ai、…aIに交換する入力部と;パタン長に
よつてK個のクラスに分けられた標準パタンセツ
トR1、R2…Rk、…RKの中の各単語nに対して標
準パタンBn=b1 n、b2 n、…bj n、…bn Jnを記憶す
る標準パタン記憶部と;単語nの入力によつて状
態遷移p→qが生じることを意味する規則(p、
q、n)の群である状態遷移テーブルΔと最終状
態の群Fとを記憶するオートマトン記憶部と;入
力パタン時刻mと状態qとによつて番地指定され
るテーブル記憶T(m、q)、P(m、q)、N(m、
q)およびL(m、q)と;状態pと単語指定n
および標準パタン時刻jとによつて番地指定され
るテーブル記憶G(p、n、j)およびH(p、
n、j)と;入力パタン時刻mと標準パタン時刻
jで定められる領域内で入力パタンk・BLフレ
ームの幅を持ち標準パタン軸へ対して傾斜してい
る平行四辺形で区切られた第b/k番目の斜めブ
ロツクの各点(m、j)において、順次指定され
る単語指定信号nに対応した標準パタンの各特徴
ベクトルbj nと入力パタンの特徴ベクトルanとの
距離d(m、j)を算出する距離計算部と;単語
指定nに対して生起し得る状態対(p、q)に対
して、状態pと単語指定nと標準パタン時刻jに
よつて指定される前記テーブル記憶G(p、n、
j)およびH(p、n、j)を参照しテーブル記
憶T(m−1、p)の値を漸化式境界条件として
DPマツチング漸化式値g(m、j)と経路値h
(m、j)を前記第b/k番目の斜めブロツク内
の各点(m、j)について求めて、第b/k+1
番目の斜めブロツクとの境界における漸化式値g
(mej、j)と経路値h(mej、j)を前記テーブ
ル記憶G(p、n、j)H(p、n、j)とに格納
するDPマツチング部と;前記DPマツチング部で
算出された漸化式値g(m、jn)を状態qに関し
て最小値を求め前記テーブル記憶T(m、q)に
書き込み、この最小を与えた単語名n、状態指定
p、経路値h(m、Jn)を前記テーブル記憶N
(m、q)、P(m、q)、L(m、q)にそれぞれ
書き込む比較回路と;前記入力パタン時刻m、入
力パタンブロツク番号b、標準パタンセツト番号
k、単語指定n、状態指定p、qおよび標準パタ
ン時刻j等の信号を発生するための制御部と;最
終時刻m=Iにおいて、前記最終状態群Fに含ま
れる状態qで前記テーブル記憶T(m、q)が最
小なるものを定め、この最小を与えた状態qおよ
び時刻mをもとにして前記テーブル記憶P(m、
q)、N(m、q)およびL(m、q)を参照して
認識結果を定める判定部とを備えることを特徴と
する。
(作用) 次に本発明について第3図を参照しながら説明
する。本発明の連続音声認識装置による方法は、
第3図に示すように複数個のBLの整数倍(k・
BL)のブロツク幅を持つ斜めブロツクを並列に
計算を進める。すなわち始めに、標準パタンをそ
のパタン長によつてK個のクラス(R1、R2…RK
に分割する。ここでRkに属する標準パタンBn
パタン長Jnは k・BL・aDPJn<(k+1)・BL・aDP ……(13) を満足する。第10図に示すようなDPパスを採
用する場合は、aDP=2となる。次に、初期条件
を T(0、0)=0 T(m、q)=∞、m≠0、q≠0 G(p、n、j)=∞ ……(14) とし、ブロツク番号b=1よりI/BLまで変化
させ、各ブロツク番号において b/k−[b/k]=0 ……(15) ただし[x]はxより小さな最大の整数 となる(bがkで割り切れる)kまたはb=I/
BLのときはすべてのkに対応したRkに属するす
べて標準パタンBnについて(16)、(17)式の境
界条件を基に(18)式の漸化式を(p、q、n)
∈Δなるすべての対(p、n)について求める。
すなわち、境界条件を m=msp、…、mepについて q(m−1、0)=T(m−1、p) h(m−1、0)=m−1 ただしmsp=[b−1/k]・k・BL+1 mep=min{msp+k・BL−1、I} ……(16) と、j=1、…、Jnなる各標準パタン時刻jにつ
いて g(msj−1、j)=G(p、n、j) h(msj−1、j)=H(p、n、j) ただしmsj=msp+[(j+1)/aDP] ……(17) とし、漸化式 g(m、j)=d(m、j)+g(m−1、j^) h(m、j)=h(m−1、j^ ただしd(m、j)=DIS(am、bj n) j^=argming(m−1、j′) j−2<j′<j ……(18) を時刻m=msjよりmej=msj+k・BL−1まで
計算し、境界値であるg(mej、j)、h(mej
j)をそれぞれテーブル記憶G(p、n、j)、H
(p、n、j)へ格納する。
(18)式の計算が標準パタン時刻j=Jnまで終
了した後、単語境界における最小化としてm=
mSJよりmeJについて if T(m、q)>0(m、Jn) then T(m、q)=g(m、Jn) N(m、q)=n P(m、q)=p L(m、q)=h(m、Jn) ただしmSJ=mSO−[Jn+1/aDP] meJ=mSJ+k・BL−1 ……(19) を計算する。
入力パタンの認識結果は前記(9)、(10)、(11)式
により前述の従来方式と同様にして求める。
本発明では複数個のブロツク幅を持つ斜めブロ
ツクを並列に計算している。実行できる理由を次
に説明する。今、標準パタンRkに属しているも
ののみとした場合は前記特願昭59−068015号に記
述してある原理によりブロツク長はk・BLとす
ることができる。さらに異なるブロツク長を持つ
斜めブロツクを並列して実行できる条件は (1) 斜めブロツクを実行する時、初期状態がすべ
て求められていること (2) 斜めブロツク実行結果が、他の斜めブロツク
の初期状態を壊さないこと の2つである。(1)の条件についてはブロツク番号
b−1までに求められている斜めブロツクは
[(b−1)/k]番目であり、その結果は[(b
−1)/k]・k・BL+k・BLb・BLまで求
められている。すなわちb番目に開始される斜め
ブロツクの初期状態は求められている。(2)の条件
についてはブロツク番号bにおいて実行される計
算される結果はすべてb・BL以後の値であり、
すでに計算済みの斜めブロツクの初期状態はb・
BL以前の値であるため、壊すことはない。
(実施例) 次に第1図および第4図〜第9図を参照して本
発明について説明する。
第1図は本発明の連続音声認識装置の一実施例
を示すブロツク図、第4図、第5図、第6図はそ
れぞれ第1図の実施例の一部詳細構成を示すブロ
ツク図、第7図は第1図における動作の時間関係
を示すタイムチヤート、第8図a,〜dは第1図
における動作の一連の流れを示すフローチヤー
ト、第9図a,bは第1図におけるオートマトン
記憶部のメモリ構成例を示す図である。
標準パタン記憶部130には標準パタンセツト
R1、R2、…Rk…、RKに含まれる標準パタンBn
記載されている。オートマトン記憶部230には
状態遷移規則と最終状態の指定情報とが記憶され
ている。本実施例では状態遷移規則は第9図aお
よびbに示すように記憶されている。第9図aは
状態指定テーブルと呼ばれ単語nによる状態遷移
p→qとして許される状態pの集合を指定してい
る。同図には単語nに対する状態pとしてp1…p
…peが生じ得ることが例示されている。第9図b
は遷移テーブルと呼ばれ単語nによつて状態pか
ら遷移し得る状態qの集合を記憶している。
マイクロホン100より未知入力音声が入力さ
れると入力部110によつて周波数分析がなされ
る特徴を示すベクトルa1に変換され順次入力パタ
ンバツフア120に送られる。また、入力部11
0には音声レベルを検知することによつて音声区
間を決定する機能が与えられており、音声区間を
中では「1」その他では「0」なる音声区間信号
Sを発生する。制御部240は、この音声区間信
号Sの立上りの時刻において初期化パルスSET
1を発生する。これによつて第8図aのブロツク
10に対応する初期化がGメモリ150とTメモ
リ200に対応してなされる。
以上初期化が終了すると、以後のBLフレーム
分の入力特徴aiの入力に同期して入力パタンブロ
ツク信号bが1、2…と計数される。この入力パ
タンブロツクbにおいて制御部240よりの標準
パタンセツト指定信号kは1からKまで変化す
る。各kにおいて前記(15)式で示したbがkで
割り切れるかまたはb=I/BLの場合のみ以下
の処理が行われる。
制御部240よりの単語指定信号nは1からN
まで変化する。各単語nにおいてその単語Rk
属しているか判定し、属している場合のみ以下の
処理が行われる。オートマトン記憶部230の中
の状態テーブルが参照され、状態指定信号pがp1
からpeまで変化される。またその単語nと状態
pにて規定される状態指定信号qも出力される。
次に単語n、状態pなる1サイクル内の動作を
説明する。この1サイクルによつて第2図に図示
した斜め1ブロツク部分の計算が実行される。す
なわち前記(16)、(17)式の境界条件のもとで前
記(18)、(19)式を計算する。始めに制御部24
0よりの信号SET2によつて、第8図aのブロ
ツク11に対応する値のセツトがDPマツチング
部140内のgメモリ143とhメモリ144に
対して行われる。続いて制御部240よりの標準
パタン時刻信号jは1からJnまで変化する。各標
準パタン時刻jにおいて、まず第8図bのブロツ
ク12に示す第b/k−1番目の斜めブロツクと
の境界値のセツトが制御部240よりの信号
SET3によつて行われる。続いて入力パタン時
刻信号mがmsj(msj=(b−k)・BL+1[j・
a])からmej(mej−min{msj+k・BL−1、I}
まで変化する。各入力パタン時刻mにおいて第8
図bのブロツク13に示した計算がDPマツチン
グ部140で行われる。DPマツチング部140
では始めに入力パタンのmフレーム第n番目の単
語の標準パタンのjフレームが読み出されて前記
(71)式に示すR次元ベクトル間の距離を距離計
算部141で求める。すなわち入力パタンバツフ
ア120と標準パタン記憶部130とからの信号
にに従つてR個のデータを順次読み出し、絶対値
回路1411で差の絶対値を求め、加算器141
2とアキユムレータ1413によつてその和が求
められ、Dis(an、bj n)得られる。一方、距離計
算と並列して3つの相異度の最小値が求められ
る。すなわち、gメモリ143よりg(m−1、
j)、g(m−1、j−1)、g(m−1、j−2)
とhメモリ144よりh(m−1、j)、h(m−
1、j−1)、h(m−1、j−2)を読み出し、
レジスタG1,G2,G3とH1,H2,H3へ
それぞれ格納する。比較回路1422は3つのレ
ジスタG1,G2,G3から最小値を検出し、そ
の最小値が得られたレジスタGn^(n^は1、2、3
のどれか)に対応したレジスタHn^を選択するゲ
ート信号n^を発する。前記ゲート信号nにより選
択されたレジスタHn^の内容がhメモリ144の
h(m、j)へ書き込まれる。また、比較回路1
422より出力された最小値g(m−1、j^)は前
記距離計算部141で求められた距離d(m、j)
と加算器1421によつて加算され、gメモリ1
43のg(m、j)へ書き込まれる。
入力パタン時刻mがmsjよりmejまで変化した
後、制御部240よりの信号SET4に従つて第
8図bのブロツク14に示した第b/k+1番目
の斜めとの境界値g(mej、j)、h(mej、j)を
テーブル記憶G(p、n、j)150、H(p、
n、j)160へ格納する。
以上説明した第8図bのブロツク12,13,
14の動作を標準パタン時刻jが終端Jnとなるま
で実行することによつて第b/k番目の斜めブロ
ツクの漸化式計算が行われる。次いで制御部24
0より発せられた信号m2(ms=msp+[Jn・a]か
らme=min{ms+k・BL−1、I}まで変化す
る)に従つて第8図cのブロツク15に示した比
較が行われる。すなわち、第5図に示すように、
信号m2と状態qに従つてTメモリ200よりT
(m、q)とgメモリ143よりg(m、Jn)が読
み出され、比較回路170により比較しT(m、
q)>g(m、Jn)の場合wp信号が発せられ、g
(m、Jn)、n、p、(h(m、Jn)がテーブル記憶
T(m、q)200、N(m、q)190、P(m、
q)180、L(m、q)210へそれぞれ書き
込まれる。
以上の動作によつて状態p、単語nの処理が終
了する。さらに状態指定信号pがp1からPeと変
化されることにより単語指定信号nに対する処理
が終了する。さらに単語指定信号nが1からNま
で変化されることにより標準パタンセツトkに対
する処理が終了する。さらに標準パタンセツト信
号kが1からKまで変化することにより第b番目
の入力パタンブロツクに対する処理が終了する。
入力パタンブロツク信号bがI/BLとなつた
後に前記(9)、(10)、(11)式に示した判定処理が開
始される。判定部220は第6図に示すように構
成され、まず第8図dのブロツク16の処理とし
て、オートマトン記憶部230から最終状態集合
Fに含まれる状態qを信号q3に従つて順次指定
され、Tメモリ200よりT(I、q)を読み出
し、比較回路211、最小値レジスタ222、状
態レジスタ223を用いて最小のT(I、q)が
与えられる状態g^を得る。続いて第8図dのブロ
ツク17の処理として判定制御部227はg=
g^、m=Iとしてアドレス信号m3、qをNメモ
リ190、Lメモリ210、Pメモリ180へ発
しN(m、q)、L(m、q)、P(m、q)を読み
出す。このL(m、q)とP(m、q)は次の時刻
mと状態qとなり、N(m、q)は認識結果とし
て出力される。この処理をmが零になるまで繰り
返すことにより順次認識結果が得られる。
以上、本発明の構成を実施例にもとづいて説明
したが、これらの記載は本発明の権利範囲を限定
するものではない。特に本実施例ではDPマツチ
ングの漸化式として最も簡単な(7)式を用いたが、
他のより高性能なものを用いる方法も考えられ
る。例えば g(m、j)=ming(m−2、j−
1)+d(m−1、j)+d(m、j) g(m−1、j−1)+d(m、j) g(m−1、j−2)+d(m、j) なるものを用いる方法が考えられる。ただし、こ
の場合には漸化式値は時刻(m−2)まで、距離
も時刻(m−1)まで保存しなくてはならないの
でテーブル記憶G(p、n、j)と同様なものを
増設する必要がある。また、本説明では距離を基
本として認識を行つたが、相関を基本として認識
する方法も考えられる。この場合には、大小関係
が逆になるので本説明の最小値検出機能を、すべ
て最大値検出機能に置換する必要がある。また、
本説明ではテーブル記憶G(p、n、j)および
H(p、n、j)はフオートランで用いられる三
次元配列としてあるが、状態指定信号p、単語指
定信号n、標準時刻jによつて指定されるメモリ
としてもよい。すなわち、テーブル記憶は前記
p、n、jのすべての範囲(テーブルサイズ=
Pnax×nnax×jnax)を持つのではなく、使用され
る範囲(テーブルサイズ=ΣJn)のみを持つてい
るものとしてもよい。これらの自明な変更は本発
明の権利範囲に属するものである。
(発明の効果) 以上説明したように本発明の連続音声認識装置
では、BLの整数倍の幅を持つ斜めブロツク単位
に計算を進めているので、短い標準パタンがあつ
てもその標準パタンにのみ短いブロツク幅で計算
すればよく長い標準パタンに対しては長いブロツ
ク幅で計算できる。これによつて前記特願昭59−
068015号明細書に記載されている方法に比較して
メモリアクセス時間の削減という利点を有してお
り、多様な文法によつて発生された文音声を高速
に認識することが可能となる効果が生じる。
【図面の簡単な説明】
第1図は本発明の連続音声認識装置の一実施例
を示すブロツク図、第2図および第10図は本発
明の原理を説明するための図、第3図は従来技術
を説明するための図、第4図、第5図、第6図は
それぞれ第1図の実施例の一部詳細構成を示す部
分ブロツク図、第7図は第1図における動作の時
間関係を示すタイムチヤート、第8図a,〜dは
第4図〜第6図における動作の一連の流れを示す
フローチヤートおよび第9図a,bは第1図にお
けるオートマトン記憶部のメモリ構成例を示す図
である。 図において、100……マイクロホン、110
……入力部、120……入力パタンバツフア、1
30……標準パタン記憶部、140……DPマツ
チング部、141……距離計算部、143……g
メモリ、144……hメモリ、150……Gメモ
リ、160……Hメモリ、170,221……比
較回路、180……Pメモリ、190……Nメモ
リ、200……Tメモリ、210……Lメモリ、
220……判定部、222……最小値レジスタ、
223……状態レジスタ、227……判定制御
部、230……オートマトン記憶部、240……
制御部。

Claims (1)

  1. 【特許請求の範囲】 1 (a) 入力音声を特徴の時系列A=a1、a2、…
    ai、…arに変換する入力部、 (b) パタン長によつてK個のクラスに分けられた
    標準パタンセツトR1、R2、…、Rk、…RKの中
    の各単語nに対して標準パタンBn=b1 n、b2 n
    …bj n、…bnJnを記憶する標準パタン記憶部と、
    単語nの入力によつて状態遷移p→qが生じる
    ことを意味する規則(p、q、n)の群である
    状態遷移テーブル△と最終状態群Fとを記憶す
    るオートマトン記憶部、 (c) 入力パタン時刻m、状態qにおける最小単語
    累積相違度T(m、q)、その最小累積相違度を
    与えた単語名N(m、q)、その単語の経路値L
    (m、q)、単語始点の状態P(m、q)を記憶
    するテーブル記憶T(m、q)、N(m、q)、L
    (m、q)およびP(m、q)、 (d) 単語n、状態p、標準パタン時刻jにて定ま
    る前ブロツクとの境界上における累積相違度G
    (p、n、j)、その累積相違度が得られた経路
    値H(p、n、j)を記憶するテーブル記憶G
    (p、n、j)およびH(p、n、j)、 (e) 入力パタン時刻mと標準パタン時刻jで定め
    られる領域内で入力パタンk・BLフレームの
    幅を持ち、標準パタン軸に対して傾きの度合が
    aで傾斜し、かつ[a・Jmin]+1>BL>1
    を満たす平行四辺形で区切られた第b/k番目
    の斜めブロツクの各点(m、j)において、順
    次指定される単語指定信号nに対応したRk
    属する標準パタンの各特徴ベクトルbj nと入力
    パタンの特徴ベクトルanとの距離d(m、j)
    を算出する距離計算部、 (f) 単語指定nに対して生起し得る状態対(p、
    q)に対して、状態pと単語指定nと標準パタ
    ン時刻jによつて指定される前記テーブル記憶
    G(p、n、j)およびH(p、n、j)を参照
    し、テーブル記憶T(m−1、p)の値を漸化
    式境界条件としてDPマツチング漸化式値g
    (m、j)と経路値h(m、j)を前記第b/k
    番目の斜めブロツク内の各点(m、j)につい
    て求めて、第b/k+1番目の斜めブロツクと
    の境界における漸化式値g(mej、j)と経路
    値h(mej、j)を前記テーブル記憶G(p、
    n、j)とH(p、n、j)とに格納するDPマ
    ツチング部、 (g) 前記DPマツチング部で算出された漸化式値
    g(m、Jn)を状態qに関して最小値を求め前
    記テーブル記憶T(m、q)に書き込み、この
    最小を与えた単語名n、状態指定p、経路値h
    (m、Jn)を前記テーブル記憶N(m、q)、P
    (m、q)、L(m、q)にそれぞれ書き込む比
    較回路、 (h) 前記入力パタン時刻m、入力パタンブロツク
    番号b、標準パタンセツト番号k、単語指定
    n、状態指定p、qおよび標準パタン時刻j等
    の信号を発生するための制御部、 (i) 最終時刻m=Iにおいて、前記最終状態群F
    に含まれる状態qで前記テーブル記憶T(m、
    q)が最小なるものを定め、この最小を与えた
    状態qおよび時刻mをもとにして前記テーブル
    記憶P(m、q)、N(m、q)およびL(m、
    q)を参照して認識結果を定める判定部、とを
    備えることを特徴とする連続音声認識装置。
JP59267830A 1984-12-19 1984-12-19 連続音声認識装置 Granted JPS61145599A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP59267830A JPS61145599A (ja) 1984-12-19 1984-12-19 連続音声認識装置
US06/809,968 US4792976A (en) 1984-12-19 1985-12-17 Pattern recognizing device with pattern matching in slant parallelogrammic blocks of widths dependent on classified reference pattern lengths
DE8585116153T DE3582150D1 (de) 1984-12-19 1985-12-18 Mustererkennungseinrichtung mit mustervergleichung in geneigten parallelogrammfoermigen bloecken, deren breiten von den laengen von eingeordneten referenzmustern abhaengen.
EP85116153A EP0188761B1 (en) 1984-12-19 1985-12-18 Pattern recognizing device with pattern matching in slant parallelogrammic blocks of widths dependent on classified reference pattern lengths
CA000497938A CA1241118A (en) 1984-12-19 1985-12-18 Pattern recognizing device with pattern matching in slant parallelogrammic blocks of widths dependent on classified reference pattern lengths

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59267830A JPS61145599A (ja) 1984-12-19 1984-12-19 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS61145599A JPS61145599A (ja) 1986-07-03
JPH0346839B2 true JPH0346839B2 (ja) 1991-07-17

Family

ID=17450205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59267830A Granted JPS61145599A (ja) 1984-12-19 1984-12-19 連続音声認識装置

Country Status (5)

Country Link
US (1) US4792976A (ja)
EP (1) EP0188761B1 (ja)
JP (1) JPS61145599A (ja)
CA (1) CA1241118A (ja)
DE (1) DE3582150D1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
JP2692581B2 (ja) * 1994-06-07 1997-12-17 日本電気株式会社 音響カテゴリ平均値計算装置及び適応化装置
DE4433366A1 (de) * 1994-09-20 1996-03-21 Sel Alcatel Ag Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür
EP0703569B1 (de) * 1994-09-20 2000-03-01 Philips Patentverwaltung GmbH System zum Ermitteln von Wörtern aus einem Sprachsignal
DE19818582A1 (de) * 1998-04-25 1999-10-28 Bayerische Motoren Werke Ag Visualisierung von Kraftfluß- und Momentenverläufen in einer Struktur oder in Elementen aus dieser Struktur
US20130067366A1 (en) * 2011-09-14 2013-03-14 Microsoft Corporation Establishing content navigation direction based on directional user gestures
WO2014094275A1 (en) * 2012-12-20 2014-06-26 Intel Corporation Accelerated object detection filter using a video motion estimation module
US10235993B1 (en) * 2016-06-14 2019-03-19 Friday Harbor Llc Classifying signals using correlations of segments

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
GB1557286A (en) * 1975-10-31 1979-12-05 Nippon Electric Co Speech recognition
JPS5529803A (en) * 1978-07-18 1980-03-03 Nippon Electric Co Continuous voice discriminating device
JPS5569880A (en) * 1978-11-22 1980-05-26 Nec Corp Pattern recognition unit
JPS55157799A (en) * 1979-05-29 1980-12-08 Nippon Electric Co High efficiency pattern matching unit
US4277644A (en) * 1979-07-16 1981-07-07 Bell Telephone Laboratories, Incorporated Syntactic continuous speech recognizer
JPS5722295A (en) * 1980-07-15 1982-02-05 Nippon Electric Co Speaker recognizing system
JPS5782896A (en) * 1980-11-12 1982-05-24 Hitachi Ltd Continuous voice recognition system
JPS57147781A (en) * 1981-03-06 1982-09-11 Nec Corp Pattern matching device
US4400788A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Continuous speech pattern recognizer
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
US4570232A (en) * 1981-12-21 1986-02-11 Nippon Telegraph & Telephone Public Corporation Speech recognition apparatus
JPS58115490A (ja) * 1981-12-29 1983-07-09 日本電気株式会社 パタン間距離計算装置
JPS58132298A (ja) * 1982-02-01 1983-08-06 日本電気株式会社 窓制限付パタンマツチング装置
JPS60211498A (ja) * 1984-04-05 1985-10-23 日本電気株式会社 連続音声認識装置

Also Published As

Publication number Publication date
EP0188761B1 (en) 1991-03-13
DE3582150D1 (de) 1991-04-18
CA1241118A (en) 1988-08-23
EP0188761A1 (en) 1986-07-30
JPS61145599A (ja) 1986-07-03
US4792976A (en) 1988-12-20

Similar Documents

Publication Publication Date Title
Ellis et al. Tandem acoustic modeling in large-vocabulary recognition
JPS6024597A (ja) 音声登録方式
CN110188353A (zh) 文本纠错方法及装置
JP2980026B2 (ja) 音声認識装置
JPH029359B2 (ja)
JPH0346839B2 (ja)
US5086472A (en) Continuous speech recognition apparatus
JPS6312312B2 (ja)
JP2964881B2 (ja) 音声認識装置
JPH01241667A (ja) 学習機構を有するダイナミック・ニユーラル・ネットワーク
CA1229924A (en) Speech recognition activation and deactivation method
JPH0355836B2 (ja)
JPS60164800A (ja) 音声認識装置
CA1229923A (en) Speech recognition method including biased principal components
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS62209497A (ja) 連続音声認識装置
JPS61148496A (ja) 連続音声認識装置
JPS61235899A (ja) 音声認識装置
JPS62266600A (ja) 単語音声認識装置
JPH0552516B2 (ja)
JPH0223876B2 (ja)
JPH0567037B2 (ja)
JPH0744188A (ja) 音声認識装置
JPS61102698A (ja) 標準パタ−ン適応方式
JPH053596B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees