JPS62299999A - パタ−ン比較装置 - Google Patents

パタ−ン比較装置

Info

Publication number
JPS62299999A
JPS62299999A JP61145101A JP14510186A JPS62299999A JP S62299999 A JPS62299999 A JP S62299999A JP 61145101 A JP61145101 A JP 61145101A JP 14510186 A JP14510186 A JP 14510186A JP S62299999 A JPS62299999 A JP S62299999A
Authority
JP
Japan
Prior art keywords
input
pattern
word
series
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61145101A
Other languages
English (en)
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61145101A priority Critical patent/JPS62299999A/ja
Publication of JPS62299999A publication Critical patent/JPS62299999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、登録された複数種類のパターンと入力パター
ンとの比較を行ない、入力パターンの識別を行なうパタ
ーン比較装置、特に単語音声の認識などに適用可能なパ
ターン比較装置に関する。
従来の技術 人間にとって最も自然な情報発声手段である音声が、人
間−機械系の入力手段として真価が発揮されるだめには
、高認識率の実現が最も重要である。本発明の目的もこ
こに存し、高認識率を実現した音声認識装置を提供する
ことにある。
第2図は単語単位を認識の単位とする音声認識装置のブ
ロック図である。21は音声信号の入力端子、22は入
力音声信号を周波数分析、LPG分析、PARCOR分
析、相関分析等により幾つかの数値の組(特徴ベクトル
)の系列に変換する3ヘ−7 音響分析部、23は認識すべき単語が前記特徴ベクトル
の系列として登録されている標準パターン記憶部、24
は音響分析部22で分析された認識すべき入力音声信号
に対する前記特徴ベクトルの系列と前記標準パターンの
それぞれとを比較し、両者の距離あるいは類似度を81
算するパターンマツチングfi、25はパターンマツチ
ング部24の計算結果に基づいて前記入力音声パターン
に最も近い標準パターンに対〔6する単語を認識結果と
して判定する判定部であり、26はこの認識結果を出力
する出力端子である。このような構成による音声認識装
置において、パターンマツチングの方法として、動的計
画法による時間軸非線形伸縮によりマツチング(DPマ
ツチング)を行なう方法が優れている。
次にI)Pマツチングによるアルゴリズムについて簡単
に説明する。いま、 を二つの音声パターンとする。すなわち、それ等の音声
パターンは、それぞれに対する特徴ベクトル&i、t)
jの系列で表わされる。
特徴ベクトルaiとbjとの距離’rd(i、j)とす
るとき、前記両系列を構成するベクトルの種々の対応付
けに対し、d(i、j )の荷重平均を求め、それが最
小になる対応付けを両系列間の最適な対応付けとし、そ
の時の荷重平均を両系列間の距離D(A、B)とするの
であるが、この手続きを動的計画法を用いて効率よく行
なうのがDPマツチングである。なお、d(i、j)は
通常、ベクトル’Li’ 、 bjのユークリッド距離
または市街地距離が用いられる。
第3図はこれを二次元的に図示したもので、ム。
8両パターンの時間の対応即ち時間変換関数j (i)
は、i−j平面上の格子点C例)=(i(k)、j(k
))の系列 F = c(1) c(2)・・・・・・C□□□)・
・・・・・C(ト)  ・・・・・・(2)(i(5)
)=1.j(5))=J) で表わされる。このとき、D(A、B)は次のように定
義される。
6ベージ ここに、W(8))は非負の定数で、その値は時間変換
関数、t(i)k点列で近似するときの方式によって定
められる。ここで、式(3)の分母をFに依存しない定
数 とすれば、D(A、B)は動的計画法により効率的に求
められる。すなわち、 ν +d(c(k))w□□□)] −min[g(c(k−+))+d(c(k))w(k
月 ・・・・・・(4)0(IC) 6ヘー。
であるから、g(c(1))=g (1,1)=a (
1゜1)として、漸化式(4)を解き、g(c(K))
 −g (X 。
J)が求められれば、 D(ム、B)=−g(I、J)    ・・・・・・(
6)としてD(A、B)が求められる。
式(3)の分母を定数化する方法として、M−I+Jと
なるようにする方法(対称型)と、M=IまたはJとな
るようにする方法(非対称型)がある。
第4図a −jは点列Fを選ぶ際の拘束条件の例を示し
ており、点(i、j)に至る径路は図の矢線で示される
径路のみ取り得る。また各線分上に示された数字はその
線分が径路として選ばれた場合の荷重W(k)を示して
いる。a、bは前記対称型の例でM=I+Jとなり、c
−f+g−jは前記非対称型の例で、前者はy=Iとな
り、後者はM−Jとなる。
このようなマツチング法を用いて単語音声の認識をする
には次のようにする。認識の対象とkっている単語クラ
スをn(n−1〜N)、その標準7ヘーノ パターンをRn で表わす。入力パターン人と各標準パ
ターンRn  との距離Dn=D (A 、 R”)を
上記の方法で計算し、Inn” = fIIin(Dl
l)を与えるクラスn* をAに対する認識結果とする
前記非対称型のDPマツチングでM−、Iとなるように
すれば、Mは入力パターン長にのみ関係する量とな′す
、式(5)において何れの標準パターンに対してもMは
一定であるから、 よ り(ム、B)=g(I、J)−min[、Σd(i、j
 )]−・−(e)j(i) 1=’ と定義出来る。また、前記非対称型のDPマツチングで
M=Jとなるようにすれば、Mは標準バタと定義出来る
。次に実際の計算を行う場合の例を示す。
第4図aの拘束条件の許に式(四におけるD(I・J)
を求める場合には次の漸化式(8)を計算すれば良い。
・・・・・・(8) 初期条件 g(1,1) −d(1,1)第4図eの拘
束条件の許に式(6)を求める場合には次の漸化式(9
)を計算すれば良い。
・・・・・・(9) 初期条件 g(1,1)=d(1,1)また、第4図1
の拘束条件の許に式(7)’!に求める場合には次の漸
化式(1o)を計算すれば良い。
・・・・・・(1o) 初期条件 g(1,1)−d(1,1)次に連続単語音
声の認識について説明する。連続単語音声の認識は次の
ように定式化できる。いまX個の単語q(1)、q(2
)、・−・・・・、q(X)を連続して9へ一1゛ 発生したときの音声パターンを人で表す。
A−=a1a2・・・・・・al・・・・・・八!  
  ・・・・・・(11)単語qCK)の標準パターン
を R(1(X) = b(1(X) b(1(X) 、、
、bq(X)、 、、、 b(1(X)1  2   
 ]    ’q(x)トスルトキ、X (l?il 
)単m Rq”’+ R”)+ ”・s R”z)全接
続して得られる標準パターンR*ハ R*−Rq(1句Rq(2届・・・・・・■Rq(x)
・・・・・・(12):bq(1)、、、、(1(1)
  5q(2)、、、、Q(2)  、、、、Q(X>
1Jq(+)  +    Jq(2)   +、、、
、(1(X)  、、、、Q(X)1.、、(1(X)
Jq(X)   I   JQ(X) で表される。ここで■はパターンの接続を表す。
そこで、連続単語音声認識は、とのR*と入力音声パタ
ーン人との間でDPマツチングを実行し、その際得られ
るD(A、R*)が最小になるように、Xとq(x)(
x =1 、2 、・・・・・・、X)を決めるという
問題になる。即ち、 T= min [D(i、f(1)■Rq(2)(わ、
<EiEIRq(x)■1.■、p(x)]X 、q(
x) 10ベーン゛ ・・・・・・(13) を計算し、Tが最小になる条件を求めればよい。
式(13)の計算をまともに実行しようとすると、膨大
な計算量が必要となる。即ち、入力音声パターンにおい
て連続発生の単語数の最大値をに1単語標準パターンの
数をNとすれば、N 回の計算を実行する事になる。そ
こで、実際にはこの問題を次の漸化式を解く問題に帰着
させている。
入力音声パターン人において、i=に+1からi=mま
での部分区間を、部分パターンA(k、m)で定義する
A (k e m ) = lLk+1ak+z +・
+ +++ aB   =−=−(14)このとき、式
(6)によりパターン間の距離を定義すれば次のことが
言える。
D(A、R■R)=mzn[D(A(0,m)、R’ 
)+D(A(m、I)、R)]  −・団−(15)こ
のことを用いれば式(13)は次のように解ける。
ここで以後用いる記号の意味を第1表にまとめて示す。
11べ一7′ 第1表 イ)入力単語数Xが既知の場合 Nx(i)=n” 、  Bx(i)−m”(n、mは
式(15)を満たすnとm)なる漸化式の解を求めれば
、認識結果は第5図に示すフローチャートにより、X単
語列の最後尾単語名とバンクポインタから先頭迄の単語
名とセグメンテーション結果が逆の順序で順次求まる。
口)入力単語数Xが未知の場合 ”(’) ”  win [Dx−+(m) +Dol
(Il+1 : i )]m、n、x ”mln[D(m)+ Dol(In+1 :l )コ
・・・・・・(17) N(i)=n” 、  B(i)=m”(” r ”は
式(16)を満たすnとm)なる漸化式の解から第6図
のフローチャートにより認識結果が得られる。
以上の考え方を実現するのに2段DP法が知られている
。次に入力単語数Xが既知の場合の2段13ヘーl DP法について概略を説明する。
2段DP法は、式(16)あるいは式(17)を直接解
く方法であって、先ずDon(s:t)をあらゆるS。
tの組み合わせに対してI)Pで求めておき、その後D
x(i)をDPで求める方法で、DPを2段にしている
のが特徴である。この2段DP法としては前向きア〉ゴ
リズムと後向きアルゴリズムが知られているが、ここで
は後向きアルゴリズムについて説明する。
(1)入力パターンのフレーム1−1に対して、X=1
〜xについて、Dx−1(1−1)、Bx−1(i 1
)。
Nx−+(11)は求まっているとする。
(2)単語n (n=1 、2、−−−−−−、 N 
)の標準パターンと入力パターンを、io を始点とし
て逆時間向きにDPマツチングする。従って、径路の拘
束条件は第4図c、d、e、fに対応して、第7図a、
b、c、dとなる。マツチング範囲は、整合窓幅rで行
うことも考えられるが、ここでは傾き1/2〜2の範囲
(傾斜制限内、第8図の斜線部)で行うものとする。こ
のマツチ141・−ソ ングを終端フリーで行う。その結果、D(、n(s:i
)カ求マル。タタシ、i−2コ+1≦8 ≦i(1/2
)j”である。
(3)式(16)のDX(1)、BX(i)、NX(1
)をx−1〜xについて求める。
(4)  i= i+1として(2)へ戻る。
この考え方により、連続発生された単語音声を認識する
ことが可能である。Xが未知である時は、上記(1)〜
(3)における添字Xを取り除き、Xを無視すればよい
発明が解決しようとする問題点 Xの値が既知の場合は前記−(イ)入力単語数Xが既知
の場合−の漸化式を適用する方が前記−(ロ)入力単語
数Xが未知の場合−の漸化式を適用するよりも高い認識
率が得られる。ところがXの値は一般には不明であるこ
とが多く、前記←)の方法を用いざるを得ない場合が多
かった。
問題点を解決するための手段 入力信号を特徴ベクトルの系列a1 a2・・・・・・
tLlに変換する特徴抽出手段と、特徴ベクトルの系列
16ベー/ b1b2・・・・・・bn 、n から成る標準パター
ンRn(ただし、n=1.2、……、N)を記憶する標
準パターン記憶手段と、連続的に単語又は音節等を発生
する毎にそれに同期したマーカ信号を入力するマーカ信
号入力手段と、この一連の入力信号に対するマーカ信号
の総数をXとするとき、前記入力パターンと前記標準パ
ターンRnの結合パターンとのパターン間の距離を、動
的計画法により、前記入力パターンを構成する特徴ベク
トルの系列a1&2・・・・・・a!と前記標準パター
ンHnの種々の結合パターンRq(1)■Rq(2)■
・・・・・・■Hq(X謄構成する特徴ペクト、l/の
系列bq(1)1.、、b(1(+)  b(1(2)
 0.4.(1(2)Jq(1)   j   Jq(
2)・・・b q(1)・・・bq(X)、q、、、  とからなる関
数として求め、最適の単語列q(1) Q(2)・・・
・・・q(X)  を求める動的計画手段とを少なくと
も含んで構成される。
作用 特徴抽出手段により入力信号を特徴ベクトルの系列IL
I In2・・・・・・&i  に変換し、標準パター
ン記憶手段に記憶されている標準パターンRn (ただ
し、n=1.2.・・・・・・、N)の特徴ベクトルの
系列色bn2・・・・・・bnlnと、マーカ信号入力
手段により、連続的に単語又は音節等を発生する毎にそ
れに同期して入力されたマーカ信号の総数をXとすると
き、前記入力パターンと前記標準パターンHnの結合パ
ターンとのパターン間の距離を、動的計画法により、前
記入力パターンを構成する特徴ベクトルの系列ILI 
a2・・・・・・ILX  と前記標準パターンHnの
種h ノ結合バター y Rq(1)O+ Rq(2)
(E) 、−0−1−O+ vtq(x)全構成する特
徴ベクトルの系列bq0)l・・・bq(i)bq(2
)Jq(+)    1 、、、b(1(2)    q(1)  (1(1)1
   □、(X)とからなる関数と Jq(2) ”’ b   ”°b して求め、最適の単語列(1(1) q(2)・・・・
・・q(X)を求めるものである。
実施例 第1図は本発明の連続音声認識装置の一実施例を示すブ
ロック図である。
本実施例においては、新たに第2表に示す量を導入し、
入力パターンのフレーム毎に実時間的に処理して行くい
わゆる前向きのアルゴリズムを導17ベーノ 大した場合について説明する。
第2表 第1図において、Inは音声信号の入力端子、1はフィ
ルタバンク等で構成された特徴抽出部であって、入力音
声信号を特徴ベクトルa1の系列ムに変換する。2は単
語標準パターン記憶部であって、認識語型たるH個の単
語がそれぞれ標準パ1−7R”=、b”  b” ・−
・−・b”、n(n==1.2.・・・・−、N)とし
て特徴ベクトルの形で予め登録されている。
6はベクトル間距離計算部であって、入力パターンの第
1フレームにおける特徴ベクトルal とn番目の単語
標準パターンHnの特徴ベクトルbnjとの距離d”(
i、j)をj=1.2.・・・・・・、Jについて求め
るものである。本実施例では第4図6のマ18ページ ッチング径路を用いるものとすれば、d”(i、j)は
1つ前のフレームについてのみ記憶しておればよ<、j
=J〜1の順序で計算することにすれば、現フレームの
d(i、j )は計算が終わればd(i−1゜j)を記
憶した場所に記憶することが出来るので、1フレ一ム分
のみの記憶場所があれば良い。従って、ここでは11”
(j ) = d”(i、j )とすることができる。
d”(i、j ) (d、例エバfLiトbnjトノ市
街地距離として定義出来る。即ち、ベクトルの次元ヲp
とし、’4 =(’11 h a12 m ”’ ”’
 I ’ip) # ”j = (”j 、+bnj2
.・・・・・・、bnjp)とするとき、等である。
6は累積距離計算部であって、径路の拘束条件が第4図
eの場合について漸化式(9)の解を求める部分である
。第1フレームについて中間累積距離D”x(i、j)
、終端累積距離Dx(i) 、中間バックポインタBn
x(’ej )sバックポインタBz(i)をj−1゜
2、・・・・・・、にn=1.2.・・・・・・、Hに
ついて求19へ 。
め、iを終端フレームとしたときの最後尾の単語を示す
Nx(i)を求める。本実施例におけるマツチング径路
の拘束条件によれば、Dx(1,] ) + ”x(1
)はj=1.2.・・・・・・、Jについて順次次の漸
化式を計算することにより求まる。
・・・・・・(19) 初期条件 D”x(i−1、O) −D”x、 (i−
1)Dz(i) −min [D”x(i、j )] 
     ・−・−(20)B”!(1,j )、 B
x(i)は次の式から求まる。
・・・・・・(21) 初期条PpB”x(i−1,0)−i−1Bx(1)−
B”x(1,J)        ”−・(22)(n
9は式(26)を満たすn) また、 Nx(i) =n”           =−=−(
23)である。
式(19)〜(22)の計算を!=1 、2 、・・・
・・・、Xのそれぞれについて行ない、各フレームにつ
いて最終的にDx(i)、 Bx(i)、 Nx(i)
を得る。ここでDx(i)は次のフレームの計算の際に
のみ必要であるから、Dx = Dx(i)  とする
事が出来る。即ち、D1+ D2+・・・・・・+ D
X のみ記憶しておけば良い。以上のようにして求めら
れた終端累積距離Dx(i)。
バックポインタBx(’) *最後尾単語名NZ(i)
はそれぞれX=1,2.・・・・・・、Xについて、終
端累積距離記憶部7.バックポインタ記憶部8.最後尾
単語名記憶部9に記憶される。なお、Dnx(i、j)
B”x(i、j)(j =1.2、−・−、J”; n
=1.2 。
・・・・・・、N)は必要が無くなるまで、累積距離計
算部6の内部のメモリに一時的に記憶されるのであるが
、本実施例においては、第iフレームのそれらの計算に
は1フレーム前と2フレーム前の値のみ必要であってj
=J〜1の順に計算することに21ベー、/ すれば、D” x(i、j )、 B”x(i、j )
等は”x(i 2 、j )tB”x(i  2.j)
の記憶していた場所に記憶出来るから、それ等の記憶は
2フレ一ム分のみ記憶すれハ良イ。即チ、k−0,1ニ
ツイテDn(k、j)。
B”(k、j ) ’f:準備しておき、例えば、入力
の奇数番目のフレームにおいてはに=oを前フレーム、
k−1を2つ前のフレームとして計算し、入力の偶数フ
レー゛ムにおいてはに=1を前フレーム、k=0を2つ
前のフレームとして計算すれば良い。
10は音声区間検出部であって、入力信号の大きさ等か
ら音声区間を判定するものである。音声区間検出部10
が、音声入力が開始されたことを検出するとフレーム計
数部11はフレーム毎に計数を始める。っ前記の処理は
、第iフレームの処理であったが、このフレーム計数部
11の計数値が即ちこのiを設定している。従って、前
記と同様の処理が、フレームが1進む毎に行なわれるこ
とになる。フレーム数計数部11は音声区間が検出され
ると計数を始め、音声区間が終了するとリセットされる
。最後尾単語記憶部9.バックポイン22へ一7゛ 夕記憶部8には、従って、Nx(1)、 Bx(i)が
i−1,2,・・・・・・、I;x=1,2.・・・・
・・、Xについて記憶されることになる。
3はマーカ発生部であって、単語を発生する毎に、手動
スイッチを押圧することによりマーカパルスを発生する
ものである。4はマーカ計数部であって、音声区間内に
入力されたマーカを計数するものである。
セグメンテーション部12はバックポインタ記憶部8に
対し、所定のバックポインタを読み出すべき命令を発す
るものである。即ち、セグメンテーション部12がBx
(i)なる値をバックポインタ記憶部8に発すると、バ
ックポインタ記憶部8からはバックポインタBx−1(
Bx(1))が読み出される。
セグメンテーション部12はバックポインタ記憶部8か
らBx−+(Bx(’))なる値を受は取ると、その同
じ値をバックポインタ記憶部8に発する。従って、音声
区間検出部1oが音声入力の終了を検知すると、フレー
ム計数部11の最終値Iとマーカ計数部の計数値Xfが
セグメンテーション部1223へ− に供給され、セグメンテーション部12は先ず工。
Xfなる値をバックポインタ記憶部8に発する。
以後、前記説明の動作に従って、バックポインタ記憶部
8から、Bx(I)、 Bx−1(Hz(I))。
Bx−z(Bx−1(Bx(I)))、 ++++++
 s Oなる出力が順次前られることになる。これ等の
値は最後から2番目の単語の終わりのフレーム、同3番
目の終わりのフレーム、同4番目の終わりのフレーム、
・・・・・・というものであり、NX(’)はiフレー
ムで終わる単語であったから、この値をその1ま最後尾
単語記憶部9に与えると、最後の単語から逆の順序で認
識結果が得られる。
第9図は前記実施例装置の機能をソフトウェアで実現し
た場合のフローチャートであり、以下前記実施例装置の
各部の動作と結び付けて説明する。
ステップ1oo〜105は累積距離I)x(i) 、中
間累積距離”x(1,) )、バックポインタBx(’
) +中間バックポインタB”x(i、j)の初期化を
行う部分である。
ステップ107〜117は第iフレームのときに実行す
るときの処理である。ステップ111は第iフレームに
おける中間累積距離と中間バックポインタの初期値を与
える部分である。ステップ114〜117の処理は、主
として累積距離計算部6で行なわれる処理である。ステ
ップ116における記法 n ” = argmin [D”x(k 、 J” 
)]はDnx(k、Jn)を最小にするnをnl とお
くと言う意味である。ステップ111j:中間累積距離
”x (’ I ] ) +中間バックポインタ”x(
ksj)  を求めている。ステップ116はステップ
114の計算をn=1.2.・・・・・・、Nについて
行った結果、入力の第iフレームを入力の終端とした時
、累積距離D”x(k 、 J” )が最小となる最後
尾単語n* を求める処理である。ステップ117はス
テップ116で求まった最適の単語n* に対し、Hz
ri) −n” 。
Dx(i)−Dxn*(i、Jn*)、Bx(i)−B
xn*(i、Jn*)としてそれぞれメモリに記憶する
ことを示しており、それらのメモリは最後尾単語記憶部
9.累積距離26へ−7 記憶部7.バックポインタ記憶部8に対応しているO ステップ106,108によって、iが奇数のときはに
−1、iが偶数のときはに=oとなり、前記のように中
間累積距離”X(’1j)+中間バックポインタBnx
(k、コ)を記憶子るためのメモリはフレームが・切り
替る毎に、謔前、のフレームに対する記憶用と、現フレ
ームに対する記憶用と交互に切り替ることになる。即ち
、ステップ111,114.’116.117において
、kは現フレームに対する記憶用と、現フレームに対す
る記憶用と交互に切り替ることになる。即ち、ステップ
111゜114.116,117において、kは現フレ
ーム、k*は直前のフレームを意味することになる。
ステップ118〜120は以上のようにして求められた
Nx(i)、 Bx(i)から逆の順序で単語の認識結
果を求める部分で、セグメンテーション部12、バック
ポインタ記憶部8.最後尾単語記憶部9の間で行なわれ
る処理に対応している。   ′ステップ118のXと
しては、種々の値を設定26ヘー。
出来る。例えば、x−6として計算しておけば、入力単
語数が1〜5のそれぞれを仮定した場合についてDx(
I)が求ま−ているから、!=1〜6について!”= 
argmin[Dx(I)] を計算し、x=x”から
ステップ118〜120の計算をすることにすれば、x
−1〜5について入力単語数みちの場合の認識も可能と
なる。
以上のように本実施例に於いては、連続して発声された
音声に対して、認識精度の高い装置を実現することが出
来る。
また、本実施例では、連続して発声された単語を認識す
る場合を述べたが、単語の代わりに単音節等であっても
よく、その他の連続するパターンの認識にも適用出来る
ものである。
また、径路の拘束条件として第4図6に示したものを用
いたが、他の拘束条件を用いてもよいのは勿論であり、
入力パターンの物理的性質に応じて適当に設定すること
が出来る。
さらに、本実施例では距離を用いて説明したが、相関等
を用いると類似度によってベクトル間の近27ペーノ さを定義することが出来、距離で最小化する代わりに類
似度で最大化するという方法も全く同様な扱いで実現出
来る。
発明の効果 以上のように、本発明によれば、連続して発声された単
語又は音節に対し、それらが入力される毎にそれちに同
期してマーカ信号を入力するようにしたので、それらの
入力完了後に、入力された単語数あるいは音節数等が明
らかとなり、それを基に入力単語数既知の動的計画法の
技術が適用できるようになり、認識率の大幅な向上を実
現することが可能となったものである。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は音声
認識装置の従来例を示すブロック図、第3図は前記従来
例のパターンマツチング部の動作を説明する動作説明図
、第4図はDPマツチングの径路の拘束条件の例を示す
説明図、第6図はDPマツチングを用いて連続発声した
単語音声を単語数既知の場合について認識する方法を説
明するフローチャート、第6図はDPマツチングを用い
て連続発声した単語音声を単語数未知の場合について認
識する方法を説明するフローチャート、第7図は逆時間
DPマツチングにおける径路の拘束条件の例を示す説明
図、第8図は連続単語音声認識における入力パターンと
標準パターンとのフレームiにおけるマツチング径路の
取り得る範囲を示す説明図、第9図は本発明の実施例の
動作説明のためのフローチャートである。 1・・・・・・特徴抽出部、2・・・・・・単語標準パ
ターン記憶部、3・・・・・・マーカ発生部、4・・・
・・・マーカ計数部、5・・・・・・ベクトル間距離計
算部、6・・・・・・累積距離計算部、7・・・・・・
終端累積距離記憶部、8・・・・・・バックポインタ記
憶部、9・・・・・・最後尾単語記憶部、10・・・・
・・音声区間検出部、11・・・・・・フレーム数計数
部、12・・・・・・セグメンテーション部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 乃3図 第4図 (久)(b) CC)          (a)         
 (a)          (、)’ン(?)   
   <h)<わ     G)第5図 第6図 δ=工 穴=NCt 第7図 (α)(b)   CC)   (ダ)第8図

Claims (1)

    【特許請求の範囲】
  1. 入力信号を特徴ベクトルの系列a_1a_2……a_
    I に変換する特徴抽出手段と、特徴ベクトルの系列b^
    n_1b^n_2……b^n_(J_n)から成る標準
    パターンR^n(ただし、n=1、2、……、N)を記
    憶する標準パターン記憶手段と、連続的に単語又は音節
    等を発生する毎にそれに同期したマーカ信号を入力する
    マーカ信号入力手段と、この一連の入力信号に対するマ
    ーカ信号の総数をXとするとき、前記入力パターンと前
    記標準パターンR^nの結合パターンとのパターン間の
    距離を、動的計画法により、前記入力パターンを構成す
    る特徴ベクトルの系列a_1a_2……aIと前記標準
    パターンR^nの種々の結合パターンR^q^(^1^
    )■R^q^(^2^)■……■R^q^(^X^)を
    構成する特徴ベクトルの系列b^q^(^1^)_1…
    …b^[J_q_(_1_)]_J__q__(__1
    __)b^q^(^2^)_1……b^[J_q_(_
    2_)]_J__q__(__2__)……b^q^(
    ^X^)_1……b^[J_q_(_X_)]_J_q
    _(_X_)とからなる関数として求め、最適の単語列
    q(1)q(2)……q(X)を求める動的計画手段と
    を少なくとも備えたことを特徴とするパターン比較装置
JP61145101A 1986-06-20 1986-06-20 パタ−ン比較装置 Pending JPS62299999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61145101A JPS62299999A (ja) 1986-06-20 1986-06-20 パタ−ン比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61145101A JPS62299999A (ja) 1986-06-20 1986-06-20 パタ−ン比較装置

Publications (1)

Publication Number Publication Date
JPS62299999A true JPS62299999A (ja) 1987-12-26

Family

ID=15377392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61145101A Pending JPS62299999A (ja) 1986-06-20 1986-06-20 パタ−ン比較装置

Country Status (1)

Country Link
JP (1) JPS62299999A (ja)

Similar Documents

Publication Publication Date Title
JPS61219099A (ja) 音声認識装置
JPH0247760B2 (ja)
JPS62299999A (ja) パタ−ン比較装置
JPS59223499A (ja) 音素認識装置
Tanaka et al. A demiphoneme network representation of speech and automatic labeling techniques for speech data base construction
JPS59198A (ja) パタ−ン比較装置
JPS60164800A (ja) 音声認識装置
JPS62173498A (ja) 音声認識装置
US5956677A (en) Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition
JPS5972498A (ja) パタ−ン比較装置
JPH0436400B2 (ja)
JPH0636155B2 (ja) パタ−ン比較装置
JP2862306B2 (ja) 音声認識装置
JPS6073698A (ja) パタ−ン比較装置
JPH0552516B2 (ja)
JP3097134B2 (ja) Dpマッチング法
JPS59172692A (ja) 連続単語音声認識方法
JPS6337398A (ja) パタ−ン比較装置
JPS60130797A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPS6265090A (ja) パタ−ン比較装置
JPS61200596A (ja) 連続音声認識装置
JPS6283798A (ja) 連続音声認識装置
JPS617893A (ja) 大語彙単語音声認識方式