JPS59197A - パタ−ン比較装置 - Google Patents

パタ−ン比較装置

Info

Publication number
JPS59197A
JPS59197A JP57110528A JP11052882A JPS59197A JP S59197 A JPS59197 A JP S59197A JP 57110528 A JP57110528 A JP 57110528A JP 11052882 A JP11052882 A JP 11052882A JP S59197 A JPS59197 A JP S59197A
Authority
JP
Japan
Prior art keywords
frame
pattern
input
cumulative distance
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57110528A
Other languages
English (en)
Other versions
JPH0247757B2 (ja
Inventor
中川 聖一
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP57110528A priority Critical patent/JPS59197A/ja
Publication of JPS59197A publication Critical patent/JPS59197A/ja
Publication of JPH0247757B2 publication Critical patent/JPH0247757B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は特徴ベクトルの系列として登録された標準パタ
ーンのそれぞれと、特徴ベクトルの系列に入換された入
カバターンとの比較を行い、入カバターンを認識するパ
ターン比較装置、持に標準バター・ンとしてパターンの
一部のみが異なるのみで他のパターン部分が非常に類似
している標準パターンの認識にJ薗したパターン比較装
置に関する。
人間にとって最も自然な情報発生手段である昌−声が、
人間−機械系の入力手段として実現されることに対する
期待は大きい、近年、ワードブロー量?すの人力を仮名
漢字茨換の技術と組合せ、仮名キーによる入力の代シに
単音節音用の発声によシ実行することが試られている。
この場合、各月1音f粕は孤立して発生されるが、「夕
」、「パ」、「力」のようにそのパターンの一部が異な
るのみで全体として非常に類似しfコ入カバターン(以
下、類似パターンという)の場合、誤認識の回顧が生じ
ている。
ところで標準パターンと入カバターンとを比較し、その
類似度や距離を計算して音声認識を行う場合、類似度や
距隙の計算に動的計画法(以下、DP法という)の手法
が用いられる。この動的M1画法を用いrコ首声認識に
おいて前記類似パターンの誤認識の問題を解決しまうと
すると、単音節1個当りの特徴ベクトルの数を増しtこ
り、ベクトルの次元を増しjこりすることが必要である
。しかしシシがう特徴ベクトルの数や次元を増すと計算
風は飛躍的に増大し、実用化することができなくなる。
また単音節を独立して発生した・侍合でなく、連続して
発生しtコ場合の認識、すなわち連続単音節認tル(に
おいては、前記問題に加えて11音節間の境界を分■[
するという回顧があり、これも計誹、販の増大に影響す
る。ところで人間により発声される音用IJ人によりま
1こ時により変化し、基準となるわ一部パターンに対し
時間的に非線形に伸縮したものとな−・ている。この非
線形に伸縮している入カバターンと控へ1.パターンと
を比較し入力召声の認識を行う1こめには、人力バター
′)と標準パターンノ各fflベクトルの対応付けを非
線形に行い、入カバターンがどの標準パターンと最も類
似しているかを計糎する必要がある。しかしこの入力音
声は非線形に伸縮するとはいっても異常に長く伸び1こ
り、短くなっ1こすすることはない。
本発明はこのような人カバターンの物理的な特徴に注目
し、入カバターンと標準パターンを比較する隙には無制
限にすべての可能性について比較するので1.1なく、
入カバターンの物理的々性質によp定まるある妥当と当
えられる範囲について比申交を行うようにしtこもので
ある。
入力音声信号はパターン比較装置において、1.“d波
数分析、LPG分析、PARCOR分析、相関分化f等
によシ、いくつかの数値の組(特徴ベクトル)の系列に
変換され、この入カバターンのに?1.Qベクトルと比
較の対象となる標準パターンの特徴ベクトルとが各ベク
トル毎に比較される。この各ベクトル毎の比較値、すな
わちベクトル間の距離を金言1した屋稍距離というもの
をパターンの類似の尺度に用いる。この累積距離を計算
する場合、各ベクトル毎の比較をすべての組み合わせに
ついて行うのはal算量が膨大となシ、パターン比較装
置と(〜で実用化することができない。
入カバターンを一方の軸に、標準パターンを他方の軸と
する平面(以下、i−j平面という)を考えると、人カ
バターンおよび標準パターンの各ベクトルの組み合わせ
というのはi−j平面上の各格子点(以下、甲に点とい
う)により示すことができる。従ってio記あらゆる組
み合わせについて各ベクトル間の距離を計算するとは、
各点におけるベクトル間の鉗廚を計算することであυ、
累積距離をN1算するとは、入カバターンの特徴ベクト
ルと、それに対応する標準パターンの特徴ベクトルのベ
クトル間距離を順次計紳し合計していくことである。こ
の累積距離をn(舅する過程で選択されfこ、入カバタ
ーンと標準パターンの特徴ベクトルの対応、すなわち点
列を径路という。
前記しfコ入カバターンの物理的な性質を考慮して比較
の範囲を限定するということは、本発明においては径路
の選択に拘束条件を設けるということである。
ここで、以後の説明において用いる用飴および記号につ
いて説明する。
A:入カバターン(A = al a2H+・3i11
H・ax)、alは¥、1フレームの特徴ベクトル、■
は入カバターンのフレーム数 x<n: =−、n cgeバター ン< Rn= b
qb2−b−= bRn)すはF n 標準パターンの
第1フレームの鞘゛徽ベクトル J”は第n標準パターンのフレーム数、Nを標準パター
ンの総数とするとき1 (n <、 Nd”(i 、 
j ) :第n標準パターンの第1フレームの特徴ベク
トルリと入カバターンの第1フレームの特徴ベクトルa
1とのベクトル間距爵1[D (D : i 1〜IL
Nフレームまでの入カバターンと、各標準パターンの最
適な組み合せの結合パターンとのパターン間の距#(以
下、終端累積距離という) N fi) :第1〜第1フレームまでの入カバターン
に対する各標準パターンの最適な組み合せの結合パター
ンを求めたときの当該結合パターンを構成する最後尾標
準パターンを示す番号(以下、最後尾標準パターン名) B (i) : N (i)の始点フレームの1つ手前
のフレームを示す番号(以下、バックポインタという)
D”(i 、 j ) :入カバターンの第1〜第1フ
レームまでの部分パターンとRnの第1〜第Jフトムま
での部分パターンのパターン間の距DC以下、部分累積
i[′I:!jnN)7z(i + j )トイウ) 
ト、D(i’−1)との和のi′についての最小値(以
F1中間累積距離という) Bn(+ + 3 ) :部分累抽距離居・(+ l 
J )とD(i’−J)との和を最小にするi′を?、
すなオ)ち i’=  argmjn   (D  (
i’  −1)  + Dil(Lj))とするとき、
当該1フレームの1つ手前のフレームを示す番号(以下
、中間バンクポインタという)1こたしargmin(
)は〔〕内の値をXについてノド)小化しfコときのX
の値を示す。
D’(1) : j = J”のときの中間累積距離で
あシ、17’(1)=I)n(i 、 Jn)である。
13n(i) : j = J”(’) (!:き)l
−I11川ハックポインタテアシ、13”(i)= B
”(i 、 J”)である。
vH< + 、 j) :入カバターンの第1′(始端
)フ第1フレームフレームまでの部分パターンと第n標
準パターンの第1〜第jフレームまでの部分パターン間
の距離(以ド、特定区間累積距離という) 本発明においては、人カバターンが第n。フレームで終
了すると仮定した場合、最後尾パターンをHnとしtこ
ときの中間累稍距1IlllDn(io)を求めるのに
 l/を始端フレーム、10を終端フレームとする入カ
バターンの部分パターンA (i’ −1、io)と標
準パターンRnとのD P =、 ツチングを始端点自
由、終端点固定として行うものであって、始端点i′に
おける中間累積距離の初期値D”(i’ 、 1 )と
中間バックポインタの初期値B″(i’ 、 0 )を
T)”(i’、 1 )=D(i’−1)+cl”(1
、1)Bn(+’ + 0 )二B” (1’  1 
)とすることによって、第1′−1フレームまでσ月〕
Pマツチングの続きとして部分パターンA(i’ −1
゜io )と標準パターンRnのD Pマツチングを行
っている。
このようにすることによって、例えば、fJ41Jに示
すようなマツチング径路に対する拘束条件のもとでは、
取シ得るマツチング径路は第2図のPの領域内に制限さ
れ、Dn(i、)を求めるために必姿とされるd”(i
、j)+D”(i+j)のi−+Mは領域P内の各点に
ついてそれぞれ1回行うのみでよい。第2図において横
軸は入カバターン、縦軸は最後電標〜ニパターンRI′
Iである。領域Pは傾き1/2の白線P1と傾き2の白
線2とで囲まれた領域となっている61)n(1、j)
を求めるには、第1図から明らかなようにD”(i−2
,j−1)。
1)n(+  11 J−’ ) + D”(+  1
 * j2 ) +d”(1−1、j ) +dn(i
 、 j )0)みわかっていればよいから、第iフレ
ーム上の中間累積距離”’ IO+ J ) (7,:
だしj=1 、2 、=−J”)le求めるにはlll
−1フレーム、第10フレーム上の中間累積側9Dnc
 1−1 、 j ) 、Lln(1−2、j)および
第1−1フレーム、第iフレーム上のベクトル開側11
11td”(i−1、j) 、d”(i  、 j)(
7jだしj二1.2.・・・J”)を記憶しておくのみ
でよいうこのとき、1.)i](10)は、I)n(1
゜) = Dn(to + J” )として求めること
ができる。
以上のように、入カバターンのフレーム1が1フレーム
進む毎に、そのフレーム−ヒの中fMI X b’t 
Il’lj&D”(i 、 j )(ただし、3−1.
2 、+++、 J”in ” ’ 、2 + ”’ 
+ N )を1フレーム0口と2フレームii+ ノ中
間累積距1jIDn(i −1、j ) 、 D”(1
2゜jL!=1フレームl1ilおよび当該フレーノ・
のベクトル(ハJ距1qlld”(+  1 r j 
) * cln(I T j) (f:だし) ” ’
 * ” + ”’ + J” I n ”” ’ +
 2+ ”’ + N )から求め、D(i)−min
 (D”(1、J’) )としてmin フレームまでの終端累積距離を求めることができる。こ
のようにして求められたDn(i、j)(7こだしj−
’ + 2+=・+ J”+ 1==l I 2 、・
・・、 N)は必要がなくなるまですなわち次のフレー
ノないしその次のフレームにおけるI)”(i 、 j
 )の81算終了まで記憶される。
まfこ、1.)(i)に対するバックポインタz)(i
)に対する始端点から1を差し引いた値)B(i)は次
のようにして求まる。
D”(+ + 3 )に対する中間バックポインタをH
n(Ill)とするとき、 1)  D[l、j)=I)’日−2、j −1)十d
”(i −1、j )−1−drl(i 、 j )の
ときは )3K I 、 j )”B”(i −2、j−1)2
)   IJ”(i + 3 )、−D”(t  1 
、]  1 ) + d”C+ + 5 )のときはB
”(i 、 j、)=Bn(i−1、j −3)8) 
 I)n(i、j)−」Jn(i−1,j−2)+d”
(Lj)のときはB”(+ * J )=B’(+  
1 + j2)とおくことにより D′□(i)=L+升(i、J令) と−4れば B(i)二)3つ(i、J8) となる。従って、I3’(1、j )についても、1フ
レームrJIIト2ノし一ムQ11のものを覚えておく
なお、目)8し〕の6Lうな径路の時含はD”(+ +
 j)Hn(i 、 j )は1フL−・−ノ、r′J
i+の値を覚えておくだ(Jでよい。
この占えガを九[続!@−11音1!11石Ihの認識
にJN用するコトケ考える。))″I高節g7?1は子
凸プラスJけ音という形をしてふ・9、了r1計1は母
高部よりかな、り短い。
1〜かるに、持に、11計部が同じである小音節音声は
、子1一部の微妙な違いにまり区別されなければならな
い。従って、前記のパターンマノチンク1こおいて入力
されf、:串↑f節音声と標1(h、 )<’ターンの
#11音節音ハのそれぞれと甲、音節音用全体としてマ
ツチングするとマツチング結果に−りえる母石部の叱曽
が大きく子音部の微妙な差を区別するのが911かしく
なる。
本発明はこの欠点を補うものであって、辿続小宿i、i
1)音りに」二n己アルコ゛リズノ・を適用オるにあt
こって子%r部のマツチング結果4・重視するもので力
)る。
すなわち、L’li %〒フ11)全体としてのマツチ
ング結果の他にそのマツチングの過程における子餡部の
みのマツチング結果をも認識に利用しようとす7)もの
である。
第4図は入カバターンの第i。フレームを終端点とし、
始端点をb +1としてマツチングしtこ場合のマツチ
ングの様子を示したものである。Cは第1ノ+1フレー
ムを始D;1i1とし、第10フレームを終端としたと
きのマツチングの径路を示しているうなお、径路の拘束
条1’1′は第1図に示しfコものを用いている。jl
lは標準パターン1】を構成する単音節の子音部と母音
部を分けるフレームであって、標準パターンとしてこの
単音節を登録するときに同時に登録しておくものである
。従って、登録単音節nの第1フレームから第10フレ
ームまではその単音節の子肖部 IQ jn+lフレー
ムから錦J”フレームまではそのII4召節の母音部と
いうことになる。
eは径路Cにふ・いて jnに対紀・する入カバターン
のフレームである。
本発明においては、1iiJ記O月〕Pマツチングにお
いて、I)(i)、B (i) 、 N (i)を求め
るのに単音節全体とL で(7)マツチング結果以外に
子音部のみのマツチング結果も加味′4−ることを特徴
としている。すなわち、第4図に示したi−j平面にお
いて、亀1゜フレームに至るト1を語nに対する最適の
マツチング径路がCのようであっtことすると、この径
路に沿う点(b+1.1 )から点(e 、 j”)ま
での特定区間累積距離をD:(to、 J”)、iib
+1フレームから第1゜フレームまでの長さくフレーム
数)をL”(io、 J”)とするとき、Dn(i。、
 Jn) / Ln(i0+ J”)とlX1)との荷
重和が最小になる単音節nを求め、N(io)=nとす
るのである。
まfこ、第10フレームは當に単音節の最終フレームと
仮定してマツチングを行っているわけであるから、輛i
。フレームから数フレーム711114っtこところは
fU音であると仮定していることになる。従つ−C第i
フレームを始端とするマツチングにおいて、数フレーム
6;jっfこところのフレーム1′を母音の標準パター
ンと比較し、今からマツチングを行おうとする単音節は
アオイ、つ、工、オの向れの段であるかを予め決定する
ことができる。、第i。フレームが実際に…音1’ii
4の最終フレームであれば、そこから数フレーム潤っl
こところは母音の定常部であると考えられ、t−=、r
音の認識はかなシの精度で認識できる。その認識の具体
的方法は、識別函数による方法など周知の方法が用いら
れ得る。この+rフレームの母音としての認識結果をv
(1’)とすれば、荷重和をH]Wすべきnとしてはv
(1’)段の小音節のみに対して計p、すればよいこと
になる。i′の決め方としては、10から一定数のフレ
ームを翻るとい・)方〃、の他に、1ア(10)を最小
にする単す節nが求まれば、そのときのマツチング径路
に関してjJζ対応する入力フレームをe5バックポイ
ンタをbと−4る吉き(e+l))/2に最も近いフレ
ームを1′としてもよい。
)り5図は、v上の原理に基づく辿糾単音節音声Q) 
nlj識を行う本発明の実施例を示すブロック図でを・
る。
八1(1信号入力端子0()に入力された音声信号は、
フィルタバンク等で構成された特徴抽出部0υで特徴ベ
クトルの系列A = aIa2・・・alに変換されろ
0功1.iこのそれぞれのIP!徴ベクトルを母音とみ
なして認識する母名認識部で、(1免は母音認識部02
で0ilItF1特徴ベクトルを母音とみなして認識す
るrこめに必要な識別函数を記憶している品別函数記憶
部である。識別函数による認識は通當の良く知られfコ
バターン認識の手法が、その才ま1史用される。、04
)は母音部り部0’l+ T iil i己のように母
音として認識さノ11コ結東をフレーム番号と共に配回
する母音認識結果記憶部である。09は単音節標準パタ
ーン記憶部で、それぞれの用音節は特徴ベクトルの糸タ
リの形で記憶されている。Oeは入力音声04号の第i
フレームにおいて、単音節標準パターン記憶部05に記
憶されている第n単台尉) t)? b:・・・b、γ
1を構成するベクトルのそtlぞれと、特徴抽出部0υ
の出力の特徴ベクトルa1との距1’jlId”(i 
 、 j)をgH9し、その計算結果を必要がなくなる
まで一時的にdLi憶−4−るベクトル間距#1F計算
部である。ベクトルaj−(ail  l alz −
+ aiM )とベクトルbr= (b、rl  。
b、l□+++ l bjM )との距fllld”(
1、j ) tt例エバd”(i、j)= Σ l a
lm  J::11  とイーる己とカ)cきm=す る。
0橡はX 積h’l:離計算部で、第iフレームにおい
てD”(i l j ) l B”(i l j ) 
l D”(i 、 j ) IL”(i 、 j )を
j=” + 2 +・”+ J’n==1 、2゜・・
・、Nに胸してベクトルI#11We M計#、 E<
+S O(9の出力から計算するとともにその結果を必
要がなくなるまで一1!F的に記1@する。
前記のようにマツチング径路の拘束条件を第1図とする
ときは、第iフレームの1)’(i、j)を+?lシす
るには第1−1フレームのベクトル間距離dn(1、j
 )と、第i−2+@1−17L/−1.(7)r11
囲累積距離1)”(i 、 j )と中間バンクポイン
タB”(i 、 j )をn ”” ’ + 2 + 
”・+ N ; J ”’ 1 + 2 +・・・Jn
について覚えておく必要がある。D”(s + S)、
B”(1、j )の求め方については既に前記した通り
である。
とのH1騨を行うとき、子音部のみの累積距離D:(1
,j)と子音部に対応する入力フレームの数L”(i 
、 j )もlj1時に計算される。すなわち1)j=
j”ま1こはj=jn+1でj”+1に到る最適の径1
ri!iの1フレーム前のjがjn  lのとき、すな
わち D”(i −1、j”−1) = +ni n(IF’(i −2,j”) −1−d
n(i−1,j”+ 1 )、IJ’K i−1,jn
) 。
1)n(i−1、j”−1)〕   のときはLn(i
 * j )=i −B”(i 、 j)D:(i 、
j )=D代i 、 j )−1)(B・’(+ + 
j)2)それ以外のj>i+1に対し P=1)’X1−2. j−1)+d”(i−1,j)
+ d”(i 、 j)Q=D”(i−1,j−1)+
d”(i、j)R=D”Ci−1,j−2)−f−d”
(i 、j)とおくとき、 なる劇林がなさ九4.この結果第4図のす、eに対し e−b=Ln(iol J”) D:(e 、 j勺=D:(i。、 J”)トナル。ス
ナワチ、n=(1゜+ J ” ) ハD” (+ry
 )を求め1こときの径路に沿っ1こj = 1からj
oまたはj畔1までの子音部のみの累積マツチング距離
であシ、Ln< r、1. J”)はj=1からj−j
nまf: ハj = j”+1までの前記径路の人力方
向のフレームの数である。
占い換えれは、H1鹸拉11 nに対し、最終フレーム
をioと仮定したときの子音部のみのマツチング距離は
1):(iol J”) %子音部の入力方向の長さは
Ln(10,1”)となる、なお、1)の条件は、子音
部の終点がマツチング距離がjnを通るときはjnであ
υ、jnをi[Ilらないときはjn  lとなること
を意味している。
Olは最後尾用音節母音フレーム計聯部であって、ベク
トル間距離H1算部G呻、累積距離計算部0樽における
H1算をn−1,2,・・・、NIこっbて実行した結
果から、最後尾単音節を n== argmin (D”(i))+1 へ として求めると共に、単痛節nに対し、そのマツチング
距離に関し、」nに対応する入力フレームと第1フレー
ムの中点(母音の定常部に相当)i′を求めるものであ
る。1′は次のようにして求めることができろ。
1′磐−CB”(+ + % ) + L”(+ + 
J介)十i )翰は候補車音節発生部で坐って、最後尾
単音節母音フレーム8]算部四で計算された1′に対し
、既に第i′フレームが、伺れの匈、音であっTコか記
憶されている母音認識結果記憶部θVの第i′フレーム
に対ル1、・する出力から、その母音を匈音部としても
つ単音節を発生するものである。
?υはこの候補単音節をkとするとき’ ”o(1+J
k)。
Lk(i * Jk) l Dk(t l Jk)を累
積距離計算部(至)から読み出し、wl 、W2を屯み
係数とするとき、を計算する最後尾単音節決定部である
。このようにして、第iフレームにおける最後尾単音節
はkN(i)=1? として記憶される。
ま1こ、最後尾単音節が、rであると決定されると、累
積距離計算部(ハ)に記憶されでいるDk(i 。
Jk) 、 BΩ(i、J嘗)かそれぞれI) (1)
 、 B (i)として累積側らW記憶部(ホ)、バッ
クポインタ記憶部(ハ)に記慟される。累伯距離割算部
QI9iこおけるa1舞において用いられる初期値D(
i−1、0)=I)(ト1)はこの累積距印1記僧部(
ハ)に以上のようにして既に配憶ネれているものである
。tコだしD (o) −〇である。
Qノ)は音戸11区間検出部であって、入力信号の大き
さ等から音7ハ区間を判定するものであって、音り区間
検出部(ハ)が、片り入力が゛/囲始さね−こことを検
出するとフレーム数計!&器09はフレーム毎にRJ数
をはじめろ。前記の処理は第1フレーlについての処理
であっ1こが、このフレーム数劇数器翰の計数価が〆す
なわちこのiを設電している。従って、前記と同様の処
理がフレームが1進む毎に行オ)れることになる。フレ
ーム数31数器(ホ)は音角区聞が検出さノすると81
数を始め、音ハ区間が終了す卸 るとリナットされる。最後尾単音記憶部(ハ)、バラク
ポインタ記憶部(ハ)には従って、 N(i) 、 B
(i)がi=1.2.・・・、■について記憶されるこ
とになる。
セグメンテーション部(イ)はパンクポインタ記憶部(
ハ)に対し、肋定のバックポインタを読出すべき重合を
発するものである。オなわし7、セグメンテーション部
(ハ)がiなる値をバックポインタ記k tieXQQ
に発すると、バンクポインタ記″■部Q4からはバック
ポインタT((i)が読出される。セグメンテーション
部(イ)はバックポインタ記憶部シ4からB(i)なる
値を受は取ると、その同じ値をバックポインタ記憶部(
ハ)に発する。従って、旨゛h区間検出部(ハ)が音声
入力の終了を検知すると、フレーム数H1数器の最終碩
Iがセグメンテーション部(ハ)に供給され、セグメン
テーション部い)は先ずIなる値をバックポインタ記憶
部(ハ)に発する。以後、f)il前記明の動作に従っ
て、バックポインタ記憶部(ハ)から、B(I)B (
B(T)) 、 B (B(13(1)) ) 、・・
・、Oなる出力が11拍次得られることになる。これら
の値は、最後から2番目の小音節の終υのフレーム、同
8兆日の終h ノア レ−A 、btl 411i 目
の終υのフレーム、・・・というものであり、N(i)
はiフレームで終る単石節であったから、この値をその
まま最後尾単音節記憶部(イ)に与えると、最後の単音
節から逆の順序で認4″flj結果が得らノする。なお
認識結果が逆の111&I序で得られないようにするf
こめには、この順序の友11dj ffpバックポイン
タ記t@ x H(/、)出力に対して行なうかノ12
後尾j11音i¥1)記憶部(ホ)の出力に対して行な
えはよい。
f:Js 6 図1;t ソー) l・つ、:c、−7
)C、J: −) テfJiJパL yjhll1例装
置の機能を実」見し1こ場合のフローチャートであシ、
以[・−111汀記実/1flx例装盾の各部の動作と
関連づけながら説明する。
ステップ■1.J初ル1化する部分で無音区間でこの処
理を行う。ステップ■■0はへカフレームiに対j7で
行う処理であるう ステップ■1.J人)1の第1フレーl、をP4音とみ
なしtことき、如伺なる母音であるがを紹鮎する部分で
ふって、fiJにi;、1°1:紙部0じ、tq音認識
結果記憶部Q4)で行う処理である。
ステ210月よ主とし、で累栢距離計騨部Q8+で行う
処nHテAって、ステップ■はXt+N:11;+Dn
(H、j)バックポインタB”(i 、 j )を求め
ている。ステップ■は子f−r部のみのマツチング結果
ヲ求メている。
ステップ■はステップ■の81騨をn=1.2゜・・・
、Nについて行っf:、 結果、人力の第1フレーl・
を音り入力の終端としtコとき、累Ws距脚it D”
(1。
J”)が最小となる最後尾小腸91]nと、nの母音部
のフレーム1′を求める部分−C%最後尾m高鮎母t1
フレームiす、 薯m(11で行う処理である。
ステップ■はステップ■で求ル・られ1こlli ;−
;節の付着フレームに対する母dを匈石部としても一2
串音節kに対し、子音部のみのマツチング結果をその人
力フレーム数で1規化し1こイu+ DJ i  、 
Jk)/Lk(i 、 Jk)と根後尾単飴をkとした
ときの累積側1111IDk(i、Jk)との荷重和を
針脚し、それが最小と々る単音ig kを針具する部分
であっ”−titt後尾単音節決疋部QOで行う処理で
ある。
なお前d己フローチャート中、 P=D”(i−2,j−1)+d”(i−1)+d”(
i 、j)Q=D”(+  1.j 1)+d”(i、
j)k=D”(i−1,j−2)十dn(i、j)であ
り、 まfこステップ4aにおいては、 Dt’(i  + j )=P or  QのときはJ
、”J−1,1)n(1、3) =HのときはJ=J−
2である。
まf−ステップ6においては、 k : i’フ1/−ムを母福として認πjつした結果
その母音を含む単音節 Wl、 Wj :車み である。
ステップのはステップ■で求まった最適の小音節↑に対
し、Nfi)=貧、D(1)l)省(i)、H(i) 
= B’(i)としてそノアぞれメモリに8己1農さf
することを示しており、そtlらのメモリは、最後ノら
単音節記憶部(イ)、累招距#11記憶部い9.バック
ポインタHIシ憶部(ハ)に対応している。
ステップ゛■は以、ヒのようにして求められrこN(i
)、B Fi)から逆の順序で単籟バIJの紹1賊結果
を求める部分でセクメンテーション部いフ、バックポイ
ンタ記憶部Q4、最後尾t@ B節記憶部(2)の間で
行イ〕れる処理である。
角された音声を精度よく単酋節列に変換することができ
、音hタイプライタ等への応用が可能となっfこもので
ある。
また本実施例においては母音部の認識をシしにン」い、
その結果を用いてア段、イ段、つ段、二段、オ段のいず
れの単音節であるかを決めでいるので、全パターンに対
する荷重和を求める必要がなく々シ、U1算社は115
に削減されている。さらにN音部の認島方法として精度
の商い方法が採用できるので、認a率を向上することが
できる。
なお、前記実施例においては、子音プラス母音のいわゆ
るCVをm位とするm名節について説明しtコが、VC
V(母音十子音十母音)を単位とする場合にも本発明は
適用することができる。この場合、第7図に示すように
、j鮮  J n、2を標準パターンの子音部と母名部
の境界とするとき、マツチング径路−において、j=j
”〜1の部分の累槓距融からj=J”−tの部分の累槓
珀軸を差し引いγこものをjnl〜J n2の累積距離
として評価す71はまい。jn2〜1あるいはJnl 
〜1の部分の累積距離は、CvC))場合” j nヲ
J ”2アルイ14 、’n’ ニ」ンきかえれはよい
から、結局Ail記実b113例において次の)?イき
飴えをすればよいだけである。すなわち、Jnl 〜1
0間の累(゛目側Mikは前記実施例において、jnf
:Vjnl、1.′(i、j)ヲLn1(i、j)、I
)8(i、j)を1):’(+ + j)にそれぞれお
きかえればよく、jn2〜1 ノ1t41ノX4Mh’
EAff l;t j”ヲj”  、Ln(i、j)を
I7゜2(i + j) t D:(r 、 j)をげ
(i、j)にそれぞれおきかえればよい。従って、i1
+ ioフレームを終端フレームとすると子音部のみの
累f^Ir1r、1lll+ 1.):(io、 J”
) 、 入力+1i111方向(’)4%すL”(io
、 Jn)はり、のようになる。
I)s(to、 J”)=D’;2 (ro * J’
)−DT′o’ (io * J”)1):(Lll 
J”) =:1)”:’Cio l J”)−D”’C
iol J”)=g−f第5図に示しtコ実施例装置に
丸・ける累積距離uIF、1. jX]i 0榎を以」
−の動作を行う機能を有するものに置き換えれは、前記
実施例装置はそのままVCVを標準パターンにする場合
のものになる。
なお、自ti記実施例においては、用M節全体としては
、その区間を抽々に想定しtこ場合が、兆層されてい1
こが、子音区間のマツチング結果は単畠簡の認識結末に
ついての子音区間のマツチングに対応しTこものであっ
て、子音区間を神々に想定しtコ場合は考慮されていな
い。
そこで、[ltl記マツチング方法で子音部Hの抽出を
行い、その区間で子音パターンの始端点自由による累積
DPマツチングII!1」離を求める子音区間をよ、り
重視したマツチング方法を用いた実施例について次に述
べる。
第8図は以上の考え方を説明するIt!を念図である。
すなわち、C(t)は前記の方法で求められtコ単音節
全体に対して求められたマツチング?L b’6であっ
て、点線ζ3りはマツチング径路(至)によって規定さ
れt、二子音と匈゛音の境界点(e 、 j”)を1ん
定したときの子音部に対する他の径路である。本実施例
の煮え方はこの点(e * 3”)を]b」定・して、
始喘点をある制限のもとに変化させtことき子音部にお
いて最も良くマツチングする径路を求め、その径鯖にお
けるマツチング結果を子音部のマツチング結果とするも
のである。
第1悩は子計部のマツチングに用いられる径路の拘束条
件の一実施例である。このような経路の拘束を課すと子
洛部のマツチング径路は第9図の((邊、0゛シでポさ
れる点Ce+ j”)を通る傾き1/2、および1頃き
2Q)ll′1線で囲まれる領域内に制限されることに
なる。
このような考え方を前記実施例に導入するには累栢距*
1i81算部0樽と最後尾単肯節決定部aUにおける処
理を次のように変更するだtlてよい。すなわち累積距
離RIM部G〜に丸・ける子音部のみのマツチング結果
を計9し記憶する部分であって、第6図のステップ■に
おLfる処理をD:(ilj)iこついてのみ次のよう
に変更する。
1)j=1のとき 1)”(1,1)=d(i、1) 2)j<jn  のとき 叶(i、j)qnin(IJ、’(i、j−1)、叶(
i−Li−ILD”(i−2,j−1))+d(i 、
 j)8)51番−=j’+1かツD”Ci 、 j 
) =Hノとき1):(il  コ )=1)か −−
L、j−1)4)8)以外のj>j”+1のとき lユ まTコI欧後尾単音節決定部Qυ従って第6図のステX ツブ■の処理を次のように変更する。
l)は子一部の始端点自由のマツチングを行うとき、D
Iの初期値を定義している。、2)は千7片部のマツチ
ングを行う規則を式で表現したもので、第18図のマツ
チング径路の拘束条件に対応している。8)は2ウチン
グ住路がjn  10点からJll + 1の点−\j
n上の点を粋ずに躍ぶ場合は強制的にjnからj”+1
へ移るように変更することを趣味している。すなわち予
言区間は必ずjn上の点で終端するようにしている。4
)は8)以外のj > j”+ 1に対してはjn上の
点て快疋さ#1. fコ子首区IR1のみのマツチング
結果をj”+1より上の点に対しては伝えてII <の
みであることを承している。
kを求めろ式Cξ丸いて、第1の=友施例T、 it第
1項の分JりかI−”(+ + J”)であっIこのに
対し、jkとなっているのは、η)1o1スのマツチン
グ径路の拘束条件のもとでは、経路長はj軸上の長さど
のみ比例するからである。
以−1,のまうに、第1の実施例に対し、第2の実施C
”11のように、子11部のみで1、tあるがb Kj
 in:点自山とすることによって、さらに認融吊の向
上が実1F、1.1きる。
なよ、・01前記i’を口+ ff! 2の実施例に丸
・いては、単音f4fJ畠J:+について説明し1こが
、ベクトルの系列で表わさhるあらゆるパターンのマツ
チングにおいて81’r rj1視してマツチングを行
いf、′いときは本発明のパターン1いり装置6が1史
出できる。
以十のように本旬明は、全14にとして六l似し、一部
のみが微妙に屁なる誹うな入カバターンであっても、s
t多+Lbiを大幅に減少させてル1けることがで〜き
、その実用同価(+αは高い。
【図面の簡単な説明】
第1図はマツチングH1丼径路の拘束条件を示す図、第
2図はマツチング径路躊を行う@H賊ろ冒1り1図、胎
8図はマッチンクa1算径路の別の拘束条ff+を小才
図、I’jXJ図は本発明の詳細な説明図、口)5図1
を本発明における一実施例の音声認識装置Mのブロック
図、嶋6図は同冥施例装酋の機能をソフトウェアで実現
し1こときのフローチャート、第7図はパターンの重視
する区間を異ならせ1こ場合の実hili例を貌明才ろ
ための図、第8図1〜い、10図は子召区間ケ・より組
視する実施例を説明イるtこめの図である。 OJ、1・・・持P仙出部、04・・・母音MJ識部、
07ヤ・・・識別函数記悼一部、Q<i・・・母音認詩
、結果記憶部、OQ・・・m音部(苧準パターン占1シ
1忌部、αG・・・ベクトル間1r14 #JI計に部
、08)・・・累積側l1li、it紳部、01・・・
最後尾n1音負」lり音フレーム#IN部、ぼb・・・
候N+ If B節発生部、?υ・・・最後尾小音節決
定部、に1・・・俵後尾小音部記憶部、翰・・・累(b
距縫記憶部、(ハ)・・・パックポインタ記憶部、(イ
)0.。 音声区間検出部、(イ)・・・フレーム数計ill、り
lレー・セグメンテーション部 代理人 森本戎弘 第1図 第2図 第31ン1 −t  5 第6図 第1[×1 f 第2図 中/σ図

Claims (1)

  1. 【特許請求の範囲】 1、 入力信号を特徴ベクトルa+’az・・・al・
    ・・alの系列に変換する特徴抽出手段と、特徴ベクト
    ルの系列昭b1・・・bS・・・b3nから成る標準パ
    ターンRn(ただしn=1 、2 、・・・、N)を記
    憶する標準パターン記憶手段と、入カバターンの第1フ
    レームにおいて、前記特徴ベクトルalとす、1との距
    11111dn(i 、 j )をJ = 1+ 2+
     ”’ * J”i n==1.2゜・・・、Nについ
    てd1算し、必要がなくなるまで一時的に記憶するベク
    トル開側^)を計算手段と、入カバターンの第iフレー
    ムにおいて、j=1.!、・;・。 J”I n””g2*”’QNについて中間累積距離D
    ”(i 、 j )と、それを求めるに至っtこ径路に
    沿う)、パターンnに対して予め指定した区間の第iフ
    レームまでの特定累積距離D:(1、j)と、中間パッ
    クポインタB”(i 、 j )とを求め、それらを必
    要が、なくなるまで記憶すると共に、n=1゜2、・・
    ・、Nについて、中門累積距離D”(r r J”)と
    特定累積距離D”(i 、 J”)との伺重和を最小に
    するn=曾と、その最小(11’f D令(i+戸)、
    それに対する中間バックポインタB貰(1,J”)を求
    める累積距離計算手段と、前記D’(+ * J”)を
    終端累積距離D(1)としてフレーム毎に記憶する終端
    累積距離記憶手段と、前記B佇c + 、 J8)を終
    端パックポインタB(i)としてフレーム毎に記憶する
    終端パックポインタ記憶手段と、前記貧を第iフレーム
    で終端する最後尾パターンN(i)としてフレーム毎に
    記憶する最後尾パターン記m手段と、入カバターンの最
    終フレームIで入力が完了したとき、前記終端バックポ
    インタ記憶手段からB(I)、 B (B(1)) 、
    ・・・IOすなわち連続して入力されたパターンの境界
    を逆の順序で求めるセグメンテーション手段と、入カバ
    ターンが存在する区間を検出する入カバターン区間検出
    手段と、この入カバターン区間検出手段によシ入カバタ
    ーンが存在してい々いと判定され1こときリセットされ
    、入カバターンが存在していると判定されている四人カ
    バターンのフレーム数を計数し、前記入力フレーム番号
    iを得るフレーム数計数手段とを備え、前記入カバター
    ン区間検出手段によシ入カバターンが終了し1こことが
    検出されると、前記計数手段のその時の値IとniI記
    セグメンテーション手段の出力とから1)11記最後尾
    バタン記憶手段に記憶されて^ いる内容N(1)、 N(B(1)) 、 N (B 
    (B(I)) 、・・・を11v1次市℃み出すことを
    特徴とするパターン比較装置。 2、 特r[−請求の範囲第1項記載の累積距離計算手
    段において、特定累積距kT)”;、Ci 、 j )
    をパターンnに対して予め指定しtこ区間のみ適当な範
    囲で始端自由として求めろことを特徴とするパターン比
    較装置。
JP57110528A 1982-06-25 1982-06-25 パタ−ン比較装置 Granted JPS59197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57110528A JPS59197A (ja) 1982-06-25 1982-06-25 パタ−ン比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57110528A JPS59197A (ja) 1982-06-25 1982-06-25 パタ−ン比較装置

Publications (2)

Publication Number Publication Date
JPS59197A true JPS59197A (ja) 1984-01-05
JPH0247757B2 JPH0247757B2 (ja) 1990-10-22

Family

ID=14538086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57110528A Granted JPS59197A (ja) 1982-06-25 1982-06-25 パタ−ン比較装置

Country Status (1)

Country Link
JP (1) JPS59197A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60164798A (ja) * 1984-02-03 1985-08-27 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 単音節音声認識方法
JPS6195029A (ja) * 1984-10-15 1986-05-13 Mitsui Toatsu Chem Inc ポリイミド樹脂粉末の製造方法、ポリイミド樹脂粉末を用いる接着方法及び被膜形成方法
JPS6195028A (ja) * 1984-10-15 1986-05-13 Mitsui Toatsu Chem Inc 耐熱性樹脂粉末の製造方法及び該樹脂粉末を用いる接着方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5255414A (en) * 1975-10-31 1977-05-06 Nec Corp Continuous voice recognition equipment
JPS5255413A (en) * 1975-10-31 1977-05-06 Nec Corp Continous voice recognition equipment
JPS54145409A (en) * 1978-05-06 1979-11-13 Hiroya Fujisaki Monosyllable speech recognition system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5255414A (en) * 1975-10-31 1977-05-06 Nec Corp Continuous voice recognition equipment
JPS5255413A (en) * 1975-10-31 1977-05-06 Nec Corp Continous voice recognition equipment
JPS54145409A (en) * 1978-05-06 1979-11-13 Hiroya Fujisaki Monosyllable speech recognition system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60164798A (ja) * 1984-02-03 1985-08-27 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 単音節音声認識方法
JPH0246957B2 (ja) * 1984-02-03 1990-10-17 Intaanashonaru Bijinesu Mashiinzu Corp
JPS6195029A (ja) * 1984-10-15 1986-05-13 Mitsui Toatsu Chem Inc ポリイミド樹脂粉末の製造方法、ポリイミド樹脂粉末を用いる接着方法及び被膜形成方法
JPS6195028A (ja) * 1984-10-15 1986-05-13 Mitsui Toatsu Chem Inc 耐熱性樹脂粉末の製造方法及び該樹脂粉末を用いる接着方法

Also Published As

Publication number Publication date
JPH0247757B2 (ja) 1990-10-22

Similar Documents

Publication Publication Date Title
US11217224B2 (en) Multilingual text-to-speech synthesis
JP2739945B2 (ja) 音声認識方法
JP4114888B2 (ja) 声質変化箇所特定装置
JP2022107032A (ja) 機械学習を利用したテキスト音声合成方法、装置およびコンピュータ読み取り可能な記憶媒体
US10319373B2 (en) Information processing device, information processing method, computer program product, and recognition system
JP5240457B2 (ja) 拡張認識辞書学習装置と音声認識システム
US8271282B2 (en) Voice recognition apparatus, voice recognition method and recording medium
KR20210059586A (ko) 텍스트 음성 변환과 함께 멀티태스크 학습을 사용한 감정적 음성 변환 방법 및 장치
JP5411845B2 (ja) 音声合成方法、音声合成装置及び音声合成プログラム
JPH0713594A (ja) 音声合成において音声の質を評価するための方法
JPS59197A (ja) パタ−ン比較装置
JP2022067223A (ja) 生成装置および生成方法
JP6748607B2 (ja) 音声合成学習装置、音声合成装置、これらの方法及びプログラム
JP4226942B2 (ja) アクセント位置推定方法、装置およびプログラム
JP5772219B2 (ja) 音響モデル生成装置、音響モデル生成方法及び音響モデル生成用コンピュータプログラム
US20240153486A1 (en) Operation method of speech synthesis system
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JP3586644B2 (ja) パターン認識装置とパターン認識方法および記録媒体
KR100236962B1 (ko) 음소별 화자 종속 변이음 모델링 방법
JPH07113838B2 (ja) 音声認識方法
JPS61148497A (ja) 標準パタン作成装置
JP2002189489A (ja) 音声合成装置
JPS62173499A (ja) 連続音声認識装置
JPH0320759B2 (ja)
JPS60150098A (ja) 音声認識装置