JP3092384B2 - Pattern matching device - Google Patents

Pattern matching device

Info

Publication number
JP3092384B2
JP3092384B2 JP05077026A JP7702693A JP3092384B2 JP 3092384 B2 JP3092384 B2 JP 3092384B2 JP 05077026 A JP05077026 A JP 05077026A JP 7702693 A JP7702693 A JP 7702693A JP 3092384 B2 JP3092384 B2 JP 3092384B2
Authority
JP
Japan
Prior art keywords
candidate
distance value
candidates
pattern matching
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05077026A
Other languages
Japanese (ja)
Other versions
JPH06289892A (en
Inventor
知弘 岩崎
邦男 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP05077026A priority Critical patent/JP3092384B2/en
Publication of JPH06289892A publication Critical patent/JPH06289892A/en
Application granted granted Critical
Publication of JP3092384B2 publication Critical patent/JP3092384B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は音声認識装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech recognition device.

【0002】[0002]

【従来の技術】図11は例えば古井貞照著「ディジタル
音声処理」p160−161(東海大学出版会)に記述
されているような従来のパターン照合装置の構成を示す
ブロック図である。
2. Description of the Related Art FIG. 11 is a block diagram showing a configuration of a conventional pattern matching apparatus described in, for example, "Digital Speech Processing" by Sadateru Furui, p160-161 (Tokai University Press).

【0003】図において61は音声信号66を一定時間
毎に音響分析し特徴パラメータ67に変換する音響分析
手段、62は標準パターンを記憶する標準パターン記憶
手段、63は前記音響分析手段61より特徴パラメータ
が出力されるたびに、前記標準パターン記憶手段62の
標準パターン68とのパターン照合を行い、距離値記憶
手段64が記憶する各候補の累積距離値を更新するパタ
ーン照合手段、65は距離値記憶手段64に記憶されて
いる累積距離値から照合結果70を抽出し出力する結果
出力手段である。69a、69bは累積距離値である。
In FIG. 1, reference numeral 61 denotes acoustic analysis means for acoustically analyzing a voice signal 66 at regular time intervals and converts it into characteristic parameters 67; 62, a standard pattern storage means for storing a standard pattern; Each time is output, a pattern matching unit that performs pattern matching with the standard pattern 68 of the standard pattern storage unit 62 and updates the cumulative distance value of each candidate stored in the distance value storage unit 64. This is a result output means for extracting and outputting the collation result 70 from the accumulated distance value stored in the means 64. 69a and 69b are cumulative distance values.

【0004】以下、動的計画法によりパターン照合を行
うパターン照合装置の一例として従来のパターン照合装
置の説明を行う。図12はこの従来のパターン照合装置
におけるパターン照合手段の処理を示す流れ図である。
音声入力は時間1より開始され時間Tに終了するものと
する。
Hereinafter, a conventional pattern matching apparatus will be described as an example of a pattern matching apparatus that performs pattern matching by a dynamic programming method. FIG. 12 is a flowchart showing the processing of the pattern matching means in the conventional pattern matching device.
It is assumed that the voice input starts at time 1 and ends at time T.

【0005】図12においてtは時間、jは標準パター
ンのフレーム番号、nは候補番号、J(n)は候補nの標
準パターンのフレーム数、Nは認識すべき候補数、d
(n,t,j)は時間tにおける候補nの標準パターンのフ
レームjの局所距離値であり、例えばユークリッド距離
を用いて演算される。またg(n,t,j)は時間tにおけ
る候補nの標準パターンのフレームjに至る累積距離値
である。
In FIG. 12, t is time, j is the frame number of the standard pattern, n is the candidate number, J (n) is the number of frames of the standard pattern of candidate n, N is the number of candidates to be recognized, d
(n, t, j) is a local distance value of the frame j of the standard pattern of the candidate n at the time t, and is calculated using, for example, the Euclidean distance. G (n, t, j) is a cumulative distance value to the frame j of the standard pattern of the candidate n at the time t.

【0006】処理に先立ち標準パターン記憶手段62に
は全候補の標準パターンが記憶されているものとする。
N候補に対するパターン照合処理はステップ101から
始まりステップ114で終了する。まずステップ102
において距離値記憶手段64の初期化が行われる。図3
は距離値記憶手段64が初期化された様子を候補nにつ
いて示した図である。図中「−」の記号はその項目が初
期化されておらず、値が定まっていないことを示す。
Prior to the processing, the standard pattern storage means 62 stores standard patterns of all candidates.
The pattern matching process for N candidates starts from step 101 and ends at step 114. First, step 102
In, initialization of the distance value storage means 64 is performed. FIG.
FIG. 9 is a diagram showing a state in which the distance value storage means 64 is initialized for a candidate n. In the figure, the symbol "-" indicates that the item has not been initialized and the value has not been determined.

【0007】ステップ103からステップ113におい
て入力パターンのフレームtに関する処理が示されてい
る。パターン照合は入力パターンの1フレームが入力さ
れるたびに全候補に対するパターン照合を繰り返し、距
離値記憶手段64の累積距離値g(n,t,j)を更新して
いく。ステップ104から111において候補nに関す
る処理が記述されている。ステップ105からステップ
109において各候補の標準パターンのフレームjに対
する処理が記述されている。
In steps 103 to 113, processing relating to the frame t of the input pattern is shown. In the pattern matching, the pattern matching for all the candidates is repeated every time one frame of the input pattern is input, and the cumulative distance value g (n, t, j) in the distance value storage unit 64 is updated. In steps 104 to 111, the processing regarding the candidate n is described. In steps 105 to 109, processing for the frame j of the standard pattern of each candidate is described.

【0008】ステップ106において標準パターン記憶
手段62から候補nの標準パターンの第jフレームが読
み出され、時間tにおける局所距離値d(n,t,j)が演
算される。その局所距離値を用いてステップ107にお
いて動的計画法による演算が行われ累積距離値g(n,
t,j)が更新される。音声入力が終了する時間Tにおい
て、結果出力手段65においてg(n,T,J(n))を候補
nのパターン照合結果70として出力する。入力された
音声信号はこのパターン照合結果70の小さな候補の順
に確からしいと判断できる。
In step 106, the j-th frame of the standard pattern of the candidate n is read from the standard pattern storage means 62, and the local distance value d (n, t, j) at time t is calculated. Using the local distance value, a calculation by the dynamic programming is performed in step 107, and the cumulative distance value g (n,
t, j) is updated. At the time T when the voice input ends, the result output unit 65 outputs g (n, T, J (n)) as the pattern matching result 70 of the candidate n. It can be determined that the input audio signal is more likely to be in the order of smaller candidates in the pattern matching result 70.

【0009】従来のパターン照合装置は以上のように構
成されており、候補数が増加するにつれ演算量が大きく
なる。特に連続音声認識を行う場合で類似した複数の候
補の照合結果を獲得したい場合には、標準パターンの組
み合わせにより候補数が多くなるため、演算量が極めて
大きくなるという問題がある。例えば「わたしは学校へ
行きます」という連続音声認識を対象とする場合には
「わたし」「は」「学校」「へ」「行きます」等の単語
の標準パターンを連結して文章候補を表現する。このよ
うに単語を連結する規則により認識すべき文章を表現し
た一例を図4に示す。この規則により表現できる文章候
補の例としては図5に示すものがあげられる。
[0009] The conventional pattern matching device is configured as described above, and the amount of calculation increases as the number of candidates increases. In particular, in the case of performing continuous speech recognition, when it is desired to obtain a matching result of a plurality of similar candidates, the number of candidates increases due to the combination of the standard patterns, so that there is a problem that the amount of calculation becomes extremely large. For example, in the case of continuous speech recognition such as "I go to school", standard sentences of words such as "I", "ha", "school", "to", "go" are connected to represent sentence candidates. I do. FIG. 4 shows an example in which a sentence to be recognized is represented by a rule for connecting words in this manner. FIG. 5 shows an example of a sentence candidate that can be represented by this rule.

【0010】図5において候補1が発声されたとする
と、これに対し、候補2は「は」が脱落した例、候補3
は「は」が「も」に置換された例、候補4は「たち」が
挿入された例とみなせる。このように挿入、置換、脱落
により「わたし」や「学校へ行きます」等のように共通
の標準パターンの並びから構成される部分が複数生成さ
れる。「わたし」のように前半部分が共通の標準パター
ンの並びから構成される候補に対しては、認識がLef
t−to−Rightに進められる場合には、「わた
し」の部分に対するパターン照合は、全ての候補で共通
であり同じ累積距離値を用いることができるため省略可
能である。
In FIG. 5, if candidate 1 is uttered, candidate 2 is an example in which "ha" is dropped, candidate 3
Can be regarded as an example in which “ha” has been replaced with “mo”, and candidate 4 can be regarded as an example in which “tachi” has been inserted. In this way, a plurality of portions composed of a common standard pattern sequence such as "I" and "go to school" are generated by insertion, substitution, and omission. For a candidate whose first half consists of a sequence of common standard patterns, such as "I", recognition is left
In the case of proceeding to t-to-Right, pattern matching for the "I" part can be omitted because it is common to all candidates and the same cumulative distance value can be used.

【0011】後半部分が共通の標準パターンの並び「学
校へ行きます」により構成される候補に対しても、同一
の標準パターンに対する演算を行うこととなり、同じ累
積距離値とはならないが同様の演算が重複して行われる
こととなる。ここでは候補1と候補2のパターン照合を
例にとって説明を行う。
For the candidate whose second half is composed of a series of common standard patterns "go to school", the same standard pattern is calculated. Are performed repeatedly. Here, a description will be given taking pattern matching of candidate 1 and candidate 2 as an example.

【0012】図6は図5に示した候補1と候補2のパタ
ーン照合を行う場合の距離値記憶手段の内容を模式的に
示したものである。図において縦は標準パターン、横は
時間tの経過を示す。図中の実線は最適パスを示す。最
適パスとは動的計画法により求められた入力パターンの
各フレームと標準パターンの各フレームの最適な組み合
わせを示すものである。候補1と候補2では始まりで
「わたし」の標準パターンが共通に用いられているた
め、パターン照合は同一演算となり、時間t1までは最
適パスも同一である。候補1では「は」が存在するため
時間t1から時間t2では異なるパターン照合となり、異
なる最適パスをたどる。しかし、時間t2以降では再び
同じ最適パスをたどる。そのため時間t2以降では最適
パス上の累積距離値の差は一定であり、どちらか一方の
パターン照合のみ行い、残りの候補の累積距離値は時間
Tにおいてこの差から求めることができる。
FIG. 6 schematically shows the contents of the distance value storage means in the case where the pattern matching between the candidate 1 and the candidate 2 shown in FIG. 5 is performed. In the figure, the vertical axis indicates the standard pattern, and the horizontal axis indicates the passage of time t. The solid line in the figure indicates the optimal path. The optimal path indicates an optimal combination of each frame of the input pattern and each frame of the standard pattern obtained by the dynamic programming. Since the standard pattern of "I" is used in common at the beginning of candidate 1 and candidate 2, pattern matching is the same operation, and the optimal path is the same until time t1. Since "ha" exists in the candidate 1, different pattern matching is performed from the time t1 to the time t2, and a different optimal path is followed. However, after time t2, the same optimal path is followed again. Therefore, after time t2, the difference between the accumulated distance values on the optimal path is constant. Only one of the pattern comparisons is performed, and the accumulated distance value of the remaining candidates can be obtained from this difference at time T.

【0013】[0013]

【発明が解決しようとする課題】しかし動的計画法にお
ける最適パスはパターン照合が全て終わった後にバック
トラックして初めて求められるため、パターン照合中に
最適パスが同一のパスをたどることを検出する手段がな
い。そのため上記に述べた重複したパターン照合演算を
行わざるをえないという問題があった。
However, since the optimal path in the dynamic programming is found only after backtracking after all the pattern matchings are completed, it is detected that the optimal path follows the same path during the pattern matching. There is no means. Therefore, there has been a problem that the above-described redundant pattern matching calculation has to be performed.

【0014】このような問題を回避する方法としてShwa
rtz著「A Comparizon of Several Apoximate Algorithm
s For Finding Multiple (N-BEST) Sentence Hypothse
s」(ICASSP-91.pp701-704)に記述されているN-bestア
ルゴリズムや、渡辺隆夫著「Bundleサーチによる連続音
声認識のための高速化手法」(日本音響学会平成3年
研究発表会講演論文集p125-126)に記述されているbu
ndleサーチ等が提案されている。しかし、これらのアル
ゴリズムではバックトラックするためのかなり大きなメ
モリ領域が必要であったり、Lattice N-Bestアルゴリズ
ムやbundleサーチのように下位順位のパターン照合結果
が正しく求まらない場合があるなどの問題がある。
As a method for avoiding such a problem, Shwa
rtz, A Comparizon of Several Apoximate Algorithm
s For Finding Multiple (N-BEST) Sentence Hypothse
s "(ICASSP-91.pp701-704) and Takao Watanabe," High-speed Method for Continuous Speech Recognition by Bundle Search "(Acoustic Society of Japan Spring 1991)
Bu, which is described in the season Research Workshop Proceedings p125-126)
An ndle search and the like have been proposed. However, these algorithms require a fairly large memory area for backtracking, and may not correctly calculate the lower-order pattern matching results, such as the Lattice N-Best algorithm or bundle search. There is.

【0015】この発明によるパターン照合装置は上記の
ような問題点を解決するためになされたもので、パター
ン照合性能を劣化させることなく、演算量と必要なメモ
リ量の小さなパターン照合装置を得ることを目的とす
る。
A pattern matching device according to the present invention has been made in order to solve the above-described problems, and it is possible to obtain a pattern matching device having a small amount of calculation and a small amount of memory without deteriorating pattern matching performance. With the goal.

【0016】[0016]

【課題を解決するための手段】音声信号を一定時間毎に
音響分析し特徴パラメータに変換する音響分析手段と、
パターン照合を行う照合候補を記憶する照合指示手段
と、前記音響分析手段より特徴パラメータが入力される
たびに、前記照合指示手段において指定されている候補
に対応する標準パターンを標準パターン記憶手段から参
照してパターン照合を行い累積距離値を算出するパター
ン照合手段と、この算出された累積距離値に基づき前記
各候補の累積距離値を記憶する距離値記憶手段と、後半
部分が同一の標準パターンの並びにより構成される候補
の間において、この後半部分においてそれぞれ対応する
部分の累積距離値が所定時間幅の間所定以内の差を保つ
場合、これらを統合候補として検出し、これら統合候補
のうち一つを残し、残りの統合候補を前記照合指示手段
における照合対象から除去する統合候補検出手段と、統
合候補検出手段で検出された統合候補の組み合わせとそ
の累積距離値の差とを記憶する統合候補記憶手段と、前
記照合指示手段で除去された候補の距離値を、除去され
ていない候補の累積距離値と、前記統合候補記憶手段の
累積距離値の差とから求め、この各候補の距離値に基づ
いて照合結果を決定し出力する結果出力手段とを備えた
ものである。
Means for solving the problems Acoustic analysis means for acoustically analyzing a voice signal at regular time intervals and converting it into characteristic parameters,
A matching instruction means for storing matching candidates for performing pattern matching, and each time a characteristic parameter is input from the acoustic analysis means, a standard pattern corresponding to the candidate specified by the matching instruction means is referenced from the standard pattern storing means. Pattern matching means for performing pattern matching and calculating a cumulative distance value, distance value storing means for storing the cumulative distance value of each candidate based on the calculated cumulative distance value, and a latter half of the same standard pattern. If the cumulative distance value of the corresponding part in the latter half of the candidate is kept within a predetermined distance for a predetermined time width, these are detected as integrated candidates, and one of these integrated candidates is detected. Integrated candidate detecting means for removing the remaining integrated candidates from the matching target in the matching instruction means, and detecting the remaining integrated candidates by the integrated candidate detecting means. Integrated candidate storage means for storing the combination of the selected integrated candidates and the difference between the cumulative distance values thereof, and the distance value of the candidate removed by the matching instruction means, the cumulative distance value of the unremoved candidate, And a result output means for determining and outputting a collation result based on the distance value of each candidate obtained from the difference between the accumulated distance values of the candidate storage means.

【0017】また前記統合候補検出手段で、後半部分が
同一の標準パターンの並びにより構成される候補の間に
おいて、後半部分の累積距離値の最小値の差がある時間
幅を隔てて再び同じ場合にこれらの候補を統合候補とす
るものである。
In the integrated candidate detecting means, a difference between the minimum values of the cumulative distance values of the latter part is the same again after a certain time interval between the candidates composed of the same standard pattern in the latter part. First, these candidates are integrated candidates.

【0018】さらに、前記結果出力手段においてbest-f
irst-searchを行うことにより上位のN個を出力するも
のである。
Further, best-f
By performing irst-search, the top N items are output.

【0019】[0019]

【作用】この発明においては、統合候補記憶手段によ
り、後半部分において累積距離値の同じ候補が統合候補
として検出され、ひとつの候補のみ代表候補として残さ
れ、他の候補については相対的な距離差のみが統合候補
記憶手段に記憶されるとともに、パターン照合を中止し
た候補の距離値は最終的に代表候補の累積距離値に統合
候補記憶手段の累積距離値の差を加算して求められるの
で、同じパターン照合を中止することができ、同じ標準
パターンに対する重複したパターン演算の演算量削減が
可能となる。
In the present invention, candidates having the same accumulated distance value are detected as integrated candidates in the latter half by the integrated candidate storage means, and only one candidate is left as a representative candidate.
For the other candidates , only the relative distance difference is stored in the integrated candidate storage means, and the distance value of the candidate whose pattern matching has been stopped is finally stored in the integrated candidate storage means as the cumulative distance value of the representative candidate. Since the difference is obtained by adding the difference between the distance values, the same pattern matching can be stopped, and the amount of calculation of the overlapping pattern calculation for the same standard pattern can be reduced.

【0020】また前記統合候補検出手段により、後半部
分が同一の標準パターンの並びにより構成される候補の
間において、後半部分の累積距離値の最小値の差がある
時間幅を隔てて再び同じ場合にこれらの候補を統合候補
とされることにより、統合候補検出処理が簡素化され
る。
[0020] The integrated candidate detecting means may further include a case where the difference between the minimum values of the cumulative distance values of the latter part is the same again after a certain time interval between the candidates composed of the same standard pattern in the latter part. By making these candidates as integrated candidates, the integrated candidate detection process is simplified.

【0021】さらに、前記結果出力手段においてbest-f
irst-searchを行うことにより上位のN個の距離値の小
さな上位のN個の候補が出力される。
Further, best-f
By performing the irst-search, the top N candidates having the small top N distance values are output.

【0022】[0022]

【実施例】【Example】

実施例1.以下、請求項1の発明の一実施例を図1につ
いて説明する。図において31は音声信号39を一定時
間毎に音響分析し特徴パラメータに変換する音響分析手
段、32は標準パターンを記憶する標準パターン記憶手
段、33は各候補の累積距離値を記憶する距離値記憶手
段、34はパターン照合を行う候補を記憶する照合指示
手段である。
Embodiment 1 FIG. Hereinafter, an embodiment of the invention will be described with reference to FIG. In the figure, reference numeral 31 denotes sound analysis means for sound-analyzing the audio signal 39 at fixed time intervals and converts it into characteristic parameters; 32, standard pattern storage means for storing standard patterns; and 33, distance value storage for storing the cumulative distance value of each candidate. Means 34 is a matching instruction means for storing candidates for pattern matching.

【0023】35は前記音響分析手段31より特徴パラ
メータ40が入力されるたびに、前記標準パターン記憶
手段32の標準パターン41を参照し、前記照合指示手
段34からの照合指示42によって指示されている候補
とのパターン照合を行い、前記距離値記憶手段33に累
積距離値43aを出力して更新するパターン照合手段で
ある。
Each time a characteristic parameter 40 is input from the acoustic analysis means 31, the reference numeral 35 refers to the standard pattern 41 of the standard pattern storage means 32 and is designated by a collation instruction 42 from the collation instruction means 34. This is a pattern matching unit that performs pattern matching with a candidate and outputs a cumulative distance value 43a to the distance value storage unit 33 for updating.

【0024】36は後半部分が同一の標準パターンの並
びにより構成される候補の間において、この後半部分に
おけるそれぞれ対応する累積距離値43cがある時間幅
の間同じ差を保つ場合、これらを統合候補として検出す
るとともに、これら統合候補のうち一つを残すものとし
て選定し、残りの統合候補を除去指示44によって前記
照合指示手段34内で照合対象から除去する統合候補検
出手段である。
The reference numeral 36 designates an integrated candidate in the case where the corresponding cumulative distance value 43c in the latter half maintains the same difference for a certain time width between candidates having the same standard pattern in the latter half. , And selects one of the integration candidates as the one to be left, and removes the remaining integration candidates from the matching target in the matching instruction means 34 by the removal instruction 44.

【0025】37はこの統合候補検出手段36で検出さ
れた統合候補の組み合わせとその累積距離値の差を記憶
する統合候補記憶手段、38は前記照合指示手段34で
除去された候補の累積距離値を、最終的に前記照合指示
手段34に残存した候補の累積距離値43bおよび前記
統合候補記憶手段37に記憶された統合候補間の累積距
離値の差から求めて各候補の照合結果46を決定し出力
する結果出力手段である。
Reference numeral 37 denotes an integrated candidate storage means for storing the difference between the combination of the integration candidates detected by the integration candidate detection means 36 and the cumulative distance value, and 38 denotes the cumulative distance value of the candidate removed by the collation instruction means 34. Is finally determined from the difference between the cumulative distance value 43b of the candidate remaining in the matching instruction means 34 and the cumulative distance value between the integrated candidates stored in the integrated candidate storage means 37 to determine the matching result 46 of each candidate. And a result output means for outputting the result.

【0026】以下、従来のパターン照合装置と同様に動
的計画法によりパターン照合を行うパターン照合装置を
一例としてこの発明によるパターン照合装置の説明を行
う。図2はこの発明のパターン照合装置におけるパター
ン照合手段の処理を示す流れ図である。図2において
t、j、n、T、J(n)、N、d(n,t,j)、g(n,
t,j)の各記号は従来のパターン照合装置の説明に用い
たものと同じ意味で用いている。
Hereinafter, a pattern matching apparatus according to the present invention will be described with an example of a pattern matching apparatus that performs pattern matching by a dynamic programming method as in the conventional pattern matching apparatus. FIG. 2 is a flowchart showing the processing of the pattern matching means in the pattern matching device of the present invention. In FIG. 2, t, j, n, T, J (n), N, d (n, t, j), g (n,
Each symbol of (t, j) has the same meaning as that used in the description of the conventional pattern matching device.

【0027】m(n)は照合指示手段34の照合指示42
の内容を示し、m(n)=1は候補nに対するパターン照
合を指定していることを示し、m(n)=0はパターン照
合をしないこと、すなわち照合対象から除去されたこと
を示す。処理に先立ち標準パターン記憶手段32には全
候補の標準パターンが記憶されているものとする。N個
の候補に対するパターン照合処理はステップ1から始ま
りステップ18で終了する。まずステップ2において図
3に示すように距離値記憶手段33の記憶内容の初期化
が行われ、またステップ3において照合指示手段34に
おいて全てのm(n)を1とする初期化が行われ、全ての
候補をパターン照合するように設定される。
M (n) is the collation instruction 42 of the collation instruction means 34
M (n) = 1 indicates that the pattern matching for the candidate n is designated, and m (n) = 0 indicates that the pattern matching is not performed, that is, it is removed from the matching target. Prior to the processing, it is assumed that standard patterns of all candidates are stored in the standard pattern storage unit 32. The pattern matching process for N candidates starts from step 1 and ends at step 18. First, in step 2, as shown in FIG. 3, the storage contents of the distance value storage means 33 are initialized, and in step 3, the initialization is performed in the collation instruction means 34 so that all m (n) is set to 1. It is set so that all candidates are subjected to pattern matching.

【0028】ステップ4からステップ17において、時
刻tに対応する入力パターンのフレームtに関する処理
が、音声入力の終了する時刻Tまでの間行なわれる動作
が示されている。このなかでは、入力パターンの1フレ
ームが入力されるたびにその1フレームと、全候補の標
準パターンとのパターン照合を行ない、各候補に対する
距離値記憶手段33の累積距離値g(n,t,j)を更新し
ていく。
Steps 4 to 17 show an operation in which the processing for the frame t of the input pattern corresponding to the time t is performed until the time T when the voice input ends. Among them, every time one frame of the input pattern is input, pattern matching of the one frame with the standard patterns of all the candidates is performed, and the cumulative distance value g (n, t, j) of the distance value storage means 33 for each candidate is checked. ) Will be updated.

【0029】ステップ8からステップ11までの処理
は、時刻tで入力されたフレームtに対し、ある候補n
の標準パターンとのパターン照合を行なってその候補に
対する累積距離値g(n,t,j)を更新していく処理が示
されている。すなわち、ステップ8において、標準パタ
ーン記憶手段32から候補nの標準パターンの第jフレ
ームが読み出し、入力されたフレームtと、この候補n
の標準パターンの第jフレームとの局所距離値d(n,
t,j)を演算し、これをもとにステップ9で動的計画
法による演算が行われ累積距離値g(n,t,j)をもと
め、図3に示す距離値記憶手段33の該当箇所の内容を
更新する。
The processing from step 8 to step 11 is performed for a certain candidate n for the frame t input at the time t.
2 shows a process of performing pattern matching with the standard pattern of No. and updating the cumulative distance value g (n, t, j) for the candidate. That is, in step 8, the j-th frame of the standard pattern of the candidate n is read from the standard pattern storage unit 32, and the input frame t and the candidate n
Local distance value d (n,
t, j), and based on this, the calculation by the dynamic programming is performed in step 9 to obtain the cumulative distance value g (n, t, j), and the corresponding value of the distance value storage means 33 shown in FIG. Update the contents of the location.

【0030】ステップ10でjを増やしていき、ステッ
プ11で候補nの標準パターンの全てのフレーム数の回
数だけ行なったと判定されるまでステップ8からの処理
を繰り返す。これにより時刻tで入力されたフレームt
に対する候補nの標準パターンの全フレームとの照合が
なされ、時刻tにおける候補nの累積距離値g(n,t,
j)が更新される(図3におけるtに対応した縦1列分
が更新される)。
In step 10, j is increased, and the processing from step 8 is repeated until it is determined in step 11 that the processing has been performed the same number of times as the number of all frames of the standard pattern of the candidate n. Thus, the frame t input at the time t
Is compared with all frames of the standard pattern of the candidate n, and the cumulative distance value g (n, t,
j) is updated (one vertical column corresponding to t in FIG. 3 is updated).

【0031】その後、ステップ12、ステップ13から
なる統合候補の検出、処理を行なうがこれについては後
述する。ステップ14において候補番号nを増やしてい
きながら、上述のステップ8からステップ13までの処
理を繰り返すことで、別の候補に対する同様の処理を行
ない、ステップ15で全ての候補数Nについて行なった
と判断されるまで繰り返す。これにより、全ての候補に
対する時刻tのフレームに関する照合が行なわれたこと
になる。すなわち図3のような記憶内容が各候補毎にそ
れぞれ距離値記憶手段33に設定されており、全ての候
補に対する累積距離値g(n,t,j)の更新がなされる。
After that, detection and processing of integration candidates consisting of steps 12 and 13 are performed, which will be described later. By repeating the processing from step 8 to step 13 while increasing the candidate number n in step 14, the same processing is performed for another candidate, and it is determined in step 15 that the processing has been performed for all candidate numbers N. Repeat until As a result, the matching of the frame at the time t with respect to all the candidates is performed. That is, the storage contents as shown in FIG. 3 are set in the distance value storage means 33 for each candidate, and the cumulative distance values g (n, t, j) for all the candidates are updated.

【0032】ここで、ステップ12において、統合候補
検出手段36による統合候補の検出が行なわれる。これ
は後半部分が同じパターンの並びにより構成され、統合
できる候補を検出するものである。このステップ12で
統合候補が検出されると、ステップ13において、その
候補が統合候補を代表する代表候補でない場合には、照
合指示手段34におけるその候補の照合指示内容m(n)
を0に設定し、照合対象から除去するとともに、統合候
補の組み合わせとその累積距離値の差を統合候補記憶手
段37に記憶する。
Here, in step 12, an integration candidate is detected by the integration candidate detection means 36. This is to detect candidates that can be integrated, with the latter half being composed of the same pattern sequence. When an integrated candidate is detected in step 12, if the candidate is not a representative candidate representing the integrated candidate in step 13, the matching instruction contents m (n) of the candidate in the matching instruction means 34
Is set to 0 to remove the candidate from the collation target, and store the combination of the integration candidates and the difference between their cumulative distance values in the integration candidate storage means 37.

【0033】そして、上述の各候補における累積距離値
g(n,t,j)の更新処理において、照合指示内容m(n)
が0と設定された候補は、ステップ6において照合対象
から除去されたと判定され、ステップ7からステップ1
3までのパターン照合演算を行わない。これにより、複
数候補間で重複した後半部分の演算の量を削減できる。
In the process of updating the cumulative distance value g (n, t, j) in each of the candidates, the collation instruction content m (n)
Is set to 0, it is determined in step 6 that the candidate has been removed from the collation target.
The pattern matching calculation up to 3 is not performed. As a result, the amount of calculation of the latter half part which is duplicated among a plurality of candidates can be reduced.

【0034】上述のステップ13における統合候補検出
手段36の統合候補の検出は以下のようにして行う。例
えば、図6に示すように、候補1におけるフレームjs
(1)以降の後半部分と候補2におけるフレームjs(2)
以降の後半部分とが同一の標準パターンの並びにより表
現されるとする。つまり候補1のフレームjs(1)から
J(1)まで、候補2ではフレームjs(2)からJ(2)ま
でが統合候補の検出の対象となる部分である。
The detection of the integration candidate by the integration candidate detection means 36 in the above-mentioned step 13 is performed as follows. For example, as shown in FIG.
Frame js (2) in the latter half of (1) and candidate 2
It is assumed that the latter half is expressed by the same standard pattern. In other words, the frames from candidate frames js (1) to J (1) and the candidate 2 from frames js (2) to J (2) are the candidates for the integrated candidate detection.

【0035】この部分のフレーム長をJwとする。時間
t3における統合候補検出処理の流れを図7に示す。ス
テップ73からステップ76で、候補1と候補2の対応
する部分(候補1のjs(1)からJ(1)までおよび候補2
のjs(2)からJ(2)まで)の累積距離値g(n,t,j)の
差e(t,j)を求める。これをt3からさかのぼって求め
ていき、ステップ77、78により時間t3から所定の
時間幅Twだけさかのぼったと判定されるまで求める。
The frame length of this portion is defined as Jw. FIG. 7 shows the flow of the integration candidate detection process at time t3. In steps 73 to 76, corresponding portions of candidate 1 and candidate 2 (from js (1) to J (1) of candidate 1 and candidate 2)
The difference e (t, j) between the accumulated distance values g (n, t, j) of js (2) to J (2) is calculated. This is calculated retroactively from t3, and is determined until it is determined in steps 77 and 78 that it has been retroactive from the time t3 by a predetermined time width Tw.

【0036】そして、求められた、e(t,j)が所定の
時間幅Twの間全て同じ値であった場合、候補1と候補
2は統合候補であるとみなす。そして、例えば候補1を
代表候補として残し、候補2を照合指示手段34から削
除するものとする。すなわち統合候補検出手段36から
照合指示手段34に対し、除去指示44が出され照合指
示手段34内でm(2)=0にするとともに、代表候補の
候補番号1と削除された候補番号2と累積距離値の差d
1をを統合候補記憶手段37に記憶する。なお、d1=e
(t,j)である。
If the obtained values of e (t, j) are all the same during a predetermined time width Tw, the candidates 1 and 2 are regarded as integrated candidates. Then, for example, candidate 1 is left as a representative candidate, and candidate 2 is deleted from collation instruction means 34. That is, a removal instruction 44 is issued from the integration candidate detection means 36 to the collation instruction means 34, m (2) = 0 is set in the collation instruction means 34, and the candidate number 1 of the representative candidate and the deleted candidate number 2 Cumulative distance value difference d
1 is stored in the integration candidate storage means 37. Note that d1 = e
(t, j).

【0037】図8に統合候補記憶手段37の記憶内容を
模式的に示す。各行が統合候補の組み合わせを表し、第
1列が代表候補、第2列が除去された候補、第3列が累
積距離差を示す。この図8では、上記の説明で求められ
た候補1と候補2の統合候補の組み合わせが第1行に入
れられており、この例では先に入力された第6行から順
に上に積み重なっていく形式で示されている。
FIG. 8 schematically shows the storage contents of the integration candidate storage means 37. Each row indicates a combination of integration candidates, the first column indicates a representative candidate, the second column indicates a removed candidate, and the third column indicates a cumulative distance difference. In FIG. 8, the combination of the combined candidates of candidate 1 and candidate 2 obtained in the above description is included in the first row, and in this example, the combination is sequentially stacked upward from the sixth row input earlier. It is shown in the format.

【0038】音声入力が終了する時間Tになったとき、
結果出力手段38において照合指示手段34により除去
されていない候補1については距離値記憶手段33から
の累積距離値43bを参照し、累積距離値g(1,T,J
(1))を候補1の最終的な距離値とする。また照合指示
手段34により除去されている候補2については統合候
補記憶手段37より候補2に対する代表候補の候補番号
1を獲得し、距離値記憶手段33から得られる候補1の
累積距離値43bと、統合候補記憶手段37に記憶され
た代表候補1に対する候補2の累積距離値の差d1を加
算してg(1,T,J(1))+d1のようにして候補2の最
終的な距離値を定める。
When the time T at which the voice input ends is reached,
For the candidate 1 not removed by the collation instruction means 34 in the result output means 38, the cumulative distance value 43 (b) from the distance value storage means 33 is referred to, and the cumulative distance value g (1, T, J
Let (1)) be the final distance value of candidate 1. For the candidate 2 removed by the collation instruction means 34, the candidate number 1 of the representative candidate for the candidate 2 is obtained from the integrated candidate storage means 37, and the cumulative distance value 43b of the candidate 1 obtained from the distance value storage means 33; The difference d1 of the cumulative distance value of the candidate 2 with respect to the representative candidate 1 stored in the integrated candidate storage means 37 is added to obtain the final distance value of the candidate 2 as g (1, T, J (1)) + d1. Is determined.

【0039】例えば、統合候補記憶手段37が図8のよ
うな内容となっていた場合、 候補3の距離値はg(1,T,J(1))+d2 候補4の距離値はg(1,T,J(1))+d1+d3 候補5の距離値はg(1,T,J(1))+d1+d4 候補6の距離値はg(1,T,J(1))+d2+d5 候補7の距離値はg(1,T,J(1))+d2+d6 と求められる。
For example, when the integrated candidate storage means 37 has the contents as shown in FIG. 8, the distance value of the candidate 3 is g (1, T, J (1)) + d2 and the distance value of the candidate 4 is g (1 , T, J (1)) + d1 + d3 Distance value of candidate 5 is g (1, T, J (1)) + d1 + d4 Distance value of candidate 6 is g (1, T, J (1)) + d2 + d5 Distance value of candidate 7 Is obtained as g (1, T, J (1)) + d2 + d6.

【0040】入力された音声信号は、このようにして求
められた最終的な距離値が小さい候補ほど確からしいと
判断できる。
In the input audio signal, it can be determined that a candidate having a smaller final distance value thus obtained is more likely.

【0041】なお、上述した統合候補検出処理の説明で
は、時刻tが進む毎に毎回候補1のと候補2の累積距離
値g(n,t,j)の差e(t,j)を求める演算を行なって
いたが、この差e(t,j)を記憶しておき、次の時刻に
利用するようにしてもよい。
In the above description of the integrated candidate detecting process, the difference e (t, j) between the cumulative distance values g (n, t, j) of the candidate 1 and the candidate 2 is calculated every time t advances. Although the calculation has been performed, the difference e (t, j) may be stored and used at the next time.

【0042】また、統合候補の判定を、差e(t,j)が
所定の時間幅Twの間全く同じ値であった場合を述べた
が、所定の値以内の範囲であれば統合候補であるとみな
すようにしてもよい。以上のようにして後半部分が同じ
候補同士を統合候補とすることにより、同じ演算結果と
なる後半部分の重複演算が削減される。
In addition, the case where the difference e (t, j) is the same value during the predetermined time width Tw has been described as the judgment of the integration candidate. It may be assumed that there is. As above, the latter half is the same
By setting the candidates as integrated candidates, duplicate operations in the latter half of the same operation result are reduced.

【0043】なお、上記の統合候補の検出は音響分析手
段31から特徴パラメータが出力されるたびに毎フレー
ム行うのが望ましいが、統合候補検出手段36における
統合検出処理を、音響分析手段31から出力される特徴
パラメータの数フレームに一回に間引いて行なってもよ
く、この場合でも同様に効果を奏する。
It is preferable that the detection of the integration candidate be performed every frame every time the characteristic parameter is output from the acoustic analysis means 31, but the integrated detection processing in the integration candidate detection means 36 is output from the acoustic analysis means 31. It may be thinned out once for several frames of the feature parameter to be performed. In this case, the same effect can be obtained.

【0044】また、この発明によるパターン照合装置は
ビームサーチ法と併用でき、その場合はさらに演算量減
少の効果が増大できる。ここで、上述してように、この
発明によるパターン照合装置においては統合候補として
検出された候補のうち、どちらを代表候補としても同様
に効果を奏する。しかし、ビームサーチと併用する場合
には打ち切りに合わないように距離値の小さな方を代表
候補として残しながらパターン照合を行うことでさらに
良好なパターン照合装置が得られる。
The pattern matching apparatus according to the present invention can be used in combination with the beam search method, in which case the effect of reducing the amount of calculation can be further increased. Here, as described above, in the pattern matching device according to the present invention, the same effect can be obtained even if any of the candidates detected as integrated candidates is set as the representative candidate. However, when used together with the beam search, a better pattern matching device can be obtained by performing pattern matching while leaving the smaller distance value as a representative candidate so as not to be censored.

【0045】また上記の説明では距離値記憶手段33で
時間Tの幅の分の全ての累積距離値g(n,t,j)を記憶
しておく場合で説明を行ったが、実際には入力される特
徴パラメータ1フレーム分に対応する累積距離値を記憶
する容量だけを用意し、これを繰り返し用いてパターン
照合を行うことが可能であり、少ない容量でも同様に効
果を奏する。また同様に統合候補検出のための累積距離
値の差を求めるテーブルe(t,j)も実際には幅Tw分だ
け用意して繰り返し用いれば良く、メモリ量を小さく抑
えることができる。
In the above description, the case where all the accumulated distance values g (n, t, j) for the width of the time T are stored in the distance value storage means 33 has been described. Only a capacity for storing the accumulated distance value corresponding to one frame of the input feature parameter can be prepared, and pattern matching can be performed by repeatedly using the capacity, and the same effect can be obtained even with a small capacity. Similarly, a table e (t, j) for calculating the difference between the accumulated distance values for detecting the integration candidate may be prepared for the width Tw and used repeatedly, and the memory amount can be reduced.

【0046】実施例2.請求項2の発明の一実施例につ
いて説明する。この発明によるパターン照合装置の構成
図は図1と同じであり、統合候補検出手段36を除く、
他の構成要素は実施例1と同様の働きであるためここで
は説明を省略する。
Embodiment 2 FIG. An embodiment of the invention according to claim 2 will be described. The configuration diagram of the pattern matching device according to the present invention is the same as that of FIG.
The other components have the same functions as those of the first embodiment, and a description thereof will not be repeated.

【0047】実施例1では統合候補検出手段36の処理
量が大きいが、この実施例2ではより簡便な方法を用い
て統合候補検出を行う手段を示す。ここでは統合候補の
検出を以下のようにして行う。実施例1と同様に図6に
示すように、候補1のフレームjs(1)以降の後半部分
と候補2のフレームjs(2)以降の後半部分が同一の標
準パターンの並びにより表現されるとする。
In the first embodiment, the processing amount of the integration candidate detecting means 36 is large, but in the second embodiment, means for detecting the integration candidate using a simpler method is shown. Here, detection of an integration candidate is performed as follows. As in the first embodiment, as shown in FIG. 6, when the second half of the candidate 1 after the frame js (1) and the second half of the candidate 2 after the frame js (2) are expressed by the same standard pattern sequence. I do.

【0048】まず各候補nについて後半部分js(n)か
らJ(n)において時間tにおける累積距離値g(n,t,
j)の最小値である最小累積距離値gmin(n,t)を求め
る。
First, for each candidate n, the cumulative distance value g (n, t, t) at the time t in the latter half part js (n) to J (n) is obtained.
The minimum cumulative distance value gmin (n, t) which is the minimum value of j) is obtained.

【0049】gmin(n,t)=min(g(n,t,j))、j
はjs(n)からJ(n)まで
Gmin (n, t) = min (g (n, t, j)), j
Is from js (n) to J (n)

【0050】後半部分が同一の標準パターンの並びによ
り構成される候補の間において、この最小累積距離値g
min(n,t)の差eが時間幅Tw隔てたところで等しい場
合、これらの候補は統合候補であると判断する。すなわ
ち候補1と候補2に対しては以下の条件となる場合であ
る。
The minimum cumulative distance value g between candidates in which the latter half is composed of the same standard pattern
If the difference e of min (n, t) is equal at intervals of the time width Tw, it is determined that these candidates are integration candidates. That is, the following conditions are satisfied for candidate 1 and candidate 2.

【0051】gmin(1,t)−gmin(2,t)=gmin(1,
t−Tw)−gmin(2,t−Tw)
Gmin (1, t) -gmin (2, t) = gmin (1, t)
t-Tw) -gmin (2, t-Tw)

【0052】このときは上記の最小累積距離値の差eを
候補1と候補2の累積距離値の差と定める。この手法に
よっても実施例1と同様に効果を奏し、統合候補検出手
段36の処理量も削減できる。
At this time, the difference e between the minimum cumulative distance values is determined as the difference between the cumulative distance values of candidate 1 and candidate 2. According to this method, the same effect as in the first embodiment can be obtained, and the processing amount of the integration candidate detecting unit 36 can be reduced.

【0053】なお、この統合候補の検出は音響分析手段
から特徴パラメータが出力されるたびに毎フレーム行う
のが望ましいが、統合検出検出処理を数フレームに一回
に間引いてもよく、同様に効果を奏する。さらにビーム
サーチ法と併用でき、さらに演算量減少の効果が増大で
きる。また、統合候補として検出された候補のうち、ど
ちらを代表候補としても同様に効果を奏する。しかし、
ビームサーチと併用する場合には打ち切りに合わないよ
うに距離値の小さな方を代表候補として残しながらパタ
ーン照合を行うことでさらに良好なパターン照合装置が
得られる。
It is desirable that the integration candidate is detected every frame every time the characteristic parameter is output from the acoustic analysis means. However, the integration detection processing may be thinned out once every several frames. To play. Further, it can be used together with the beam search method, and the effect of reducing the amount of calculation can be further increased. Further, the same effect can be obtained by selecting any of the candidates detected as the integration candidates as the representative candidate. But,
When used together with the beam search, a better pattern matching device can be obtained by performing pattern matching while leaving smaller distance values as representative candidates so as not to be censored.

【0054】距離値記憶手段33の容量を1フレーム分
のだけ用意してパターン照合を行うことも実施例1同様
可能であり、同様の効果を奏する。また統合候補検出の
ための累積距離値の差を求めるテーブルgmin(n,t)も
実際には幅Tw分だけ用意して繰り返し用いれば良く、
必要なメモリ量を小さく抑えることができる。
As in the first embodiment, it is possible to prepare the capacity of the distance value storage means 33 for one frame and perform pattern matching, and the same effect is obtained. In addition, a table gmin (n, t) for calculating the difference between the accumulated distance values for detecting the integration candidate may be actually prepared for the width Tw and used repeatedly.
The required memory amount can be reduced.

【0055】実施例3.請求項3の発明の一実施例につ
いて説明する。この発明によるパターン照合装置の構成
図は図1と同じであり、結果出力手段38を除く他の構
成要素は実施例1と同様の働きであるためここでは説明
を省略する。
Embodiment 3 FIG. A third embodiment of the present invention will be described. The configuration diagram of the pattern matching device according to the present invention is the same as that of FIG. 1, and the other components except for the result output means 38 have the same functions as those of the first embodiment, so that the description is omitted here.

【0056】ここではbest-first-search法を用いて統
合候補記憶手段37の内容から最終的な距離値の小さな
N個の候補を獲得する方法について述べる。音声入力終
了後、統合候補記憶手段37において図8のような結果
が得られたものとし、累積距離値の差d1からd6までは
図9に示すような大きさであったものとする。
Here, a method for acquiring N candidates with a small final distance value from the contents of the integrated candidate storage means 37 using the best-first-search method will be described. After the voice input is completed, it is assumed that the result as shown in FIG. 8 is obtained in the integration candidate storage means 37, and that the differences d1 to d6 of the accumulated distance values are as shown in FIG.

【0057】まずスタック領域を用意する。以下スタッ
クの動作について図10を用いて説明する。まず照合指
示手段34において除去されていない候補をスタックに
いれて距離値によりソーティングする(繰り返し回数
0)。次にスタックより距離値が最も小さな候補を取り
出す。この場合候補が一つしかないため候補1が取り出
される。次に候補1を代表候補とする候補である候補2
と候補3について実施例1に示したように累積距離値の
差d1、d2より距離値を求め、小さい順にスタックに入
れその距離値によりソーティングする(繰り返し回数
1)。
First, a stack area is prepared. Hereinafter, the operation of the stack will be described with reference to FIG. First, candidates not removed by the collation instruction means 34 are put on a stack and sorted by distance value (number of repetitions: 0). Next, the candidate having the smallest distance value is extracted from the stack. In this case, since there is only one candidate, candidate 1 is extracted. Next, candidate 2 which is a candidate with candidate 1 as a representative candidate
As shown in the first embodiment, the distance values are obtained from the differences d1 and d2 of the cumulative distance values, and the candidates are put into the stack in ascending order and sorted by the distance values (the number of repetitions 1).

【0058】次にスタック内で最も距離値の小さな候補
2をスタックより取り出す。同様に候補2を代表候補と
する候補について同様の処理を繰り返す。このような処
理をN回繰り返すことにより距離値の小さなN個の候補
を求めることができる。
Next, the candidate 2 having the smallest distance value in the stack is taken out of the stack. Similarly, the same process is repeated for a candidate whose candidate is candidate 2. By repeating such processing N times, N candidates with small distance values can be obtained.

【0059】照合指示手段34において除去されていな
い候補が複数存在する場合でも同様に効果を奏する。
The same effect can be obtained even when there are a plurality of candidates which have not been removed by the collation instruction means 34.

【0060】[0060]

【発明の効果】以上のようにこの発明によれば、統合候
補検出手段により、後半部分において累積距離値が同じ
候補が統合候補として検出され、ひとつの候補のみ代表
候補として残され、他の候補については相対的な距離差
のみが統合候補記憶手段に記憶されるとともに、パター
ン照合を中止した候補の距離値は最終的に代表候補の累
積距離値に統合候補記憶手段の累積距離値の差を加算し
て求められるので、同じパターン照合を中止することが
でき、同じ標準パターンに対する重複したパターン演算
の演算量削減が可能となり、効率的な装置が得られると
いう効果がある。
As described above, according to the present invention, candidates having the same cumulative distance value in the latter half are detected as integrated candidates by the integrated candidate detecting means, and only one candidate is left as a representative candidate , while other candidates are left as representative candidates. Is stored only in the integrated candidate storage means, and the distance value of the candidate for which pattern matching has been stopped is finally calculated as the cumulative distance value of the representative candidate by the cumulative distance value of the integrated candidate storage means. Since it is obtained by addition, the same pattern collation can be stopped, the amount of operation of the duplicate pattern operation for the same standard pattern can be reduced, and an effective device can be obtained.

【0061】また前記統合候補検出手段により、後半部
分が同一の標準パターンの並びにより構成される候補の
間において、後半部分の累積距離値の最小値の差がある
時間幅を隔てて再び同じ場合にこれらの候補を統合候補
とされることにより、統合候補検出処理が簡素化され
る。
In addition, the integrated candidate detecting means may use the same standard pattern in the latter half part for the same pattern again if the difference in the minimum value of the accumulated distance value in the latter half part is the same again after a certain time interval. By making these candidates as integrated candidates, the integrated candidate detection process is simplified.

【0062】さらに、前記結果出力手段においてbest-f
irst-searchを行うことにより上位のN個の距離値の小
さな上位のN個の候補が容易に出力される。
Further, best-f
By performing the irst-search, the top N candidates having small top N distance values are easily output.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の一実施例によるパターン照合装置を
示す構成図である。
FIG. 1 is a configuration diagram showing a pattern matching device according to an embodiment of the present invention.

【図2】この発明の一実施例によるパターン照合装置の
動作を示す流れ図である。
FIG. 2 is a flowchart showing the operation of the pattern matching device according to one embodiment of the present invention.

【図3】この発明の一実施例及び従来のパターン照合装
置の距離値記憶手段の記憶内容を示す説明図である。
FIG. 3 is an explanatory diagram showing storage contents of a distance value storage means of an embodiment of the present invention and a conventional pattern matching device.

【図4】単語の連結により文章を表現した一例を示す説
明図である。
FIG. 4 is an explanatory diagram showing an example of expressing a sentence by connecting words;

【図5】文章候補の一例を示す説明図である。FIG. 5 is an explanatory diagram showing an example of a sentence candidate.

【図6】最適パスを示す説明図である。FIG. 6 is an explanatory diagram showing an optimal path.

【図7】この発明の一実施例によるパターン照合装置の
統合候補検出手段の動作を示す流れ図である。
FIG. 7 is a flowchart showing the operation of the integrated candidate detecting means of the pattern matching device according to one embodiment of the present invention.

【図8】この発明の一実施例によるパターン照合装置の
統合候補記憶手段の記憶内容を示す説明図である。
FIG. 8 is an explanatory diagram showing storage contents of an integrated candidate storage means of the pattern matching device according to one embodiment of the present invention.

【図9】各候補に対応して統合候補記憶手段に記憶され
た累積距離値の差を示す説明図である。
FIG. 9 is an explanatory diagram showing a difference between accumulated distance values stored in an integrated candidate storage unit corresponding to each candidate;

【図10】この発明の実施例3におけるパターン照合装
置の結果出力手段の動作を説明する説明図である。
FIG. 10 is an explanatory diagram illustrating an operation of a result output unit of the pattern matching device according to the third embodiment of the present invention.

【図11】従来のパターン照合装置を示す構成図であ
る。
FIG. 11 is a configuration diagram showing a conventional pattern matching device.

【図12】従来のパターン照合装置の動作を示す流れ図
である。
FIG. 12 is a flowchart showing the operation of a conventional pattern matching device.

【符号の説明】[Explanation of symbols]

31 音響分析手段 32 標準パターン記憶手段 33 距離値記憶手段 34 照合指示手段 35 パターン照合手段 36 統合候補検出手段 37 統合候補記憶手段 38 結果出力手段 39 音声信号 40 特徴パラメータ 41 標準パターン 42 照合指示 43a、43b、43c 累積距離値 44 除去指示 45a、45b 統合候補の情報 46 照合結果 Reference Signs List 31 acoustic analysis means 32 standard pattern storage means 33 distance value storage means 34 collation instruction means 35 pattern collation means 36 integrated candidate detection means 37 integrated candidate storage means 38 result output means 39 voice signal 40 feature parameter 41 standard pattern 42 collation instruction 43a 43b, 43c Cumulative distance value 44 Removal instruction 45a, 45b Integration candidate information 46 Matching result

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 15/08 G10L 15/10 G10L 15/12 G10L 15/14 JICSTファイル(JOIS)──────────────────────────────────────────────────の Continued on the front page (58) Fields surveyed (Int. Cl. 7 , DB name) G10L 15/08 G10L 15/10 G10L 15/12 G10L 15/14 JICST file (JOIS)

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 予め記憶されている標準パターンを連結
してなる認識対象の候補と、外部から入力される音声信
号のパターン照合を行うパターン照合装置において、音
声信号を一定時間毎に音響分析し特徴パラメータに変換
する音響分析手段と、標準パターンを記憶する標準パタ
ーン記憶手段と、パターン照合を行う照合対象の候補を
記憶する照合指示手段と、前記音響分析手段より特徴パ
ラメータが入力されるたびに、前記照合指示手段におい
て指定されている候補に対応する標準パターンを前記標
準パターン記憶手段から参照してパターン照合を行い累
積距離値を算出するパターン照合手段と、このパターン
照合手段で算出された累積距離値に基づき前記各候補の
累積距離値を記憶する距離値記憶手段と、後半部分が同
一の標準パターンの並びにより構成される候補の間にお
いて、この後半部分においてそれぞれ対応する部分の累
積距離値が所定時間幅の間所定値以内の差を保つ場合、
これらを統合候補として検出し、これら統合候補のうち
の一つを残し、残りの統合候補を前記照合指示手段にお
ける照合対象から除去する統合候補検出手段と、この
合候補検出手段で検出された統合候補の組み合わせとそ
の累積距離値の差とを記憶する統合候補記憶手段と、前
記照合指示手段で除去された候補の距離値を、除去され
ていない候補の累積距離値と、前記統合候補記憶手段の
累積距離値の差とから求め、この各候補の距離値に基づ
いて照合結果を決定し出力する結果出力手段とを備えた
ことを特徴とするパターン照合装置。
1. A pattern matching apparatus for performing pattern matching of a recognition target candidate obtained by connecting a pre-stored standard pattern with an externally input audio signal, wherein the audio signal is subjected to acoustic analysis at regular intervals. Acoustic analysis means for converting to a feature parameter, standard pattern storage means for storing a standard pattern, matching instruction means for storing candidates to be matched for pattern matching, and each time a feature parameter is input from the sound analysis means A pattern matching unit that calculates a cumulative distance value by performing pattern matching by referring to a standard pattern corresponding to a candidate designated by the matching instruction unit from the standard pattern storage unit; Distance value storage means for storing the cumulative distance value of each candidate based on the distance value; If the cumulative distance value of the corresponding part in the latter half part keeps a difference within a predetermined value for a predetermined time width,
Detect these as an integrated candidate, leaving one of these integration candidates, and integrated candidate detecting means for removing the remaining integrated candidate from the verification target in the comparison instruction means, the integration <br/> case candidate detecting means The integrated candidate storage means for storing the combination of the integrated candidates detected in and the difference of the cumulative distance value thereof, and the distance value of the candidate removed by the collation instruction means, the cumulative distance value of the unremoved candidate, And a result output means for determining and outputting a matching result based on the distance value of each candidate obtained from the difference between the accumulated distance values of the integrated candidate storage means.
【請求項2】前記統合候補検出手段において、後半部分
が同一の標準パターンの並びにより構成される候補の間
において、後半部分の累積距離値の最小値の差がある時
間幅を隔てて再び同じ場合に、これらの候補を統合候補
とすることを特徴とする請求項1記載のパターン照合装
置。
2. The integrated candidate detecting means according to claim 1, wherein said second half portion has a difference in the minimum value of the accumulated distance value in the second half portion again with a certain time width between candidates having the same standard pattern. 2. The pattern matching apparatus according to claim 1, wherein in such a case, these candidates are regarded as integration candidates.
【請求項3】前記結果出力手段においてbest-first-sea
rchを行うことにより距離値の小さな上位のN個の候補
を出力することを特徴とする請求項1または請求項2記
載のパターン照合装置。
3. The best-first-sea method in the result output means.
The pattern matching apparatus according to claim 1 or 2, wherein the N top candidates having a small distance value are output by performing rch.
JP05077026A 1993-04-02 1993-04-02 Pattern matching device Expired - Fee Related JP3092384B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05077026A JP3092384B2 (en) 1993-04-02 1993-04-02 Pattern matching device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05077026A JP3092384B2 (en) 1993-04-02 1993-04-02 Pattern matching device

Publications (2)

Publication Number Publication Date
JPH06289892A JPH06289892A (en) 1994-10-18
JP3092384B2 true JP3092384B2 (en) 2000-09-25

Family

ID=13622243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05077026A Expired - Fee Related JP3092384B2 (en) 1993-04-02 1993-04-02 Pattern matching device

Country Status (1)

Country Link
JP (1) JP3092384B2 (en)

Also Published As

Publication number Publication date
JPH06289892A (en) 1994-10-18

Similar Documents

Publication Publication Date Title
JP2739945B2 (en) Voice recognition method
EP0043006B1 (en) Pattern recognition apparatus using prototype probability matching
EP0109190B1 (en) Monosyllable recognition apparatus
KR19980702723A (en) Speech recognition method and device
US6038535A (en) Speech classifier and method using delay elements
US5987409A (en) Method of and apparatus for deriving a plurality of sequences of words from a speech signal
US6507815B1 (en) Speech recognition apparatus and method
US5787393A (en) Speech recognition apparatus using neural network, and learning method therefor
US6151592A (en) Recognition apparatus using neural network, and learning method therefor
JP3092384B2 (en) Pattern matching device
JPH0247760B2 (en)
JP3428058B2 (en) Voice recognition device
US5812739A (en) Speech recognition system and speech recognition method with reduced response time for recognition
JP2001312293A (en) Method and device for voice recognition, and computer- readable storage medium
EP0420825A2 (en) A method and equipment for recognising isolated words, particularly for very large vocabularies
JPH0713598A (en) Specific task speech data base generating device
JPH0777998A (en) Successive word speech recognition device
CN1061451C (en) Concealed Markov-mould Chines word sound idenfitying method and apparatus thereof
JP2792720B2 (en) Voice recognition device
JP3503862B2 (en) Speech recognition method and recording medium storing speech recognition program
JP2577891B2 (en) Word voice preliminary selection device
JP3818154B2 (en) Speech recognition method
JPH0554678B2 (en)
JP3011984B2 (en) Pattern matching method
JPH0247758B2 (en)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees