JP3094473B2 - Dynamic programming collator - Google Patents
Dynamic programming collatorInfo
- Publication number
- JP3094473B2 JP3094473B2 JP03027215A JP2721591A JP3094473B2 JP 3094473 B2 JP3094473 B2 JP 3094473B2 JP 03027215 A JP03027215 A JP 03027215A JP 2721591 A JP2721591 A JP 2721591A JP 3094473 B2 JP3094473 B2 JP 3094473B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- standard
- input
- matching
- standard time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】[0001]
【産業上の利用分野】本発明は、標準パターンと入力パ
ターンの対応づけを行う動的計画法(Dynamic Progr
amming, 以下DPという)を用いたDP照合装置に関す
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dynamic programming method for associating a standard pattern with an input pattern.
amming (hereinafter referred to as DP).
【0002】[0002]
【従来の技術】音声認識は連続して生成された音声信号
を観測して、音素や音節の離散的な言語記号に変換する
ことを目的にしている。文字や画像パターンと比べると
音声パターンは時間軸に沿った1次元的なものであるこ
とが特徴となっている。しかも同一人が1つの単語を発
声してもどれ1つとして全く同じ長さのものでなく時間
的な長さが変化している。2. Description of the Related Art Speech recognition aims at observing continuously generated speech signals and converting them into discrete language symbols of phonemes and syllables. The sound pattern is characterized by being one-dimensional along the time axis as compared with the character or image pattern. Moreover, even if the same person utters one word, none of the words has the same length but changes in time length.
【0003】単語音声認識方法としては、単語標準パタ
ーンと入力音声パターンのマッチングにより単語を認識
する方法がよく用いられている。標準パターンとして、
入力を処理して得られるスペクトルの時系列の形であら
かじめ用意しておく。入力された発声データとの類似度
を計算して、最も類似度が大きいものを発声された単語
とする。As a word speech recognition method, a method of recognizing a word by matching a word standard pattern with an input speech pattern is often used. As a standard pattern,
It is prepared in advance in the form of a time series of a spectrum obtained by processing the input. The similarity with the input utterance data is calculated, and the one with the highest similarity is set as the uttered word.
【0004】ところで、同じ単語であっても発声の度に
時間長が異なる場合が多い。子音の時間長は比較的安定
しているが、母音の時間長はその変化が大きい。従って
時間軸上での非線形なパターンマッチングが必要とな
る。時間軸を正規化するマッチングは、標準パターンを
特徴量パラメータの時系列として用意しておき、入力パ
ターンとの非線形な対応付けを調べることにより、発声
による時間軸上の音韻の変動を吸収するものである。こ
の場合、標準パターンと入力パターンの時間軸上の対応
付けは逐一調べる。その方法として動的計画法(DP)
が用いられる。このDPについては多くの書物(例え
ば、パターン認識、森健一監修、社団法人電子情報通信
学会、コロナ社1988年11月1日初版発行)で解説されて
いるので内容の説明は省略する。[0004] By the way, even if the same word is used, the time length often differs each time it is uttered. Although the time length of consonants is relatively stable, the time length of vowels varies greatly. Therefore, nonlinear pattern matching on the time axis is required. In the matching that normalizes the time axis, a standard pattern is prepared as a time series of feature amount parameters, and the non-linear correspondence with the input pattern is examined to absorb the fluctuation of phonemes on the time axis due to utterance It is. In this case, the correspondence between the standard pattern and the input pattern on the time axis is examined one by one. Dynamic Programming (DP)
Is used. This DP has been described in many books (for example, pattern recognition, supervised by Kenichi Mori, The Institute of Electronics, Information and Communication Engineers, Corona Co., Ltd., first edition issued on November 1, 1988), and the description thereof is omitted.
【0005】このようなDP照合の具体例を図面を用い
て説明する。図11は従来用いられているDP照合装置の
構成を示すブロック図であり、図12は図11に示すDP照
合部15の詳細図である。図13はこのDP照合装置の動作
を示すフロー図である。図13の動作を中心に説明を行
う。まず入力時系列パターンの読み込みを行う( ステッ
プ20) 。これにより入力時系列パターン読込部10で読み
込んだ入力時系列パターンを入力パターンメモリ11に記
憶する。次に1つの標準時系列パターンの読み込みを行
う(ステップ21) 。標準時系列パターン記憶部12には多
くの標準時系列パターンが格納されており、このうちの
1つを標準時系列パターン読込部13により読み出し、標
準パターンメモリ14に記憶する。次にDP照合を行う
(ステップ22) 。A specific example of such a DP comparison will be described with reference to the drawings. FIG. 11 is a block diagram showing a configuration of a conventionally used DP matching apparatus, and FIG. 12 is a detailed view of the DP matching unit 15 shown in FIG. FIG. 13 is a flowchart showing the operation of the DP matching device. Description will be made focusing on the operation of FIG. First, an input time-series pattern is read (step 20). Thus, the input time-series pattern read by the input time-series pattern reading unit 10 is stored in the input pattern memory 11. Next, one standard time series pattern is read (step 21). Many standard time series patterns are stored in the standard time series pattern storage unit 12, and one of them is read out by the standard time series pattern reading unit 13 and stored in the standard pattern memory 14. Next, DP collation is performed (step 22).
【0006】DP照合を説明するため、図14に示すDP
パス算出を例にとり説明する。図14において局所距離d
(i,j)とは、入力時系列パターンのi番目の特徴量
と標準時系列パターンのj番目の特徴量との距離であ
る。距離としてはこれらの特徴量間のユーグリッド距離
や市街地距離などが用いられる。累積距離G(i,j)
とは、基点からスタートし、図(a)に示す格子点
(i,j)に至る種々のルートのうち格子点局所距離d
(i,j)の和が最小となる経路を示す。図(b)の3
つの初期条件は累積距離G(i,j)の計算が基点(0
,0 )よりスタートする条件を表し、G(i,j)の
算出式は、G(i,j)が、格子点(i,j)の局所距
離d(i,j)と、図(a)に矢印で示すようにG(i
−1,j)とG(i−1,j−1)のうちの小さい値と
の和より得られることを示している。[0006] To explain the DP collation, the DP shown in FIG.
A description will be given of a path calculation as an example. In FIG. 14, the local distance d
(I, j) is the distance between the i-th feature of the input time-series pattern and the j-th feature of the standard time-series pattern. As the distance, a Eugrid distance or a city distance between these feature values is used. Cumulative distance G (i, j)
Means the local distance d of the grid point among various routes starting from the base point and reaching the grid point (i, j) shown in FIG.
Shows the path where the sum of (i, j) is the minimum. (B) 3
The two initial conditions are based on the calculation of the cumulative distance G (i, j) as the base point (0
, 0), and the formula for calculating G (i, j) is as follows: G (i, j) is the local distance d (i, j) of grid point (i, j) and FIG. ), G (i)
-1, j) and the smaller value of G (i-1, j-1).
【0007】このような累積距離G(i,j)を初期条
件として与えられる基点をスタートとして結んだものが
DPパスであり、図15に1つの入力時系列パターンに対
して標準時系列パターン1〜nとの照合を行った結果を
示す。照合作業は図(a)に示すように入力時系列パタ
ーンの1つの特徴量iに対して標準時系列パターンの各
特徴量(0〜n)と局所距離d(i,0),d(i,
1)……d(i,n)を求め、次に累積距離G(i,
0),G(i,1)……G(i,n)を求める。これら
を用いて基点(0,0)よりのDPパスを求める。図
(a)の処理単位とはこの照合作業単位を表している。[0007] A DP path is formed by connecting the base point given as the initial condition the cumulative distance G (i, j) as a start, and FIG. 15 shows a standard time series pattern 1 to an input time series pattern. The result of collation with n is shown. As shown in FIG. 7A, the matching operation is performed for each feature amount (0 to n) of the standard time-series pattern and the local distances d (i, 0), d (i,
1)... D (i, n) is obtained, and then the cumulative distance G (i, n) is obtained.
0), G (i, 1)... G (i, n) are obtained. Using these, a DP path from the base point (0,0) is obtained. The processing unit in FIG. 7A indicates this collation work unit.
【0008】図12はDP照合部15の詳細図であり、入力
パターンメモリ11から読み出した入力パターン特徴量i
と標準パターンメモリ14から読み出した標準パターン特
徴量jとの局所距離d(i,j)が局所距離計算部151
で計算される。累積距離メモリ154 はベクトルレジスタ
で構成され、これまでに算出されたG(i−1,0)〜
G(i−1,n)までの累積距離が格納されている。最
小累積距離算出部153でG(i−1,j−1)とG
(i−1,j)とのうち小さい方の値を取り出し、この
値と局所距離d(i,j)を加算器152 で加算してG
(i,j)を求める。このG(i,j)は累積距離メモ
リ154 に格納される。制御部155 はこれらの動作を制御
する。FIG. 12 is a detailed diagram of the DP collating unit 15, and the input pattern feature amount i read from the input pattern memory 11 is shown.
The local distance d (i, j) between the standard pattern feature amount j read from the standard pattern memory 14 and the local distance calculation unit 151
Is calculated. The cumulative distance memory 154 is composed of a vector register, and G (i−1,0) to G (i−1,0) calculated so far.
The cumulative distance to G (i-1, n) is stored. The minimum cumulative distance calculation unit 153 calculates G (i−1, j−1) and G
The smaller value of (i−1, j) is taken out, and this value and the local distance d (i, j) are added by the adder 152 to obtain G
(I, j) is obtained. This G (i, j) is stored in the cumulative distance memory 154. The control unit 155 controls these operations.
【0009】図16は図12のDP照合部15の動作を示すタ
イミングチャートである。DP照合部はベクトルプロセ
ッサよりなり、ベクトルレジスタ154 上の処理対象を一
括してパイプライン処理をしている。図16に示す処理単
位とは図15(a)に示す処理単位で入力時系列パターン
の特徴量iに対する1つの標準時系列パターンの特徴量
(0〜j〜n)に対する処理作業を表す。オーバヘッド
とは、処理単位1における入力時系列パターンの特徴量
iのG(i−1,j−1)の読み出しが全て終わり、処
理単位2における特徴量i+1の最初のG(i,j−
1)の読み出しが開始されるまでの期間である。このよ
うにして全て標準時系列パターンについての照合を行う
(ステップ23) 。FIG. 16 is a timing chart showing the operation of the DP matching unit 15 of FIG. The DP collating unit is composed of a vector processor, and performs a pipeline process on the objects to be processed on the vector register 154 collectively. The processing unit shown in FIG. 16 is a processing unit shown in FIG. 15 (a) and represents a processing operation on the characteristic amount (0 to j to n) of one standard time-series pattern with respect to the characteristic amount i of the input time-series pattern. The overhead means that the reading of all G (i-1, j-1) of the feature amount i of the input time-series pattern in the processing unit 1 is completed, and the first G (i, j-) of the feature amount i + 1 in the processing unit 2 is completed.
This is a period until the reading of 1) is started. In this way, all the standard time-series patterns are collated (step 23).
【0010】[0010]
【発明が解決しようとする課題】上述のように照合処理
はベクトルプロセッサによりベクトルレジスタ154 上の
処理対象を一括してパイプライン処理行うが、処理単位
として1つの標準時系列パターン毎に処理を行ってい
る。通常のベクトルレジスタ154 の場合、数百程度の標
準時系列パターンを格納する容量があるが、このように
1つの標準時系列パターン単位で処理を行うと、ベクト
ルレジスタの機能を十分使用していないことになり処理
効率が悪い。また処理単位ごとにベクトルレジスタ154
にロードするため、ロード回数が多くなる。さらに図16
に示すように処理単位毎にオーバヘッド時間が増える。
このためベクトルプロセッサを用いてもその利点を生か
しきれないことが多い。As described above, in the collation processing, the objects to be processed in the vector register 154 are collectively pipelined by the vector processor, but the processing is performed for each standard time series pattern as a processing unit. I have. In the case of the normal vector register 154, there is a capacity to store about several hundred standard time-series patterns. However, if processing is performed in units of one standard time-series pattern, the function of the vector register is not sufficiently used. Processing efficiency is poor. Vector registers 154 for each processing unit
, The number of times of loading increases. Further FIG.
As shown in (1), the overhead time increases for each processing unit.
For this reason, even if a vector processor is used, the advantage cannot often be fully exploited.
【0011】本発明は、上述の問題点に鑑みてなされた
もので、DP照合処理に一括処理を行えるベクトルプロ
セッサを用い、複数の標準時系列パターンをベクトルレ
ジスタ上に読み込み一括ベクトル照合処理を行うことに
より処理効率の向上を図った動的計画法照合装置を提供
することを目的とする。SUMMARY OF THE INVENTION The present invention has been made in view of the above-mentioned problems, and uses a vector processor capable of performing batch processing for DP matching processing, and reads a plurality of standard time-series patterns into a vector register and performs batch vector matching processing. It is an object of the present invention to provide a dynamic programming collation apparatus which improves the processing efficiency.
【0012】[0012]
【課題を解決するための手段】図1は、本発明の原理図
である。同図において1は入力パターン読取部で、入力
時系列パターンの中から処理を行う入力パターンの特徴
量を読み取る。2は複数標準パターン読取部で処理を行
う入力パターンの特徴量に対して照合を行う複数の標準
時系列パターンを読み取る。3は照合部で入力パターン
の特徴量に対する複数の標準時系列パターンの照合を行
う。FIG. 1 is a diagram illustrating the principle of the present invention. In FIG. 1, reference numeral 1 denotes an input pattern reading unit which reads a feature amount of an input pattern to be processed from an input time-series pattern. Reference numeral 2 reads a plurality of standard time-series patterns for performing matching with respect to a feature amount of an input pattern to be processed by a plurality of standard pattern reading units. Reference numeral 3 denotes a collation unit that collates a plurality of standard time-series patterns with respect to the feature amount of the input pattern.
【0013】また、標準時系列パターンをネットワーク
構造とする。また、このネットワーク構造の共通のネッ
トワーク部分に対する入力時系列の特徴量との照合を順
次連続して行うようにする。The standard time-series pattern has a network structure. In addition, the matching with the input time-series feature amount for the common network portion of the network structure is performed sequentially and continuously.
【0014】また、複数標準パターン読込部2に複数の
記憶部を設けて照合部3の照合結果を記憶し、照合部3
がこの複数の記憶部の内容を同時に読み出しできるよう
にする。A plurality of storage units are provided in the plurality of standard pattern reading units 2 to store the comparison result of the comparison unit 3, and the comparison unit 3
Can simultaneously read the contents of the plurality of storage units.
【0015】[0015]
【作用】入力パターンの特徴量に対して複数標準パター
ンの特徴量を照合部3で順次連続して照合処理を行うこ
とにより、標準時系列パターンの読み込み回数、および
オーバヘッドが減少し、照合処理効率が向上する。The matching unit 3 sequentially performs the matching process on the feature amounts of a plurality of standard patterns with respect to the feature amount of the input pattern, thereby reducing the number of times of reading the standard time-series pattern and the overhead, and improving the matching process efficiency. improves.
【0016】また、標準時系列パターンをネットワーク
構造とすることにより、ネットワークを構成する部分を
同一処理単位内で処理でき処理効率が向上する。また、
共通のネットワーク部分に対する入力パターンの特徴量
との照合を同一処理単位内で共通して行うことにより処
理効率が向上する。Further, by forming the standard time series pattern into a network structure, the parts constituting the network can be processed in the same processing unit, thereby improving the processing efficiency. Also,
The processing efficiency is improved by collating the common network portion with the feature amount of the input pattern in the same processing unit.
【0017】また複数標準パターン読込部2に複数の記
憶部を設け、照合部(3)の同一照合結果をこの複数の
記憶部に記憶しておくことにより、複数の累積距離、例
えばG(i−1,j−1)とG(i−1,j)を同時に
読み出すことができるので処理速度が向上する。A plurality of storage units are provided in the plurality of standard pattern reading units 2, and the same comparison result of the comparison unit (3) is stored in the plurality of storage units, so that a plurality of accumulated distances, for example, G (i −1, j−1) and G (i−1, j) can be read simultaneously, so that the processing speed is improved.
【0018】[0018]
【実施例】以下、本発明の実施例を図面を参照して説明
する。図2は本発明の第1実施例の構成を示すブロック
図である。10は入力時系列パターン読込部で人の発声を
読み込む。11は入力パターンメモリで入力時系列パター
ン読込部10から照合処理を行う入力時系列パターンの特
徴量を読み出し記憶する。12は標準時系列パターン記憶
部12で単語などの標準時系列パターンが多数記憶されて
いる。16は複数標準時系列パターン読み込み部で、入力
時系列パターンに対して照合を行う複数標準時系列パタ
ーンを同時に標準時系列パターンに記憶部12より読み出
す。17は複数標準パターンメモリで複数標準時系列パタ
ーン読み込み部16で読み出した複数の標準時系列パター
ンを記憶する。18は複数DP照合部で入力パターンメモ
リ11から読み出した入力時系列パターンの特徴量に対し
て複数標準パターンメモリ17から読み出した複数の標準
時系列パターンを順次DP照合を行う。なおこの複数D
P照合部18の詳細構造は、図12に示した構成と基本的に
は同じであり、累積距離メモリ154 に複数の標準時系列
パターンとの照合結果が格納される。Embodiments of the present invention will be described below with reference to the drawings. FIG. 2 is a block diagram showing the configuration of the first embodiment of the present invention. Reference numeral 10 denotes an input time-series pattern reading unit that reads a human utterance. Reference numeral 11 denotes an input pattern memory which reads out and stores a feature amount of an input time-series pattern to be subjected to a matching process from an input time-series pattern reading unit 10. Reference numeral 12 denotes a standard time series pattern storage unit 12, which stores a large number of standard time series patterns such as words. Reference numeral 16 denotes a plurality of standard time-series pattern reading units, which simultaneously read a plurality of standard time-series patterns to be compared with the input time-series patterns into the standard time-series patterns from the storage unit 12. Reference numeral 17 denotes a plurality of standard time-series patterns, which stores a plurality of standard time-series patterns read by the plurality of standard time-series patterns reading unit 16. Reference numeral 18 denotes a plurality of DP matching units which sequentially perform DP matching of a plurality of standard time-series patterns read from the plurality of standard pattern memories 17 with respect to the feature amount of the input time-series pattern read from the input pattern memory 11. In addition, this plural D
The detailed structure of the P collation unit 18 is basically the same as the configuration shown in FIG. 12, and the result of collation with a plurality of standard time-series patterns is stored in the cumulative distance memory 154.
【0019】図3は本実施例の動作フロー図である。先
ず入力時系列パターンの読み込みを入力パターンメモリ
11に記憶し( ステップ30) 、次に複数の標準時系列パタ
ーンの読み込みを複数標準パターンメモリ17に記憶する
( ステップ31) 。入力時系列パターンの各特徴量ごと
に、まず最初の標準時系列パターンの各特徴量との照合
を行い、同じように次の標準時系列パターンの各特徴量
との照合というように、順次複数の標準時系列パターン
との照合を行う。FIG. 3 is an operation flowchart of this embodiment. First, the input time series pattern is read in the input pattern memory.
11 (Step 30), and then read the plurality of standard time-series patterns into the plurality of standard pattern memories 17.
(Step 31). For each feature of the input time-series pattern, first match with the feature of the first standard time-series pattern, and then compare with the feature of the next standard time-series pattern. Check with the sequence pattern.
【0020】図4は入力時系列パターンに対する複数の
標準時系列パターンとの照合処理の様子を表した図であ
る。図15は各標準時系列パターン毎に照合処理を行う処
理作業を示しているが、図4はこれら複数の標準時系列
パターンを1つの処理単位の中で順次処理してゆく様子
を示す。FIG. 4 is a diagram showing how the input time series pattern is compared with a plurality of standard time series patterns. FIG. 15 shows a processing operation for performing a matching process for each standard time-series pattern. FIG. 4 shows a state in which the plurality of standard time-series patterns are sequentially processed in one processing unit.
【0021】本実施例の場合、図14に示した処理条件は
次のようになる。これは各標準時系列パターンのDPパ
スが基点(0,0)よりスタートするように設定したも
のである。 初期条件; G(0,j)=0(j=各標準時系列パターンの境界) =∞(j≠各標準時系列パターンの境界) 累積距離; G(i,j)=d(i,j)+min {G(i−1,j),G
(i−1,j−1)} (j≠各標準時系列パターンの境界) G(i,j)=∞ (j=各標準時系列パターンの境界) このようにして全標準パターンに対する照合が終了する
まで照合処理を行う(ステップ33) 。In the case of this embodiment, the processing conditions shown in FIG. 14 are as follows. This is set so that the DP path of each standard time series pattern starts from the base point (0, 0). G (0, j) = 0 (j = boundary of each standard time series pattern) = {(j} boundary of each standard time series pattern) Cumulative distance; G (i, j) = d (i, j) + min {G (i-1, j), G
(I-1, j-1)} (j 境界 boundary of each standard time-series pattern) G (i, j) = ∞ (j = boundary of each standard time-series pattern) In this way, the collation for all standard patterns is completed. The collation processing is performed until (step 33).
【0022】図10のタイミングチャートはG(i−1,
j−1)とG(i−1,j)の読み出しを同時に行う場
合であるが、これを図16に示したように1 クロックずら
して読み込むようにすれば、本実施例のタイミングチャ
ートとなる。図10と図16を比較してみると、図10では処
理単位1の間に標準時系列パターン1〜nと入力パター
ン特徴量iとの照合を行うためオーバヘッドは、次の処
理単位2との間に1回生じるのみであり、また標準時系
列パターン1〜nの読み込みも一括して行う。これに対
し図16に示す従来方法の照合処理のオーバヘッドは、各
標準時系列パターンとの照合ごとに生じ、また、標準時
系列パターン1〜nの読み込みもそれぞれ行うのでn回
の読み込みとなる。このため本実施例のように複数の標
準時系列パターンと入力時系列パターンの特徴量との比
較を1処理単位内で行うことによりオーバヘッドおよび
標準時系列パターンの読み込み回数が減少し照合処理を
行うベクトルプロセッサの処理効率が向上する。FIG. 10 is a timing chart of G (i-1,
j-1) and G (i-1, j) are read at the same time. If they are read by shifting one clock as shown in FIG. 16, the timing chart of this embodiment is obtained. . When comparing FIG. 10 with FIG. 16, in FIG. 10, since the standard time-series patterns 1 to n are compared with the input pattern feature amount i during the processing unit 1, the overhead is between the next processing unit 2. , And the reading of the standard time-series patterns 1 to n is also performed collectively. On the other hand, the overhead of the collation processing of the conventional method shown in FIG. 16 is generated for each collation with each standard time series pattern, and the standard time series patterns 1 to n are also read, so that the number of times of reading is n. For this reason, as in the present embodiment, the comparison between a plurality of standard time-series patterns and the feature amount of the input time-series pattern is performed within one processing unit, thereby reducing the overhead and the number of times of reading the standard time-series pattern, and performing a matching process. Processing efficiency is improved.
【0023】図5は標準時系列パターンがネットワーク
構造をもつ場合を示す。映画とか英雄の映,英はエイと
もエーとも発音される。また雄もユウともユーとも発音
される。このような場合エイとエーを一緒に照合するこ
とにより照合処理の効率が向上する。図6はこの照合処
理状況を表したものである。FIG. 5 shows a case where the standard time series pattern has a network structure. Movies and heroes, and English is pronounced both as a and a. Males are also pronounced as Yu and Yu. In such a case, by collating the rays A and A together, the efficiency of the collation processing is improved. FIG. 6 shows the state of the matching process.
【0024】図7はネットワーク構造を持った標準パタ
ーンの共通部を共通化した様子を表す。映画のエイ(エ
ー)と英雄のエイ(エー)は画,雄に対して共通となっ
ている。図8はこの共通部を共通して照合処理する様子
を示す。このように共通処理することにより処理量が削
減される。FIG. 7 shows a state in which a common part of a standard pattern having a network structure is shared. The movie ray (A) and the hero ray (A) are common to the painting and the male. FIG. 8 shows how the common part is subjected to the collation processing in common. The processing amount is reduced by performing the common processing in this manner.
【0025】図9は本発明の第2実施例の複数DP照合
部18の詳細構成を示すブロック図である。他の構成は第
1実施例と同一である。図12との相違点は、累積距離メ
モリ184,185 として同一の容量をもつものを2つ設け、
同一の内容を記憶するようにしたことにより、G(i−
1,j),G(i−1,j−1)を同時に読み出すこと
ができ、処理の高速化を図ったことである。FIG. 9 is a block diagram showing a detailed configuration of the multiple DP collating unit 18 according to the second embodiment of the present invention. Other configurations are the same as those of the first embodiment. The difference from FIG. 12 is that two memories having the same capacity are provided as the cumulative distance memories 184 and 185,
By storing the same contents, G (i-
1, (j), G (i-1, j-1) can be read out at the same time, thereby speeding up the processing.
【0026】図10は図9に示す複数DP照合部18のタイ
ミングチャートを示す。図16との相違は、処理単位1内
で標準時系列パターン1〜nと照合を行うこと、処理単
位1,2,……毎にしかオーバヘッドは生じないので図
16に比べ1処理単位当たり標準時系列パターンの数n−
1だけオーバヘッド時間が少なくなること、またG(i
−1,j−1)の読み出しを同時に行うので1つの標準
時系列パターン当たり1クロックずつ照合処理が速くな
ることである。FIG. 10 is a timing chart of the multiple DP collating unit 18 shown in FIG. The difference from FIG. 16 is that the matching is performed with the standard time-series patterns 1 to n in the processing unit 1, and the overhead is generated only for each of the processing units 1, 2,.
Number of standard time series patterns per processing unit compared to 16 n-
The overhead time is reduced by one, and G (i
−1, j−1) are simultaneously performed, so that the matching process is speeded up by one clock per one standard time-series pattern.
【0027】[0027]
【発明の効果】以上の説明から明らかなように、本発明
は入力時系列パターンの特徴量と複数の標準時系列パタ
ーンとの照合処理を1つの処理単位内で行うため、DP
照合処理効率を向上することができる。As is apparent from the above description, the present invention performs the matching process between the feature quantity of the input time-series pattern and a plurality of standard time-series patterns in one processing unit.
The collation processing efficiency can be improved.
【図1】本発明の原理図である。FIG. 1 is a principle diagram of the present invention.
【図2】第1実施例の構成を示すブロック図である。FIG. 2 is a block diagram illustrating a configuration of a first embodiment.
【図3】第1実施例の動作を示すフロー図である。FIG. 3 is a flowchart showing the operation of the first embodiment.
【図4】第1実施例の照合処理を示す図である。FIG. 4 is a diagram illustrating a collation process according to the first embodiment.
【図5】ネットワーク構造を持った標準パターンを説明
する図である。FIG. 5 is a diagram illustrating a standard pattern having a network structure.
【図6】ネットワーク構造の標準パターンの照合処理を
説明する図である。FIG. 6 is a diagram illustrating a process of collating a standard pattern having a network structure.
【図7】ネットワーク構造を持った標準パターンの共通
化を説明する図である。FIG. 7 is a diagram illustrating the sharing of a standard pattern having a network structure.
【図8】図7に示す標準パターンの共通化した照合処理
を説明する図である。FIG. 8 is a diagram illustrating a collation process in which the standard patterns shown in FIG. 7 are shared.
【図9】第2実施例の複数DP照合部の構成を示すブロ
ック図である。FIG. 9 is a block diagram illustrating a configuration of a multiple DP matching unit according to a second embodiment.
【図10】第2実施例の複数DP照合部のタイミングチャ
ートである。FIG. 10 is a timing chart of the multiple DP matching unit of the second embodiment.
【図11】従来のDP照合装置の構成を示すブロック図で
ある。FIG. 11 is a block diagram illustrating a configuration of a conventional DP matching device.
【図12】図11のDP照合部の詳細構成を示す図である。FIG. 12 is a diagram illustrating a detailed configuration of a DP matching unit in FIG. 11;
【図13】図11に示す装置の動作を示すフロー図である。13 is a flowchart showing the operation of the device shown in FIG.
【図14】DPパス算出の説明図である。FIG. 14 is an explanatory diagram of DP path calculation.
【図15】図11に示す装置による照合処理の進め方および
照合結果を説明する図である。15 is a diagram illustrating a method of performing a matching process by the device illustrated in FIG. 11 and a matching result.
【図16】図12に示すDP照合部のタイミングチャートで
ある。16 is a timing chart of the DP matching unit shown in FIG.
10 入力時系列パターン読込部 11 入力パターンメモリ 12 標準時系列パターン記憶部 16 複数標準時系列パターン読込部 17 複数標準パターンメモリ 18 複数DP照合部 10 Input time series pattern reading section 11 Input pattern memory 12 Standard time series pattern storage section 16 Multiple standard time series pattern reading section 17 Multiple standard pattern memories 18 Multiple DP matching section
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−144100(JP,A) 特開 平2−250188(JP,A) 特開 昭63−226693(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-1-144100 (JP, A) JP-A-2-250188 (JP, A) JP-A-63-226993 (JP, A) (58) Survey Field (Int.Cl. 7 , DB name) G10L 11/00-21/06 JICST file (JOIS)
Claims (4)
との照合を行う動的計画法照合装置において、複数の標
準時系列パターンを読み込む複数標準パターン読込部
と、入力時系列を読み込む入力パターン読込部と、この
入力パターン読込部の読み込んだ入力時系列の特徴量と
前記複数の標準時系列パターンの特徴量との照合を、入
力時系列の構成要素である特徴量毎に順次、連続して行
う、単一のベクトルプロセッサからなる照合部を備えた
ことを特徴とする動的計画法照合装置。A dynamic programming matching apparatus for matching a standard time series pattern with an input time series pattern, wherein a plurality of standard pattern reading units for reading a plurality of standard time series patterns.
When an input pattern reading unit for reading the input time series, and feature quantity of the read input time series of the input pattern read unit
The matching with the feature values of the plurality of standard time-series patterns is input.
Force time series components and a characteristic amount for each sequentially performed continuously, dynamic programming matching system characterized by comprising a verification portion formed of a single vector processor.
造としたことを特徴とする請求項1記載の動的計画法照
合装置。2. The dynamic programming matching apparatus according to claim 1, wherein said standard time series pattern has a network structure.
ーク部分に対する前記特徴量との照合を共通して行うこ
とを特徴とする請求項2記載の動的計画法照合装置。3. The dynamic programming matching apparatus according to claim 2, wherein the matching of the standard time series pattern with the feature amount for a common network portion is performed in common.
部を有して前記照合部の照合結果を記憶し、前記照合部
がこの複数の記憶部の内容を同時に読み出すようにした
ことを特徴とする請求項1記載の動的計画法照合装置。Wherein said plurality standard pattern reading unit has a plurality of storage portions storing the collation result of the collating unit, the comparison unit
2. The dynamic programming collation apparatus according to claim 1, wherein the contents are simultaneously read from the plurality of storage units.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03027215A JP3094473B2 (en) | 1991-02-21 | 1991-02-21 | Dynamic programming collator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03027215A JP3094473B2 (en) | 1991-02-21 | 1991-02-21 | Dynamic programming collator |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04265997A JPH04265997A (en) | 1992-09-22 |
JP3094473B2 true JP3094473B2 (en) | 2000-10-03 |
Family
ID=12214881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03027215A Expired - Fee Related JP3094473B2 (en) | 1991-02-21 | 1991-02-21 | Dynamic programming collator |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3094473B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5161942B2 (en) * | 2010-09-17 | 2013-03-13 | 株式会社東芝 | Speech recognition apparatus, speech recognition method, and speech recognition program |
-
1991
- 1991-02-21 JP JP03027215A patent/JP3094473B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04265997A (en) | 1992-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5899971A (en) | Computer unit for speech recognition and method for computer-supported imaging of a digitalized voice signal onto phonemes | |
US5127055A (en) | Speech recognition apparatus & method having dynamic reference pattern adaptation | |
JP2595495B2 (en) | Pattern matching device | |
US10777188B2 (en) | Time-frequency convolutional neural network with bottleneck architecture for query-by-example processing | |
JPH0634185B2 (en) | Input word recognition device | |
JPH01167896A (en) | Voice input device | |
JP4289715B2 (en) | Speech recognition apparatus, speech recognition method, and tree structure dictionary creation method used in the method | |
Brown et al. | An adaptive, ordered, graph search technique for dynamic time warping for isolated word recognition | |
JPS6326700A (en) | Voice recognition system | |
US5375173A (en) | Speaker adapted speech recognition system | |
JP3094473B2 (en) | Dynamic programming collator | |
US4783809A (en) | Automatic speech recognizer for real time operation | |
US4790017A (en) | Speech processing feature generation arrangement | |
US6631349B1 (en) | Speech recognition method and system | |
JP4511274B2 (en) | Voice data retrieval device | |
JPH1173419A (en) | Method and device for retrieving electronic document | |
JP3348735B2 (en) | Pattern matching method | |
JPH0498422A (en) | Data clustering device | |
JPS61148497A (en) | Standard pattern generator | |
JPS5978400A (en) | Preparation system of candidate train | |
JP4363941B2 (en) | Word recognition program and word recognition device | |
Gravier et al. | Integrating contextual phonological rules in a large vocabulary decoder. | |
JPH11184492A (en) | Speaker recognition device and its method | |
JPH0320759B2 (en) | ||
JPS60217490A (en) | Character recognizing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000704 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080804 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090804 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |