JPS59124400A - Voice pattern matching system - Google Patents
Voice pattern matching systemInfo
- Publication number
- JPS59124400A JPS59124400A JP57234086A JP23408682A JPS59124400A JP S59124400 A JPS59124400 A JP S59124400A JP 57234086 A JP57234086 A JP 57234086A JP 23408682 A JP23408682 A JP 23408682A JP S59124400 A JPS59124400 A JP S59124400A
- Authority
- JP
- Japan
- Prior art keywords
- matching
- route
- distance
- input
- pattern matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔°発明の技術分野〕
本発明は、音声認識装置の音声パターン・マツチング方
式の改良に関するものである。DETAILED DESCRIPTION OF THE INVENTION [°Technical Field of the Invention] The present invention relates to an improvement in a speech pattern matching method for a speech recognition device.
従来の音声認識装置では、入力した音声をパターン・・
マツチング用の入カバターンに変換した後、入カバター
ンをあらかじめ記憶していた複数の標準パターンとパタ
ーン・マツチングして、最モ似ている標準パターンの認
識結果としている。このパターン・マツチングでは、単
語音声などは発声時間がかなりの幅で変動するので、こ
の時間変動を補正して入カバターンと標準パターンが最
も近似した状態において比較する必要がある。そうした
時間正規化パターン・マツチングは、DP(ダイナミッ
ク・プログラミング)マツチングに代表されるが、DP
マツチングでは計算量が非常に多く、大きなハードウェ
アを必要としていた。また、線形マツチングの変型で幾
つかのマツチング・ルートを予想してマツチングさせ最
も近似したものを採用するルート限定マツチングは、計
算量は少ないが、入カバターンと標準パターンのマツチ
ング・ルートが予想ルートと大きく異なると、時間正規
化をすることが出来ず、また予想ルートの数をあまり多
くすると、計算量が多くなってしまう欠点があった。Conventional speech recognition devices convert input speech into patterns...
After converting into an input cover pattern for matching, the input cover pattern is pattern matched with a plurality of pre-stored standard patterns to obtain the most similar standard pattern as the recognition result. In this pattern matching, since the utterance time of word sounds varies considerably, it is necessary to correct this time variation and compare the incoming cover pattern and the standard pattern in a state in which they are most similar. Such time normalized pattern matching is typified by DP (dynamic programming) matching;
Matching requires a large amount of calculation and requires large hardware. In addition, route-limited matching, which is a modification of linear matching, predicts several matching routes, matches them, and then adopts the one that is the most similar.Although the amount of calculation is small, the matching route of the input cover pattern and standard pattern is the expected route. If there is a large difference, time normalization cannot be performed, and if the number of predicted routes is too large, the amount of calculation will increase.
本発明は、上記の考察に基づくものであって、計算量が
少なく、しかもDPマツチングに近い結果を期待できる
音声パターン・マツチング方式を提供することを目的と
している。The present invention is based on the above consideration, and an object of the present invention is to provide a voice pattern matching method that requires a small amount of calculation and can be expected to produce results close to DP matching.
そしてそのため、本発明の音声パターン・マツチング方
式は、音声認識装置の音声パターン・マツチング方式に
おいて予め網状に予想したマツチング・ルートの各辺の
部分のみ線形マツチングさせ、始端から終端までのマツ
チングを、各辺のマツチング結果をルート毎に合計して
求めるようにしたことを特徴とするものである。Therefore, in the voice pattern matching method of the present invention, the voice pattern matching method of the voice recognition device performs linear matching only on each side of the matching route predicted in advance in a net shape, and performs matching from the start end to the end of each side. This method is characterized in that the results of matching edges are summed for each route.
以下、本発明を図面を参照しつつ説明する。 Hereinafter, the present invention will be explained with reference to the drawings.
第1図は本発明における網状マツチング・ルートの1例
を示す図、第2図は従来のルート限定マツチングにより
距離Gを求めるためのフローチャート、第3図は網状の
各辺の照合点でのフレーム間の差dの累積を求めこれら
を組合せて各ルートの距離gを求め次に距離Gを求める
ようにしだ本発明による場合のフローチャートである。Fig. 1 is a diagram showing an example of the mesh matching route in the present invention, Fig. 2 is a flowchart for determining the distance G by conventional route-limited matching, and Fig. 3 is a diagram showing frames at matching points on each side of the mesh. This is a flowchart according to the present invention in which the distance g of each route is determined by calculating the cumulative difference d between the two routes, and then calculating the distance G of each route.
第1図において、A、 B、 C,・・・Lは辺を示し
ている。マツチングは、ルート上のも点での入力パラメ
ータ登録パラメータの差dを計算し、ルートに沿ってd
を累積することによりそのルートの距離gを求める。各
ルートの距離gの中で最小のものを入力パラメータと登
録パラメータの距離Gとする。入力パラメータは下記の
ようにして求められる。入力音声を例えば16個のフィ
ルタより成るフィルタ群を通し、各フィルタの出力を例
えば10m5毎にサンプリングし、アナログ・サンプリ
ング信号をディジタル化する。冬すンフ゛リング点にお
ける16個のフィルタのディジタル出カ僅の集合をフレ
ームという。入力パラメータは、フレームの集りで構成
される。登録パラメータは入力パラメータと同様な構成
を有している。ルート上の各点での入力パラメータと登
録パラメータの差dは下記のようにして求められる。ル
ート上の点で定められる登録パラメータのフレームと入
力パラメータのフレームを各チャネル毎に引算し、チャ
ネル毎の差を合計するこ(により差dが求まる。In FIG. 1, A, B, C, . . . L indicate sides. Matching calculates the difference d between the input parameter registration parameters at the point on the route, and
The distance g of the route is determined by accumulating the distance g. The smallest distance among the distances g of each route is defined as the distance G between the input parameter and the registered parameter. Input parameters are determined as follows. The input audio is passed through a filter group consisting of, for example, 16 filters, the output of each filter is sampled every 10 m5, and the analog sampling signal is digitized. A collection of only a few digital outputs of 16 filters at a winter filtering point is called a frame. The input parameters consist of a collection of frames. The registered parameters have the same configuration as the input parameters. The difference d between the input parameter and the registered parameter at each point on the route is determined as follows. The difference d is determined by subtracting the registered parameter frame defined by the point on the route and the input parameter frame for each channel, and summing the differences for each channel.
なお、チャネルとはフィルタに対応するものであるO
第1図には1]個の々ツチング・ルートが存在する。各
ルートは下記のような辺で構成される。Note that a channel corresponds to a filter. In FIG. 1, there are 1] switching routes. Each route consists of the following edges.
■ A−D−に
■ 33− i
■ e−G−L
■ A−E−H−に
■ A−E−i
■ A−E−J−L
■ B−H−に
■ B−J−L
■ C−F−H−K
[F] C−F−i
G) C−F −J −L
なお、第11dにおいて○で囲まれた点は辺の端を示し
、点は照合点を示している。■ A-D- ■ 33- i ■ e-G-L ■ A-E-H- ■ A-E-i ■ A-E-J-L ■ B-H- ■ B-J-L ■ C-F-H-K [F] C-F-i G) C-F -J -L In addition, in No. 11d, the circled points indicate the edges of the sides, and the dots indicate the matching points. There is.
第2図は従来のルート限定マツチングにより距離Gを求
める場合のフロー、チャートである。先ず、入力パラメ
ータと登録パラメータとからマツチング・ルートを定め
る。例えば、同じ言葉を短かく発声した場合と長く発声
した場合とでは入力パラメータのフレーム数が異なるの
で、入力パラメータと登録パラメータとを参照してマツ
チング・ルートを定める必要がある。冬ルート■、■・
・・、■に沿って照合点での差dを計算し、その累積g
をルート毎にglないしgllまで求める。glはルー
ト■上における全て照合点での差dを計算し、これを累
積したものであり、gllはルート@上における全て照
合点での差dを計算し、これらを累積したものである。FIG. 2 is a flowchart for determining the distance G using conventional route-limited matching. First, a matching route is determined from input parameters and registered parameters. For example, since the number of input parameter frames is different when the same word is uttered for a short time and when it is uttered for a long time, it is necessary to determine a matching route by referring to the input parameters and registered parameters. Winter route■、■・
..., calculate the difference d at the matching point along ■, and calculate the cumulative g
is calculated from gl to gll for each route. gl is the result of calculating and accumulating the differences d at all matching points on the route ■, and gll is the calculating and accumulating the differences d at all matching points on the route @.
各ルートの距離g1ないしg11乞比較し、最小のもの
を入力パラメータと登録パラメータとの距離をGとする
。第1図のようにマツチング・ルートを設定した場合、
従来のルート限定マツチングにより距離Gを求めるため
には、dの計算を451箇所分行う必要がある。The distances g1 to g11 of each route are compared, and the minimum distance between the input parameter and the registered parameter is set as G. If you set the matching route as shown in Figure 1,
In order to obtain the distance G using conventional route-limited matching, it is necessary to calculate d for 451 locations.
第2図は本発明によって入力パラメータと登録パラメー
タとの距離Gを求めろ場合のフローチャートである。先
ず、入力パラメータと登録バラメ−タによりマツチング
・ルート及び各辺を定める。。FIG. 2 is a flowchart for calculating the distance G between an input parameter and a registered parameter according to the present invention. First, a matching route and each side are determined using input parameters and registered parameters. .
辺A、B、・・、Lのそれぞれについて、辺上に存在す
る全ての堀合点での差dを求め、これらの差dを累檎し
辺A、B、C,・・・L毎の累積gAないしgLを求め
る。各ルート■、■、・・・、■の距離g1゜g2.・
・・9g11をgムないしgLの中の該当するものを組
合せて計算する。各ルートの距離g1ないしgllを比
較し、最小のものを入力パラメータと登録パラメータと
の距離Gとする。第1図のようにマツチング・ルートお
よび辺で設定した場合、本発明により距離Gを求めろた
めにはdの計算は163箇所分で済み、従来の計算量の
1/2.7になる。For each side A, B, ..., L, find the difference d at all the moat points that exist on the side, accumulate these differences d, and calculate the difference d for each side A, B, C, ...L. Find the cumulative gA or gL. Distance g1゜g2 for each route ■, ■, ..., ■.・
...Calculate 9g11 by combining the appropriate items from gmu to gL. The distances g1 to gll of each route are compared, and the smallest one is set as the distance G between the input parameter and the registered parameter. When the matching route and sides are set as shown in FIG. 1, in order to obtain the distance G according to the present invention, d only needs to be calculated at 163 locations, which is 1/2.7 of the conventional calculation amount.
以上の説明から明らかなように、本発明によれば、マツ
チング・ルートの数が多くなっても計算量がルート限定
マツチングに比較して格段に少なく、またDPマツチン
グに近い結果が期待できる。As is clear from the above description, according to the present invention, even if the number of matching routes increases, the amount of calculation is much smaller than that of route-limited matching, and results similar to DP matching can be expected.
第′1図は本発明による網状マツチング・ルート01例
を示す図、第2図は従来のルート限定マツチングにより
距離を求めるためのフローチャート、第3図は網状の各
辺の照合点でのフレーム間の差dの累積を求めこれらを
組合せて各ルートの距離gを求め次に距離Gを求めるよ
うにした本発明による場合のフローチャートである。
A、B、C,・・・L、・・・辺
特許出願人 富士通株式会社
代理人弁理士 京 谷 四 部
ヤ1図
′:X3図Fig. 1 is a diagram showing an example of the mesh matching route 01 according to the present invention, Fig. 2 is a flowchart for determining distance by conventional route-limited matching, and Fig. 3 is a diagram showing the distance between frames at matching points on each side of the mesh. 2 is a flowchart according to the present invention in which the distance g of each route is determined by calculating the cumulative difference d between the two routes, and then calculating the distance G. A, B, C,...L,... Side Patent Applicant Fujitsu Ltd. Representative Patent Attorney Kyotani 4 Part Ya1 Figure': X3 Figure
Claims (1)
予め網状に予想したマツチング・ルートの各辺の部分の
み線形マツチングさせ、始端から終端までのマツチング
を、各辺のマツチング結果をルート毎に合計して求める
ようにしたことを特徴とする音声パターン・マツチング
方式。In the speech pattern matching method of the speech recognition device, linear matching is performed only on each side of the matching route predicted in advance in a net shape, and the matching from the start end to the end is calculated by summing the matching results of each side for each route. A voice pattern matching method characterized by the following.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57234086A JPS59124400A (en) | 1982-12-30 | 1982-12-30 | Voice pattern matching system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57234086A JPS59124400A (en) | 1982-12-30 | 1982-12-30 | Voice pattern matching system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59124400A true JPS59124400A (en) | 1984-07-18 |
Family
ID=16965389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57234086A Pending JPS59124400A (en) | 1982-12-30 | 1982-12-30 | Voice pattern matching system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59124400A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5675014A (en) * | 1996-01-22 | 1997-10-07 | The Goodyear Tire & Rubber Company | Process for the preparation of organosilicon disulfide compounds |
US6084014A (en) * | 1998-03-02 | 2000-07-04 | The Goodyear Tire & Rubber Company | Asymmetrical siloxy compounds |
-
1982
- 1982-12-30 JP JP57234086A patent/JPS59124400A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5675014A (en) * | 1996-01-22 | 1997-10-07 | The Goodyear Tire & Rubber Company | Process for the preparation of organosilicon disulfide compounds |
US6084014A (en) * | 1998-03-02 | 2000-07-04 | The Goodyear Tire & Rubber Company | Asymmetrical siloxy compounds |
US6410625B1 (en) | 1998-03-02 | 2002-06-25 | The Goodyear Tire & Rubber Company | Asymmetrical siloxy compounds |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4864620A (en) | Method for performing time-scale modification of speech information or speech signals | |
JPS59124400A (en) | Voice pattern matching system | |
JP2992324B2 (en) | Voice section detection method | |
JPS62113197A (en) | Voice recognition equipment | |
JPS60166993A (en) | Word voice recognition equipment | |
JPS59143199A (en) | Pitch extraction | |
JPS5880697A (en) | Voice recognition system | |
JPS59211098A (en) | Voice recognition equipment | |
JPS59116798A (en) | Automatic gain control of voice recognition equipment | |
JPS6217800A (en) | Voice section decision system | |
JP4007628B2 (en) | Speech synthesizer for normalizing the pitch of speech pitch | |
JPS6260715B2 (en) | ||
JPS625298A (en) | Voice recognition equipment | |
JPS62175800A (en) | Voice pattern generation system | |
JPS61190398A (en) | Plosive consonant recognition system | |
JPS58116595A (en) | Word voice recognition equipment | |
JPH0259480B2 (en) | ||
JPS63121100A (en) | Feature pattern extraction for voice recognition equipment | |
JPS6256998A (en) | Consonant section detector | |
JPS592100A (en) | Voice recognition system | |
JPS60166997A (en) | Word voice recognition equipment | |
JPS61176996A (en) | Voice recognition equipment | |
JPS61281300A (en) | Voice recognition equipment | |
JPH07104675B2 (en) | Speech recognition method | |
JPS60254200A (en) | Voice fundamental frequency extractor |