JPH0193798A - Division labelling apparatus - Google Patents

Division labelling apparatus

Info

Publication number
JPH0193798A
JPH0193798A JP62251116A JP25111687A JPH0193798A JP H0193798 A JPH0193798 A JP H0193798A JP 62251116 A JP62251116 A JP 62251116A JP 25111687 A JP25111687 A JP 25111687A JP H0193798 A JPH0193798 A JP H0193798A
Authority
JP
Japan
Prior art keywords
label
statistics
division
labeling
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62251116A
Other languages
Japanese (ja)
Other versions
JP2629205B2 (en
Inventor
Yoshiharu Abe
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP62251116A priority Critical patent/JP2629205B2/en
Publication of JPH0193798A publication Critical patent/JPH0193798A/en
Application granted granted Critical
Publication of JP2629205B2 publication Critical patent/JP2629205B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE: To improve the accuracy of pattern matching and the accuracy of divided labeling by statistically processing variation in the section length of divided sections at the time of pattern matching. CONSTITUTION: A file device 1 stores K word voice time sequence patterns, a file device 2 stores K groups of vector label strings and section label strings and a file device 7 stores a division result obtained by m-th repeat. An initial division part 3 reads out a section length label string corresponding to the time sequence pattern of each vector stored in the device 1 from the device 2, executes time division so that each section length is proportional to the weight of a label sort and sends the result to the device 7. A statistic part 4 reads out the newest division result found out by the initial division part 3 or the best division part 6 from the device 7 and finds out the average and dispersion of cepstrum coefficients as the statistic value of vectors and finds out the average and dispersion as the statistical value of section length in each label and stores the obtained results in a file device 5. The best division is repeated in accordance with the contents of the device 5.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、音声バタンで代表されるベクトルの時系列
パタンを、与えられたラベル列に従って分割し、これら
分割区間にラベルを付ける装置の改良に関する。
[Detailed Description of the Invention] [Field of Industrial Application] This invention is an improvement of a device that divides a time series pattern of a vector represented by a voice button according to a given label string and labels these divided sections. Regarding.

〔従来の技術〕[Conventional technology]

第2図は、昭和62年3.us日出願の特願昭62−0
64952号公報、「分割ラベル付け装置」、記載の従
来のこの種装置の機能ブロック図である。図において、
11)はベクトルの時系列バタンを格納するためのファ
イル装置、(2)はファイル装置+11中のベクトルの
時系列パタンに対して付けるべきラベル列を格納するた
めのファイル装置。
Figure 2 is from March 1986. Patent application filed on US day 1986-0
64952, "Divided labeling device", is a functional block diagram of a conventional device of this kind. In the figure,
11) is a file device for storing time-series patterns of vectors; (2) is a file device for storing label strings to be attached to time-series patterns of vectors in file device+11;

(31は初期分割部、(41は統計部、(5;は統計部
(4)の出力するラベル別の統計量を格納するためのフ
ァイル装置、(6)は最良分割部、(7)は分割結果を
格納するためのファイル装置である。
(31 is the initial division section, (41 is the statistics section, (5) is a file device for storing statistics for each label output by the statistics section (4), (6) is the best division section, (7) is This is a file device for storing division results.

ここで、初期分割部(3)或いは最良分割部(6)は。Here, the initial dividing section (3) or the best dividing section (6) is.

ファイル装置III中の各ベクトルの時系列パタンを。Time series pattern of each vector in file device III.

ファイル装置(2)中の対応するラベル列に従い分割し
、その分割結果をファイル装置(7)に出力するもので
ある。一方、統計部(4)は、これら分割結果から9分
割区間に含まれるベクトルの平均あるいは分散等の統計
量をラベル別に求め、ファイル装置(5)に出力するも
のである。
It divides the file device (2) according to the corresponding label string, and outputs the division results to the file device (7). On the other hand, the statistics section (4) calculates statistics such as the average or variance of the vectors included in the nine divided sections from these division results for each label, and outputs them to the file device (5).

ところで、最良分割部(6)は、ある時系列パタンを分
割するに際し、対応するラベル列の順に、ラベル別のベ
クトルの統計量をファイル装置(5)から読み取り、こ
れらを並べた系列を型版として、この型版と分割対象の
時系列パタンとの整合を、動的計画法に基づくバタン整
合技術を用いてとり。
By the way, when dividing a certain time series pattern, the best dividing unit (6) reads the statistics of vectors for each label from the file device (5) in the order of the corresponding label sequence, and uses the sequence in which these are arranged as a template. As such, we use a slam matching technique based on dynamic programming to match this template with the time series pattern to be divided.

バタンと型版間の整合の尤度(尤もらしさ)が最大と6
時の時系列パタンの時間分割の状態を最良の分割結果と
して、ファイル装置(7)に格納する。
The likelihood of matching between the baton and the template is maximum 6
The time division state of the time series pattern is stored in the file device (7) as the best division result.

ある時点における最良の分割結果は、統計部(4)によ
って、再び最新のラベル別統計量を求めるため用いられ
、これらは更に再度、最良分割のため用いられる。この
様な、最良の分割と、ラベル別に統計量を求める処理と
の繰り返しによって、順次改良された分割結果を得る。
The best division result at a certain point in time is used again by the statistics unit (4) to obtain the latest statistics for each label, and these are used again for the best division. By repeating the best division and the process of obtaining statistics for each label, a successively improved division result is obtained.

この様な原理で動作するこの種の装置によって。With this kind of device that works on this principle.

正確な分割ラベル付けを行うためには、最良分割部で利
用される統計量の内容、及びそれに基づく型版と1時系
列パタンの間のバタン整合の技術が問題となる。
In order to perform accurate segmentation labeling, the content of the statistics used in the best segmentation unit and the technique of matching between the model version and one time series pattern based on the statistics are important.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

ベクトルの時系列パタンに対して、型版をより正確に整
合させる技術としては、引用文献(電子通信学会論文誌
(A)、第69−A巻、第2号、pp261−270)
に述べられている様に、ベクトルの時系列パタンを分割
する際、各分割区間の区間長に上限及び下限を決め、こ
れら区間長の許容範囲の制限の下で最良な整合状態を求
める方法がある。
As a technique for more accurately matching the template to the time series pattern of vectors, the cited document (Transactions of the Institute of Electronics and Communication Engineers (A), Volume 69-A, No. 2, pp 261-270)
As described in , when dividing a time series pattern of vectors, there is a method of determining upper and lower limits for the interval length of each divided interval and finding the best consistency condition under the limits of the allowable range of these interval lengths. be.

しかしながら、この方法は分割区間の区間長の許容範囲
を9人間が限られた量のデータの観察経験に基づいて決
めて与え、−旦与えたものは以後−定幅としていたため
に、データ量を増加した時に始めて明かとなると考えら
れる9分割区間の区間長の真の分布を考慮したものでは
な(、必ずしも正しい整合が行えると言う保証はない。
However, in this method, the allowable range of the interval length of the divided interval was determined and given by nine people based on the experience of observing a limited amount of data, and what was given once was given a constant width from then on, so the amount of data This method does not take into account the true distribution of the section lengths of the 9-section sections, which is thought to become clear only when the number of sections is increased (there is no guarantee that correct matching can be achieved).

又、許容範囲から、はずれるような区間長の大きな変動
に対しては、誤った整合状態を与えるため1分割の精度
が低下すると言う問題点があった。
Further, there is a problem in that when there is a large variation in the section length that deviates from the allowable range, an incorrect matching state is given, resulting in a decrease in the accuracy of one division.

この発明は、係る欠点を解決するためなされたもので、
バタン整合の際問題となる区間長の変動を、統計的に捉
えるようにして1分割ラベル付けの精度を改善した装置
を提供するものである。
This invention was made to solve such drawbacks,
An object of the present invention is to provide an apparatus that improves the accuracy of one-segment labeling by statistically capturing fluctuations in section lengths, which are a problem during baton matching.

〔問題点を解決するための手段〕[Means for solving problems]

この発明に係る分割ラベル付け装置は、統計部に、最新
の分割ラベル付けの状態から、ラベル別のベクトルの統
計量の他に、ラベル別の分割区間の区間長の統計量をも
求める手段を用いると共に。
The segmented labeling device according to the present invention includes means for determining, in the statistics section, not only vector statistics for each label but also statistics on the section length of segmented sections for each label from the latest segmented labeling state. Along with using.

最良分割部でも、これらラベル別のベクトルの統計量と
、ラベル別の分割区間の区間長の統計量の両者を用いて
バタン整合を行い、最良な分割ラベル付けの状態を求め
る手段を用いる様にしたものである。
Even in the best segmentation section, a method is used to perform slam matching using both the statistics of vectors for each label and the statistics of the section length of segmented sections for each label to find the best segmentation labeling state. This is what I did.

〔作 用〕 この発明による分割ラベル付け装置では、バタンの際問
題となる1分割区間の区間長の変動を。
[Function] The divided labeling device according to the present invention prevents fluctuations in the length of one divided section, which is a problem when slamming.

統計的に捉えることができるため、バタン整合の精度が
向上し、その結果9分割ラベル付けの精度を改善した装
置が実現される。
Since it can be grasped statistically, the accuracy of baton matching is improved, and as a result, an apparatus with improved accuracy of 9-division labeling is realized.

〔実施例〕〔Example〕

第1図は、この発明の一実施例を示す機能ブロック図で
ある。各機能ブロックは、汎用ミニコンピユータ上で動
作するプログラムによって実現されている。
FIG. 1 is a functional block diagram showing an embodiment of the present invention. Each functional block is realized by a program running on a general-purpose minicomputer.

図において、11)は単語音声データの分析によって得
られた(特徴)ベクトル(具体的には、16次元のケプ
ストラム係数ベクトル)の時系列パタンか格納されたフ
ァイル装置、 +21はラベル列の格納されたファイル
装置、(3)は初期分割部、14)は統計部、(5)は
ラベル別の統計量を格納するためのファイル装置、(6
)は最良分割部、(7)は分割結果を格納するためのフ
ァイル装置である。
In the figure, 11) is a file device that stores time-series patterns of (feature) vectors (specifically, 16-dimensional cepstral coefficient vectors) obtained by analyzing word audio data, and +21 is a file device that stores label sequences. (3) is the initial division section, (14) is the statistics section, (5) is the file device for storing statistics for each label, and (6) is the file device for storing statistics for each label.
) is the best division unit, and (7) is a file device for storing the division results.

この実施例では、ファイル装置Ill中の単語音声の時
系列パタンを、ファイル装置(2)中のラベル列に従っ
て1分割ラベル付けするものである。
In this embodiment, the time-series pattern of word sounds in the file device Ill is labeled into one segment according to the label string in the file device (2).

以下、ラベル列として、その成分ラベルが、ベクトルの
統計量に対する識別のためのラベル成分(以後、ベクト
ルラベルと呼ぶ)と2区間長の統計部に対する識別のた
めのラベル成分(以後1区間長ラベルと呼ぶ)からなる
場合について説明し。
Hereinafter, as a label string, the component labels are a label component for identifying vector statistics (hereinafter referred to as a vector label) and a label component for identifying a 2-interval length statistical part (hereinafter referred to as a 1-interval length label). ).

又、ベクトルの統計量として、ケプストラム係数の平均
及び分散を、又1区間長の統計量として。
Also, as vector statistics, the mean and variance of cepstral coefficients, and as statistics for one interval length.

その平均及び分散を用いる場合について説明する。The case where the average and variance are used will be explained.

又1分割の繰り返しの回数(以後2mで表す)を、初期
分割の結果に対し9m=1となるように定義する。
Furthermore, the number of repetitions of one division (hereinafter expressed as 2m) is defined so that 9m=1 for the result of the initial division.

更に、ファイル装置+11には、KI[Fjの単語音声
の時系列パタンか格納されているものとし、これらを。
Furthermore, it is assumed that the file device +11 stores time-series patterns of the word sounds of KI[Fj.

(((C(k、i 、n)、 O≦n≦+s )、 I
≦i≦I(k))、1≦に≦K)と記す。(ここで、記
号(X)はXなる列を表すものとし、以後、断りなくこ
の記法を用いる。又。
(((C(k, i, n), O≦n≦+s), I
≦i≦I(k)), and 1≦≦K). (Here, the symbol (X) represents the sequence X, and this notation will be used hereinafter without further notice.

C(k、i、n)は第に番目の単語を分析して得られる
第1番目のフレームにおける第3次のケプスラム係数、
[1は1時系列パタンの長さ(分析フレーム数)である
。) 更に、又、ファイル装置(2)には、に組のベクトルラ
ベル列、及び区間長ラベル列が格納されているものとし
、これらを、ベクトルラベル列は。
C(k, i, n) is the third-order cepthrum coefficient in the first frame obtained by analyzing the th word,
[1 is the length of one time series pattern (number of analysis frames). ) Furthermore, it is assumed that the file device (2) stores a set of vector label strings and a section length label string, and these are defined as the vector label string.

(il?s (k、j)、 1≦j≦J(k))、1≦
に≦K)(但しl R3(k、j)  は第に番目の時
系列パタンの第j番目の分割区間に付されるベクトルラ
ベル成分を、J(k)はラベル列の長さを表す。)と、
又1区間長ラベル列は。
(il?s (k, j), 1≦j≦J(k)), 1≦
≦K) (where l R3(k, j) represents a vector label component attached to the j-th divided section of the th-th time series pattern, and J(k) represents the length of the label string. )and,
Also, the one section length label string is:

(tRt (k、D、 l≦j≦J(k))、*≦に≦
K)(但し、 Rt (k、j)は第に番目の時系列パ
タンの第j番目の分割区間に付される区事長ラベル成分
を表す。)                   1
と記すものとし、これらラベル列に含まれる異なるラベ
ルの集合を、それぞれ、ベクトルラベル集合及び区間長
ラベル集合と呼ぶ。ベクトルラベル集合は。
(tRt (k, D, l≦j≦J(k)), *≦to≦
K) (However, Rt (k, j) represents the section chief label component attached to the j-th division interval of the th-th time series pattern.) 1
The sets of different labels included in these label strings are called a vector label set and an interval length label set, respectively. Vector label set is.

(QS (qs )、 l≦qs≦NQs )(但し、
NQsは異なるベクトルラベルの総数を表す。) と、又9区間長ラベル集合は。
(QS (qs), l≦qs≦NQs) (However,
NQs represents the total number of different vector labels. ), and the 9 interval length label set is.

(Qt (qt )、 t≦qt≦NQt)(但し、N
Qtは異なる区間長ラベルの総数を表す。)と記すもの
とする。
(Qt (qt), t≦qt≦NQt) (However, N
Qt represents the total number of different interval length labels. ).

更に、又、ファイル装置(7)に格納される第m回目の
繰り返しにおける分割結果を。
Furthermore, the division result at the m-th repetition is stored in the file device (7).

11e (m、k j)、 1≦j≦J(k)−H)、
1≦に≦K)と記すものとする。(ここで、e  (m
、に、j)は。
11e (m, k j), 1≦j≦J(k)−H),
1≦ and ≦K). (Here, e (m
, ni, j) is.

第m回目の繰り返しにおける第に番目のベクトルの時系
列パタンを分割する時の、第j番目の分割区間の開始端
のフレーム番号を表し1次の式を満たすものとする。
It represents the frame number at the start end of the j-th division section when dividing the time-series pattern of the th vector in the m-th repetition, and satisfies the first-order equation.

=e (m、に、 1)≦e (m、に、 2)≦・・
・≦e (m、に、J(kl刊)=I(k)−z・・・
・・・11) これによって、第m回目の繰り返しにおける第に番目の
時系列パタンの第j番目の分割区間のフレーム範囲は。
=e (m, ni, 1)≦e (m, ni, 2)≦...
・≦e (m, ni, J (published by kl) = I(k)-z...
...11) As a result, the frame range of the j-th divided section of the th time-series pattern in the m-th repetition is as follows.

e(m、に、j)≦ice (m、に、j +1) (
iはフレーム番号)の様に与えられる。) 以上の準備の下で1次に、各部の動作について説明する
e(m, ni, j)≦ice (m, ni, j +1) (
i is a frame number). ) With the above preparations in place, the operation of each part will be explained.

初期分割部(3)は、ファイル装置(1)中の各ベクト
ルの時系パタンに対して、対応する区間長ラベル列をフ
ァイル装置(2肋)ら読み取って、各分割区間の区間長
が、その区間に付される区間長ラベルの種類によりあら
かじめ決められている重みに比例するように9時系列バ
タンを時間分割し1分割結果をファイル装置(7)に出
力する。ファイル装置+71に出力された初期分割結果
、即ち、第1回目。
The initial dividing unit (3) reads the corresponding interval length label string from the file device (2 ribs) for the time series pattern of each vector in the file device (1), and calculates the interval length of each divided interval as follows. Nine time-series bumps are time-divided in proportion to the weight predetermined according to the type of section length label attached to the section, and one division result is output to the file device (7). The initial division result output to the file device +71, ie, the first division.

(m=1)の繰り返しにおける分割結果。(m=1) division result in repetition.

1(e(z、に、j)、   + ≦j≦J(k)+1
)、   l ≦に≦K)(ただし、1≦j≦J(k)
+ 1 )   ・・・・・・(2)(但し、記号(X
)は9本第2式に限って、Xを超えない最大の整数を表
すものとする。)の様に求められる。(ここで、 W(
Rt(k、j))は。
1(e(z, ni, j), + ≦j≦J(k)+1
), l ≦ to ≦K) (where 1≦j≦J(k)
+ 1) ・・・・・・(2) (However, the symbol (X
) shall represent the largest integer not exceeding X only in the second equation. ) is required. (Here, W(
Rt(k,j)) is.

区間長ラベルRt (k、j )に与えられた重みを表
す。)又、統計部(4)は、初期分割部(3)又は最良
分割部(6)で求められた最新の分割結果を、ファイル
装置(7)から読み取って、ベクトルに関する統計量と
してケプストラム係数の平均及び分散を、又9区間長の
統計量として、その平均及び分散をラベル別に求め、こ
れらラベル別の統計量をファイル装置(5)に格納する
。ここで、これらラベル別の統計量は、第m回目の繰り
返しにおいて9次の様に与えられる。即ち、ベクトルラ
ベル集合の第qs番目のベクトルラベルQs (qs 
)に対するケプストラム係数の平均(以後、 Hs (
m、qs、 n)と記す)及び分散(以後、vS(m、
qS、n)と記す)は、それぞれ。
It represents the weight given to the interval length label Rt (k,j). ) Also, the statistics section (4) reads the latest division results obtained by the initial division section (3) or the best division section (6) from the file device (7), and calculates the cepstral coefficients as statistics regarding the vector. The mean and variance are obtained for each label as statistics for the length of 9 sections, and these statistics for each label are stored in the file device (5). Here, the statistics for each label are given as 9th order in the m-th repetition. That is, the qs-th vector label Qs (qs
) for the average cepstral coefficient (hereinafter Hs (
m, qs, n)) and variance (hereinafter, vS(m,
qS, n) are respectively.

Hs (m、qs、n)= K   J(kl Σ  Σ           ΣC(k、i、n)k
=l j =1. Rs(k、j)=Qs(qs) e
 (m、に、 j)≦i(e(mkj+1)K   J
lkl Σ  Σ   (e(m、に、j+1)−e(m、に、
j))k= + j = t 、Rs(k、j ) =
Qs (qs)(但し、1≦qs≦NQs、0≦n≦1
5 )   −・−+a+及び。
Hs (m, qs, n) = K J (kl Σ Σ ΣC(k, i, n)k
=l j =1. Rs(k,j)=Qs(qs) e
(m, ni, j)≦i(e(mkj+1)K J
lkl Σ Σ (e(m, to, j+1)−e(m, to,
j))k=+j=t,Rs(k,j)=
Qs (qs) (1≦qs≦NQs, 0≦n≦1
5) -・-+a+ and.

Vs (m、qs、 n) = (但し、I≦qs≦NQs、Q≦n≦15)   ・−
−−−−(4)で与えられる。一方1区間長ラベルの集
合の第qt番目の区間長ラベルQt (qt )に対す
る区間長の平均(以後、 Ht (m、qt)と記す)
及び分散(以後、 vt (m、 qt >と記す)は
、それぞれ。
Vs (m, qs, n) = (However, I≦qs≦NQs, Q≦n≦15) ・-
---It is given by (4). On the other hand, the average interval length for the qt-th interval length label Qt (qt) of the set of 1 interval length labels (hereinafter referred to as Ht (m, qt))
and variance (hereinafter referred to as vt (m, qt >), respectively).

Σ   Σ    1 に=l j=+、Rt(k、j)=Qt(qt)(但し
、 1≦qt≦NQt)          ・・・・
・・(5)及び。
Σ Σ 1 = l j = +, Rt (k, j) = Qt (qt) (however, 1≦qt≦NQt) ...
...(5) and.

Vt (m qt ) = Σ   Σ    1 に=1 j=1.Rt (k、 j)= Qt (qt
)(但し、1≦qt≦NQt)          ・
・・・・・(6)で与えられる。
Vt (m qt ) = Σ Σ 1 = 1 j = 1. Rt (k, j) = Qt (qt
) (However, 1≦qt≦NQt) ・
...It is given by (6).

更に、最良分割部(6)は、ファイル装置+11中の各
時系列パタンについて、ファイル装置(2)中の対応す
るラベル列に従って、ファイル装置(5)から読み取っ
たラベル別の統計量を並べ換えることによって型版を構
成し1時系列バタンと型版との間で。
Furthermore, the best dividing unit (6) rearranges the label-specific statistics read from the file device (5) for each time series pattern in the file device +11 according to the corresponding label string in the file device (2). By doing so, a template is constructed between one time series and the template.

動的計画法に基づき整合の尤度を最大化する時の分割状
態を求め、これを最良の分割結果として。
Based on dynamic programming, find the partitioning state that maximizes the likelihood of matching, and use this as the best partitioning result.

ファイル装置(7)に出力する。ここで、第m回目の繰
り返しにおけるラベル別統計量に基づいて求められる。
Output to file device (7). Here, it is determined based on the statistics for each label in the m-th repetition.

最良の整合の尤度(以後、 S ” (m、k)と記す
)は。
The likelihood of the best match (hereafter denoted S ” (m, k)) is:

S ” (m、k ) = の様に定義され、又、この時の最良の分割状態(以後+
  te” (m*kej)+ 1≦j≦Jlkl +
 1 )と記す)は。
S ” (m, k) = , and the best division state at this time (hereinafter +
te” (m*kej)+ 1≦j≦Jlkl+
1) is written as ).

(e ” (m、に、j )、 1≦j≦J(k)+1
)=の様に定義される。ここで、第7式及び第8式中の
S (m、 k )は、第m回目の繰り返しにおいて求
められたラベル別の統計量に基づいて、ある分割状態(
e (m、に、j)、 1≦j≦J(kl−z)に対し
決まる整合の尤度であり、ベクトルラベル列に対する整
合の尤度と1区間長ラベル列に対する整合の尤度の和と
して。
(e ” (m, ni, j), 1≦j≦J(k)+1
)= is defined. Here, S (m, k) in the seventh and eighth equations is calculated based on the statistics for each label obtained in the m-th iteration.
e (m, to, j), is the likelihood of matching determined for 1≦j≦J(kl-z), and is the sum of the likelihood of matching for the vector label string and the likelihood of matching for the 1-interval length label string. As.

S (m、k)= Ls (m、k)+ Lt(m、k
) −Wt (+≦に≦K)・・・・・・(9) の様に定義される。ここで、Wtは区間長ラベル列に対
する整合の尤度に付する重み係数、又。
S (m, k) = Ls (m, k) + Lt (m, k
) −Wt (+≦≦K) (9) Defined as follows. Here, Wt is a weighting coefficient assigned to the likelihood of matching the interval length label string.

Ls (m、k)及びLt (m、t)は、それぞれ、
ベクトルラベル列に対する整合の尤度と1区間長ラベル
列に対する整合の尤度である。
Ls (m, k) and Lt (m, t) are, respectively,
These are the likelihood of matching for a vector label string and the likelihood of matching for a one-section length label string.

ベクトルラベル列に対する整合の尤度は。The likelihood of matching for a vector label sequence is.

Ls (m、k)= j=1.e(m、に、j)p!e (m、に、j+ t
)・・・・・・(1(1 (但し+ Is (e (m、に、j)、e(m、に、
j+1)、qs)は、ベクトルラベル集合の第qs番目
のベクトルラベルQs(qs)  に対する。第j番目
の区間の尤度であり。
Ls (m, k)=j=1. e(m,ni,j)p! e (m, ni, j+ t
)・・・・・・(1(1 (However, + Is (e (m, ni, j), e(m, ni,
j+1), qs) corresponds to the qs-th vector label Qs(qs) of the vector label set. is the likelihood of the jth interval.

ls (e (m、に、j)、e (m 、に、j−)
−1)、qs)=と定義される。) 又1区間長ラベル列に対する整合の尤度は。
ls (e (m, ni, j), e (m, ni, j-)
−1), qs)=. ) Also, the likelihood of matching for a one-section length label string is:

Lt (m、k) = ・・・・・−へ3 (但し、 It (e (m、に、j )、 e (m
、に、 j+1)、 qt)は1区間長ラベル集合の第
qt番目の区間長ラベルQt(qt )に対する。第j
番目の区間の尤度で。
Lt (m, k) = ......-3 (However, It (e (m, to, j), e (m
, j+1), qt) corresponds to the qt-th interval length label Qt (qt) of the one interval length label set. jth
with the likelihood of the interval.

It (x、y、qt)= と表現される。It (x, y, qt) = It is expressed as

さて、第7式及び第8式の区間分割法1e (m、に、
 D。
Now, the interval division method 1e (m, to,
D.

1≦j≦J(kl−Ml に関する最大化は、一種の組
み合せ最適化問題となり、動的計画法の原理に基づいて
9次の漸化式。
The maximization regarding 1≦j≦J(kl−Ml) becomes a kind of combinatorial optimization problem, and is a 9th order recurrence formula based on the principle of dynamic programming.

j=2.a、・・・、J(kl−zについて。j=2. a, ..., J (about kl-z.

かつ、1=23.・・・、 I(k) + +について
And 1=23. ..., about I(k) + +.

Gs (i、j)= Gs (i−ビ、j−+)+1s
(i−?、 i、 Qs−’ (Rs(k、j)))G
t(i、j)=Gt(i−r”、j−1)+1s(i−
τ”、i、Qt  ’(Rt(k、j)))Ns(i、
j)=Ns(i−r”、j−1)+u(i−げ+’)B
(i、j)=i−げ              ・・
・・・・a4(ここに+ Gs (i、j )、 Gt
 (ij)e Ns(i、j)、 B(i、j )は動
的計画法における状態変数で、以下の意味を有する。
Gs (i, j) = Gs (i-bi, j-+) + 1s
(i-?, i, Qs-' (Rs(k,j)))G
t(i,j)=Gt(ir”,j-1)+1s(i-
τ'', i, Qt'(Rt(k,j)))Ns(i,
j)=Ns(i-r", j-1)+u(i-ge+')B
(i, j)=i-ge...
...a4 (here + Gs (i, j), Gt
(ij)e Ns(i, j), B(i, j) are state variables in dynamic programming and have the following meanings.

Gs(i、j): ベクトルラベルに対する整合尤度の
累積値。
Gs(i,j): Cumulative value of matching likelihood for vector labels.

Gt(i、j) : 区間長ラベルに対する整合尤度の
累積値。
Gt(i,j): Cumulative value of matching likelihood for interval length labels.

Ns(i、j):ベクトルラベルに対する整合尤度の累
積回数。
Ns(i,j): cumulative number of matching likelihoods for vector labels.

B(i、j) : ポックポインタ。B(i,j): Pock pointer.

尚。still.

Qs  ’ (Rs) :  Rs=Qs (qs)を
満たすベクトルラベルの番号qsを返す関数。
Qs' (Rs): A function that returns the vector label number qs that satisfies Rs=Qs (qs).

Qt  (Rt)  :  Rt=Qt (qt)を満
たす区間長ラベルの番号qtを返す関係。
Qt (Rt): A relationship that returns the section length label number qt that satisfies Rt=Qt (qt).

1s(x、y、q):ベクトルラベルに対する区間の尤
度(第11式) It (x、y、q) :区間長ラベルに対する区間の
尤度(第13式) u(x、y):次式を満たす関数 である。) を初期条件、即ち。
1s (x, y, q): Likelihood of the interval for the vector label (Equation 11) It (x, y, q): Likelihood of the interval for the interval length label (Equation 13) u(x, y): This is a function that satisfies the following equation. ) as the initial condition, i.e.

Gs(1,j)=O(t≦j≦J fk) + 1)G
t (1,0= o  (+≦j≦J fk) + 1
 )Nt(+、D=o  (+≦j≦J(k)+1)G
s (i、 1) =oo  (2≦゛i≦I(k)+
°+)Gt (i、 1) =閃 (2≦i≦I(k)
+1)Nt(i、1)−1(2≦i≦I(k)+l) 
  ・・・・・−msの下で解き、最良の整合の尤度S
′″(m、 k)を。
Gs(1,j)=O(t≦j≦J fk) + 1)G
t (1,0= o (+≦j≦J fk) + 1
)Nt(+, D=o (+≦j≦J(k)+1)G
s (i, 1) =oo (2≦゛i≦I(k)+
°+)Gt (i, 1) = Flash (2≦i≦I(k)
+1) Nt (i, 1) - 1 (2≦i≦I(k)+l)
Solve under ・・・・・・−ms, the likelihood of the best match S
′″(m, k).

S” (m、k)= Ns (I(k)+ +、 J(k)+ +)    
  J(k)・・・・・・ae と置くことにより解け、又、最良の分割状態。
S” (m, k) = Ns (I(k)+ +, J(k)+ +)
It can be solved by putting J(k)...ae, and it is the best division state.

(e” (m、に、j )+ t≦j≦J(k)+l)
は、バックポインタを逆向きに辿ることにより求められ
る。即ち、まず。
(e” (m, ni, j) + t≦j≦J(k)+l)
is found by tracing the back pointer in the opposite direction. Namely, first.

e”  (m、に、j(k)+t)=I(k)+1  
 −・・−6nと置き1次に。
e” (m, to j(k)+t)=I(k)+1
-...-6n and place 1st order.

j =J(k)、J[kl−+、・・・、 3.2. 
l  について。
j = J(k), J[kl-+,..., 3.2.
About l.

e”(m、に、j)=B(e”(m、に、j+1)、j
+1)  =−・・UFjと置くことによって求められ
る。この結果、即ち。
e”(m, ni, j)=B(e”(m, ni, j+1), j
+1) =-...UFj. This result, ie.

第m+1回目の繰り返しにおける分割結果。The division result at the m+1st iteration.

((e(m+l、に、j)、 1≦j≦J [k)+ 
1 )、 l≦に≦K)は、ファイル装置(7)に、 
e (m+l、に、j)=e” (m。
((e(m+l, ni, j), 1≦j≦J [k)+
1), l≦ and ≦K) in the file device (7),
e (m+l, j)=e” (m.

k、j)  と置いて出力される。k, j) and output.

この様にして求められた。繰の返しの第m+1回目にお
ける分割結果は、再び第m+を回目の繰り返しにおける
ラベル別の統計量を求めるために使われ、この統計量は
、更に1次の第m+2回目の繰り返しにおける最良の分
割結果を求めるためにも使われる。
It was requested in this way. The division result at the m+1st iteration is used again to calculate the statistics for each label at the m+th iteration, and this statistic is further used to determine the best division at the m+2nd iteration of the first order. It is also used to obtain results.

ところで9以上の説明から、最良分割部(6)によって
求められた最新の分割ラベル付けの状態は。
By the way, from the explanation above in 9, what is the state of the latest division labeling determined by the best division unit (6)?

第9式で定義された整合の尤度S(m、k)を最大とす
るものであって、しかも、この第9式の第2項として含
まれる区間長ラベル列に対する整合の尤度、 Lt (
m、k)を考慮したものとなっている。
Maximizes the likelihood of matching S(m, k) defined by the ninth equation, and the likelihood of matching for the interval length label string included as the second term of the ninth equation, Lt (
m, k).

更に、この区間長ラベル列に対する整合の尤度。Furthermore, the likelihood of matching for this interval length label sequence.

Lt(m、k)は、第12式及び第13式の様に区間長
のラベル別の統計量、即ち、その平均(Ht (m、q
t)、 1≦qt≦NQt)、及び分散(Vt (m 
qt)、 1≦qt≦NQt )に基づイテ求められた
ものなので1本実施例によれば9区間長の統計的変動を
捉えたバタン整合が行え、しかも。
Lt (m, k) is the statistic for each label of the interval length as shown in equations 12 and 13, that is, its average (Ht (m, q
t), 1≦qt≦NQt), and variance (Vt (m
qt), and 1≦qt≦NQt). According to this embodiment, it is possible to perform the matching that captures the statistical fluctuations of nine section lengths.

その際用いられる区間長の統計量は、常に最新の分割結
果から求めているため9本実施例は区間長データの真の
分布に近い統計量によってバタン整合を行っていると言
える。
Since the section length statistics used at this time are always obtained from the latest division results, it can be said that this embodiment performs slam matching using statistics close to the true distribution of the section length data.

〔発明の効果〕〔Effect of the invention〕

以上説明した様に、この発明に係る分割ラベル付け装置
では、従来のこの種装置における統計手段に、ベクトル
のラベル別統計量の他に9分割区間の区間長のラベル別
統計量を求める手段を用いると共に、最良分割手段にこ
れらベクトルのラベル別統計量と1分割区間の区間長の
ラベル別統計量に基づき、最良な分割ラベル付けの状態
を求める手段を用いているため、最良分割を求めるため
のバタン整合の際9分割区間長の変動を統計的に捉える
ことが出来、バタン整合の精度が改善され。
As explained above, in the segmented labeling device according to the present invention, in addition to the statistics for each label of vectors, means for obtaining the statistics for each label of the section length of 9 segmented sections are added to the statistical means in conventional devices of this type. In addition, since the best segmentation method uses a means to determine the best segment labeling state based on the label-specific statistics of these vectors and the label-specific statistics of the interval length of one segment, it is possible to obtain the best segmentation. It is possible to statistically capture the fluctuations in the length of the 9-division section during the baton matching, and the accuracy of the baton matching is improved.

その結果1分割ラベル付けの精度が改善されると言う効
果を有する。
As a result, this has the effect of improving the accuracy of one-segment labeling.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、この発明の一実施例による分割ラベ、ル付け
装置の機能ブロック図、第2図は、従来の装置の機能ブ
ロック図である。図において、(1)はベクトルの時系
列パタンを格納するファイル装置。 (21はラベル列を格納するファイル装置、(3)は初
期分割部、(41は統計部、(5)はラベル別の統計量
を格納するファイル装置、(6)は最良分割部、(7)
は分割結果を格納するファイル装置である。 なお1図中同一あるいは相当部分には、同一の符号を付
して示しである。 第1図 7 : コア4ル躾置 第2図 手続補正書(自発)
FIG. 1 is a functional block diagram of a divided labeling apparatus according to an embodiment of the present invention, and FIG. 2 is a functional block diagram of a conventional apparatus. In the figure, (1) is a file device that stores time-series patterns of vectors. (21 is the file device that stores the label string, (3) is the initial division section, (41 is the statistics section, (5) is the file device that stores the statistics for each label, (6) is the best division section, (7 )
is a file device that stores the division results. Note that the same or corresponding parts in FIG. 1 are indicated with the same reference numerals. Figure 1 7: Core 4 Discipline Figure 2 Procedural Amendment (Voluntary)

Claims (2)

【特許請求の範囲】[Claims] (1)ベクトルの時系列パタンを、それと対となるラベ
ル列に従つて分割し、これら分割された区間にこのラベ
ル列の成分ラベルを付ける装置であつて、分割ラベル付
けの初期状態を求める初期分割手段と、最新の分割ラベ
ル付けの状態に従つてラベル別のベクトルの統計量を求
める統計手段と、該統計手段によつて求められるラベル
別のベクトルの統計量に基づいて最良な分割ラベル付け
の状態を求める最良分割手段とを備え、前記初期分割手
段によつて求められる初期の分割状態から出発し、前記
統計手段によつて求められる最新のラベル別のベクトル
の統計量に基づき、前記最良分割手段によつて求められ
る最良な分割ラベル付けの状態を最新の分割ラベル付け
の状態とし直す分割ラベル付け装置において、前記統計
手段を、最新の分割ラベル付けの状態から、ラベル別の
ベクトルの統計量と、ラベル別の分割区間の区間長の統
計量とを求める手段とすると共に、前記最良分割手段を
、これらラベル別のベクトルの統計量と、ラベル別の分
割区間の区間長の統計量とに基づいて、最良な分割ラベ
ル付けの状態を求める手段としたことを特徴とする分割
ラベル付け装置。
(1) A device that divides a time-series pattern of a vector according to a pair of label sequences and labels the components of this label sequence on these divided intervals, and is an initial device for determining the initial state of division labeling. A dividing means, a statistical means for calculating statistics of vectors for each label according to the latest divided labeling state, and optimal dividing labeling based on the statistics of vectors for each label obtained by the statistical means. starting from the initial dividing state determined by the initial dividing means, and determining the best dividing state based on the latest vector statistics for each label determined by the statistical means. In the segmented labeling device, the best segmented labeling state determined by the segmenting means is replaced with the latest segmented labeling state, and the statistical means calculates the statistics of vectors for each label from the latest segmented labeling state. and the statistics of the interval lengths of the division intervals for each label, and the best division means is a means for calculating the statistics of the vectors for each label and the statistics of the interval length of the division intervals for each label. A divided labeling device characterized in that it is a means for determining the best divided labeling state based on the following.
(2)前記ラベル列の成分ラベルは、ベクトルの統計量
を識別するためのラベル成分と、区間長の統計量を識別
するためのラベル成分とからなり、両成分は必ずしも一
致しないことを特徴とする特許請求の範囲第1項記載の
分割ラベル付け装置。
(2) The component labels of the label string consist of a label component for identifying vector statistics and a label component for identifying interval length statistics, and the two components do not necessarily match. A divided labeling apparatus according to claim 1.
JP62251116A 1987-10-05 1987-10-05 Split labeling device Expired - Lifetime JP2629205B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62251116A JP2629205B2 (en) 1987-10-05 1987-10-05 Split labeling device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62251116A JP2629205B2 (en) 1987-10-05 1987-10-05 Split labeling device

Publications (2)

Publication Number Publication Date
JPH0193798A true JPH0193798A (en) 1989-04-12
JP2629205B2 JP2629205B2 (en) 1997-07-09

Family

ID=17217892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62251116A Expired - Lifetime JP2629205B2 (en) 1987-10-05 1987-10-05 Split labeling device

Country Status (1)

Country Link
JP (1) JP2629205B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440734U (en) * 1990-08-03 1992-04-07
JP2007096217A (en) * 2005-09-30 2007-04-12 Toppan Printing Co Ltd Electromagnetic wave shielding plate, its production process, and display

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440734U (en) * 1990-08-03 1992-04-07
JP2007096217A (en) * 2005-09-30 2007-04-12 Toppan Printing Co Ltd Electromagnetic wave shielding plate, its production process, and display

Also Published As

Publication number Publication date
JP2629205B2 (en) 1997-07-09

Similar Documents

Publication Publication Date Title
Mroueh et al. Fisher gan
Dam et al. A deep language model for software code
Wu et al. Session-based recommendation with graph neural networks
US11468262B2 (en) Deep network embedding with adversarial regularization
Kar et al. Online optimization methods for the quantification problem
Gish et al. Parametric trajectory models for speech recognition
CN110147551A (en) Multi-class entity recognition model training, entity recognition method, server and terminal
CN103617435B (en) Image sorting method and system for active learning
CN111368920A (en) Quantum twin neural network-based binary classification method and face recognition method thereof
CN108090520A (en) Training method, system, device and the readable storage medium storing program for executing of intention assessment model
CN108228684A (en) Training method, device, electronic equipment and the computer storage media of Clustering Model
US20200395036A1 (en) Sound signal model learning device, sound signal analysis device, method and program
CN108960430A (en) The method and apparatus for generating personalized classifier for human body motor activity
CN112420125A (en) Molecular attribute prediction method and device, intelligent equipment and terminal
Xu et al. An alternating direction and projection algorithm for structure-enforced matrix factorization
Ke et al. A multivariate grey incidence model for different scale data based on spatial pyramid pooling
Kim et al. Recovery of stimuli encoded with a Hodgkin–Huxley neuron using conditional PRCs
CN109791627A (en) Using input pretreatment and switch target for training the semiconductor devices of deep neural network to model
JPH0193798A (en) Division labelling apparatus
CN115098722B (en) Text and image matching method and device, electronic equipment and storage medium
CN106802866A (en) A kind of restoring method of the execution route of Android program
Chen et al. A distance for HMMS based on aggregated Wasserstein metric and state registration
CN109947945A (en) Word-based vector sum integrates the textstream classification method of SVM
Marconato et al. Dynamic compensation of nonlinear sensors by a learning-from-examples approach
CN113987188B (en) Short text classification method and device and electronic equipment

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 11