JP4536445B2 - Data classification device - Google Patents

Data classification device Download PDF

Info

Publication number
JP4536445B2
JP4536445B2 JP2004217580A JP2004217580A JP4536445B2 JP 4536445 B2 JP4536445 B2 JP 4536445B2 JP 2004217580 A JP2004217580 A JP 2004217580A JP 2004217580 A JP2004217580 A JP 2004217580A JP 4536445 B2 JP4536445 B2 JP 4536445B2
Authority
JP
Japan
Prior art keywords
determination
type
attribute
pairwise
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004217580A
Other languages
Japanese (ja)
Other versions
JP2006039862A (en
Inventor
秀俊 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004217580A priority Critical patent/JP4536445B2/en
Publication of JP2006039862A publication Critical patent/JP2006039862A/en
Application granted granted Critical
Publication of JP4536445B2 publication Critical patent/JP4536445B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、観測データを類別するデータ類別装置に関するものである。   The present invention relates to a data classification device for classifying observation data.

従来のデータ類別装置は、類別対象の観測データを受信すると、その観測データから属性値を取得して特徴量ベクトルを生成し、その特徴量ベクトルを用いて、種類対毎にペアワイズ判定を実施する。
そして、種類対毎のペアワイズ判定結果からメンバーシップ関数を生成し、そのメンバーシップ関数のファジイ論理積を実施することにより、その観測データを類別する(例えば、非特許文献1参照)。
When the conventional data classification device receives the observation data to be classified, it acquires an attribute value from the observation data, generates a feature vector, and performs pairwise determination for each type pair using the feature vector .
Then, a membership function is generated from the pairwise determination result for each type pair, and the observation data is classified by performing fuzzy logical product of the membership function (see, for example, Non-Patent Document 1).

Inoue,T. and Abe,S.,“Fuzzy Support Vector Machines for Pattern Classification,” Proc.Int.Joint Conf.on Neural Networks,pp.1449−1454,(Jul.2001).Inoue, T .; and Abe, S .; , “Fuzzy Support Vector Machines for Pattern Classification,” Proc. Int. Joint Conf. on Neural Networks, pp. 1449-1454 (Jul. 2001).

従来のデータ類別装置は以上のように構成されているので、例えば、種類対毎のペアワイズ判定結果が三竦みの状態になると、メンバーシップ関数のファジイ論理積を実施するに際して、いずれかのペアワイズ判定結果が無視される。そのため、観測データの類別精度が劣化することがある課題があった。   Since the conventional data classification device is configured as described above, for example, when the pairwise judgment result for each type pair is in a trivial state, when performing the fuzzy logical product of the membership function, any pairwise The judgment result is ignored. For this reason, there is a problem that the classification accuracy of the observation data may deteriorate.

この発明は上記のような課題を解決するためになされたもので、種類対毎のペアワイズ判定結果の状態に拘わらず、常に観測データを正確に類別することができるデータ類別装置を得ることを目的とする。   The present invention has been made to solve the above-described problems, and an object thereof is to obtain a data classification device that can always correctly classify observation data regardless of the state of the pairwise determination result for each type pair. And

この発明に係るデータ類別装置は、種類対が相互に異なるペアワイズ判定用の判定器レコードを複数個有し、種類対毎に当該判定器レコードの特徴量ベクトルと特徴量ベクトル生成手段により生成された特徴量ベクトルからペアワイズ判定を実施するペアワイズ判定手段を設け、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求めるようにしたものである。
また、ペアワイズ判定結果を種類対における当該種類の帰属値と乖離値で表す場合、ペアワイズ判定手段が、当該種類の帰属値と乖離値を数値化する関数に、当該判定器レコードの特徴量ベクトルと特徴量ベクトル生成手段により生成された特徴量ベクトルを代入することで、当該種類の帰属値と乖離値を計算し、属性判定手段が、種類対毎のペアワイズ判定結果から当該種類の乖離値を取り出し、観測データが当該種類に属する可能性を示す判定属性として、当該種類の乖離値の総和を求めるようにしたものである。
The data classification device according to the present invention includes a plurality of pairwise determination classifier records having different type pairs, and is generated for each type pair by the feature quantity vector and feature quantity vector generation means of the classifier record. A pairwise determination means for performing pairwise determination from a feature vector is provided, and a determination attribute indicating the possibility that observation data belongs to each type is obtained from the pairwise determination result for each type pair.
Further, when the pairwise determination result is represented by the belonging value and the divergence value of the type in the pair of types, the pairwise determining means converts the feature value vector of the determining device record into a function that digitizes the belonging value and the divergence value of the type. By substituting the feature vector generated by the feature vector generator, the attribution value and divergence value of the type are calculated, and the attribute determination unit extracts the divergence value of the type from the pairwise determination result for each type pair. As a determination attribute indicating the possibility that the observation data belongs to the type, the sum of the deviation values of the type is obtained.

この発明によれば、種類対が相互に異なるペアワイズ判定用の判定器レコードを複数個有し、種類対毎に当該判定器レコードの特徴量ベクトルと特徴量ベクトル生成手段により生成された特徴量ベクトルからペアワイズ判定を実施するペアワイズ判定手段を設け、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求めるように構成したので、種類対毎のペアワイズ判定結果の状態に拘わらず、常に観測データを正確に類別することができる効果がある。
また、ペアワイズ判定結果を種類対における当該種類の帰属値と乖離値で表す場合、ペアワイズ判定手段が、当該種類の帰属値と乖離値を数値化する関数に、当該判定器レコードの特徴量ベクトルと特徴量ベクトル生成手段により生成された特徴量ベクトルを代入することで、当該種類の帰属値と乖離値を計算し、属性判定手段が、種類対毎のペアワイズ判定結果から当該種類の乖離値を取り出し、観測データが当該種類に属する可能性を示す判定属性として、当該種類の乖離値の総和を求めるように構成したので、客観性のあるペアワイズ判定結果が得られるとともに、全てのペアワイズ判定結果を考慮した判定属性が得られる効果がある。
According to the present invention, there are a plurality of pairwise decision-making discriminator records with different type pairs, and the feature vector of the discriminator record and the feature vector generated by the feature vector generation unit for each type pair. Is provided with a pairwise determination means that performs pairwise determination from the pairwise, and is configured to obtain a determination attribute indicating the possibility that observation data belongs to each type from the pairwise determination result for each type pair, so the state of the pairwise determination result for each type pair Regardless of this, there is an effect that observation data can always be classified accurately.
Further, when the pairwise determination result is represented by the belonging value and the divergence value of the type in the pair of types, the pairwise determining means converts the feature value vector of the determining device record into a function that digitizes the belonging value and the divergence value of the type. By substituting the feature vector generated by the feature vector generator, the attribution value and divergence value of the type are calculated, and the attribute determination unit extracts the divergence value of the type from the pairwise determination result for each type pair. Since the configuration is such that the sum of the divergence values of the type is obtained as a determination attribute indicating the possibility that the observation data belongs to the type, an objective pair-wise determination result is obtained, and all the pair-wise determination results are considered. This has the effect of obtaining the determined attribute.

実施の形態1.
図1はこの発明の実施の形態1によるデータ類別装置を示す構成図であり、図において、整形部1は類別対象の観測データを受信すると、その観測データから属性値を抽出して、1以上の属性値からなる特徴量ベクトルxを生成し、その特徴量ベクトルxを含む観測レコードを観測DB部2に出力する。なお、整形部1は特徴量ベクトル生成手段を構成している。
観測DB部2は整形部1により生成された特徴量ベクトルxを含む観測レコードを観測DB3に格納するとともに、その観測レコードに含まれている観測タグと特徴量ベクトルxを判定器DB部5に出力し、また、判定部6から判定属性を受けると、その判定属性に応じて観測データの類別結果を提示する。
観測DB3は特徴量ベクトルxを含む観測レコードを格納する。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing a data classification apparatus according to Embodiment 1 of the present invention. In FIG. 1, when the shaping unit 1 receives observation data to be classified, it extracts attribute values from the observation data and outputs one or more Is generated, and an observation record including the feature vector x is output to the observation DB unit 2. The shaping unit 1 constitutes feature quantity vector generation means.
The observation DB unit 2 stores an observation record including the feature vector x generated by the shaping unit 1 in the observation DB 3, and stores the observation tag and the feature vector x included in the observation record in the determiner DB unit 5. When a determination attribute is received from the determination unit 6, the observation data classification result is presented according to the determination attribute.
The observation DB 3 stores an observation record including the feature vector x.

判定器DB4は種類対が相互に異なるペアワイズ判定用の判定器レコードを複数個格納している。
判定器DB部5は判定器DB4から「無効フラグ」が有効である種類対毎の判定器レコードを取得し、種類対毎に当該判定器レコードの特徴量ベクトルs〜sと整形部1により生成された特徴量ベクトルxからペアワイズ判定を実施する。なお、判定器DB4及び判定器DB部5からペアワイズ判定手段が構成されている。
判定部6は判定器DB部5による種類対毎のペアワイズ判定結果を取得し、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求める。なお、判定部6は属性判定手段を構成している。
図2はこの発明の実施の形態1によるデータ類別装置の処理内容を示すフローチャートである。
The determinator DB 4 stores a plurality of determinator records for pair-wise determination with different type pairs.
Determiner DB unit 5 determiner DB4 "invalid flag" acquires a determination unit records for each type pairs are valid from the judgment unit record feature vectors s 1 ~s n and shaping unit 1 of each type pairs The pairwise determination is performed from the feature vector x generated by the above. The determiner DB4 and the determiner DB unit 5 constitute a pairwise determination means.
The determination unit 6 acquires a pairwise determination result for each type pair by the determiner DB unit 5, and obtains a determination attribute indicating the possibility that the observation data belongs to each type from the pairwise determination result for each type pair. The determination unit 6 constitutes attribute determination means.
FIG. 2 is a flowchart showing the processing contents of the data classification device according to Embodiment 1 of the present invention.

次に動作について説明する。
類別対象の観測データは複数の属性値から構成されており、その属性値には、例えば、レーダ強度などが数値化されている数値属性のほか、天気が晴れや曇り、あるいは、気圧が○○hPaなどのカテゴリを示すカテゴリ属性がある。
整形部1は、類別対象の観測データを受信すると、その観測データから属性値を抽出する(ステップST1)。
Next, the operation will be described.
The observation data to be classified is composed of multiple attribute values. For example, the attribute values are numerical attributes such as radar intensity, weather is fine or cloudy, or atmospheric pressure is XX There is a category attribute indicating a category such as hPa.
When receiving the observation data to be classified, the shaping unit 1 extracts an attribute value from the observation data (step ST1).

即ち、整形部1は、類別対象の観測データに含まれている属性値が所定の数値属性であれば、その属性値を単純に抽出するだけであるが、その属性値がカテゴリ属性であれば、そのカテゴリ属性を抽出してから、例えばN次元空間数量化四類などの数値化ルールにしたがってカテゴリ属性を数値化する。例えば、晴れ→1、曇り→0.5、雨→0のように、カテゴリ属性を数値化する。
整形部1は、上記のようにして、複数の属性値zを抽出すると、複数の属性値zからなる特徴量ベクトルxを生成する(ステップST2)。
x=z,z,z,・・・,z,・・・,z (1)
m=1〜Mの整数
That is, the shaping unit 1 simply extracts the attribute value if the attribute value included in the observation data to be classified is a predetermined numeric attribute, but if the attribute value is a category attribute, Then, after extracting the category attribute, the category attribute is quantified according to a quantification rule such as N-dimensional space quantification type IV. For example, the category attributes are digitized such as clear → 1, cloudy → 0.5, rain → 0.
When the shaping unit 1 extracts a plurality of attribute values z m as described above, the shaping unit 1 generates a feature quantity vector x including the plurality of attribute values z m (step ST2).
x = z 1, z 2, z 3, ···, z m, ···, z M (1)
m = integer from 1 to M

整形部1は、複数の属性値zからなる特徴量ベクトルxを生成すると、図3に示すような観測レコードに特徴量ベクトルxを格納するとともに、その観測レコードを識別するユニークな観測タグを付加する。
また、整形部1は、観測データの中に、特徴量ベクトルxに含まれない数値属性やカテゴリ属性が存在する場合、その数値属性やカテゴリ属性を説明属性として観測レコードに格納する。
この段階では、観測レコードの判定属性は不定でよく、後段の観測DB部2が判定属性を観測レコードに格納する。
整形部1は、図3の観測レコードを観測DB部2に出力する。
When the shaping unit 1 generates a feature vector x consisting of a plurality of attribute values z m , the shaping unit 1 stores the feature vector x in an observation record as shown in FIG. 3 and a unique observation tag for identifying the observation record. Append.
In addition, when the observation data includes a numerical attribute or category attribute that is not included in the feature vector x, the shaping unit 1 stores the numerical attribute or category attribute as an explanatory attribute in the observation record.
At this stage, the determination attribute of the observation record may be indefinite, and the observation DB unit 2 in the subsequent stage stores the determination attribute in the observation record.
The shaping unit 1 outputs the observation record in FIG. 3 to the observation DB unit 2.

観測DB部2は、整形部1から観測タグや特徴量ベクトルxなどが含まれている観測レコードを受けると、その観測タグをキーにして、その観測レコードを観測DB3に格納するとともに、その観測レコードに含まれている観測タグと特徴量ベクトルxを判定器DB部5に出力する。   When the observation DB unit 2 receives an observation record including an observation tag, a feature vector x and the like from the shaping unit 1, the observation DB unit 2 stores the observation record in the observation DB 3 using the observation tag as a key and the observation record. The observation tag and the feature vector x included in the record are output to the determiner DB unit 5.

判定器DB4は、観測データの類別用に作成された複数の判定器を判定器レコードの形式で格納している。
ここで、判定器とは、特徴量ベクトルの張る特徴量空間において、多数ある種類の中から2つの種類に着目し、2つの種類の間の境界面と帰属種類を関数で表現するものである。
種類の数がN個であれば、N個の中から2個選択する組み合せの数だけ、判定器が用意されていることになる。
The determiner DB 4 stores a plurality of determiners created for categorizing observation data in the format of determiner records.
Here, the determiner focuses on two types from among a large number of types in the feature amount space spanned by the feature amount vector, and expresses the boundary surface and the attribution type between the two types as a function. .
If the number of types is N, there are as many determiners as the number of combinations selected from the N.

上記の関数は、その値が“0”であれば、2つの種類の境界面を表現し、その値が正値であれば、2つの種類のうちの一方の種類(以下、正種類という)を表現し、その値が負値であれば、2つの種類のうちの他方の種類(以下、負種類という)を表現するものである。
このような関数としては、サポートベクターマシン(以下、SVMという)の関数が代表的である。
If the value is “0”, the above function represents two types of boundary surfaces, and if the value is a positive value, one of the two types (hereinafter referred to as a positive type). If the value is a negative value, the other of the two types (hereinafter referred to as the negative type) is expressed.
As such a function, a function of a support vector machine (hereinafter referred to as SVM) is representative.

図4は判定器レコードの構成例を示す説明図である。
判定器レコードは、正種類、負種類、距離属性、性能、無効フラグ(使用属性)、複数の係数及び複数の特徴量ベクトルの組から構成されている。
ここで、「距離属性」は、SVMのカーネル(距離の決定方法に関わる関数)の選択を表現するものであり、カーネルの種類を示すカテゴリ属性と、カーネル毎に必要なパラメータとから構成されている。
カーネルの種類を示すカテゴリ属性の取る値としては、例えば、線形、多項式、RBFがある。
FIG. 4 is an explanatory diagram showing a configuration example of a determiner record.
The determiner record is composed of a set of positive type, negative type, distance attribute, performance, invalid flag (use attribute), a plurality of coefficients, and a plurality of feature quantity vectors.
Here, the “distance attribute” expresses the selection of the SVM kernel (function related to the distance determination method), and is composed of a category attribute indicating the type of the kernel and a parameter required for each kernel. Yes.
Examples of the value of the category attribute indicating the kernel type include linear, polynomial, and RBF.

線形カーネルのパラメータは、ソフトマージン用のスラック係数であり、その数は標本全体で共通にして1つにすることもできるし、標本毎に決めることもできる。あるいは、距離属性には記録せずにパラメータなしでもよい。
多項式カーネルのパラメータは、線形カーネルのパラメータに加えて、次数のパラメータが1つ加わる。
RBFカーネルのパラメータは、線形カーネルのパラメータに加えて、距離の規準に相当するパラメータが1つ加わる。
The parameter of the linear kernel is a slack coefficient for the soft margin, and the number thereof can be made common to all the samples, or can be determined for each sample. Alternatively, the parameter may not be recorded without being recorded in the distance attribute.
The parameter of the polynomial kernel is added with one order parameter in addition to the parameters of the linear kernel.
In addition to the linear kernel parameters, one parameter corresponding to the distance criterion is added to the RBF kernel parameters.

「性能」は、判定器の性能を表現するものであり、例えば、学習に用いた標本の自己識別成功率などを格納している。これにより、同じ種類対について、距離属性や特徴量ベクトルが異なる複数の判定器を格納し、類別する際に最高性能の判定器を1つ選択して使用することができる。
「無効フラグ」は、初期値・有効・無効のうちのいずれかによって、その判定器の使用の可否を表現するものである。ユーザがある種類を考慮しないで類別を行うことを希望する場合に、無効フラグを無効にすれば、判定器を実際に削除せずに、観測データの類別結果や判定属性の修正が可能となる。
“Performance” expresses the performance of the determiner, and stores, for example, the self-identification success rate of the sample used for learning. Thereby, a plurality of determiners having different distance attributes and feature quantity vectors can be stored for the same type pair, and one of the highest performance determiners can be selected and used for classification.
The “invalid flag” represents whether or not the determiner can be used by any one of an initial value, valid and invalid. If the user wishes to perform classification without considering a certain type, disabling the invalid flag makes it possible to correct the classification result and determination attributes of observation data without actually deleting the determiner. .

判定器DB部5は、上記のようにして、観測DB部2から観測レコードに含まれている観測タグと特徴量ベクトルxを受けると、判定器DB4から「無効フラグ」が有効である種類対毎の判定器レコードを取得する(ステップST3)。
例えば、観測データを「旅客機」、「戦闘機」、「ミサイル」のいずれかの種類に類別する場合、判定器DB4から種類対(正種類、負種類)が(旅客機、戦闘機)、(旅客機、ミサイル)、(戦闘機、ミサイル)であるような判定器レコードを検索して取得する。
このとき、種類対(正種類、負種類)が(旅客機、戦闘機)の判定器レコードが判定器DB4に格納されていないが、種類対(正種類、負種類)が(戦闘機、旅客機)の判定器レコードが判定器DB4に格納されている場合、その判定器レコードが保有する係数値の正負をすべて反転し、その判定器レコードを(旅客機、戦闘機)の判定器レコードとして見なすものとする。
When the determiner DB unit 5 receives the observation tag and the feature vector x included in the observation record from the observation DB unit 2 as described above, the type pair for which the “invalid flag” is valid from the determiner DB4. Each discriminator record is acquired (step ST3).
For example, when observing data is classified into “passenger aircraft”, “fighter aircraft”, or “missile” types, the type pair (positive type, negative type) is (passenger aircraft, fighter aircraft), (passenger aircraft) from the judgment device DB4. , Missiles), (fighters, missiles).
At this time, the discriminator record whose type pair (positive type, negative type) is (passenger aircraft, fighter) is not stored in the discriminator DB4, but the type pair (positive type, negative type) is (fighter, passenger aircraft). If the discriminator record is stored in the discriminator DB4, the sign of the coefficient value held by the discriminator record is reversed, and the discriminator record is regarded as a (passenger aircraft, fighter) discriminator record. To do.

判定器DB部5は、判定器DB4から種類対毎の判定器レコードを取得すると、種類対毎に当該判定器レコードの特徴量ベクトルs〜sと整形部1により生成された特徴量ベクトルxからペアワイズ判定を実施する(ステップST4)。
即ち、判定器DB部5は、図5に示すように、ペアワイズ判定結果を示すペアワイズ判定レコードを正種類の帰属値(観測データが正種類である可能性を示す数値であり、その数値が大きい程、正種類である可能性が高い)と、負種類の帰属値(=正種類の乖離値:観測データが正種類でない可能性を示す数値であり、その数値が大きい程、正種類でない可能性が高い)で表す場合、正種類の帰属値と、負種類の帰属値(正種類の乖離値)を以下のように計算する。
Determiner DB unit 5, the determiner acquires the determiner records for each type pairs from DB4, each kind pair and feature vector s 1 ~s n of the determination unit records the feature quantity vectors generated by the shaping unit 1 Pairwise determination is performed from x (step ST4).
That is, as shown in FIG. 5, the determiner DB unit 5 sets the pairwise determination record indicating the pairwise determination result to a positive type attribute value (a numerical value indicating the possibility that the observation data is a positive type, and the numerical value is large). It is more likely that it is a positive type) and an assigned value of a negative type (= divergence value of a positive type: a numerical value indicating the possibility that observation data is not a positive type. In the case of a high-level), a positive-type attribute value and a negative-type attribute value (positive-type divergence value) are calculated as follows.

判定器DB部5は、各判定器レコードからそれぞれ特徴量ベクトルであるn個のs〜sと、係数であるn個のa〜aと、カーネル関数であるKを取得する。
この場合、SVM関数R(x)は、次式で表される。
R(x)=ΣaK(s,x) (2)
ただし、Σはi=1〜nの総和を表すものとする。
Determiner DB unit 5 acquires the n number of s 1 ~s n is a feature amount vector, respectively, and n pieces of a 1 ~a n is a coefficient, and K is a kernel function from the determiner record.
In this case, the SVM function R (x) is expressed by the following equation.
R (x) = Σa i K (s i , x) (2)
Here, Σ represents the sum of i = 1 to n.

判定器DB部5は、SVM関数R(x)の計算結果に応じて、次のように正種類の帰属値と、負種類の帰属値(正種類の乖離値)を決定する。
R(x)<0 → 正種類の帰属値=0
0≦R(x)≦1 → 正種類の帰属値=R(x)
R(x)>1 → 正種類の帰属値=1
R(x)<−1 → 負種類の帰属値=1
−1≦R(x)≦0 → 負種類の帰属値=−R(x)
R(x)>0 → 負種類の帰属値=0
The determiner DB unit 5 determines a positive type attribute value and a negative type attribute value (positive type divergence value) as follows according to the calculation result of the SVM function R (x).
R (x) <0 → positive kind attribute value = 0
0 ≦ R (x) ≦ 1 → Positive kind attribute value = R (x)
R (x)> 1 → positive kind attribute value = 1
R (x) <− 1 → negative type attribution value = 1
−1 ≦ R (x) ≦ 0 → negative type attribution value = −R (x)
R (x)> 0 → negative kind attribute value = 0

なお、カーネル関数Kは、判定器レコードの距離属性におけるカーネル種類が線形である場合、標本と特徴量ベクトルの内積、即ち、R(x)=Σaxという式で表される。
また、距離属性におけるカーネル種類が多項式である場合、次数のパラメータdを用いて、R(x)=Σa(1+sx)という式で表される。
また、距離属性におけるカーネル種類がRBFである場合、標本からの距離の規準に相当するパラメータrを用いて、R(x)=Σaexp[−||s−x||/2r]という式で表される。
When the kernel type in the distance attribute of the discriminator record is linear, the kernel function K is expressed by the inner product of the sample and the feature vector, that is, R (x) = Σa i s i x.
Further, when the kernel type in the distance attribute is a polynomial, it is expressed by the equation R (x) = Σa i (1 + s i x) d using the order parameter d.
Also, if the kernel type at a distance attribute is RBF, using parameter r corresponding to the reference distance from the specimen, R (x) = Σa i exp [- || s i -x || 2 / 2r 2 ].

判定部6は、判定器DB部5から種類対毎のペアワイズ判定結果であるペアワイズ判定レコードを取得すると、種類対毎のペアワイズ判定レコードから観測データが各種類に属する可能性を示す判定属性を求める(ステップST5)。
具体的には、次のようにして判定属性を求める。
When the determination unit 6 acquires a pairwise determination record that is a pairwise determination result for each type pair from the determiner DB unit 5, the determination unit 6 obtains a determination attribute indicating the possibility that observation data belongs to each type from the pairwise determination record for each type pair. (Step ST5).
Specifically, the determination attribute is obtained as follows.

判定部6は、例えば、判定器DB部5から以下に示すような3個のペアワイズ判定レコードが出力されたものとする。
・種類対(正種類、負種類)→(A、B)
正種類の帰属値=0.5 負種類の帰属値=0
・種類対(正種類、負種類)→(B、C)
正種類の帰属値=0 負種類の帰属値=0.3
・種類対(正種類、負種類)→(C、A)
正種類の帰属値=0 負種類の帰属値=0.6
For example, the determination unit 6 is assumed to output three pairwise determination records as shown below from the determiner DB unit 5.
・ Type pair (positive type, negative type) → (A, B)
Positive attribute value = 0.5 Negative attribute value = 0
・ Type pair (positive type, negative type) → (B, C)
Positive attribution value = 0 Negative attribution value = 0.3
・ Type pair (positive type, negative type) → (C, A)
Positive attribution value = 0 Negative attribution value = 0.6

この場合、判定部6は、3個のペアワイズ判定レコードから種類Aの乖離値を取り出し(種類Aが正種類であれば負種類の帰属値を取り出し、種類Aが負種類であれば正種類の帰属値を取り出す)、種類Aの乖離値の総和Tを求める。
=0+0=0
また、3個のペアワイズ判定レコードから種類Bの乖離値を取り出し(種類Bが正種類であれば負種類の帰属値を取り出し、種類Bが負種類であれば正種類の帰属値を取り出す)、種類Bの乖離値の総和Tを求める。
=0.5+0.3=0.8
また、3個のペアワイズ判定レコードから種類Cの乖離値を取り出し(種類Cが正種類であれば負種類の帰属値を取り出し、種類Cが負種類であれば正種類の帰属値を取り出す)、種類Cの乖離値の総和Tを求める。
=0+0.6=0.6
In this case, the determination unit 6 extracts the divergence value of the type A from the three pairwise determination records (if the type A is a positive type, the negative type belonging value is extracted, and if the type A is a negative type, the positive type retrieve the membership value), obtaining the sum T a of divergence values of type a.
T A = 0 + 0 = 0
Further, the type B divergence value is extracted from the three pairwise determination records (if the type B is a positive type, a negative type attribution value is extracted, and if the type B is a negative type, a positive type attribution value is extracted), obtaining the sum T B of divergence values of type B.
T B = 0.5 + 0.3 = 0.8
Also, the type C divergence value is extracted from the three pairwise determination records (if the type C is a positive type, a negative type attribution value is extracted, and if the type C is a negative type, a positive type attribution value is extracted), obtaining the sum T C of divergence values of type C.
T C = 0 + 0.6 = 0.6

判定部6は、上記のようにして、種類A,B,Cの乖離値の総和T,T,Tを求めると、その総和T,T,Tを判定属性として観測DB部2に出力する。 When the determination unit 6 obtains the sum T A , T B , and T C of the divergence values of the types A, B, and C as described above, the observation DB uses the total T A , T B , and T C as determination attributes. Output to part 2.

観測DB部2は、判定部6から判定属性である総和T,T,Tを受けると、その判定属性に付加されている観測タグをキーにして、観測DB3に格納されている観測レコードを取り出し、その観測レコードに判定属性である総和T,T,Tを格納する。
また、観測DB部2は、判定属性である総和T,T,Tを相互に比較し、最も数値が小さい総和を特定する。
観測DB部2は、上記の例では総和Tの数値が最も小さいので、観測データが種類Aに属していることを示す類別結果を例えば表示器に表示することにより、その類別結果をユーザに提示する(ステップST6)。
When the observation DB unit 2 receives the totals T A , T B , and T C that are determination attributes from the determination unit 6, the observation DB unit 2 uses the observation tag added to the determination attributes as a key, and stores the observations stored in the observation DB 3 The record is extracted, and the sums T A , T B , and T C that are determination attributes are stored in the observation record.
Also, the observation DB unit 2, the sum T A is determined attribute, T B, compared to each other T C, to identify the most numerically lower sum.
Observation DB unit 2, since the smallest value of the sum T A in the above example, by the observation data to display the classification result indicating that it belongs to the type A for example on the display unit, the user and the classification results Present (step ST6).

以上のように、この実施の形態1によれば、種類対毎に当該判定器レコードの特徴量ベクトルs〜sと整形部1により生成された特徴量ベクトルxからペアワイズ判定を実施する判定器DB部5を設け、種類対毎のペアワイズ判定レコードから観測データが各種類に属する可能性を示す判定属性を求めるように構成したので、種類対毎のペアワイズ判定結果の状態に拘わらず、常に観測データを正確に類別することができる効果を奏する。 As described above, according to the first embodiment, the determination to implement the pairwise determination from the feature vectors s 1 ~s n and feature vector x generated by the shaping unit 1 of the determination unit records for each type pairs Since the device DB unit 5 is provided and the determination attribute indicating the possibility that the observation data belongs to each type is obtained from the pairwise determination record for each type pair, it is always determined regardless of the state of the pairwise determination result for each type pair. There is an effect that observation data can be classified accurately.

また、この実施の形態1によれば、正種類の帰属値と負種類の帰属値(正種類の乖離値)を数値化する関数に、判定器レコードの特徴量ベクトルs〜sと整形部1により生成された特徴量ベクトルxを代入するように構成したので、客観性のあるペアワイズ判定結果が得られる効果を奏する。 Further, according to the first embodiment, the positive type of membership values and negative types of membership value (positive type divergence value) function to quantify, the feature vector s 1 ~s n decision unit records shaping Since the feature vector x generated by the unit 1 is substituted, there is an effect that an objective pairwise determination result can be obtained.

さらに、この実施の形態1によれば、種類対毎のペアワイズ判定レコードから当該種類の乖離値を取り出し、当該種類の乖離値の総和を求めるように構成したので、全てのペアワイズ判定結果を考慮した判定属性が得られる効果を奏する。   Furthermore, according to this Embodiment 1, since it comprised so that the deviation value of the said type might be taken out from the pairwise determination record for every kind pair, and the sum total of the deviation value of the said type might be calculated | required, all the pairwise determination results were considered. There is an effect that the determination attribute is obtained.

実施の形態2.
上記実施の形態1では、判定器DB部5が判定器DB4に格納されている種類対毎の判定器レコードを取得するものについて示したが、判定器DB4に種類対が同一の判定器レコードが複数個格納されている場合、判定器レコードに記述されている「性能」を相互に比較し、最も性能が高い判定器レコードを1つ選択するようにしてもよい。
ここでは、「性能」を相互に比較して判定器レコードを選択しているが、「性能」以外のパラメータを基準にして判定器レコードを選択するようにしてもよいことは言うまでもない。
Embodiment 2. FIG.
In Embodiment 1 described above, the determiner DB unit 5 has shown the one that acquires the determiner record for each type pair stored in the determiner DB4. However, the determiner DB4 has a determiner record having the same type pair. When a plurality of items are stored, the “performance” described in the determiner record may be compared with each other to select one determiner record with the highest performance.
Here, the “performance” is compared with each other to select the determiner record, but it goes without saying that the determiner record may be selected based on parameters other than “performance”.

この実施の形態2によれば、同じ種類対について、距離属性や特徴量ベクトルが異なる複数の判定器レコードを判定器DB4に格納することができるので、判定器レコードを改善する際の改善履歴を判定器DB4に記録することができる効果を奏する。
また、観測データを類別する際に適正な判定器レコードを選択してペアワイズ判定を実施することができるようになり、ペアワイズの判定精度を高めることができる効果を奏する。
According to the second embodiment, since a plurality of determiner records having different distance attributes and feature quantity vectors can be stored in the determiner DB 4 for the same type pair, an improvement history when improving the determiner record is obtained. The effect which can be recorded on determination device DB4 is produced.
Further, when classifying the observation data, it becomes possible to select an appropriate discriminator record and perform pairwise determination, and the effect of improving the accuracy of pairwise determination is achieved.

実施の形態3.
図6はこの発明の実施の形態3によるデータ類別装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
使用属性設定部11は判定器DB4に格納されている判定器レコードの使用属性である「無効フラグ」の設定を受け付け、例えば、判定器レコードの「無効フラグ」を有効から無効、あるいは、無効から有効に変更する。なお、使用属性設定部11はペアワイズ判定手段を構成している。
Embodiment 3 FIG.
FIG. 6 is a block diagram showing a data classification apparatus according to Embodiment 3 of the present invention. In the figure, the same reference numerals as those in FIG.
The use attribute setting unit 11 accepts the setting of the “invalid flag” that is the use attribute of the determiner record stored in the determiner DB4. For example, the “invalid flag” of the determiner record is set from valid to invalid, or from invalid Change to enabled. The use attribute setting unit 11 constitutes a pairwise determination unit.

判定部12は図1の判定部6と同様に、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求めるが、その判定属性を求めた後に、任意の判定器レコードの「無効フラグ」が有効から無効に変更された場合、その判定器レコードに係るペアワイズ判定結果を除外して判定属性を再度求める一方、任意の判定器レコードの「無効フラグ」が無効から有効に変更された場合、判定器DB部5から当該判定器レコードに係るペアワイズ判定結果を取得し、そのペアワイズ判定結果を考慮して判定属性を再度求める。なお、判定部12は属性判定手段を構成している。   Similar to the determination unit 6 in FIG. 1, the determination unit 12 obtains a determination attribute indicating that the observation data may belong to each type from the pairwise determination result for each type pair. When the “invalid flag” of a device record is changed from valid to invalid, the determination attribute is re-excluded by excluding the pairwise judgment result related to the discriminator record, while the “invalid flag” of any discriminator record is invalid When it is changed to be valid, the pairwise determination result related to the determiner record is acquired from the determiner DB unit 5, and the determination attribute is obtained again in consideration of the pairwise determination result. In addition, the determination part 12 comprises the attribute determination means.

観測DB部13は図1の観測DB部2と同様の処理を実施するほか、観測データの類別結果を提示した後、使用属性設定部11が判定器レコードの「無効フラグ」の設定を変更すると、判定部12により再度求められた判定属性に応じて観測データの類別結果を再提示する。   The observation DB unit 13 performs the same processing as the observation DB unit 2 of FIG. 1 and, after presenting the classification result of the observation data, the usage attribute setting unit 11 changes the setting of the “invalid flag” of the determiner record. The classification result of the observation data is re-presented according to the determination attribute obtained again by the determination unit 12.

次に動作について説明する。
観測データの類別結果をユーザに提示する処理は、上記実施の形態1と同様であるため説明を省略するが、観測DB部13が図1の観測DB部2と同様にして観測データの類別結果を提示した後、ユーザが使用属性設定部11を操作して、ある種類対の判定器レコードの「無効フラグ」を有効から無効に変更する場合がある。
例えば、観測データの類別結果が「旅客機」であるとき、ユーザが「旅客機」ではないと認定するような場合には、種類対に「旅客機」が含まれている判定器レコードの「無効フラグ」を有効から無効に変更することがある。
Next, the operation will be described.
The process of presenting the observation data classification result to the user is the same as in the first embodiment and will not be described. However, the observation DB section 13 is similar to the observation DB section 2 in FIG. In some cases, the user operates the usage attribute setting unit 11 to change the “invalid flag” of a certain type of determiner record from valid to invalid.
For example, if the classification result of the observation data is “passenger aircraft” and the user certifies that it is not “passenger aircraft”, the “invalid flag” of the determinator record that includes “passenger aircraft” in the type pair May be changed from enabled to disabled.

判定部12は、図1の判定部6と同様にして、種類対毎のペアワイズ判定結果から判定属性を求めるが、その判定属性を求めた後に、任意の判定器レコードの「無効フラグ」が有効から無効に変更された場合、その判定器レコードに係るペアワイズ判定結果を除外して判定属性を再度求める。
具体的には、以下の通りである。
The determination unit 12 obtains a determination attribute from the pairwise determination result for each type pair in the same manner as the determination unit 6 in FIG. 1, and after obtaining the determination attribute, the “invalid flag” of any determinator record is valid. If it is changed from invalid to invalid, the determination attribute is obtained again by excluding the pair-wise determination result related to the determiner record.
Specifically, it is as follows.

判定部12は、例えば、5個の判定器レコードの「無効フラグ」が有効であり、判定器DB部5から5個のペアワイズ判定レコードを受けていれば、5個のペアワイズ判定レコードから各種類毎に、当該種類の乖離値を取り出して、当該種類の乖離値の総和を判定属性として求める。
しかし、その後、そのうちの2個の判定器レコードの「無効フラグ」が有効から無効に変更されると、2個のペアワイズ判定レコードを除外し、3個のペアワイズ判定レコードから各種類毎に、当該種類の乖離値を取り出して、当該種類の乖離値の総和を判定属性として求める。
For example, if the “invalid flag” of five determiner records is valid and the determination unit 12 receives five pairwise determination records from the determiner DB unit 5, each type is determined from the five pairwise determination records. Each time, the divergence value of the type is extracted, and the sum of the divergence values of the type is obtained as a determination attribute.
However, after that, when the “invalid flag” of two of the discriminator records is changed from valid to invalid, the two pair-wise judgment records are excluded, and each type from the three pair-wise judgment records The divergence value of the type is extracted, and the sum of the divergence values of the type is obtained as a determination attribute.

観測DB部13は、観測データの類別結果を提示した後、使用属性設定部11により判定器レコードの「無効フラグ」が有効から無効に変更されると、判定部12により再度求められた判定属性に応じた観測データを例えば表示器に表示することにより、その類別結果をユーザに再提示する。   The observation DB unit 13 presents the classification result of the observation data, and when the “invalid flag” of the determiner record is changed from valid to invalid by the use attribute setting unit 11, the determination attribute obtained again by the determination unit 12 By displaying the observation data corresponding to the display on the display, for example, the classification result is presented again to the user.

また、観測DB部13が図1の観測DB部2と同様にして観測データの類別結果を提示した後、ユーザが使用属性設定部11を操作して、ある種類対の判定器レコードの「無効フラグ」を無効から有効に変更する場合がある。
例えば、種類対に「旅客機」が含まれている判定器レコードの「無効フラグ」が無効であって、観測データの類別結果が「戦闘機」であるとき、ユーザが「戦闘機」ではないと認定するような場合には、種類対に「旅客機」が含まれている判定器レコードの「無効フラグ」を無効から有効に変更することがある。
In addition, after the observation DB unit 13 presents the observation data classification result in the same manner as the observation DB unit 2 in FIG. 1, the user operates the use attribute setting unit 11 to display “invalid” of the determinator record of a certain type pair. The flag may be changed from disabled to enabled.
For example, if the “invalid flag” of the classifier record that includes “passenger aircraft” in the type pair is invalid and the classification result of the observation data is “fighter”, the user is not “fighter” In such a case, the “invalid flag” of the determination device record that includes “passenger aircraft” in the type pair may be changed from invalid to valid.

判定器DB部5は、判定器DB4から「無効フラグ」が有効である種類対毎の判定器レコードを取得して、ペアワイズ判定を実施した後、ある判定器レコードの「無効フラグ」が無効から有効に変更されると、その判定器レコードを取得してペアワイズ判定を実施する。
そして、そのペアワイズ判定結果であるペアワイズ判定レコードを判定部12に出力する。
The determinator DB unit 5 obtains a determinator record for each type pair for which the “invalid flag” is valid from the determinator DB 4, and after performing pairwise determination, the “invalid flag” of a certain determinator record is invalid When it is changed to valid, the discriminator record is acquired and pairwise judgment is performed.
Then, a pairwise determination record that is the pairwise determination result is output to the determination unit 12.

判定部12は、図1の判定部6と同様にして、種類対毎のペアワイズ判定結果から判定属性を求めるが、その判定属性を求めた後に、任意の判定器レコードの「無効フラグ」が無効から有効に変更された場合、判定器DB部5から当該判定器レコードに係るペアワイズ判定結果を取得し、そのペアワイズ判定結果を考慮して判定属性を再度求める。
具体的には、以下の通りである。
The determination unit 12 obtains a determination attribute from the pairwise determination result for each type pair in the same manner as the determination unit 6 in FIG. 1, but after obtaining the determination attribute, the “invalid flag” of any determinator record is invalid When the change is effectively made, the pairwise determination result relating to the determination unit record is acquired from the determination unit DB unit 5, and the determination attribute is obtained again in consideration of the pairwise determination result.
Specifically, it is as follows.

判定部12は、例えば、5個の判定器レコードの「無効フラグ」が有効であり、判定器DB部5から5個のペアワイズ判定レコードを受けていれば、5個のペアワイズ判定レコードから各種類毎に、当該種類の乖離値を取り出して、当該種類の乖離値の総和を判定属性として求める。
しかし、その後、3個の判定器レコードの「無効フラグ」が無効から有効に変更されると、判定器DB部5から3個の判定器レコードに係るペアワイズ判定レコードを取得し、合計8個のペアワイズ判定レコードから各種類毎に、当該種類の乖離値を取り出して、当該種類の乖離値の総和を判定属性として再度求める。
For example, if the “invalid flag” of five determiner records is valid and the determination unit 12 receives five pairwise determination records from the determiner DB unit 5, each type is determined from the five pairwise determination records. Each time, the divergence value of the type is extracted, and the sum of the divergence values of the type is obtained as a determination attribute.
However, when the “invalid flag” of the three discriminator records is changed from invalid to valid after that, the pairwise judgment records relating to the three discriminator records are acquired from the discriminator DB unit 5, and a total of eight For each type, a divergence value of the type is extracted from the pairwise determination record, and the sum of the divergence values of the type is obtained again as a determination attribute.

観測DB部13は、観測データの類別結果を提示した後、使用属性設定部11により判定器レコードの「無効フラグ」が無効から有効に変更されると、判定部12により再度求められた判定属性に応じた観測データを例えば表示器に表示することにより、その類別結果をユーザに再提示する。   The observation DB unit 13 presents the classification result of the observation data, and when the “invalid flag” of the determiner record is changed from invalid to valid by the use attribute setting unit 11, the determination attribute obtained again by the determination unit 12 By displaying the observation data corresponding to the display on the display, for example, the classification result is presented again to the user.

以上で明らかなように、この実施の形態3によれば、判定器DB4に格納されている判定器レコードの「無効フラグ」の設定を受け付けるように構成したので、観測データを類別する種類を必要に応じて簡単に修正することができる効果を奏する。   As apparent from the above, according to the third embodiment, the configuration is such that the setting of the “invalid flag” of the determiner record stored in the determiner DB4 is accepted, and therefore a type for classifying the observation data is necessary. There is an effect that can be easily corrected in accordance with.

また、この実施の形態3によれば、種類対毎のペアワイズ判定レコードから判定属性を求めた後に、任意の判定器レコードの「無効フラグ」が有効から無効に変更された場合、その判定器レコードに係るペアワイズ判定結果を除外して判定属性を再度求めるように構成したので、ある種類を除外した類別結果を再提示することができる効果を奏する。   Further, according to the third embodiment, when the “invalid flag” of any discriminator record is changed from valid to invalid after obtaining the judgment attribute from the pairwise judgment record for each type pair, the discriminator record Since the configuration is such that the determination attribute is obtained again by excluding the pairwise determination result according to the above, there is an effect that the classification result excluding a certain type can be re-presented.

また、この実施の形態3によれば、種類対毎のペアワイズ判定レコードから判定属性を求めた後に、任意の判定器レコードの「無効フラグ」が無効から有効に変更された場合、判定器DB部5から当該判定器レコードに係るペアワイズ判定レコードを取得し、そのペアワイズ判定レコードを考慮して判定属性を再度求めるように構成したので、ある種類を追加した類別結果を再提示することができる効果を奏する。   Further, according to the third embodiment, when the determination attribute is obtained from the pairwise determination record for each type pair, and the “invalid flag” of an arbitrary determiner record is changed from invalid to valid, the determiner DB unit Since the configuration is such that the pairwise determination record related to the determination device record is acquired from 5 and the determination attribute is obtained again in consideration of the pairwise determination record, the effect of re-presenting the classification result with a certain type added can be obtained. Play.

実施の形態4.
上記実施の形態1〜3では、特に言及していないが、判定器DB部5がカーネル関数Kを含む計算を実施する部分は、全ての種類対において、互いに共有する情報がカーネル関数と、パラメータと、観測データだけである。
したがって、判定器DB部5が複数の計算実行モジュール(プロセッサ)を実装し、判定器DB部5が複数の計算実行モジュールに対して、カーネル関数とパラメータと観測データとを配付するようにすれば、複数の計算実行モジュールが並列処理によってペアワイズ判定を実施することができる。
Embodiment 4 FIG.
Although not particularly mentioned in the first to third embodiments, the part in which the determiner DB unit 5 performs the calculation including the kernel function K is that the information shared with each other is the kernel function and the parameter in all types of pairs. And only the observation data.
Therefore, if the determiner DB unit 5 is mounted with a plurality of calculation execution modules (processors), and the determiner DB unit 5 distributes kernel functions, parameters, and observation data to the plurality of calculation execution modules. A plurality of calculation execution modules can perform pair-wise determination by parallel processing.

以上で明らかなように、この実施の形態4によれば、判定器DB部5が複数の計算実行モジュールを用いて、複数のペアワイズ判定の実施を並列処理するように構成したので、ペアワイズ判定処理の高速化を図ることができる効果を奏する。   As is apparent from the above, according to the fourth embodiment, the determination unit DB unit 5 is configured to perform a plurality of pairwise determinations in parallel using a plurality of calculation execution modules. It is possible to increase the speed.

この発明の実施の形態1によるデータ類別装置を示す構成図である。It is a block diagram which shows the data classification device by Embodiment 1 of this invention. この発明の実施の形態1によるデータ類別装置の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data classification device by Embodiment 1 of this invention. 観測レコードの構成例を示す説明図である。It is explanatory drawing which shows the structural example of an observation record. 判定器レコードの構成例を示す説明図である。It is explanatory drawing which shows the structural example of a determination device record. ペアワイズ判定レコードの構成例を示す説明図である。It is explanatory drawing which shows the structural example of a pairwise determination record. この発明の実施の形態3によるデータ類別装置を示す構成図である。It is a block diagram which shows the data classification device by Embodiment 3 of this invention.

符号の説明Explanation of symbols

1 整形部(特徴量ベクトル生成手段)、2 観測DB部、3 観測DB、4 判定器DB(ペアワイズ判定手段)、5 判定器DB部(ペアワイズ判定手段)、6 判定部(属性判定手段)、11 使用属性設定部(ペアワイズ判定手段)、12 判定部(属性判定手段)、13 観測DB部。   DESCRIPTION OF SYMBOLS 1 shaping part (feature quantity vector production | generation means), 2 observation DB part, 3 observation DB, 4 determination device DB (pairwise determination means), 5 determination device DB part (pairwise determination means), 6 determination part (attribute determination means), DESCRIPTION OF SYMBOLS 11 Use attribute setting part (pairwise determination means), 12 Determination part (attribute determination means), 13 Observation DB part

Claims (7)

類別対象の観測データから属性値を抽出し、1以上の属性値からなる特徴量ベクトルを生成する特徴量ベクトル生成手段と、種類対が相互に異なるペアワイズ判定用の判定器レコードを複数個有し、種類対毎に当該判定器レコードの特徴量ベクトルと上記特徴量ベクトル生成手段により生成された特徴量ベクトルからペアワイズ判定を実施するペアワイズ判定手段と、上記ペアワイズ判定手段による種類対毎のペアワイズ判定結果を取得し、種類対毎のペアワイズ判定結果から上記観測データが各種類に属する可能性を示す判定属性を求める属性判定手段とを備えたデータ類別装置において、
上記ペアワイズ判定手段は、ペアワイズ判定結果を種類対における当該種類の帰属値と乖離値で表す場合、当該種類の帰属値と乖離値を数値化する関数に、当該判定器レコードの特徴量ベクトルと上記特徴量ベクトル生成手段により生成された特徴量ベクトルを代入することで、当該種類の帰属値と乖離値を計算し、
上記属性判定手段は、種類対毎のペアワイズ判定結果から当該種類の乖離値を取り出し、上記観測データが当該種類に属する可能性を示す判定属性として、当該種類の乖離値の総和を求めることを特徴とするデータ類別装置。
Extracting attribute values from observation data to be classified and generating feature vector generation means for generating a feature vector consisting of one or more attribute values, and a plurality of classifier records for pairwise determination with different type pairs A pairwise determination unit for performing pairwise determination from the feature quantity vector of the determination unit record for each type pair and the feature quantity vector generated by the feature quantity vector generation unit, and a pairwise determination result for each type pair by the pairwise determination unit In a data classification apparatus comprising attribute determination means for obtaining a determination attribute indicating the possibility that the observation data belongs to each type from a pairwise determination result for each type pair ,
When the pair-wise determination means represents the pair-wise determination result as the attribute value and divergence value of the type in the pair of types, the feature value vector of the determiner record and the function By substituting the feature vector generated by the feature vector generator, the attribute value and the divergence value are calculated,
The attribute determining means extracts the divergence value of the type from the pairwise determination result for each type pair, and obtains the sum of the divergence values of the type as a determination attribute indicating the possibility that the observation data belongs to the type. Data classification device.
ペアワイズ判定手段は、種類対が同一の判定器レコードを複数個有する場合、複数の判定器レコードに記述されている性能を相互に比較することで、最も性能が高い判定器レコードを選択し、その判定器レコードの特徴量ベクトルを使用してペアワイズ判定を実施することを特徴とする請求項1記載のデータ類別装置。 When the pairwise determination means has a plurality of the same classifier records, the pairwise determination means selects the classifier record having the highest performance by comparing the performance described in the plurality of classifier records with each other. The data classification apparatus according to claim 1, wherein pairwise determination is performed using a feature quantity vector of a determiner record. ペアワイズ判定手段は、複数の判定器レコードのうち、使用属性が無効である判定器レコードを使用せず、使用属性が有効である判定器レコードを使用してペアワイズ判定を実施することを特徴とする請求項1または請求項2記載のデータ類別装置。 The pair-wise determination means is characterized in that, among the plurality of determiner records, the determiner record whose use attribute is invalid is not used, and the pair-wise determination is performed using the determiner record whose use attribute is valid. The data classification apparatus according to claim 1 or 2 . ペアワイズ判定手段は、判定器レコードの使用属性の設定を受け付けることを特徴とする請求項記載のデータ類別装置。 4. The data classification apparatus according to claim 3 , wherein the pairwise determination means receives a setting of a use attribute of the determiner record. 属性判定手段は、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求めた後に、任意の判定器レコードの使用属性が有効から無効に変更された場合、その判定器レコードに係るペアワイズ判定結果を除外して判定属性を再度求めることを特徴とする請求項記載のデータ類別装置。 The attribute determination means obtains a determination attribute indicating the possibility of observation data belonging to each type from the pairwise determination result for each type pair, and when the use attribute of an arbitrary determiner record is changed from valid to invalid, 5. The data classification apparatus according to claim 4, wherein the determination attribute is obtained again by excluding the pairwise determination result relating to the determiner record. 属性判定手段は、種類対毎のペアワイズ判定結果から観測データが各種類に属する可能性を示す判定属性を求めた後に、任意の判定器レコードの使用属性が無効から有効に変更された場合、ペアワイズ判定手段から当該判定器レコードに係るペアワイズ判定結果を取得し、そのペアワイズ判定結果を考慮して判定属性を再度求めることを特徴とする請求項記載のデータ類別装置。 The attribute determination means obtains a determination attribute indicating the possibility that the observation data belongs to each type from the pairwise determination result for each type pair, and then when the use attribute of an arbitrary determiner record is changed from invalid to valid, 5. The data classification apparatus according to claim 4, wherein a pairwise determination result relating to the determination device record is acquired from the determination means, and the determination attribute is obtained again in consideration of the pairwise determination result. ペアワイズ判定手段は、複数のプロセッサを用いて、複数のペアワイズ判定の実施を並列処理することを特徴とする請求項1から請求項のうちのいずれか1項記載のデータ類別装置。 The data classification apparatus according to any one of claims 1 to 6 , wherein the pair-wise determination unit performs a plurality of pair-wise determinations in parallel by using a plurality of processors.
JP2004217580A 2004-07-26 2004-07-26 Data classification device Expired - Fee Related JP4536445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004217580A JP4536445B2 (en) 2004-07-26 2004-07-26 Data classification device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004217580A JP4536445B2 (en) 2004-07-26 2004-07-26 Data classification device

Publications (2)

Publication Number Publication Date
JP2006039862A JP2006039862A (en) 2006-02-09
JP4536445B2 true JP4536445B2 (en) 2010-09-01

Family

ID=35904809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004217580A Expired - Fee Related JP4536445B2 (en) 2004-07-26 2004-07-26 Data classification device

Country Status (1)

Country Link
JP (1) JP4536445B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014096086A (en) * 2012-11-12 2014-05-22 Hitachi Solutions Ltd Document classification system and method
JP7075057B2 (en) 2018-12-27 2022-05-25 オムロン株式会社 Image judgment device, image judgment method and image judgment program

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160503A (en) * 1993-12-13 1995-06-23 Meidensha Corp Knowledge processing system
JPH07182368A (en) * 1993-12-24 1995-07-21 Hitachi Ltd Data processing system
JP2000250925A (en) * 1999-02-26 2000-09-14 Matsushita Electric Ind Co Ltd Document retrieval and sorting method and device
JP2002531906A (en) * 1998-12-02 2002-09-24 マーズ インコーポレイテッド Classification method and equipment
JP2003345810A (en) * 2002-05-28 2003-12-05 Hitachi Ltd Method and system for document retrieval and document retrieval result display system
JP2004094521A (en) * 2002-08-30 2004-03-25 Nippon Telegr & Teleph Corp <Ntt> Inquiry type learning method, learning device, inquiry type learning program, recording medium recorded with the program, recording medium recorded with learning data, inquiry type identification method and device using learning data, program, and recording medium with the program
JP2004521407A (en) * 2000-09-01 2004-07-15 フレッド・ハッチソン・キャンサー・リサーチ・センター Statistical modeling for analyzing large data arrays
JP2004280712A (en) * 2003-03-18 2004-10-07 Just Syst Corp Data classification device, data classification method, and program making computer execute the method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160503A (en) * 1993-12-13 1995-06-23 Meidensha Corp Knowledge processing system
JPH07182368A (en) * 1993-12-24 1995-07-21 Hitachi Ltd Data processing system
JP2002531906A (en) * 1998-12-02 2002-09-24 マーズ インコーポレイテッド Classification method and equipment
JP2000250925A (en) * 1999-02-26 2000-09-14 Matsushita Electric Ind Co Ltd Document retrieval and sorting method and device
JP2004521407A (en) * 2000-09-01 2004-07-15 フレッド・ハッチソン・キャンサー・リサーチ・センター Statistical modeling for analyzing large data arrays
JP2003345810A (en) * 2002-05-28 2003-12-05 Hitachi Ltd Method and system for document retrieval and document retrieval result display system
JP2004094521A (en) * 2002-08-30 2004-03-25 Nippon Telegr & Teleph Corp <Ntt> Inquiry type learning method, learning device, inquiry type learning program, recording medium recorded with the program, recording medium recorded with learning data, inquiry type identification method and device using learning data, program, and recording medium with the program
JP2004280712A (en) * 2003-03-18 2004-10-07 Just Syst Corp Data classification device, data classification method, and program making computer execute the method

Also Published As

Publication number Publication date
JP2006039862A (en) 2006-02-09

Similar Documents

Publication Publication Date Title
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
US7783581B2 (en) Data learning system for identifying, learning apparatus, identifying apparatus and learning method
JP2006172437A (en) Method for determining position of segment boundary in data stream, method for determining segment boundary by comparing data subset with vicinal data subset, program of instruction executable by computer, and system or device for identifying boundary and non-boundary in data stream
JP2017123168A (en) Method for making entity mention in short text associated with entity in semantic knowledge base, and device
JP2012118977A (en) Method and system for machine-learning based optimization and customization of document similarity calculation
JP2006252333A (en) Data processing method, data processor and its program
JP6004015B2 (en) Learning method, information processing apparatus, and learning program
US20030182082A1 (en) Method for determining a quality for a data clustering and data processing system
JP5391637B2 (en) Data similarity calculation system, data similarity calculation method, and data similarity calculation program
JP5128437B2 (en) Entity classification apparatus and method based on time series relation graph
JP4802176B2 (en) Pattern recognition apparatus, pattern recognition program, and pattern recognition method
JP2010061176A (en) Text mining device, text mining method, and text mining program
JP4536445B2 (en) Data classification device
CN112926592A (en) Trademark retrieval method and device based on improved Fast algorithm
JP2016110256A (en) Information processing device and information processing program
JP4479745B2 (en) Document similarity correction method, program, and computer
JP6004014B2 (en) Learning method, information conversion apparatus, and learning program
CN114943285B (en) Intelligent auditing system for internet news content data
JPH10111869A (en) Device and method for information classification
US20170293863A1 (en) Data analysis system, and control method, program, and recording medium therefor
CN110490667B (en) Data processing method and device and electronic equipment
CN115048504A (en) Information pushing method and device, computer equipment and computer readable storage medium
JP6039057B2 (en) Document analysis apparatus and document analysis program
JP4460417B2 (en) Automatic classification method, automatic classification program, recording medium, and automatic classification device
CN112307133A (en) Security protection method and device, computer equipment and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070510

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071015

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100616

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees