JP4662909B2 - 特徴評価方法及び装置及びプログラム - Google Patents
特徴評価方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP4662909B2 JP4662909B2 JP2006310631A JP2006310631A JP4662909B2 JP 4662909 B2 JP4662909 B2 JP 4662909B2 JP 2006310631 A JP2006310631 A JP 2006310631A JP 2006310631 A JP2006310631 A JP 2006310631A JP 4662909 B2 JP4662909 B2 JP 4662909B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- evaluation
- learning
- feature set
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
サポートベクターマシン学習手段が、学習パラメータ記憶手段から読み出した学習パラメータを用いて評価対象学習パターンについて学習するサポートベクターマシン学習手順(ステップ1)と、
サポートベクター数取得手段が、サポートベクターマシン学習手順による学習結果からサポートベクターの数N(SV)を取得するサポートベクター数取得手順(ステップ2)と、
特徴次元数取得手段が、評価対象特徴セットの次元数Y(Feature)を取得する特徴次元数取得手順と、
特徴セット評価値算出手段が、サポートベクター数N(SV)、評価対象特徴セットの次元数Y(Feature)、既存の方法により求めた特徴セット評価指標を利用して特徴セットの評価値を求める特徴セット評価値算出手順(ステップ3)と、
特徴決定手段が、特徴セットの評価値の最も高いものを最適特徴セットとする特徴決定手順(ステップ4)とを行う。
サポートベクターの数N(SV)が多いほど評価値を下げる。
特徴セットの次元数Y(Feature)が少ないほど特徴セットの評価値を下げる。
コンフィデント取得手段が、サポートベクターマシン学習手順による学習結果からサポートベクターマシンの指標であるConfident(C)を取得するコンフィデント取得手順と、
を行い、
特徴セット評価値算出手順(ステップ3)において、
既存の方法により求めた特徴セット評価指標として、マージン幅M及びConfident(C)を用いる。
E(Feature)=Confident(C)・M・log(Y(Feature)+a))/(b・N(SV))
但し、a、bは予め設定された定数
により特徴セットの評価値を求める。
学習パラメータを格納した学習パラメータ記憶手段4と、
学習パラメータ記憶手段から読み出した学習パラメータを用いて評価対象学習パターンについて学習するサポートベクターマシン学習手段5と、
サポートベクターマシン学習手段5による学習結果からサポートベクターの数N(SV)を取得するサポートベクター数取得手段と7、
評価対象特徴セットの次元数Y(Feature)を取得する特徴次元数取得手段と、
サポートベクター数N(SV)、評価対象特徴セットの次元数Y(Feature)、既存の方法により求めた特徴セット評価指標を利用して特徴セットの評価値を求める特徴セット評価値算出手段10と、
特徴セットの評価値の最も高いものを最適特徴セットとする特徴決定手段12と、を有する。
図5は、本発明の一実施の形態における評価対象学習パターン生成手順の詳細な動作のフローチャートである。
サポートベクターマシン学習手順では、サポートベクターマシン学習部5が、学習対象学習パターンを学習パラメータ記憶部4から読み込んだパラメータによりサポートベクターマシンで学習する。学習パラメータ、及びサポートベクターマシンでの学習は共に一般的なものであるため、ここでは詳細については記述しない。
評価対象特徴次元数、サポートベクター数及びMargin幅はサポートベクターマシン(SVM)の学習結果として一般的に得られるものであるので、これらについては詳述しない。
Confident取得部9において、サポートベクターマシン学習部5の学習結果からConfidentを算出する。Confident(C)は非特許文献1で用いられている指標のひとつであり、
C=Σi(r(xj)・f(xi))
但し、r(xi)は学習パターンxiのラベルを返す関数である。
特徴評価手順では、特徴セット評価値算出部10において、評価対象特徴次元数取得手順(ステップ103)から得られたY(Feature)、サポートベクター数取得手順(ステップ104)で得られた(N(SV))、Margin幅取得手順(ステップ105)、Confident算出手順(ステップ106)で得られた(C)を用いて特徴セットFeatureの評価値を算出する。
但し、CはConfident値、Mはマージンの大きさ、Y(Feature)は利用している特徴の時限数、N(SV)は学習結果におけるサポートベクターの数、a,bは予め設定する定数である。
本発明は、特徴セットに対して、分類における有効性の指標を与えるものであり、本発明を既存の探索手法と組み合わせることにより、特徴選択手法とすることが可能である。
暫定特徴決定手順では、暫定特徴選択部13において、評価対象となる特徴セット(Feature)を決定する。つまり、評価対象特徴セット入力部2への入力に相当する。以下に、暫定特徴決定手順について説明する。
評価対象学習パターン生成手順では、評価対象学習パターン生成部3が学習パターン蓄積部1から読み込んだ学習パターンLij(但し、i={1,…,m,…,M}でMは学習パターンの数を表し、j={1,…,N}ではNは各パターンの特徴次元数を表すものとする)と、評価対象特徴セット入力部2から得られる特徴セット(Feature)を用いて、評価対象学習パターンxks(k={1,…,M},s={1,…,n})であり、任意のsはNに含まれる)を生成する。また各学習パターンLmは教師信号として+1もしくは−1のラベルが付与されており、r()により参照可能であり、参照は学習パターンLmでも、評価対象学習パターンxmからも可能である。
サポートベクターマシン学習手順では、サポートベクターマシン学習部5において、学習パラメータ記憶部4から学習に必要なパラメータを取得し、サポートベクターマシン(SVM)により学習する。
評価対象特徴次元数取得手順では、評価対象学習パターン特徴次元数取得部6において、評価対象特徴セット入力部2から得られる評価対象特徴セット(Feature)の次元数を取得し、Y(Feature)とする。
サポートベクター数取得手順では、サポートベクター数取得部7において、サポートベクター数をサポートベクターマシン学習部5の学習結果から取得し、N(SV)とする。
Margin幅取得手順では、Margin幅取得部8において、サポートベクターマシン学習結果からMarginの幅を取得し、Mとする。
Confident取得手順では、Confident取得部9において、サポートベクターマシン学習結果からConfidentを算出し、Cとする。
特徴評価手順では、特徴セット評価値算出部10において、前述の式1により特徴セット(Feature)に対する評価値を決定し、特徴セット評価記憶部11に格納する。
終了判定手順では、終了するか否かの判定を行う。SBSアルゴリズムを用いているため、Y(Feature)=1であれば、ステップ610へ移行し、そうでない場合は、ステップ601に移行する。
特徴決定手順では、特徴決定部12において、特徴セット評価記憶部11に記憶されている特長セットの中から最も評価値のよい特徴セットを求め、最適特徴セットとする。
本実施例では、暫定特徴選択手順において、遺伝的アルゴリズムを利用する。
X0={X0,0,X0,1,…,X0,99}
X1={X1,0,X1,1,…,X1,99}
:
Xi={Xi,0,Xi,1,…,Xi,99}
:
とする。また、学習パターン(Xi)に付与されるラベルr(Xi)は以下のルールによる決定した。
2 評価対象特徴セット入力部
3 評価対象学習パターン生成部
4 学習パラメータ記憶手段、学習パラメータ記憶部
5 サポートベクターマシン学習手段、サポートベクターマシン学習部
6 評価対象学習パターン特徴次元数取得部
7 サポートベクター数取得手段、サポートベクター数取得部
8 Margin幅取得部
9 Confident取得部
10 特徴セット評価値算出手段、特徴セット評価値算出部
11 特徴セット評価記憶部
12 特徴決定手段、特徴決定部
13 暫定特徴選択部
Claims (7)
- パターン分類を行う際に、特徴セットが分類において有効か否かを評価する特徴評価装置における特徴評価方法であって、
サポートベクターマシン学習手段が、学習パラメータ記憶手段から読み出した学習パラメータを用いて評価対象学習パターンについて学習するサポートベクターマシン学習手順と、
サポートベクター数取得手段が、前記サポートベクターマシン学習手順による学習結果からサポートベクターの数N(SV)を取得するサポートベクター数取得手順と、
特徴次元数取得手段が、評価対象特徴セットの次元数Y(Feature)を取得する特徴次元数取得手順と、
特徴セット評価値算出手段が、前記サポートベクター数N(SV)、前記評価対象特徴セットの次元数Y(Feature)、既存の方法により求めた特徴セット評価指標を利用して特徴セットの評価値を求める特徴セット評価値算出手順と、
特徴決定手段が、前記特徴セットの評価値の最も高いものを最適特徴セットとする特徴決定手順と
を行うことを特徴とする特徴評価方法。 - 前記特徴セット評価値算出手順において、
前記サポートベクターの数N(SV)が多いほど評価値を下げる
請求項1記載の特徴評価方法。 - 前記特徴セット評価値算出手順において、
前記特徴セットの次元数Y(Feature)が少ないほど前記特徴セットの評価値を下げる
請求項1または2記載の特徴評価方法。 - マージン幅取得手段が、前記サポートベクターマシン学習手順による学習結果からマージン幅Mを取得するマージン幅取得手順と、
コンフィデント取得手段が、前記サポートベクターマシン学習手順による学習結果からサポートベクターマシンの指標であるConfident(C)を取得するコンフィデント取得手順と、
を行い、
前記特徴セット評価値算出手順において、
前記既存の方法により求めた特徴セット評価指標として、前記マージン幅M及び前記Confident(C)を用いる
請求項1乃至3の何れか1項記載の特徴評価方法。 - 前記特徴セット評価値算出手順において、前記Confident(C)、前記Y(Feature)、前記N(SV)、前記Mを用いて、評価式
E(Feature)=Confident(C)・M・log(Y(Feature)+a))/(b・N(SV))
但し、a、bは予め設定された定数
により前記特徴セットの評価値を求める
請求項4記載の特徴評価方法。 - パターン分類を行う際に、特徴セットが分類において有効か否かを評価する特徴評価装置であって、
学習パラメータを格納した学習パラメータ記憶手段と、
前記学習パラメータ記憶手段から読み出した学習パラメータを用いて評価対象学習パターンについて学習するサポートベクターマシン学習手段と、
前記サポートベクターマシン学習手段による学習結果からサポートベクターの数N(SV)を取得するサポートベクター数取得手段と、
評価対象特徴セットの次元数Y(Feature)を取得する特徴次元数取得手段と、
前記サポートベクター数N(SV)、前記評価対象特徴セットの次元数Y(Feature)、既存の方法により求めた特徴セット評価指標を利用して特徴セットの評価値を求める特徴セット評価値算出手段と、
前記特徴セットの評価値の最も高いものを最適特徴セットとする特徴決定手段と
を有することを特徴とする特徴評価装置。 - コンピュータに、
請求項6記載の特徴評価装置の各手段を実行させることを特徴とする特徴評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006310631A JP4662909B2 (ja) | 2006-11-16 | 2006-11-16 | 特徴評価方法及び装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006310631A JP4662909B2 (ja) | 2006-11-16 | 2006-11-16 | 特徴評価方法及び装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008129657A JP2008129657A (ja) | 2008-06-05 |
JP4662909B2 true JP4662909B2 (ja) | 2011-03-30 |
Family
ID=39555433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006310631A Expired - Fee Related JP4662909B2 (ja) | 2006-11-16 | 2006-11-16 | 特徴評価方法及び装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4662909B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5244438B2 (ja) * | 2008-04-03 | 2013-07-24 | オリンパス株式会社 | データ分類装置、データ分類方法、データ分類プログラムおよび電子機器 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003500766A (ja) * | 1999-05-25 | 2003-01-07 | スティーヴン ディー. バーンヒル、 | 複数支援ベクトルマシンを使用した複数データセットからの知識発見の増強 |
-
2006
- 2006-11-16 JP JP2006310631A patent/JP4662909B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003500766A (ja) * | 1999-05-25 | 2003-01-07 | スティーヴン ディー. バーンヒル、 | 複数支援ベクトルマシンを使用した複数データセットからの知識発見の増強 |
Also Published As
Publication number | Publication date |
---|---|
JP2008129657A (ja) | 2008-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10916333B1 (en) | Artificial intelligence system for enhancing data sets used for training machine learning-based classifiers | |
JP6109037B2 (ja) | 時系列データ予測装置、時系列データ予測方法、及びプログラム | |
Palar et al. | On efficient global optimization via universal Kriging surrogate models | |
JP7217696B2 (ja) | ポリマーの物性予測装置、プログラム、及びポリマーの物性予測方法 | |
US20110238606A1 (en) | Kernel regression system, method, and program | |
JP6299759B2 (ja) | 予測関数作成装置、予測関数作成方法、及びプログラム | |
JP6004015B2 (ja) | 学習方法、情報処理装置および学習プログラム | |
JP5638503B2 (ja) | テキスト要約装置、方法及びプログラム | |
JP5176895B2 (ja) | Sram形状パラメータ等の多目的最適化設計支援装置、方法、及びプログラム | |
Maji et al. | Hybrid approach using SVM and MM2 in splice site junction identification | |
JP7449961B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP4662909B2 (ja) | 特徴評価方法及び装置及びプログラム | |
Liu et al. | Boosting feature selection using information metric for classification | |
JP7141371B2 (ja) | 学習データの精練方法及び計算機システム | |
JP4343140B2 (ja) | 評価装置及びそのコンピュータプログラム | |
Lee et al. | Survival prediction and variable selection with simultaneous shrinkage and grouping priors | |
JP5062046B2 (ja) | 数式処理技法を用いた多目的最適化設計支援装置、方法、及びプログラム | |
CN110674860A (zh) | 基于邻域搜索策略的特征选择方法、存储介质和终端 | |
CN111048145A (zh) | 蛋白质预测模型的生成方法、装置、设备和存储介质 | |
JP5516925B2 (ja) | 信頼度計算装置、信頼度計算方法、及びプログラム | |
Kostadinova et al. | An Integrative DTW-based imputation method for gene expression time series data | |
JP7339923B2 (ja) | 材料の特性値を推定するシステム | |
JP4495691B2 (ja) | 影響因子推定装置及び影響因子推定プログラム | |
US7933853B2 (en) | Computer-readable recording medium, apparatus and method for calculating scale-parameter | |
JP7224263B2 (ja) | モデル生成方法、モデル生成装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140114 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |