JP2020013511A - 特徴量生成装置および特徴量生成方法 - Google Patents
特徴量生成装置および特徴量生成方法 Download PDFInfo
- Publication number
- JP2020013511A JP2020013511A JP2018137210A JP2018137210A JP2020013511A JP 2020013511 A JP2020013511 A JP 2020013511A JP 2018137210 A JP2018137210 A JP 2018137210A JP 2018137210 A JP2018137210 A JP 2018137210A JP 2020013511 A JP2020013511 A JP 2020013511A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature amount
- value
- combination
- objective variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1において、1は全体として第1の実施の形態による特徴量選択システムを示す。
F_(3)
=[{A,A,B},{A,A,D},{A,D,E},{D,A,B},{D,A,D},{D,D,E},{E,A,B},{E,A,D},{E,D,E}]
=[{A,B},{A,D},{A,D,E},{A,D,B},{A,D},{D,E},{A,B,E},{A,D,E},{D,E}]
=[{A,B},{A,D},{D,E},{A,B,E},{A,D,E}]
となる。組合せ数が「3」未満の特徴量は、登録しないため(1組合せ数、2組合せ数については登録しているため)、F_(3)=[{A,B,E},{A,D,E}]となる。
(数式1)
if yi > b and xi ≦ (yi - b) ÷ a then xi* = xi
if yi > b and xi > (yi - b) ÷ a then xi* = (yi - b) ÷ a
if yi ≦ b then xi* = 0
(数式2)
if yi < b and xi ≦ (yi - b) ÷ a then xi* = xi
if yi < b and xi > (yi - b) ÷ a then xi* = (yi - b) ÷ a
if yi ≧ b then xi* = 0
象限II :点が存在しない(すべて象限IIIに移動)。
象限III:各点がなるべく傾きの大きい直線に近い状態に並ぶ。ただし、xi*<0にはならないため、xi*=0で下げ止まる。
象限IV :点がなるべく存在しない。ただし、移動前にxi=0に存在する点が移動できないのでそのまま存在する。
本特徴量選択システム1によれば、より少ない計算時間で、目的変数に対する相関の高い特徴量を抽出することで、データ分析者の分析サイクルの短縮が可能になる。
なお上述実施の形態においては、本発明を特徴量選択システム1に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、方法、プログラム、記憶媒体などに広く適用することができる。
Claims (8)
- 目的変数に係る複数の説明変数において組合せを取って特徴量を生成する際、前記目的変数との相関係数がしきい値以上になる特徴量を生成する特徴量生成部を備え、
前記特徴量生成部は、
前記複数の説明変数から生成し得る複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った特徴量同士の組合せを取った特徴量を新たな特徴量として生成する、
ことを特徴とする特徴量生成装置。 - 前記特徴量生成部は、説明変数の組合せ数がN(N≧2の整数)の特徴量を生成する際、説明変数の組合せ数がk(1≦k<Nの整数)の複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った説明変数の組合せ数が「1」の特徴量と除去して残った組合せ数がkの特徴量との組合せを取った特徴量を説明変数の組合せ数がk+1の新たな特徴量として生成する処理を、説明変数の組合せ数がNの特徴量を生成するまでkが1から順に繰り返す、
ことを特徴とする請求項1に記載の特徴量生成装置。 - 前記特徴量生成部は、前記複数の特徴量から前記しきい値未満の特徴量を除去する際、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるように、前記目的変数の値を変更することなく前記一の特徴量の値を変更することで前記点群を移動し、移動した点群と前記目的変数との相関係数である相関見込み値を計算し、計算した相関見込み値が前記しきい値以上であるか否かを判定する、
ことを特徴とする請求項1に記載の特徴量生成装置。 - 前記特徴量生成部は、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるための前記点群の移動パターンを示す移動境界直線を計算し、計算した移動境界直線に基づいて前記点群を移動する、
ことを特徴とする請求項3に記載の特徴量生成装置。 - 目的変数に係る複数の説明変数において組合せを取って特徴量を生成する際、前記目的変数との相関係数がしきい値以上になる特徴量を生成する特徴量生成方法であって、
特徴量生成部が、
前記複数の説明変数から生成し得る複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、
計算機が、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った特徴量同士の組合せを取った特徴量を新たな特徴量として生成する、
ことを特徴とする特徴量生成方法。 - 前記特徴量生成部が、説明変数の組合せ数がN(N≧2の整数)の特徴量を生成する際、説明変数の組合せ数がk(1≦k<Nの整数)の複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った説明変数の組合せ数が「1」の特徴量と除去して残った組合せ数がkの特徴量との組合せを取った特徴量を説明変数の組合せ数がk+1の新たな特徴量として生成する処理を、説明変数の組合せ数がNの特徴量を生成するまでkが1から順に繰り返す、
ことを特徴とする請求項5に記載の特徴量生成方法。 - 前記特徴量生成部が、前記複数の特徴量から前記しきい値未満の特徴量を除去する際、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるように、前記目的変数の値を変更することなく前記一の特徴量の値を変更することで前記点群を移動し、移動した点群と前記目的変数との相関係数である相関見込み値を計算し、計算した相関見込み値が前記しきい値以上であるか否かを判定する、
ことを特徴とする請求項5に記載の特徴量生成方法。 - 前記特徴量生成部が、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるための前記点群の移動パターンを示す移動境界直線を計算し、計算した移動境界直線に基づいて前記点群を移動する、
ことを特徴とする請求項7に記載の特徴量生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018137210A JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018137210A JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020013511A true JP2020013511A (ja) | 2020-01-23 |
JP7068085B2 JP7068085B2 (ja) | 2022-05-16 |
Family
ID=69169939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018137210A Active JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7068085B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793284A (ja) * | 1993-09-28 | 1995-04-07 | Mitsubishi Electric Corp | 特性値予測装置及び特性値予測方法 |
JP2006031442A (ja) * | 2004-07-16 | 2006-02-02 | Toshiba Corp | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
WO2017203601A1 (ja) * | 2016-05-24 | 2017-11-30 | 三井情報株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
-
2018
- 2018-07-20 JP JP2018137210A patent/JP7068085B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793284A (ja) * | 1993-09-28 | 1995-04-07 | Mitsubishi Electric Corp | 特性値予測装置及び特性値予測方法 |
JP2006031442A (ja) * | 2004-07-16 | 2006-02-02 | Toshiba Corp | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
WO2017203601A1 (ja) * | 2016-05-24 | 2017-11-30 | 三井情報株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7068085B2 (ja) | 2022-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5011830B2 (ja) | データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置 | |
US11308418B2 (en) | Automatic selection of variables for a machine-learning model | |
RU2716553C1 (ru) | Устройство создания сигнатуры, способ создания сигнатуры, носитель записи, в котором записана программа создания сигнатуры, и система определения программного обеспечения | |
JP6540384B2 (ja) | 評価プログラム、手順書評価方法、および評価装置 | |
JP7274434B2 (ja) | 流用設計支援システム及び流用設計支援方法 | |
KR20210132853A (ko) | 확률적 경사 하강법을 이용한 변수 선택 장치 및 방법 | |
JP2020013511A (ja) | 特徴量生成装置および特徴量生成方法 | |
JP5439235B2 (ja) | 文書分類方法、文書分類装置、およびプログラム | |
CN112287102A (zh) | 数据挖掘方法和装置 | |
US10853538B2 (en) | Model generation system and model generation method | |
Riesener et al. | Derivation of description features for engineering change request by aid of latent dirichlet allocation | |
Cheng et al. | A GA mechanism for optimizing the design of attribute double sampling plan | |
JP5786717B2 (ja) | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 | |
JP2016091138A (ja) | ソースコード検証システム | |
KR102404982B1 (ko) | 엘라스틱 넷 회귀를 이용한 변수 선택 장치 및 방법 | |
DK178764B1 (en) | A computer-implemented method for carrying out a search without the use of signatures | |
JP6447111B2 (ja) | 共通化情報提供プログラム、共通化情報提供方法、および共通化情報提供装置 | |
JP2020123035A (ja) | ソート方法、ソートプログラム及びソート装置 | |
Sreedevi et al. | A Novel Ensemble Learning for Defect Detection Method With Uncertain Data | |
JP2020166443A (ja) | データ加工方法レコメンドシステム、データ加工方法レコメンド方法、及びデータ加工方法レコメンドプログラム | |
JP2005032117A (ja) | データ分析装置およびデータ分析方法並びにデータ分析プログラム | |
JP7437545B2 (ja) | 供給元自動ランク付け方法、供給元自動ランク付け装置及び供給元自動ランク付けプログラム | |
KR102404907B1 (ko) | 라소를 이용한 변수 선택 장치 및 방법 | |
EP4290426A1 (en) | Accuracy calculation program, accuracy calculation method, and information processing device | |
JP6563549B1 (ja) | データ傾向分析方法、データ傾向分析システム及び絞り込み及び復元装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7068085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |