JP7068085B2 - 特徴量生成装置および特徴量生成方法 - Google Patents
特徴量生成装置および特徴量生成方法 Download PDFInfo
- Publication number
- JP7068085B2 JP7068085B2 JP2018137210A JP2018137210A JP7068085B2 JP 7068085 B2 JP7068085 B2 JP 7068085B2 JP 2018137210 A JP2018137210 A JP 2018137210A JP 2018137210 A JP2018137210 A JP 2018137210A JP 7068085 B2 JP7068085 B2 JP 7068085B2
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- feature
- value
- objective variable
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Description
図1において、1は全体として第1の実施の形態による特徴量選択システムを示す。
F_(3)
=[{A,A,B},{A,A,D},{A,D,E},{D,A,B},{D,A,D},{D,D,E},{E,A,B},{E,A,D},{E,D,E}]
=[{A,B},{A,D},{A,D,E},{A,D,B},{A,D},{D,E},{A,B,E},{A,D,E},{D,E}]
=[{A,B},{A,D},{D,E},{A,B,E},{A,D,E}]
となる。組合せ数が「3」未満の特徴量は、登録しないため(1組合せ数、2組合せ数については登録しているため)、F_(3)=[{A,B,E},{A,D,E}]となる。
(数式1)
if yi > b and xi ≦ (yi - b) ÷ a then xi* = xi
if yi > b and xi > (yi - b) ÷ a then xi* = (yi - b) ÷ a
if yi ≦ b then xi* = 0
(数式2)
if yi < b and xi ≦ (yi - b) ÷ a then xi* = xi
if yi < b and xi > (yi - b) ÷ a then xi* = (yi - b) ÷ a
if yi ≧ b then xi* = 0
象限II :点が存在しない(すべて象限IIIに移動)。
象限III:各点がなるべく傾きの大きい直線に近い状態に並ぶ。ただし、xi*<0にはならないため、xi*=0で下げ止まる。
象限IV :点がなるべく存在しない。ただし、移動前にxi=0に存在する点が移動できないのでそのまま存在する。
本特徴量選択システム1によれば、より少ない計算時間で、目的変数に対する相関の高い特徴量を抽出することで、データ分析者の分析サイクルの短縮が可能になる。
なお上述実施の形態においては、本発明を特徴量選択システム1に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、方法、プログラム、記憶媒体などに広く適用することができる。
Claims (8)
- 目的変数に係る複数の説明変数において組合せを取って特徴量を生成する際、前記目的変数との相関係数がしきい値以上になる特徴量を生成する特徴量生成部を備え、
前記特徴量生成部は、
前記複数の説明変数から生成し得る複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った特徴量同士の組合せを取った特徴量を新たな特徴量として生成する、
ことを特徴とする特徴量生成装置。 - 前記特徴量生成部は、説明変数の組合せ数がN(N≧2の整数)の特徴量を生成する際、説明変数の組合せ数がk(1≦k<Nの整数)の複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った説明変数の組合せ数が「1」の特徴量と除去して残った組合せ数がkの特徴量との組合せを取った特徴量を説明変数の組合せ数がk+1の新たな特徴量として生成する処理を、説明変数の組合せ数がNの特徴量を生成するまでkが1から順に繰り返す、
ことを特徴とする請求項1に記載の特徴量生成装置。 - 前記特徴量生成部は、前記複数の特徴量から前記しきい値未満の特徴量を除去する際、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるように、前記目的変数の値を変更することなく前記一の特徴量の値を変更することで前記点群を移動し、移動した点群と前記目的変数との相関係数である相関見込み値を計算し、計算した相関見込み値が前記しきい値以上であるか否かを判定する、
ことを特徴とする請求項1に記載の特徴量生成装置。 - 前記特徴量生成部は、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるための前記点群の移動パターンを示す移動境界直線を計算し、計算した移動境界直線に基づいて前記点群を移動する、
ことを特徴とする請求項3に記載の特徴量生成装置。 - 目的変数に係る複数の説明変数において組合せを取って特徴量を生成する際、前記目的変数との相関係数がしきい値以上になる特徴量を生成する特徴量生成方法であって、
特徴量生成部が、
前記複数の説明変数から生成し得る複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った特徴量同士の組合せを取った特徴量を新たな特徴量として生成する、
ことを特徴とする特徴量生成方法。 - 前記特徴量生成部が、説明変数の組合せ数がN(N≧2の整数)の特徴量を生成する際、説明変数の組合せ数がk(1≦k<Nの整数)の複数の特徴量の各々について、一の特徴量と前記一の特徴量とは異なる任意の他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が前記しきい値以上になるか否かを判定し、前記複数の特徴量から前記しきい値未満の特徴量を除去し、除去して残った説明変数の組合せ数が「1」の特徴量と除去して残った組合せ数がkの特徴量との組合せを取った特徴量を説明変数の組合せ数がk+1の新たな特徴量として生成する処理を、説明変数の組合せ数がNの特徴量を生成するまでkが1から順に繰り返す、
ことを特徴とする請求項5に記載の特徴量生成方法。 - 前記特徴量生成部が、前記複数の特徴量から前記しきい値未満の特徴量を除去する際、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるように、前記目的変数の値を変更することなく前記一の特徴量の値を変更することで前記点群を移動し、移動した点群と前記目的変数との相関係数である相関見込み値を計算し、計算した相関見込み値が前記しきい値以上であるか否かを判定する、
ことを特徴とする請求項5に記載の特徴量生成方法。 - 前記特徴量生成部が、前記目的変数の値と前記一の特徴量の値とを示す点群に基づいて、前記一の特徴量と前記他の特徴量との組合せを取ったときの特徴量と前記目的変数との間で取り得る相関係数が十分に大きくなるための前記点群の移動パターンを示す移動境界直線を計算し、計算した移動境界直線に基づいて前記点群を移動する、
ことを特徴とする請求項7に記載の特徴量生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018137210A JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018137210A JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020013511A JP2020013511A (ja) | 2020-01-23 |
JP7068085B2 true JP7068085B2 (ja) | 2022-05-16 |
Family
ID=69169939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018137210A Active JP7068085B2 (ja) | 2018-07-20 | 2018-07-20 | 特徴量生成装置および特徴量生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7068085B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7565719B2 (ja) | 2020-07-14 | 2024-10-11 | 三菱重工業株式会社 | 解析装置、解析方法及びプログラム |
JP7500358B2 (ja) * | 2020-09-07 | 2024-06-17 | キオクシア株式会社 | 情報処理装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031442A (ja) | 2004-07-16 | 2006-02-02 | Toshiba Corp | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
WO2017203601A1 (ja) | 2016-05-24 | 2017-11-30 | 三井情報株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793284A (ja) * | 1993-09-28 | 1995-04-07 | Mitsubishi Electric Corp | 特性値予測装置及び特性値予測方法 |
-
2018
- 2018-07-20 JP JP2018137210A patent/JP7068085B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031442A (ja) | 2004-07-16 | 2006-02-02 | Toshiba Corp | 空間データ分析装置、空間データ分析方法及び空間データ分析プログラム |
WO2017203601A1 (ja) | 2016-05-24 | 2017-11-30 | 三井情報株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020013511A (ja) | 2020-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5011830B2 (ja) | データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置 | |
US9727308B2 (en) | Sorting multiple records of data using ranges of key values | |
US20190087744A1 (en) | Automatic Selection of Variables for a Machine-Learning Model | |
US20070208707A1 (en) | Document data analysis apparatus, method of document data analysis, computer readable medium and computer data signal | |
RU2716553C1 (ru) | Устройство создания сигнатуры, способ создания сигнатуры, носитель записи, в котором записана программа создания сигнатуры, и система определения программного обеспечения | |
JP7068085B2 (ja) | 特徴量生成装置および特徴量生成方法 | |
Joly et al. | Machine learning enabled adaptive optimization of a transonic compressor rotor with precompression | |
JP2009163615A (ja) | 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体 | |
Schowe | Feature selection for high-dimensional data with RapidMiner | |
Seijo-Pardo et al. | Using data complexity measures for thresholding in feature selection rankers | |
JP2009129323A (ja) | 同義語抽出装置 | |
CN112597284A (zh) | 公司名称的匹配方法、装置、计算机设备及存储介质 | |
JP5163472B2 (ja) | パラメタ空間を分割してモデル化する設計支援装置、方法、及びプログラム | |
JP2017045080A (ja) | 業務フロー仕様再生方法 | |
CN116235158A (zh) | 实施自动化特征工程的系统和方法 | |
JP7274434B2 (ja) | 流用設計支援システム及び流用設計支援方法 | |
CN116226681B (zh) | 一种文本相似性判定方法、装置、计算机设备和存储介质 | |
JP5210224B2 (ja) | アノテーションデータ解析装置、アノテーションデータ解析プログラムおよびそのプログラムを記録した記録媒体 | |
WO2017129943A1 (en) | Methods and systems for physical placement control | |
JP7151515B2 (ja) | ソート方法、ソートプログラム及びソート装置 | |
JP7292235B2 (ja) | 分析支援装置及び分析支援方法 | |
US20220092260A1 (en) | Information output apparatus, question generation apparatus, and non-transitory computer readable medium | |
WO2014168199A1 (ja) | 論理演算方法および情報処理装置 | |
KR20200015300A (ko) | 신경망 피처 벡터 결정 장치 및 방법 | |
Joo et al. | Under sampling adaboosting shapelet transformation for time series feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220428 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7068085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |