JP5889759B2 - 欠損値予測装置、欠損値予測方法、欠損値予測プログラム - Google Patents
欠損値予測装置、欠損値予測方法、欠損値予測プログラム Download PDFInfo
- Publication number
- JP5889759B2 JP5889759B2 JP2012209403A JP2012209403A JP5889759B2 JP 5889759 B2 JP5889759 B2 JP 5889759B2 JP 2012209403 A JP2012209403 A JP 2012209403A JP 2012209403 A JP2012209403 A JP 2012209403A JP 5889759 B2 JP5889759 B2 JP 5889759B2
- Authority
- JP
- Japan
- Prior art keywords
- variable
- regression analysis
- prediction
- missing
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 91
- 238000000611 regression analysis Methods 0.000 claims description 62
- 238000004458 analytical method Methods 0.000 claims description 38
- 230000002776 aggregation Effects 0.000 claims description 27
- 238000004220 aggregation Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 15
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 230000007717 exclusion Effects 0.000 claims description 5
- 230000006872 improvement Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000010187 selection method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002360 prefrontal effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
この構成によれば、変数の削減と学習データ量の増加という2つの処理による変数絞込みの繰り返し回数を事前に設定した予測精度の条件から決定でき、より予測精度の向上に寄与する変数に絞り込むことができる。
この構成によれば、学習データの中で特に予測の精度向上に寄与するレコードを考慮して予測したい欠損値と各変数との相関性を計算できるので、より予測精度の向上に寄与する変数に絞り込むことができる。
ことを特徴とする。
以上の手順で、欠損値予測装置10は不完全データの欠損した値を予測することができる。
11:第1メモリ
12:第2メモリ
13:要求受付部
14:集約部
15:変数選択型回帰分析部
16:予測結果評価部
17:予測部
18:結果応答部
Claims (7)
- 複数の変数を含むレコード群と当該レコード群における欠損値のうちの予測したい目的変数を受け付ける要求受付部と、
目的変数を有するレコードの変数のうち、欠損しておらず値を有する変数を説明変数に設定し、前記レコード群のなかから説明変数の揃ったレコードを解析対象レコード群として集約する集約部と、
集約した解析対象レコード群について変数選択型の重回帰分析を行うことによって説明変数の係数を計算して相関性の低い変数を説明変数から除外する回帰分析部と、
重回帰分析の結果をもとに、目的変数を含むレコードの各説明変数の値及び係数から目的変数の値を計算する予測部と、
を備え、
前記集約部が行う処理と前記回帰分析部が行う処理とを複数回繰り返すことによって、前記集約部の2回目以降の処理において、前記回帰分析部における前記除外後に残った説明変数が揃っておりかつ前記解析対象レコード群に含まれていないレコードを解析対象レコード群に追加する
ことを特徴とする欠損値予測装置。 - 前記回帰分析部の算出した説明変数の係数を用いて予測精度を算出し、算出された予測精度が設定した条件を満たしているか否かを判定する予測結果評価部をさらに備え、
前記算出された予測精度が前記設定した条件を満たすまで、前記集約部が行う処理と前記回帰分析部が行う処理とを繰り返す
ことを特徴とする請求項1に記載の欠損値予測装置。 - 前記回帰分析部は、相関性を計算する際に、特定の説明変数について、目的変数を有するレコードの説明変数と近い値を有する解析対象レコードの重み付けを重くする
ことを特徴とする請求項1又は2に記載の欠損値予測装置。 - 要求受付部と集約部と回帰分析部と予測部とを備えた欠損値予測装置が実行する欠損値予測方法であって、
前記要求受付部が、複数の変数を含むレコード群と当該レコード群における欠損値のうちの予測したい目的変数を受け付ける要求受付手順と、
前記集約部が、目的変数を有するレコードの変数のうち、欠損しておらず値を有する変数を説明変数に設定し、前記レコード群のなかから説明変数の揃ったレコードを解析対象レコード群として集約する集約手順と、
前記回帰分析部が、集約した解析対象レコード群について変数選択型の重回帰分析を行うことによって説明変数の係数を計算して相関性の低い変数を説明変数から除外する回帰分析手順と、
前記予測部が、前記回帰分析手順において行った重回帰分析の結果をもとに、目的変数を含むレコードの各説明変数の値及び係数から目的変数の値を計算する予測手順と、
を有し、
前記集約手順と前記回帰分析手順とを複数回繰り返すことによって、2回目以降の前記集約手順において、前記回帰分析手順における前記除外後に残った説明変数が揃っておりかつ前記解析対象レコード群に含まれていないレコードを解析対象レコード群に追加する
ことを特徴とする欠損値予測方法。 - 前記欠損値予測装置は、予測結果評価部をさらに備え、
前記予測結果評価部が、前記回帰分析手順において算出された説明変数の係数を用いて予測精度を算出し、算出された予測精度が設定した条件を満たしているか否かを判定する予測結果評価手順をさらに備え、
前記算出された予測精度が前記設定した条件を満たすまで、前記集約手順と前記回帰分析手順とを繰り返す
ことを特徴とする請求項4に記載の欠損値予測方法。 - 前記回帰分析手順において、相関性を計算する際に、特定の説明変数について、目的変数を有するレコードの説明変数と近い値を有する解析対象レコードの重み付けを重くする
ことを特徴とする請求項4又は5に記載の欠損値予測方法。 - 不完全データの欠損値を予測する欠損値予測プログラムであって、
コンピュータに、
複数の変数を含むレコード群と当該レコード群における欠損値のうちの予測したい目的変数を受け付ける要求受付手順と、
目的変数を有するレコードの変数のうち、欠損しておらず値を有する変数を説明変数に設定し、前記レコード群のなかから説明変数の揃ったレコードを解析対象レコード群として集約する集約手順と、
集約した解析対象レコード群について変数選択型の重回帰分析を行うことによって説明変数の係数を計算して相関性の低い変数を説明変数から除外する回帰分析手順と、
前記回帰分析手順において行った重回帰分析の結果をもとに、目的変数を含むレコードの各説明変数の値及び係数から目的変数の値を計算する予測手順と、
を実行させ、
前記集約手順と前記回帰分析手順とを複数回繰り返させることによって、2回目以降の前記集約手順において、前記回帰分析手順における前記除外後に残った説明変数が揃っておりかつ前記解析対象レコード群に含まれていないレコードを解析対象レコード群に追加させる
ことを特徴とする欠損値予測プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012209403A JP5889759B2 (ja) | 2012-09-24 | 2012-09-24 | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012209403A JP5889759B2 (ja) | 2012-09-24 | 2012-09-24 | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014063432A JP2014063432A (ja) | 2014-04-10 |
JP5889759B2 true JP5889759B2 (ja) | 2016-03-22 |
Family
ID=50618583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012209403A Active JP5889759B2 (ja) | 2012-09-24 | 2012-09-24 | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5889759B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6178218B2 (ja) * | 2013-11-15 | 2017-08-09 | 日本電信電話株式会社 | 欠損値推定装置及び欠損値推定方法 |
JP6130977B1 (ja) * | 2016-05-24 | 2017-05-17 | 三井情報株式会社 | 情報処理装置、情報処理方法、情報処理システム及びプログラム |
US11449732B2 (en) | 2016-09-06 | 2022-09-20 | Nippon Telegraph And Telephone Corporation | Time-series-data feature extraction device, time-series-data feature extraction method and time-series-data feature extraction program |
JP7352070B2 (ja) * | 2019-07-30 | 2023-09-28 | 横浜ゴム株式会社 | データ処理方法、データ処理装置、及びプログラム |
WO2024070169A1 (ja) * | 2022-09-29 | 2024-04-04 | 日本碍子株式会社 | 試作条件提案システム、試作条件提案方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785082A (ja) * | 1993-09-10 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | 欠損値推定方式 |
JP3301247B2 (ja) * | 1994-12-28 | 2002-07-15 | 株式会社豊田中央研究所 | 材料の真密度推定方法および装置、材料の空洞量推定方法 |
JP5682484B2 (ja) * | 2010-09-16 | 2015-03-11 | 新日鐵住金株式会社 | 厚鋼板の冷却制御方法、冷却制御装置及び厚鋼板の製造方法 |
-
2012
- 2012-09-24 JP JP2012209403A patent/JP5889759B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014063432A (ja) | 2014-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Galante et al. | The challenge of modeling niches and distributions for data‐poor species: a comprehensive approach to model complexity | |
JP5889759B2 (ja) | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム | |
CN109753591B (zh) | 业务流程预测性监控方法 | |
Johnson et al. | Species distribution modeling and prediction: A class imbalance problem | |
CN112687349A (zh) | 一种降低辛烷值损失模型的构建方法 | |
JP2015082259A (ja) | 時系列データ予測装置、時系列データ予測方法、及びプログラム | |
Leite et al. | Active testing strategy to predict the best classification algorithm via sampling and metalearning | |
WO2019200739A1 (zh) | 数据欺诈识别方法、装置、计算机设备和存储介质 | |
JP2008077403A (ja) | 評価装置、評価方法及び評価プログラム | |
Shreyas et al. | Predicting popularity of online articles using random forest regression | |
JP6200076B2 (ja) | システムから取得される測定値を評価する方法及びシステム | |
CN112801231B (zh) | 用于业务对象分类的决策模型训练方法和装置 | |
Amasaki et al. | The effects of moving windows to software estimation: comparative study on linear regression and estimation by analogy | |
CN111951104A (zh) | 一种基于关联图谱的风险传导预警方法 | |
Singh et al. | An ensemble approach for feature selection of Cyber Attack Dataset | |
US11200156B2 (en) | Tester and method for testing a device under test using relevance scores | |
JP7207540B2 (ja) | 学習支援装置、学習支援方法、及びプログラム | |
Chen et al. | GAIA: delving into gradient-based attribution abnormality for out-of-distribution detection | |
Bidyuk et al. | An Approach to Identifying and Filling Data Gaps in Machine Learning Procedures | |
Sagala et al. | Enhanced churn prediction model with boosted trees algorithms in the banking sector | |
CN117472679A (zh) | 结合数据流和控制流漂移发现的异常检测方法及系统 | |
CN116188834B (zh) | 基于自适应训练模型的全切片图像分类方法及装置 | |
CN111081321B (zh) | 一种cns药物关键特征识别方法 | |
JP4230890B2 (ja) | モデル同定装置,モデル同定プログラム及びモデル同定装置の動作方法 | |
TW202105106A (zh) | 資料處理裝置、方法、及半導體製造裝置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5889759 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |