JP7010363B2 - 情報処理装置、情報処理方法、プログラム - Google Patents
情報処理装置、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP7010363B2 JP7010363B2 JP2020504927A JP2020504927A JP7010363B2 JP 7010363 B2 JP7010363 B2 JP 7010363B2 JP 2020504927 A JP2020504927 A JP 2020504927A JP 2020504927 A JP2020504927 A JP 2020504927A JP 7010363 B2 JP7010363 B2 JP 7010363B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- value
- information processing
- defect
- rules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Description
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を備えた、
という構成をとる。
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成し、
複数の前記ルールに基づいて前記欠損を補完する値を特定する、
という構成をとる。
情報処理装置に、
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を実現させる、
という構成をとる。
本発明の第1の実施形態を、図1乃至図8を参照して説明する。図1は、情報処理装置の構成を示すブロック図である。図2は、欠損を含むデータの一例を示す図である。図3は、情報処理装置の動作を示すフローチャートである。図4乃至図7は、データの欠損に対する補完処理を説明するための図である。図8は、データの欠損を補完したときの様子を示す図である。
(a1)属性「月」が「2月」の場合、属性「天気」は「晴れ」70%、「曇り」20%、「雨」40%
(a2)属性「気温」が「5℃以上10℃未満」の場合、属性「天気」は「晴れ」20%、「曇り」40%、「雨」40%
(a3)属性「湿度」が「40%以上50%未満」の場合、属性「天気」は「晴れ」60%、「曇り」35%、「雨」5%
次に、本発明の第2の実施形態を、図9を参照して説明する。図9は、実施形態2における情報処理装置の構成を示すブロック図である。なお、本実施形態では、実施形態1で説明した情報処理装置の構成の概略を示している。
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、当該特定の属性とは異なる他の属性の値と、に基づいて、上記欠損を補完するルールを複数生成する生成手段110と、
複数の上記ルールに基づいて上記欠損を補完する値を特定する補完手段120と、
を備えている。
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、当該特定の属性とは異なる他の属性の値と、に基づいて、上記欠損を補完するルールを複数生成し、
複数の上記ルールに基づいて上記欠損を補完する値を特定する、
という処理を実行するよう作動する。
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理装置、情報処理方法、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を備えた情報処理装置。
付記1に記載の情報処理装置であって、
前記生成手段は、前記特定の属性の所定の前記欠損を補完する複数の前記ルールを生成し、
前記補完手段は、複数の前記ルールに基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理装置。
付記2に記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値と、前記他の属性の値と、の組み合わせを形成する際に、前記特定の属性の値と組み合わせる前記他の属性をそれぞれ異なる属性に変えて複数の組み合わせを形成し、当該複数の組み合わせのそれぞれに基づいて前記所定の欠損を補完する前記ルールを生成することで、複数の前記ルールを生成する、
情報処理装置。
付記2又は3に記載の情報処理装置であって、
前記生成手段は、
前記特定の属性の値と、前記他の属性である第1の属性の値と、に基づく、前記所定の欠損を補完する第1の前記ルールと、
前記特定の属性の値と、前記特定の属性及び前記第1の属性とは異なる前記他の属性である第2の属性の値と、に基づく、前記所定の欠損を補完する第2の前記ルールと、
を含む少なくとも2以上の前記ルールを生成する、
情報処理装置。
付記2乃至4のいずれかに記載の情報処理装置であって、
前記生成手段は、前記特定の属性の前記所定の欠損に対応する前記他の属性の値に対する、前記特定の属性の値の出現頻度に基づいて、前記ルールを生成する、
情報処理装置。
付記5に記載の情報処理装置であって、
前記生成手段は、前記他の属性の値が連続値である場合に、前記特定の属性の前記所定の欠損に対応する前記他の属性の値を含む所定範囲の値に対する、前記特定の属性の値の出現頻度に基づいて、前記ルールを生成する、
情報処理装置。
付記5又は6に記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値が連続値である場合に、前記特定の属性の前記所定の欠損に対応する前記他の属性の値に対する、前記特定の属性の所定範囲の値の出現頻度に基づいて、前記ルールを生成する、
情報処理装置。
付記5乃至6.1のいずれかに記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値と前記他の属性の値とが連続値である場合に、前記特定の属性の前記所定の欠損を除いた値と、前記特定の属性の前記所定の欠損を除いた値に対応する前記他の属性の値と、の散布図に基づいて、前記ルールを生成する、
情報処理装置。
付記2乃至7のいずれかに記載の情報処理装置であって、
前記補完手段は、複数の前記ルールのそれぞれに基づいて前記特定の属性の前記所定の欠損を補完する値の候補をそれぞれ生成し、当該複数の候補に基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理装置。
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成し、
複数の前記ルールに基づいて前記欠損を補完する値を特定する、
情報処理方法。
付記9に記載の情報処理方法であって、
前記特定の属性の所定の前記欠損を補完する複数の前記ルールを生成し、
複数の前記ルールに基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理方法。
付記9.1に記載の情報処理方法であって、
前記特定の属性の値と、前記他の属性の値と、の組み合わせを形成する際に、前記特定の属性の値と組み合わせる前記他の属性をそれぞれ異なる属性に変えて複数の組み合わせを形成し、当該複数の組み合わせのそれぞれに基づいて前記所定の欠損を補完する前記ルールを生成することで、複数の前記ルールを生成する、
情報処理方法。
付記9.1又は9.2に記載の情報処理方法であって、
複数の前記ルールのそれぞれに基づいて前記特定の属性の前記所定の欠損を補完する値の候補をそれぞれ生成し、当該複数の候補に基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理方法。
情報処理装置に、
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を実現させるためのプログラム。
11 ルール生成部
12 補完値候補生成部
13 補完値決定部
15 データ記憶部
100 情報処理装置
110 生成手段
120 補完手段
Claims (8)
- 複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を備え、
前記生成手段は、前記特定の属性の所定の前記欠損に対応する前記他の属性の値に対する、前記特定の属性の値の出現頻度に基づいて、前記所定の欠損を補完する複数の前記ルールを生成し、
前記補完手段は、複数の前記ルールに基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値と、前記他の属性の値と、の組み合わせを形成する際に、前記特定の属性の値と組み合わせる前記他の属性をそれぞれ異なる属性に変えて複数の組み合わせを形成し、当該複数の組み合わせのそれぞれに基づいて前記所定の欠損を補完する前記ルールを生成することで、複数の前記ルールを生成する、
情報処理装置。 - 請求項1又は2に記載の情報処理装置であって、
前記生成手段は、
前記特定の属性の値と、前記他の属性である第1の属性の値と、に基づく、前記所定の欠損を補完する第1の前記ルールと、
前記特定の属性の値と、前記特定の属性及び前記第1の属性とは異なる前記他の属性である第2の属性の値と、に基づく、前記所定の欠損を補完する第2の前記ルールと、
を含む少なくとも2以上の前記ルールを生成する、
情報処理装置。 - 請求項1乃至3のいずれかに記載の情報処理装置であって、
前記生成手段は、前記他の属性の値が連続値である場合に、前記特定の属性の前記所定の欠損に対応する前記他の属性の値を含む所定範囲の値に対する、前記特定の属性の値の出現頻度に基づいて、前記ルールを生成する、
情報処理装置。 - 請求項1乃至4のいずれかに記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値が連続値である場合に、前記特定の属性の前記所定の欠損に対応する前記他の属性の値に対する、前記特定の属性の所定範囲の値の出現頻度に基づいて、前記ルールを生成する、
情報処理装置。 - 請求項1乃至5のいずれかに記載の情報処理装置であって、
前記生成手段は、前記特定の属性の値と前記他の属性の値とが連続値である場合に、前記特定の属性の前記所定の欠損を除いた値と、前記特定の属性の前記所定の欠損を除いた値に対応する前記他の属性の値と、の散布図に基づいて、前記ルールを生成する、
情報処理装置。 - 複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する際に、前記特定の属性の所定の前記欠損に対応する前記他の属性の値に対する、前記特定の属性の値の出現頻度に基づいて、前記所定の欠損を補完する複数の前記ルールを生成し、
複数の前記ルールに基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
情報処理方法。 - 情報処理装置に、
複数の属性からなるデータのうち、欠損を含む特定の属性の値と、前記特定の属性とは異なる他の属性の値と、に基づいて、前記欠損を補完するルールを複数生成する生成手段と、
複数の前記ルールに基づいて前記欠損を補完する値を特定する補完手段と、
を実現させると共に、
前記生成手段は、前記特定の属性の所定の前記欠損に対応する前記他の属性の値に対する、前記特定の属性の値の出現頻度に基づいて、前記所定の欠損を補完する複数の前記ルールを生成し、
前記補完手段は、複数の前記ルールに基づいて前記特定の属性の前記所定の欠損を補完する値を特定する、
ことを実現させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018040991 | 2018-03-07 | ||
JP2018040991 | 2018-03-07 | ||
PCT/JP2019/006957 WO2019171992A1 (ja) | 2018-03-07 | 2019-02-25 | 情報処理装置、情報処理方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019171992A1 JPWO2019171992A1 (ja) | 2021-02-04 |
JP7010363B2 true JP7010363B2 (ja) | 2022-01-26 |
Family
ID=67846266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020504927A Active JP7010363B2 (ja) | 2018-03-07 | 2019-02-25 | 情報処理装置、情報処理方法、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210042636A1 (ja) |
JP (1) | JP7010363B2 (ja) |
WO (1) | WO2019171992A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7384713B2 (ja) | 2020-03-10 | 2023-11-21 | 株式会社日立製作所 | データ補完システム、およびデータ補完方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3638310B2 (ja) * | 1994-06-29 | 2005-04-13 | 株式会社東芝 | 事例推論支援装置 |
US6047287A (en) * | 1998-05-05 | 2000-04-04 | Justsystem Pittsburgh Research Center | Iterated K-nearest neighbor method and article of manufacture for filling in missing values |
US8140421B1 (en) * | 2008-01-09 | 2012-03-20 | Zillow, Inc. | Automatically determining a current value for a home |
CN104516879B (zh) * | 2013-09-26 | 2019-09-13 | Sap欧洲公司 | 用于管理含有具有缺失值的记录的数据库的方法和系统 |
US10394631B2 (en) * | 2017-09-18 | 2019-08-27 | Callidus Software, Inc. | Anomaly detection and automated analysis using weighted directed graphs |
-
2019
- 2019-02-25 US US16/977,891 patent/US20210042636A1/en active Pending
- 2019-02-25 WO PCT/JP2019/006957 patent/WO2019171992A1/ja active Application Filing
- 2019-02-25 JP JP2020504927A patent/JP7010363B2/ja active Active
Non-Patent Citations (1)
Title |
---|
菊池 悠意 ほか,「複数自己組織化マップを用いた欠損データの推定」,日本機械学会論文集(C編),一般社団法人 日本機械学会,2013年,第79巻, 第806号,pp.3465-3473,ISSN:1884-8354 |
Also Published As
Publication number | Publication date |
---|---|
US20210042636A1 (en) | 2021-02-11 |
JPWO2019171992A1 (ja) | 2021-02-04 |
WO2019171992A1 (ja) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242135B (zh) | 一种模型运营方法、装置、及业务服务器 | |
US9292650B2 (en) | Identifying layout pattern candidates | |
CN108021931A (zh) | 一种数据样本标签处理方法及装置 | |
KR102258942B1 (ko) | 인라인 수율 모니터링을 위한 임계 파라메트릭 전기 테스트 파라미터의 자동 결정을 위한 시스템 및 방법 | |
US9275331B2 (en) | Document classification system with user-defined rules | |
CN108733508A (zh) | 用于控制数据备份的方法和系统 | |
JP2010002370A (ja) | パターン抽出プログラム、方法及び装置 | |
CN111597768B (zh) | 用于构建版图图案集的方法、设备和计算机可读存储介质 | |
KR102230354B1 (ko) | 기계 학습 모델을 이용한 반도체 소자 테스트 장치 및 방법 | |
JP2006189724A (ja) | パターン抽出システム、測定ポイント抽出方法、パターン抽出方法及びパターン抽出プログラム | |
CN111222994A (zh) | 客户风险评估方法、装置、介质和电子设备 | |
CN108345832A (zh) | 一种人脸检测的方法、装置及设备 | |
CN111353850A (zh) | 一种风险识别策略的更新、风险商户的识别方法和装置 | |
CN113554526A (zh) | 电力设备的故障预警方法、装置、存储介质及处理器 | |
Yaghini et al. | A cutting-plane neighborhood structure for fixed-charge capacitated multicommodity network design problem | |
JP7010363B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
US10191107B2 (en) | Ranking defects with yield impacts | |
WO2019189016A1 (ja) | 情報処理装置、情報処理方法、プログラム | |
CN114168318A (zh) | 存储释放模型的训练方法、存储释放方法及设备 | |
JP2022549407A (ja) | レジーム・シフトの識別及び分析のための方法及びシステム | |
JP5408975B2 (ja) | 検査位置決定方法、検査情報管理システム及び検査支援方法 | |
US10338547B2 (en) | System, method and apparatuses for determining parameter settings for a power generation system and a tangible computer readable medium | |
CN110544166A (zh) | 样本生成方法、装置及存储介质 | |
CN113012088A (zh) | 一种电路板故障检测及孪生网络的训练方法、装置和设备 | |
CN114254762A (zh) | 可解释性机器学习模型构建方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200820 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211227 |