JP2022064315A - コンピュータ実装方法、コンピュータプログラム及びコンピュータシステム(データセット間の相関検出) - Google Patents
コンピュータ実装方法、コンピュータプログラム及びコンピュータシステム(データセット間の相関検出) Download PDFInfo
- Publication number
- JP2022064315A JP2022064315A JP2021166626A JP2021166626A JP2022064315A JP 2022064315 A JP2022064315 A JP 2022064315A JP 2021166626 A JP2021166626 A JP 2021166626A JP 2021166626 A JP2021166626 A JP 2021166626A JP 2022064315 A JP2022064315 A JP 2022064315A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- value
- computer
- contributes
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】コンピュータデバイスが、(i)データセットと、(ii)コンピュータ決定アルゴリズムによりデータセットのデータエントリ用に作成された出力クラス判定のセットと、(iii)データセットの第1属性の第1の値に起因する出力クラス判定と第1属性の第2の値に起因する出力クラス判定との望ましくない相違とを識別する。コンピューティングデバイスは、(i)第1属性の第1の値を有するデータエントリの第1グループと(ii)第1属性の第2の値を有するデータエントリの第2グループとの間の相関ルールマイニングモデルを提供することによって、且つリフト計算に少なくとも部分的に基づいて相関ルールマイニングモデルにより生成される候補属性及び値のセットから第2属性の値を選択することによって、データセットの第2属性の値が望ましくない相違に寄与していると判断する。
【選択図】図2
Description
Claims (20)
- 1つ又は複数のプロセッサが、(i)データセットと、(ii)コンピュータ決定アルゴリズムにより前記データセットのデータエントリ用に作成された出力クラス判定のセットと、(iii)前記データセットの第1属性の第1の値に起因する出力クラス判定と前記第1属性の第2の値に起因する出力クラス判定との望ましくない相違とを識別する段階と、
1つ又は複数のプロセッサが、前記データセットの第2属性の値が前記望ましくない相違に寄与していることを、
(i)前記第1属性の前記第1の値を有する前記データエントリの第1グループと、(ii)前記第1属性の前記第2の値を有する前記データエントリの第2グループとを相関ルールマイニングモデルに提供することによって、且つ
リフト計算に少なくとも部分的に基づいて前記相関ルールマイニングモデルにより生成される候補属性及び値のセットから前記第2属性の前記値を選択することによって
判断する段階と
を備えるコンピュータ実装方法。 - 1つ又は複数のプロセッサが、前記第1属性以外の、前記望ましくない相違に寄与している1つ又は複数の属性の値を識別するという要求をユーザから受信する段階と、
1つ又は複数のプロセッサが、前記第2属性の前記値が前記望ましくない相違に寄与しているとの前記判断を前記ユーザに通知することによって前記要求に応答する段階と
をさらに備える、請求項1に記載のコンピュータ実装方法。 - 前記第2属性の前記値が前記望ましくない相違に寄与していると判断する段階が、前記第2属性の前記値が前記第1属性の前記第1の値と相関があると1つ又は複数のプロセッサが判断する段階を含む、請求項1又は2に記載のコンピュータ実装方法。
- 前記第2属性の第2の値も前記望ましくない相違に寄与していると1つ又は複数のプロセッサが判断する段階をさらに備え、前記第2属性の前記第2の値が前記第1属性の前記第2の値と相関があると判断される、請求項3に記載のコンピュータ実装方法。
- 第3属性の値も前記望ましくない相違に寄与していると1つ又は複数のプロセッサが判断する段階をさらに備え、前記第3属性の前記値が前記第1属性の前記第2の値と相関があると判断される、請求項3又は4に記載のコンピュータ実装方法。
- 1つ又は複数のプロセッサが、(i)訓練データセットの複数の列及び前記複数の列のそれぞれに対するそれぞれの制約を識別するスキーマと(ii)前記複数の列同士の既知の相関のリストとを含む訓練データを用いて、前記相関ルールマイニングモデルを訓練する段階をさらに備える、請求項1から5のいずれか一項に記載のコンピュータ実装方法。
- 前記リフト計算が、前記第1属性の前記第1の値と前記第2属性の前記値とが共に生じたデータエントリの数を、前記第1属性の前記第1の値が生じたデータエントリの数と前記第2属性の前記値が生じたデータエントリの数との積で割ることを含む、請求項1から6のいずれか一項に記載のコンピュータ実装方法。
- プロセッサに、
(i)データセットと、(ii)コンピュータ決定アルゴリズムにより前記データセットのデータエントリ用に作成された出力クラス判定のセットと、(iii)前記データセットの第1属性の第1の値に起因する出力クラス判定と前記第1属性の第2の値に起因する出力クラス判定との望ましくない相違とを識別する手順と、
前記データセットの第2属性の値が前記望ましくない相違に寄与していることを、
(i)前記第1属性の前記第1の値を有する前記データエントリの第1グループと、(ii)前記第1属性の前記第2の値を有する前記データエントリの第2グループとを相関ルールマイニングモデルに提供することによって、且つ
リフト計算に少なくとも部分的に基づいて前記相関ルールマイニングモデルにより生成される候補属性及び値のセットから前記第2属性の前記値を選択することによって
判断する手順と
を実行させるためのコンピュータプログラム。 - 前記プロセッサに、
前記第1属性以外の、前記望ましくない相違に寄与している1つ又は複数の属性の値を識別するという要求をユーザから受信する手順と、
前記第2属性の前記値が前記望ましくない相違に寄与しているとの前記判断を前記ユーザに通知することによって前記要求に応答する手順と
をさらに実行させる、請求項8に記載のコンピュータプログラム。 - 前記第2属性の前記値が前記望ましくない相違に寄与していると判断する前記手順が、前記第2属性の前記値が前記第1属性の前記第1の値と相関があると判断する手順を含む、請求項8又は9に記載のコンピュータプログラム。
- 前記プロセッサに、前記第2属性の第2の値も前記望ましくない相違に寄与していると判断する手順であって、前記第2属性の前記第2の値が、前記第1属性の前記第2の値と相関があると判断される、手順を実行させる、請求項10に記載のコンピュータプログラム。
- 前記プロセッサに、第3属性の値も前記望ましくない相違に寄与していると判断する手順であって、前記第3属性の前記値が、前記第1属性に前記第2の値と相関があると判断される、手順をさらに実行させる、請求項10又は11に記載のコンピュータプログラム。
- 前記プロセッサに、
(i)訓練データセットの複数の列及び前記複数の列のそれぞれに対するそれぞれの制約を識別するスキーマと、(ii)前記複数の列同士の既知の相関のリストとを含む訓練データを用いて、前記相関ルールマイニングモデルを訓練する手順をさらに実行させる、請求項8から12のいずれか一項に記載のコンピュータプログラム。 - 前記リフト計算が、前記第1属性の前記第1の値と前記第2属性の前記値とが共に生じたデータエントリの数を、前記第1属性の前記第1の値が生じたデータエントリの数と前記第2属性の前記値が生じたデータエントリの数との積で割ることを含む、請求項8から13のいずれか一項に記載のコンピュータプログラム。
- コンピュータシステムであって、前記コンピュータシステムが、
1つ又は複数のプロセッサと、
1つ又は複数のコンピュータ可読記憶媒体と、
前記1つ又は複数のプロセッサのうちの少なくとも1つによる実行のために、前記1つ又は複数のコンピュータ可読記憶媒体に格納されたプログラム命令と
を備え、前記格納されたプログラム命令が、
(i)データセットと、(ii)コンピュータ決定アルゴリズムにより前記データセットのデータエントリ用に作成された出力クラス判定のセットと、(iii)前記データセットの第1属性の第1の値に起因する出力クラス判定と前記第1属性の第2の値に起因する出力クラス判定との望ましくない相違とを識別するプログラム命令と、
前記データセットの第2属性の値が前記望ましくない相違に寄与していることを、
(i)前記第1属性の前記第1の値を有する前記データエントリの第1グループと、(ii)前記第1属性の前記第2の値を有する前記データエントリの第2グループとを相関ルールマイニングモデルに提供することによって、且つ
リフト計算に少なくとも部分的に基づいて前記相関ルールマイニングモデルにより生成される候補属性及び値のセットから前記第2属性の前記値を選択することによって
判断するプログラム命令と
を含む、コンピュータシステム。 - 前記格納されたプログラム命令がさらに、
前記第1属性以外の、前記望ましくない相違に寄与している1つ又は複数の属性の値を識別するという要求をユーザから受信するプログラム命令と、
前記第2属性の前記値が前記望ましくない相違に寄与しているとの前記判断を前記ユーザに通知することによって前記要求に応答するプログラム命令と
を含む、請求項15に記載のコンピュータシステム。 - 前記第2属性の前記値が前記望ましくない相違に寄与していると判断する前記プログラム命令が、前記第2属性の前記値が前記第1属性の前記第1の値と相関があると判断するプログラム命令を含む、請求項15又は16に記載のコンピュータシステム。
- 前記格納されたプログラム命令がさらに、前記第2属性の第2の値も前記望ましくない相違に寄与していると判断するプログラム命令を含み、前記第2属性の前記第2の値が、前記第1属性の前記第2の値と相関があると判断される、請求項17に記載のコンピュータシステム。
- 前記格納されたプログラム命令がさらに、第3属性の値も前記望ましくない相違に寄与していると判断するプログラム命令を含み、前記第3属性の前記値が、前記第1属性に前記第2の値と相関があると判断される、請求項18に記載のコンピュータシステム。
- 前記格納されたプログラム命令がさらに、
(i)訓練データセットの複数の列及び前記複数の列のそれぞれに対するそれぞれの制約を識別するスキーマと、(ii)前記複数の列同士の既知の相関のリストとを含む訓練データを用いて、前記相関ルールマイニングモデルを訓練するプログラム命令を含む、請求項15から19のいずれか一項に記載のコンピュータシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/068,856 US20220114459A1 (en) | 2020-10-13 | 2020-10-13 | Detection of associations between datasets |
US17/068,856 | 2020-10-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022064315A true JP2022064315A (ja) | 2022-04-25 |
Family
ID=78399541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021166626A Pending JP2022064315A (ja) | 2020-10-13 | 2021-10-11 | コンピュータ実装方法、コンピュータプログラム及びコンピュータシステム(データセット間の相関検出) |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220114459A1 (ja) |
JP (1) | JP2022064315A (ja) |
CN (1) | CN114357056A (ja) |
DE (1) | DE102021123132A1 (ja) |
GB (1) | GB2600551A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023154767A (ja) * | 2022-04-08 | 2023-10-20 | 株式会社三共 | 遊技機 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7410209B2 (ja) * | 2022-04-20 | 2024-01-09 | Lineヤフー株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7433879B1 (en) * | 2004-06-17 | 2008-10-07 | Versata Development Group, Inc. | Attribute based association rule mining |
US20120297331A1 (en) * | 2011-05-19 | 2012-11-22 | Sumathi Chutkay | Systems and methods for intelligent decision support |
US9652745B2 (en) * | 2014-06-20 | 2017-05-16 | Hirevue, Inc. | Model-driven evaluator bias detection |
US11893500B2 (en) * | 2017-11-28 | 2024-02-06 | International Business Machines Corporation | Data classification for data lake catalog |
US11556838B2 (en) * | 2019-01-09 | 2023-01-17 | Sap Se | Efficient data relationship mining using machine learning |
US11416500B2 (en) * | 2019-05-22 | 2022-08-16 | Oracle International Corporation | Control system for learning to rank fairness |
US11526701B2 (en) * | 2019-05-28 | 2022-12-13 | Microsoft Technology Licensing, Llc | Method and system of performing data imbalance detection and correction in training a machine-learning model |
US20220044133A1 (en) * | 2020-08-07 | 2022-02-10 | Sap Se | Detection of anomalous data using machine learning |
-
2020
- 2020-10-13 US US17/068,856 patent/US20220114459A1/en active Pending
-
2021
- 2021-09-07 DE DE102021123132.9A patent/DE102021123132A1/de active Pending
- 2021-09-24 GB GB2113647.8A patent/GB2600551A/en not_active Withdrawn
- 2021-10-11 JP JP2021166626A patent/JP2022064315A/ja active Pending
- 2021-10-12 CN CN202111185894.2A patent/CN114357056A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023154767A (ja) * | 2022-04-08 | 2023-10-20 | 株式会社三共 | 遊技機 |
Also Published As
Publication number | Publication date |
---|---|
DE102021123132A1 (de) | 2022-04-14 |
CN114357056A (zh) | 2022-04-15 |
GB202113647D0 (en) | 2021-11-10 |
US20220114459A1 (en) | 2022-04-14 |
GB2600551A (en) | 2022-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170303841A1 (en) | Burnout symptoms detection and prediction | |
US10146586B2 (en) | Managing a shared pool of configurable computing resources using a set of scaling factors and a set of workload resource data | |
US9973460B2 (en) | Familiarity-based involvement on an online group conversation | |
US9985973B2 (en) | Context sensitive security help | |
US20230107309A1 (en) | Machine learning model selection | |
US20210092071A1 (en) | Distributing computing resources based on location | |
US11734586B2 (en) | Detecting and improving content relevancy in large content management systems | |
JP2022064315A (ja) | コンピュータ実装方法、コンピュータプログラム及びコンピュータシステム(データセット間の相関検出) | |
US20180158025A1 (en) | Exploration based cognitive career guidance system | |
JP2023538941A (ja) | コンテナ化された環境のインテリジェントバックアップ及び復元 | |
US10534804B2 (en) | Customized content for social browsing flow | |
US11928038B2 (en) | Managing data sets based on user activity | |
US20210397717A1 (en) | Software information analysis | |
JP2020536299A (ja) | 改善されたパフォーマンスのためのユーザ・プロファイルの動的かつ自動的な変更を実施するための方法、コンピュータ・システム及びプログラム | |
US11893132B2 (en) | Discovery of personal data in machine learning models | |
US20190164232A1 (en) | Automated skill recommendation in social neworks | |
US20230027115A1 (en) | Event-based record matching | |
US20190065582A1 (en) | Cognitive data curation on an interactive infrastructure management system | |
US20220284485A1 (en) | Stratified social review recommendation | |
US11556385B2 (en) | Cognitive processing resource allocation | |
US11240118B2 (en) | Network mixing patterns | |
US11520846B2 (en) | Petition creation through social analytics | |
JP2023550445A (ja) | データアナリティクスにおけるデータアクセスポリシの自動調整 | |
TW202301832A (zh) | 使用基於用戶互動歷史之模型來增強移動設備中之驗證 | |
US20210158720A1 (en) | Automatic digital badge update system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220518 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250623 |