JP6655582B2 - データ統合支援システム及びデータ統合支援方法 - Google Patents
データ統合支援システム及びデータ統合支援方法 Download PDFInfo
- Publication number
- JP6655582B2 JP6655582B2 JP2017154832A JP2017154832A JP6655582B2 JP 6655582 B2 JP6655582 B2 JP 6655582B2 JP 2017154832 A JP2017154832 A JP 2017154832A JP 2017154832 A JP2017154832 A JP 2017154832A JP 6655582 B2 JP6655582 B2 JP 6655582B2
- Authority
- JP
- Japan
- Prior art keywords
- rule
- data
- integration support
- data integration
- support system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010354 integration Effects 0.000 title claims description 53
- 238000000034 method Methods 0.000 title claims description 19
- 238000007405 data analysis Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本実施の形態によるデータ統合支援システム101の概略構成の一例を示す。本実施の形態では、いわゆる名寄せ後の結果をまとめる際に基準として使用すべきルールの作成支援に特徴がある。以下、具体的に説明する。
データ統合支援システム101は以上のように構成されており、次にデータ統合支援システム101の動作例としてのデータ統合支援方法について説明する。なお、本実施の形態では、ルールの決定に際し、対象レコードデータ群から決定すれば良いが、ここでは、併せて、過去に適用したルールのうち流用可能なルールも採用しうる形態を説明する。
図2及び図3は、それぞれ、上述した対象データDB103において管理されている顧客テーブル104の各列項目に対応したレコードデータの一例を示す。顧客テーブル104は、その列項目として、複数の顧客を互いに識別するための顧客ID、氏名、住所、電話番号、性別、年齢、登録日、更新日、更新時刻及び無効フラグを有する。この顧客テーブル104におけるユニークキーは、全ての列項目のうち顧客IDであるものとする。
1)住所変更の処理をレコードデータの更新時ではなく、新規追加または古いレコードデータの無効化で処理する場合(例えば無効フラグの設定)
2)レコードの類似度に応じて確率的に名寄せを実施した場合
そこで、本実施の形態では、次のように決定したルールを用いて、これらデータ上の矛盾がある状態を解消していく。
上記実施形態は、本発明を説明するための例示であり、本発明をこれらの実施形態にのみ限定する趣旨ではない。本発明は、その趣旨を逸脱しない限り、様々な形態で実施することができる。例えば、上記実施形態では、各種プログラムの処理をシーケンシャルに説明したが、特にこれにこだわるものではない。従って、処理結果に矛盾が生じない限り、処理の順序を入れ替え又は並行動作するように構成しても良い。また、上記実施形態における各処理ブロックを含むプログラムは、例えばコンピュータが読み取り可能な非一時的記憶媒体に格納されている形態であっても良い。
Claims (12)
- 複数のレコードデータのうち関連するデータ同士をルールに従って統合するデータ統合支援システムにおいて、
前記複数のレコードデータを管理する複数のテーブルと、
前記複数のテーブルのうちから選択した対象テーブル及び前記対象テーブルにおける特定キーの指定を受け付ける指定受付部と、
前記指定受付部によって指定が受け付けられた前記対象テーブル及び前記特定キーに基づいて特定のルールを決定するルール決定部と、
前記ルール決定部によって決定された前記特定のルールに従って前記複数のレコードデータ同士のうち一のレコードデータを選択するルール実行部と、
前記ルール実行部によって選択された前記一のレコードデータを解析するデータ解析部と、
前記データ解析部による前記一のレコードデータについての解析結果を表示する結果表示部と、
を備えることを特徴とするデータ統合支援システム。 - 前記ルール決定部は、
前記対象テーブルにおける前記特定キー以外の列項目を用いた選定ルールのカバレッジを各列項目について算出し、該カバレッジに基づいて前記選定ルールから前記特定のルールを決定することを特徴とする請求項1に記載のデータ統合支援システム。 - 前記複数のレコードデータに対して適用された過去のルールを管理する適用履歴テーブルを備え、
前記ルール決定部は、
前記適用履歴テーブルにおいて管理されている前記過去のルールのうちから前記一のレコードデータに適用可能なルールを検索することを特徴とする請求項1に記載のデータ統合支援システム。 - 前記複数のレコードデータに対して適用された過去のルールを管理する適用履歴テーブルを備え、
前記ルール決定部は、
前記適用履歴テーブルにおいて管理されている前記過去のルールのうちから前記一のレコードデータに適用可能なルールを検索し、
前記結果表示部は、
前記ルールの候補を提示するための選定ルール候補表示画面を表示するとともに、前記対象テーブルにおける列項目を用いた前記選定ルールのカバレッジ及び適用履歴スコアを併せて表示することを特徴とする請求項2に記載のデータ統合支援システム。 - 前記結果表示部は、
前記選定ルール候補表示画面に、選択条件を入力するための選択条件画面を重ねて表示する請求項4に記載のデータ統合支援システム。 - 前記結果表示部は、
前記選定ルール候補表示画面において、前記対象テーブルの列項目のうち未使用の列項目をマスクして表示することを特徴とする請求項4に記載のデータ統合支援システム。 - 複数のレコードデータのうち関連するデータ同士をルールに従って統合するデータ統合支援システムにおけるデータ統合支援方法において、
前記データ統合支援システムが、前記複数のレコードデータを管理する複数のテーブルのうちから選択した対象テーブル及び前記対象テーブルにおける特定キーの指定を受け付ける指定受付ステップと、
前記データ統合支援システムが、前記指定受付ステップにおいて指定が受け付けられた前記対象テーブル及び前記特定キーに基づいて特定のルールを決定するルール決定ステップと、
前記データ統合支援システムが、前記ルール決定ステップにおいて決定された前記特定のルールに従って前記複数のレコードデータ同士のうち一のレコードデータを選択するルール実行ステップと、
前記データ統合支援システムが、前記ルール実行ステップにおいて選択された前記一のレコードデータを解析するデータ解析部ステップと、
前記データ統合支援システムが、前記一のレコードデータについての解析結果を表示する結果表示ステップと、
を有することを特徴とするデータ統合支援方法。 - 前記ルール決定ステップでは、
前記データ統合支援システムが、前記対象テーブルにおける前記特定キー以外の列項目を用いた選定ルールのカバレッジを各列項目について算出し、該カバレッジに基づいて前記選定ルールから前記特定のルールを決定することを特徴とする請求項7に記載のデータ統合支援方法。 - 前記ルール決定ステップでは、
前記データ統合支援システムが、前記複数のレコードデータに対して適用された過去のルールを管理する適用履歴テーブルにおいて管理されている前記過去のルールのうちから前記一のレコードデータに適用可能なルールを検索することを特徴とする請求項7に記載のデータ統合支援方法。 - 前記ルール決定ステップでは、
前記データ統合支援システムが、前記複数のレコードデータに対して適用された過去のルールを管理する適用履歴テーブルにおいて管理されている前記過去のルールのうちから前記一のレコードデータに適用可能なルールを検索し、
前記結果表示ステップは、
前記データ統合支援システムが、前記ルールの候補を提示するための選定ルール候補表示画面を表示するとともに、前記対象テーブルにおける列項目を用いた前記選定ルールのカバレッジ及び適用履歴スコアを併せて表示することを特徴とする請求項8に記載のデータ統合支援方法。 - 前記結果表示ステップは、
前記データ統合支援システムが、前記選定ルール候補表示画面に、選択条件を入力するための選択条件画面を重ねて表示する請求項10に記載のデータ統合支援方法。 - 前記結果表示ステップは、
前記データ統合支援システムが、前記選定ルール候補表示画面において、前記対象テーブルの列項目のうち未使用の列項目をマスクして表示することを特徴とする請求項10に記載のデータ統合支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154832A JP6655582B2 (ja) | 2017-08-09 | 2017-08-09 | データ統合支援システム及びデータ統合支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154832A JP6655582B2 (ja) | 2017-08-09 | 2017-08-09 | データ統合支援システム及びデータ統合支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019032781A JP2019032781A (ja) | 2019-02-28 |
JP6655582B2 true JP6655582B2 (ja) | 2020-02-26 |
Family
ID=65523786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154832A Expired - Fee Related JP6655582B2 (ja) | 2017-08-09 | 2017-08-09 | データ統合支援システム及びデータ統合支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6655582B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3940546A1 (en) * | 2019-03-15 | 2022-01-19 | Hitachi, Ltd. | Data integration evaluation system and data integration evaluation method |
CN112767059A (zh) * | 2021-03-02 | 2021-05-07 | 上海赛儿信息科技有限公司 | 一种会员积分管理系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3803961B2 (ja) * | 2001-12-05 | 2006-08-02 | 日本電信電話株式会社 | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム |
JP2004139237A (ja) * | 2002-10-16 | 2004-05-13 | Toshiba Corp | 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム |
US8103704B2 (en) * | 2007-07-31 | 2012-01-24 | ePrentise, LLC | Method for database consolidation and database separation |
JP5585472B2 (ja) * | 2011-01-28 | 2014-09-10 | 富士通株式会社 | 情報照合装置、情報照合方法および情報照合プログラム |
-
2017
- 2017-08-09 JP JP2017154832A patent/JP6655582B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2019032781A (ja) | 2019-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6843882B2 (ja) | 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨 | |
US8103704B2 (en) | Method for database consolidation and database separation | |
US20190370233A1 (en) | Intelligent data quality | |
US9195952B2 (en) | Systems and methods for contextual mapping utilized in business process controls | |
US8645332B1 (en) | Systems and methods for capturing data refinement actions based on visualized search of information | |
US9336286B2 (en) | Graphical record matching process replay for a data quality user interface | |
US11093521B2 (en) | Just-in-time data quality assessment for best record creation | |
JP2011503681A (ja) | データ記録を一致させるシステムの分析のための方法およびシステム | |
US8943042B2 (en) | Analyzing and representing interpersonal relations | |
US20200293557A1 (en) | Efficient association of related entities | |
US20170116305A1 (en) | Input Gathering System and Method for Refining, Refining or Validating Star Schema for a Source Database | |
US20210334292A1 (en) | System and method for reconciliation of data in multiple systems using permutation matching | |
JP6655582B2 (ja) | データ統合支援システム及びデータ統合支援方法 | |
US10963474B2 (en) | Automatic discriminatory pattern detection in data sets using machine learning | |
JP2013225181A (ja) | 情報レコメンドシステム、方法、およびプログラム | |
US10216792B2 (en) | Automated join detection | |
CN110019182B (zh) | 一种数据追溯方法及装置 | |
US20160321678A1 (en) | Customer lifecycle prediction | |
US11238077B2 (en) | Auto derivation of summary data using machine learning | |
Moreno et al. | Sortinghat: wizardry on software project members | |
US11157470B2 (en) | Method and system for data quality delta analysis on a dataset | |
US20210081483A1 (en) | Framework For Just-In-Time Decision Support Analytics | |
JP2001265580A (ja) | レビュー支援システム及びそれに用いるレビュー支援方法 | |
JP7147258B2 (ja) | データ生成方法、データ生成プログラム及び情報処理装置 | |
US20240029031A1 (en) | Machine learning recommendation for maintenance targets in preventive maintenance plans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6655582 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |