JP2022140929A - 情報処理プログラム、情報処理方法、および情報処理装置 - Google Patents
情報処理プログラム、情報処理方法、および情報処理装置 Download PDFInfo
- Publication number
- JP2022140929A JP2022140929A JP2021041009A JP2021041009A JP2022140929A JP 2022140929 A JP2022140929 A JP 2022140929A JP 2021041009 A JP2021041009 A JP 2021041009A JP 2021041009 A JP2021041009 A JP 2021041009A JP 2022140929 A JP2022140929 A JP 2022140929A
- Authority
- JP
- Japan
- Prior art keywords
- data
- time
- update
- date
- lineage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims description 151
- 238000012545 processing Methods 0.000 claims description 83
- 230000000737 periodic effect Effects 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 12
- 238000011835 investigation Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003203 everyday effect Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 230000003442 weekly effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000002354 daily effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
- G06F16/2386—Bulk updating operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】データリネージュを用いた問題対処の効率化を図る。
【解決手段】情報処理装置10は、複数のデータ1a,1b,・・・の来歴を示すデータリネージュ4における管理対象の複数のデータ1a,1b,・・・が更新されるごとに、更新されたデータに対応付けて更新日時を格納する。情報処理装置10は、指定日時または指定期間の入力に応じて、複数のデータ1a,1b,・・・それぞれに対応付けて格納された更新日時に基づいて、指定日時を含む所定期間または指定された指定期間内に更新されたデータを注目対象データと判断する。そして情報処理装置10は、データリネージュ4の一部であり、注目対象データに対応する表示オブジェクト5b,5c,5eを含む部分データリネージュ4aを生成する。
【選択図】図1
【解決手段】情報処理装置10は、複数のデータ1a,1b,・・・の来歴を示すデータリネージュ4における管理対象の複数のデータ1a,1b,・・・が更新されるごとに、更新されたデータに対応付けて更新日時を格納する。情報処理装置10は、指定日時または指定期間の入力に応じて、複数のデータ1a,1b,・・・それぞれに対応付けて格納された更新日時に基づいて、指定日時を含む所定期間または指定された指定期間内に更新されたデータを注目対象データと判断する。そして情報処理装置10は、データリネージュ4の一部であり、注目対象データに対応する表示オブジェクト5b,5c,5eを含む部分データリネージュ4aを生成する。
【選択図】図1
Description
本発明は、情報処理プログラム、情報処理方法、および情報処理装置に関する。
様々な種類のデータをため込むデータレイクでは、それらのデータを適切に管理して活用することが重要となる。データレイク内のデータを管理する技術として、機密情報を含んだデータの影響範囲やデータの流れを把握するためのデータリネージュ(データの来歴情報)がある。データリネージュには、入力データ、加工処理プロセス、出力データの関係を示す情報が含まれる。データリネージュを用いることで、各データがどのような加工処理を経て生成されたのかを示す図で表すことができる。データリネージュを用いると、誤ったデータの影響範囲を瞬時に把握可能となると共に、個人情報がシステム上のどこに存在するかの把握も容易となる。
データの来歴を示す技術としては、例えば派生したファイルのメタデータを効率的に管理する計算機システムが提案されている。また障害発生時に希望する時点への迅速なデータ回復を行うと共に、不正データ混入時には容易にデータ修正を行う方法も提案されている。
データリネージュを用いたデータ管理が行われているシステムを長期間運用していると、データソースの追加や削除、既存の加工処理の修正や新規加工処理追加などの運用変更に伴い、新旧のデータを含む大規模なデータリネージュが生成される。するといずれかのデータに問題が発生したとき、該当データの発生源や問題の影響範囲などを調査するために、蓄積されたすべてのデータおよびプロセス間の来歴の関係を確認することとなり、問題への対処が長期化する。
1つの側面では、本発明は、データリネージュを用いた問題対処の効率化を図ることを目的とする。
1つの案では、コンピュータに以下の処理を実行させる情報処理プログラムが提供される。
コンピュータは、まず複数のデータの来歴を示すデータリネージュにおける管理対象の複数のデータが更新されるごとに、更新されたデータに対応付けて更新日時を格納する。次にコンピュータは、指定日時または指定期間の入力に応じて、複数のデータそれぞれに対応付けて格納された更新日時に基づいて、指定日時を含む所定期間または指定された指定期間内に更新されたデータを注目対象データと判断する。そしてコンピュータは、データリネージュの一部であり、注目対象データに対応する表示オブジェクトを含む部分データリネージュを生成する。
コンピュータは、まず複数のデータの来歴を示すデータリネージュにおける管理対象の複数のデータが更新されるごとに、更新されたデータに対応付けて更新日時を格納する。次にコンピュータは、指定日時または指定期間の入力に応じて、複数のデータそれぞれに対応付けて格納された更新日時に基づいて、指定日時を含む所定期間または指定された指定期間内に更新されたデータを注目対象データと判断する。そしてコンピュータは、データリネージュの一部であり、注目対象データに対応する表示オブジェクトを含む部分データリネージュを生成する。
1態様によれば、データリネージュを用いた問題対処の効率化を図ることができる。
以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理方法の一例を示す図である。図1には、データリネージュを用いた問題の影響範囲調査の容易化を図る情報処理方法を、情報処理装置10を用いて実施した場合の例を示している。情報処理装置10は、例えば所定の処理手順が記述された情報処理プログラムを実行することにより、第1の実施の形態に係る情報処理方法を実施することができる。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理方法の一例を示す図である。図1には、データリネージュを用いた問題の影響範囲調査の容易化を図る情報処理方法を、情報処理装置10を用いて実施した場合の例を示している。情報処理装置10は、例えば所定の処理手順が記述された情報処理プログラムを実行することにより、第1の実施の形態に係る情報処理方法を実施することができる。
情報処理装置10は、記憶部11と処理部12とを有する。記憶部11は、例えば情報処理装置10が有するメモリまたはストレージ装置である。処理部12は、例えば情報処理装置10が有するプロセッサまたは演算回路である。
記憶部11は、複数のデータ1a,1b,・・・、データ更新日時情報2、プロセス実行日時情報3、およびデータリネージュ4を記憶する。複数のデータ1a,1b,・・・は、データリネージュ4による来歴管理対象のデータである。データ更新日時情報2は、複数のデータ1a,1b,・・・それぞれの更新日時を示す情報である。プロセス実行日時情報3は、複数のデータ1a,1b,・・・の更新を伴う処理を行うプロセスの実行日時を示す情報である。なお図1では、各更新日時の時刻の値は省略されている。
データリネージュ4は、複数のデータ1a,1b,・・・の来歴を示す情報である。データリネージュ4は、例えば複数のデータ1a,1b,・・・それぞれに対応する表示オブジェクト5a,5b,5cを含んでいる。またデータリネージュ4は、いずれかのデータの更新処理を行うプロセスに対応する表示オブジェクト5d,5eを有している。データリネージュ4では、例えば加工元のデータに対応する表示オブジェクトから、加工を行うプロセスに対応する表示オブジェクトに向かって、矢印の線が示されている。またデータリネージュ4では、例えば加工を行うプロセスに対応する表示オブジェクトから、加工結果の情報の追加先のデータに対応する表示オブジェクトに向かって、矢印の線が示されている。
処理部12は、予め用意されたプロセスを実行することにより、複数のデータ1a,1b,・・・に対する処理を行う。1つのプロセスで実行される処理は、例えば情報の抽出、抽出した情報の加工・変換、加工・変換後の情報の所定のデータへの追加の一連の処理である。
処理部12は、プロセスが実行されることにより複数のデータ1a,1b,・・・のいずれかが更新されるごとに、更新されたデータに対応付けて更新日時を格納する。例えば処理部12は、更新されたデータの識別子に対応付けて、更新日時を示す値をデータ更新日時情報2に追加する。
また処理部12は、プロセスが実行されるごとに、実行されたプロセスに対応付けて実行日時を格納する。例えば処理部12は、実行されたプロセスの識別子に対応付けて、実行日時を示す値をプロセス実行日時情報3に追加する。
処理部12は、指定日時または指定期間の入力に応じて、複数のデータ1a,1b,・・・それぞれに対応付けて格納された更新日時に基づいて、指定日時を含む所定期間または指定された指定期間内に更新されたデータを注目対象データと判断する。所定期間は、例えば指定された日時に示される日の日時以前の期間(当日の0時から指定された日時までの期間)である。
例えば複数のデータ1a,1b,・・・のうちの問題のある第1データが更新された日時が指定日時として入力される場合がある。この場合、処理部12は、第1データと、データリネージュ4上で第1データが生成されるまでに実行されたプロセスの入力として使用されており、かつ所定期間内に更新されている第2データとを、注目対象データと判断する。問題のある第1データが示されている場合の所定期間は、例えば指定日時で示された第1データの更新日時と、その更新日時の直前の第1データ更新日時との間の期間としてもよい。このような所定期間とすることで、指定日時における第1データの更新に影響する可能性のある他のデータを漏れなく注目対象データに含めることができる。
そして処理部12は、データリネージュ4の一部であり、注目対象データに対応する表示オブジェクトを含む部分データリネージュ4aを生成する。処理部12は、生成した部分データリネージュ4aを例えば表示画面7に表示する。
このようにして、部分データリネージュ4aを生成して表示させることができる。部分データリネージュ4aは、発生した問題の影響範囲のデータ間の関係を示している。従って、ユーザは、部分データリネージュ4aを参照することで、データリネージュ4を用いた問題の対処を効率的に行うことができる。
図1の例では、「データ#3」の「01/02」の更新結果に問題が見つかっている。この場合、ユーザは、日時「01/02」を指定日時として情報処理装置10に入力する。すると処理部12は、データ更新日時情報2に基づいて、日時「01/02」が更新日時のリストに含まれる「データ#2」、「データ#3」を特定する。また処理部12は、プロセス実行日時情報3に基づいて、日時「01/02」が実行日時のリストに含まれる「プロセス#2」を特定する。そして処理部12は、「データ#2」、「データ#3」、「プロセス#2」それぞれに対応する表示オブジェクト5b,5c,5eを含む部分データリネージュ4aを生成する。
部分データリネージュ4aは、データリネージュ4よりも表示オブジェクト数が少なく、各データの来歴を容易に把握可能である。また問題に関連するデータおよびプロセスが明確であり、問題の原因の調査が容易である。
また処理部12は、複数のデータそれぞれに対応付けて格納された更新日時に基づいて、複数のデータ1a,1b,・・・それぞれの更新周期を判断することもできる。この場合、処理部12は、部分データリネージュ4aにおける注目対象データに対応する表示オブジェクトに、注目対象データの更新周期を示す周期表示オブジェクト6a~6cを付与する。処理部12は、周期表示オブジェクト6a~6cを付与することで、ユーザは、問題の対処の緊急性の有無を容易に把握することができる。
なお処理部12は、プロセスに対応付けて格納された更新日時に基づいて、プロセスの実行周期を判断し、プロセスに対応する表示オブジェクトに、そのプロセスの実行周期を示す周期表示オブジェクトを付与することもできる。
図1の例では、「データ#1」の更新周期は1週間であり、「データ#2」、「データ#3」の更新周期は1日である。また「プロセス#1」の実行周期は1週間であり、「プロセス#2」の実行周期は1日である。そこで処理部12は、部分データリネージュ4a内の「データ#2」、「データ#3」、「プロセス#2」それぞれに対応する表示オブジェクト5b,5c,5eに、実行・更新周期が「毎日」であることを示す周期表示オブジェクト6a~6cを付与する。
周期表示オブジェクト6a~6cは部分データリネージュ4aと共に表示画面7に表示される。ユーザは、周期表示オブジェクト6a~6cを参照することで、問題を1日以内で対処すべきであることを容易に認識できる。
また処理部12は、複数のデータ1a,1b,・・・それぞれに対応付けて格納された最新の更新日時に基づいて、複数のデータ1a,1b,・・・それぞれの更新周期に従った次回の更新予定日時が過ぎているか否かを判断することもできる。処理部12は、例えば複数のデータ1a,1b,・・・それぞれに対応付けて格納された更新日時に基づいて、複数のデータ1a,1b,・・・それぞれの更新周期を判断する。そして処理部12は、データリネージュ4における次回の更新予定日時が過ぎている第3データに対応する表示オブジェクトに、定期更新が停止したことを示す更新停止オブジェクトを付与する。これにより、データリネージュ4を参照して現在のデータ更新状況を把握する際に、不要なデータが明確となり、データリネージュ4を用いた問題の原因調査の効率が向上する。
〔第2の実施の形態〕
次に第2の実施の形態について説明する。第2の実施の形態は、サーバで管理されているデータの来歴をデータリネージュで表示するものである。
次に第2の実施の形態について説明する。第2の実施の形態は、サーバで管理されているデータの来歴をデータリネージュで表示するものである。
図2は、第2の実施の形態のシステム構成の一例を示す図である。ネットワーク20を介してサーバ100と端末装置200とが接続されている。サーバ100は、データベースを有するコンピュータである。サーバ100は、例えばETL(Extract/Transform/Load)と呼ばれるような変換・加工処理を定期的に実行し、データを更新する。サーバ100は、データの来歴をデータリネージュによって管理する。
端末装置200は、システムを管理するユーザが使用するコンピュータである。ユーザは、端末装置200にデータリネージュを表示させ、各データの来歴を把握する。例えばあるデータで問題が検出された場合に、その原因となるプロセスまたはデータを調査するため、ユーザは端末装置200にデータリネージュを表示させる。
図3は、サーバのハードウェアの一例を示す図である。サーバ100は、プロセッサ101によって装置全体が制御されている。プロセッサ101には、バス109を介してメモリ102と複数の周辺機器が接続されている。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)である。プロセッサ101がプログラムを実行することで実現する機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現してもよい。
メモリ102は、サーバ100の主記憶装置として使用される。メモリ102には、プロセッサ101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ102には、プロセッサ101による処理に利用する各種データが格納される。メモリ102としては、例えばRAM(Random Access Memory)などの揮発性の半導体記憶装置が使用される。
バス109に接続されている周辺機器としては、ストレージ装置103、GPU(Graphics Processing Unit)104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。
ストレージ装置103は、内蔵した記録媒体に対して、電気的または磁気的にデータの書き込みおよび読み出しを行う。ストレージ装置103は、コンピュータの補助記憶装置として使用される。ストレージ装置103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、ストレージ装置103としては、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)を使用することができる。
GPU104は画像処理を行う演算装置であり、グラフィックコントローラとも呼ばれる。GPU104には、モニタ21が接続されている。GPU104は、プロセッサ101からの命令に従って、画像をモニタ21の画面に表示させる。モニタ21としては、有機EL(Electro Luminescence)を用いた表示装置や液晶表示装置などがある。
入力インタフェース105には、キーボード22とマウス23とが接続されている。入力インタフェース105は、キーボード22やマウス23から送られてくる信号をプロセッサ101に送信する。なお、マウス23は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
光学ドライブ装置106は、レーザ光などを利用して、光ディスク24に記録されたデータの読み取り、または光ディスク24へのデータの書き込みを行う。光ディスク24は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク24には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)などがある。
機器接続インタフェース107は、サーバ100に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置25やメモリリーダライタ26を接続することができる。メモリ装置25は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ26は、メモリカード27へのデータの書き込み、またはメモリカード27からのデータの読み出しを行う装置である。メモリカード27は、カード型の記録媒体である。
ネットワークインタフェース108は、ネットワーク20に接続されている。ネットワークインタフェース108は、ネットワーク20を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。ネットワークインタフェース108は、例えばスイッチやルータなどの有線通信装置にケーブルで接続される有線通信インタフェースである。またネットワークインタフェース108は、基地局やアクセスポイントなどの無線通信装置に電波によって通信接続される無線通信インタフェースであってもよい。
サーバ100は、以上のようなハードウェアによって、第2の実施の形態の処理機能を実現することができる。なお、第1の実施の形態に示した情報処理装置10も、図3に示したサーバ100と同様のハードウェアにより実現することができる。
サーバ100は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施の形態の処理機能を実現する。サーバ100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、サーバ100に実行させるプログラムをストレージ装置103に格納しておくことができる。プロセッサ101は、ストレージ装置103内のプログラムの少なくとも一部をメモリ102にロードし、プログラムを実行する。またサーバ100に実行させるプログラムを、光ディスク24、メモリ装置25、メモリカード27などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ101からの制御により、ストレージ装置103にインストールされた後、実行可能となる。またプロセッサ101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
以下、図4、図5を参照し、データリネージュを用いた問題箇所の調査における問題点について具体的に説明する。
図4は、データリネージュの一例を示す図である。データリネージュ30には、データに対応する複数のエンティティ31a~31jとプロセスに対応する複数のエンティティ32a~32hとが含まれる。これらのエンティティ31a~31j,32a~32hは、第1の実施の形態に示した表示オブジェクト5a~5eの一例である。
図4は、データリネージュの一例を示す図である。データリネージュ30には、データに対応する複数のエンティティ31a~31jとプロセスに対応する複数のエンティティ32a~32hとが含まれる。これらのエンティティ31a~31j,32a~32hは、第1の実施の形態に示した表示オブジェクト5a~5eの一例である。
エンティティ間は、関係を示す矢印で接続されている。プロセスがデータを読み込む場合、読み込まれるデータからプロセスへの矢印が設定される。またプロセスが読み込んだデータの修正や加工をして他のデータへ出力する場合、プロセスから出力先のデータへの矢印が設定される。
データリネージュ30は、問題発生時の影響範囲の特定に利用される。例えばエンティティ31hに対応するデータで問題が発生したものとする。この場合、ユーザはデータリネージュ30を参照し、エンティティ31hに対応するデータは、エンティティ31eに対応するデータをエンティティ32fに対応するプロセスによって加工することで生成されたものであることが分かる。そこでユーザは、エンティティ32fに対応するプロセスの処理内容の調査、およびエンティティ32eに対応するデータの内容の調査を行う。
エンティティ31eに対応するデータに問題の原因があった場合、エンティティ32gに基づいて、ユーザはそのデータを使用したプロセスの存在を認識する。そしてユーザは、そのプロセスからエンティティ31iに対応するデータが出力されており、該当のデータにも問題の影響が及んでいる可能性があることを認識する。このようにして、データリネージュ30を用いることで、問題の影響範囲を容易に特定できる。
またデータに個人情報が含まれる場合、データリネージュ30を参照することで、個人情報がどのデータに含まれているのかを容易に把握可能となる。例えば、エンティティ31jに対応するデータに個人情報が含まれていることが分かったとき、データリネージュ30を参照すれば、該当データの生成に利用される、エンティティ31a,31dに対応するデータにも個人情報が含まれることを容易に把握できる。
データリネージュ30を用いたデータ管理を実施しているシステムを長期運用していると、データソースの追加や削除、既存の加工処理の修正や新規加工処理追加などの運用変更に伴い、新旧含む大量のエンティティがデータリネージュ30に追加される。すると、問題発生時に、問題の発生源となるデータや問題の影響範囲を調査するために蓄積された膨大な量のエンティティを確認することとなり、調査時間が長期化する。
データリネージュ30を用いてすべてのデータについての来歴を調査可能とするには、新旧含むすべてのエンティティをデータリネージュ30に取り込むことが重要となる。他方、問題のデータが特定された場合、データリネージュ30内のすべてのエンティティが調査対象となるわけではない。すなわち調査を要しないエンティティが存在する。
図5は、調査を要しないエンティティを含むデータリネージュの一例を示す図である。図5に示すデータリネージュ30では、エンティティ32cに対応するプロセスによる処理は毎日5時に実行され、日次処理である。またエンティティ32hに対応するプロセスよる処理は毎月の最終日の20時に実行され、月次処理である。他方、エンティティ32eに対応するプロセスによる処理は、定期実行が停止されている。
図5に示すデータリネージュ30においてエンティティ31jに対応するデータに問題が検出されたものとする。該当データの最新の更新日時は「2019/01/31 20:00:00」である。この場合、問題の原因の特定において、定期実行または定期更新が停止しているプロセスおよびデータについては調査不要である。
このように、データリネージュ30には問題の原因特定において調査を要しないプロセスまたはデータに対応するエンティティが含まれる。しかし従来手法では、データリネージュ30を表示するとき、データリネージュ30に含まれるすべてのエンティティが表示される。そのため、問題のあるデータに関連する原因箇所を特定する際、そのデータが処理された時点で定期実行または定期更新が行われていないプロセスまたはデータに対応するエンティティもすべて表示される。これが調査期間長期化の原因となっている。
またデータリネージュ30を表示するだけでは、対象のデータまたはプロセスの更新または実行の頻度(処理頻度)が分からないため、データの来歴を追跡していつまでに対処すればよいのかが判断できないという問題もある。例えば図5の例では、問題が発生したデータは月次処理のデータである。そのため、例えば次回の処理日まで余裕があれば、すぐには調査の対象とせずにすむ。他方、問題のあるデータはエンティティ31dに対応するデータを加工することにより生成されており、そのデータに問題の原因がある可能性がある。エンティティ31dに対応するデータは日次処理であるため、そのデータについての対処を何日も先に延ばしてしまうと問題が大きくなってしまう可能性がある。そのため、エンティティ31dに対応するデータについての対処は1日でも早く行われることが望ましい。
ここで、各プロセスの最新の実行日時および各データの最新の更新日時を記録しておけば、問題が発生したデータがいつ更新されたのかを把握できる。しかし最新の更新日時だけでは、各プロセスの実行周期および各データの更新周期は把握できない。そのため次の実行または更新の日が何時なのかを知ることができず、問題の影響範囲内のプロセスおよびデータについて、何時までに対処するべきなのかの判断が困難となっている。
そこでサーバ100では、データリネージュ30における調査に有用なエンティティのみを表示すると共に、各エンティティの実行周期または更新周期を表示する。これにより問題の原因調査を迅速に行うことが可能となると共に、エンティティごとに何時までに対処すべきなのかを正しく判断することが可能となる。
図6は、データリネージュを用いたデータ管理のためのサーバの機能の一例を示すブロック図である。サーバ100は、記憶部110、処理実行部120、データリネージュ更新部130、およびデータリネージュ出力部140を有する。
記憶部110は、複数のデータ111a,111b,・・・、データリネージュ112、および処理日時情報113を記憶する。複数のデータ111a,111b,・・・は、プロセスによる加工処理の対象、または加工処理結果の出力先となるデータである。データリネージュ112は、複数のデータ111a,111b,・・・の来歴を示す情報である。処理日時情報113は、複数のデータ111a,111b,・・・の更新日時、およびプロセスの実行日時に関する情報である。記憶部110は、例えばサーバ100のメモリ102またはストレージ装置103の記憶領域の一部によって実現される。
処理実行部120は、プロセスを実行する。例えば処理実行部120には、定期的に実行するプロセスが定義されている。プロセスは、例えばデータ抽出、変換または加工、および変換または加工後のデータの所定の格納先へのロード処理が記述されたSQLの命令文によって定義される。各プロセスには実行日時が設定されている。処理実行部120は、実行日時に達したプロセスを実行する。
データリネージュ更新部130は、処理実行部120によるプロセスの実行およびデータの更新を監視する。そしてデータリネージュ更新部130は、プロセスの実行状況およびデータの更新状況に基づいてデータリネージュ112を更新する。またデータリネージュ更新部130は、プロセスの実行またはデータの更新が行われるごとに、実行または更新の日時を処理日時情報113に記録する。さらにデータリネージュ更新部130は、処理日時情報113に基づいてプロセスの実行周期またはデータの更新周期を計算し、データリネージュ112の各エンティティに周期を示すラベルを付与する。
データリネージュ出力部140は、端末装置200からの要求に応じた表示態様のデータリネージュ112を出力する。例えばデータリネージュ出力部140は、端末装置200から問題のあるデータを指定したデータリネージュ112の表示要求を受信すると、データリネージュ112のうち問題のあるデータに関係するエンティティの部分を端末装置200に送信する。
なお図6に示した各要素の機能は、例えば、その要素に対応するプログラムモジュールをコンピュータに実行させることで実現することができる。
図7は、記憶部に格納される情報の一例を示す図である。複数のデータ111a,111b,・・・それぞれは、1以上のレコードを含んでいる。各レコードには、例えば複数の項目が設けられ、項目ごとの項目値が設定されている。あるデータに対するプロセスによる加工では、例えば所定の条件を満たすレコードの抽出、該当レコード内の項目値を用いた計算、計算結果を示す項目値を含むレコードの出力先のデータへの追加といった処理が行われる。
図7は、記憶部に格納される情報の一例を示す図である。複数のデータ111a,111b,・・・それぞれは、1以上のレコードを含んでいる。各レコードには、例えば複数の項目が設けられ、項目ごとの項目値が設定されている。あるデータに対するプロセスによる加工では、例えば所定の条件を満たすレコードの抽出、該当レコード内の項目値を用いた計算、計算結果を示す項目値を含むレコードの出力先のデータへの追加といった処理が行われる。
データリネージュ112には、複数のデータ111a,111b,・・・それぞれに対応するエンティティ51~54と、処理実行部120で実行されるプロセスに対応するエンティティ61~63とが含まれる。
処理日時情報113には、複数のデータ111a,111b,・・・それぞれに対応する更新日時リスト71,72,・・・と処理実行部120で実行されるプロセスそれぞれに対応する実行日時リスト81,82,・・・とが含まれる。処理日時情報113は、データリネージュ更新部130によるデータリネージュ112の更新処理に伴って更新される。
なお処理日時情報113のうちの更新日時リスト71,72,・・・は、第1の実施の形態に示したデータ更新日時情報2(図1参照)の一例である。また処理日時情報113のうちの実行日時リスト81,82,・・・は、第1の実施の形態に示したプロセス実行日時情報3(図1参照)の一例である。
図8は、データリネージュ更新処理の手順の一例を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。
[ステップS101]データリネージュ更新部130は、処理実行部120によりプロセスが実行されたか否かを判断する。例えばデータリネージュ更新部130は、処理実行部120がいずれかのデータを読み込み、処理結果のレコードをデータに出力した場合、読み込まれたデータから抽出したレコードの項目値を用いた処理のプロセスが実行されたと認識する。そしてデータリネージュ更新部130は、プロセスが実行された場合、処理をステップS102に進める。またデータリネージュ更新部130は、プロセスが実行されていなければ処理をステップS105に進める。
[ステップS101]データリネージュ更新部130は、処理実行部120によりプロセスが実行されたか否かを判断する。例えばデータリネージュ更新部130は、処理実行部120がいずれかのデータを読み込み、処理結果のレコードをデータに出力した場合、読み込まれたデータから抽出したレコードの項目値を用いた処理のプロセスが実行されたと認識する。そしてデータリネージュ更新部130は、プロセスが実行された場合、処理をステップS102に進める。またデータリネージュ更新部130は、プロセスが実行されていなければ処理をステップS105に進める。
[ステップS102]データリネージュ更新部130は、実行されたプロセスが新しいプロセスか否かを判断する。例えばデータリネージュ更新部130は、データリネージュ112に対応するエンティティが存在しないデータを出力先とするプロセスが実行された場合、新しいプロセスであると判断する。データリネージュ更新部130は、新しいプロセスが実行された場合、処理をステップS103に進める。またデータリネージュ更新部130は、実行されたのが既存のプロセスであれば、処理をステップS104に進める。
[ステップS103]データリネージュ更新部130は、データリネージュ112に新しいプロセスに対応するエンティティを追加する。
[ステップS104]データリネージュ更新部130は、実行されたプロセスの実行日時リストに現在の時刻を格納する。
[ステップS104]データリネージュ更新部130は、実行されたプロセスの実行日時リストに現在の時刻を格納する。
[ステップS105]データリネージュ更新部130は、データが更新されたか否かを判断する。例えばデータリネージュ更新部130は、記憶部110内のデータへのアクセスを監視し、既存のデータにレコードの追加または削除の更新が行われるか、新たなデータが生成された場合、データが更新されたと判断する。データリネージュ更新部130は、データが更新された場合、処理をステップS106に進める。またデータリネージュ更新部130は、データが更新されていなければ処理をステップS101に進める。
[ステップS106]データリネージュ更新部130は、新しいデータが生成されたか否かを判断する。データリネージュ更新部130は、新しいデータが生成された場合、処理をステップS107に進める。またデータリネージュ更新部130は、新しいデータが生成されていなければ、処理をステップS108に進める。
[ステップS107]データリネージュ更新部130は、新たに生成されたデータに対応するエンティティを追加する。
[ステップS108]データリネージュ更新部130は、更新されたデータの更新日時リストに現在の時刻を格納する。その後、データリネージュ更新部130は処理をステップS101に進める。
[ステップS108]データリネージュ更新部130は、更新されたデータの更新日時リストに現在の時刻を格納する。その後、データリネージュ更新部130は処理をステップS101に進める。
このようにして、プロセスが実行されたデータリネージュ112が更新されると、実行されたプロセスの実行日時リストに時刻が追加されると共に、更新されたデータの更新日時リストに時刻が追加される。
図9は、更新日時リストと実行日時リストの一例を示す図である。図9の例では、「データ#1」は週に1日、20時に更新されている。「データ#2」、「データ#3」、および「データ#4」は週に1日、20時に更新されていると共に、毎日9時に更新されている。「プロセス#1」は週に1日、20時に実行されている。「プロセス#2」と「プロセス#3」は週に1日、20時に実行されていると共に、毎日9時に実行されている。
データリネージュ112に示されるすべてのデータの更新とすべてのプロセスの実行とが週次で行われ、かつ「データ#2」、「データ#3」、および「データ#4」の更新と「プロセス#2」と「プロセス#3」の実行とが日次で行われている。
データのエンティティ51~54に対応する更新日時リスト71~74には、対応するデータが更新された日時が設定されている。同様にプロセスのエンティティ61~63に対応する実行日時リスト81~83には、対応するプロセスが実行された日時が設定されている。
なお「プロセス#3」の処理と「データ#4」とは、「2019/01/08」に追加されている。そのため「データ#1」、「データ#2」、および「データ#3」の更新日時リスト71~73には「2019/01/01」以降の時刻が設定されており、「データ#4」の更新日時リスト74には「2019/01/08」以降の時刻が設定されている。また「プロセス#1」、「プロセス#2」の実行日時リスト81,82には「2019/01/01」以降の時刻が設定されており、「プロセス#3」の実行日時リスト83には「2019/01/08」以降の日時が設定されている。
さらにデータリネージュ更新部130は所定の周期計算タイミングになると、データリネージュ112のエンティティに対応する更新日時リスト71~74または実行日時リスト81~83に基づいて、データ更新周期またはプロセスの実行周期を計算する。周期計算タイミングは、例えば毎日の所定の時刻である。
図10は、周期計算処理の手順の一例を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
[ステップS111]データリネージュ更新部130は、周期計算タイミングになると、データリネージュ112内の未選択のエンティティの中から、エンティティを1つ選択する。
[ステップS111]データリネージュ更新部130は、周期計算タイミングになると、データリネージュ112内の未選択のエンティティの中から、エンティティを1つ選択する。
[ステップS112]データリネージュ更新部130は、選択したエンティティの実行または更新された日の周期を計算する。例えばデータリネージュ更新部130は、毎日実行または更新されている場合、周期は1日とする。またデータリネージュ更新部130は、7日に1日実行または更新されている場合、周期を1週間とする。さらにデータリネージュ更新部130は、各月に1日ずつ実行または更新された日が存在する場合、周期を1月とする。
[ステップS113]データリネージュ更新部130は、周期に応じたラベルをエンティティに付与する。
[ステップS114]データリネージュ更新部130は、未選択のエンティティがあるか否かを判断する。データリネージュ更新部130は、未選択のエンティティがあれば処理をステップS111に進める。データリネージュ更新部130は、すべてのエンティティが選択済みとなった場合、周期計算処理を終了する。
[ステップS114]データリネージュ更新部130は、未選択のエンティティがあるか否かを判断する。データリネージュ更新部130は、未選択のエンティティがあれば処理をステップS111に進める。データリネージュ更新部130は、すべてのエンティティが選択済みとなった場合、周期計算処理を終了する。
このようにしてすべてのエンティティについて実行または更新の周期を示すラベルが付与される。
図11は、周期計算処理の第1の例を示す図である。図11には「データ#1」の更新周期が計算されている。「データ#1」の更新日時リスト71には7日に1日ずつ時刻の登録がある。従って平均更新日数(週単位)は週に1日である。そこでデータリネージュ更新部130は、「データ#1」に対応するエンティティ51に「毎週」のラベル51aを付与する。
図11は、周期計算処理の第1の例を示す図である。図11には「データ#1」の更新周期が計算されている。「データ#1」の更新日時リスト71には7日に1日ずつ時刻の登録がある。従って平均更新日数(週単位)は週に1日である。そこでデータリネージュ更新部130は、「データ#1」に対応するエンティティ51に「毎週」のラベル51aを付与する。
図12は、周期計算処理の第2の例を示す図である。図12には「データ#2」の更新周期が計算されている。「データ#2」の更新日時リスト72には毎日時刻の登録がある。従って平均更新日数(週単位)は週に7日である。そこでデータリネージュ更新部130は、「データ#2」に対応するエンティティ52に「毎日」のラベル52aを付与する。
なお同じ日に複数回の更新があっても、更新された日は1日とカウントされている。例えば更新日時リスト72の例では「2019/01/01」に2回更新されているが、同日の2回の更新の時刻を纏めて、更新があった日「1日」とカウントされる。
図13は、エンティティにラベル付与後のデータリネージュの一例を示す図である。図13の例では、エンティティ51,61には「毎週」のラベル51a,61aが付与されている。またエンティティ52~54,62~63には「毎日」のラベル52a,53a,54a,62a,63aが付与されている。
記憶部110に格納されているデータ111a,111b,・・・の一部に問題が検出された場合、ユーザは、サーバ100に対し、問題のあるデータを指定する。サーバ100のデータリネージュ出力部140は、データリネージュ112のうちの問題のあるデータと関連する部分を表示対象として、データリネージュ112の部分構造を端末装置200に送信する。すると端末装置200においてデータリネージュ112のうちの問題のあるデータと関連する部分が表示される。
図14は、問題発生データ関連のデータリネージュ表示処理の手順の一例を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。
[ステップS121]データリネージュ出力部140は、問題発生データの指定入力を受け付ける。問題発生データの指定入力では、例えば問題のあるデータの識別番号と、問題となる部分(例えば不正な項目値)の登録が行われた更新日時が指定される。
[ステップS121]データリネージュ出力部140は、問題発生データの指定入力を受け付ける。問題発生データの指定入力では、例えば問題のあるデータの識別番号と、問題となる部分(例えば不正な項目値)の登録が行われた更新日時が指定される。
[ステップS122]データリネージュ出力部140は、問題発生データに対応するエンティティを表示対象のリストに追加する。
[ステップS123]データリネージュ出力部140は、問題発生データより生成元側(データリネージュ122で左側)のエンティティの1つを選択する。
[ステップS123]データリネージュ出力部140は、問題発生データより生成元側(データリネージュ122で左側)のエンティティの1つを選択する。
[ステップS124]データリネージュ出力部140は、問題発生データにおける更新日時リストを参照し、指定された更新日時の更新日と同日の更新時刻以前の期間(所定期間)に、選択したエンティティに対応するプロセスの実行またはデータの更新の有無を判断する。なおデータリネージュ出力部140は、指定された更新日時の直前の問題発生データの更新日時から、指定された更新日時までを、更新有無判断の所定期間としてもよい。
データリネージュ出力部140は、該当の期間にプロセスの実行またはデータの更新があった場合、処理をステップS125に進める。またデータリネージュ出力部140は、該当の期間にプロセスの実行またはデータの更新がなければ、処理をステップS126に進める。
[ステップS125]データリネージュ出力部140は、選択したエンティティを表示対象のリストに追加する。
[ステップS126]データリネージュ出力部140は、問題発生データより生成元側のエンティティのうち未選択のエンティティがあるか否かを判断する。データリネージュ出力部140は、未選択のエンティティがあれば処理をステップS123に進める。またデータリネージュ出力部140は、すべてのエンティティが選択済みであれば処理をステップS127に進める。
[ステップS126]データリネージュ出力部140は、問題発生データより生成元側のエンティティのうち未選択のエンティティがあるか否かを判断する。データリネージュ出力部140は、未選択のエンティティがあれば処理をステップS123に進める。またデータリネージュ出力部140は、すべてのエンティティが選択済みであれば処理をステップS127に進める。
[ステップS127]データリネージュ出力部140は、表示対象のリストに示されるエンティティを含み、それ以外のエンティティを除外したデータリネージュを端末装置200に送信する。すると端末装置200にデータリネージュが表示される。
このようにして、問題のあるデータに関連するプロセスまたはデータに対応するエンティティのみを含むデータリネージュを表示させることができる。
なおユーザは、問題発生データの指定に代えて、日時または期間を指定することもできる。この場合、データリネージュ出力部140は、指定された日時を基準とする所定期間内または指定された期間内に更新されたデータまたは該当期間内に実行されたプロセスに対応するエンティティを含むデータリネージュを生成する。指定された日時を基準とする所定期間は、例えば指定された日時と同日の0時から指定された日時までの期間である。
なおユーザは、問題発生データの指定に代えて、日時または期間を指定することもできる。この場合、データリネージュ出力部140は、指定された日時を基準とする所定期間内または指定された期間内に更新されたデータまたは該当期間内に実行されたプロセスに対応するエンティティを含むデータリネージュを生成する。指定された日時を基準とする所定期間は、例えば指定された日時と同日の0時から指定された日時までの期間である。
図15は、問題のあるデータを指定した場合に表示されるデータリネージュの一例を示す図である。図15には、「データ#3」の「2019/01/01 9:00:00」に更新されたデータに問題が検出された場合の例が示されている。この場合、「2019/01/01」の0時から9時までの期間内に更新されたデータおよび該当期間内に実行されたプロセスに対応するエンティティが表示対象となる。
この場合、問題発生データである「データ#3」に対応するエンティティ53、同日に実行された「プロセス#2」に対応するエンティティ62、および同日に更新された「データ#2」に対応するエンティティ52を含むデータリネージュ112aが表示される。
このように問題があるデータと関連するデータまたはプロセスに対応するエンティティのみを含むデータリネージュ112aが表示されることで、問題の原因の特定作業や影響範囲の把握を迅速に行うことができる。なお、図15に示したデータリネージュ112aは、第1の実施の形態に示した部分データリネージュ4aの一例である。
また表示されているエンティティ52,53,62それぞれに関連付けて、更新周期または実行周期を示すラベル52a,53a,62aが表示されている。ユーザは、ラベル52a,53a,62aを参照して、対象の緊急性を適確に判断することができる。
データリネージュ出力部140は、定期的な実行が停止したプロセスまたは定期的な更新が停止したデータに対応するエンティティについて、定期実行・更新停止ラベルを付与して、データリネージュを表示させることもできる。
図16は、定期実行・更新が停止したエンティティを含むデータリネージュの一例を示す図である。図16の例では現在の日時が「2019/02/10 09:00:00」を過ぎているものとする。「データ#1」の更新日時リスト71に最後に設定された更新日時は「2019/01/29 20:00:00」であり、該当データの更新周期は週次である。従って更新日時リスト71を参照することで、「データ#1」の定期更新が「2019/01/29 20:00:00」を最後に停止していることが分かる。同様に、「プロセス#1」の実行日時リスト81を参照すると、「プロセス#1」の定期更新が「2019/01/29 20:00:00」を最後に停止していることが分かる。
このようにデータリネージュ出力部140は、更新日時リスト71~74および実行日時リスト81~83を参照することで、各エンティティに対応するデータの定期更新またはプロセスの定期実行の停止の有無を判断できる。そこでデータリネージュ出力部140は、例えばデータリネージュ112の表示要求に応じ、定期実行または定期更新が停止したプロセスまたはデータに、定期実行・更新停止ラベルを付与したデータリネージュ112を表示させてもよい。
図17は、定期実行・更新停止ラベル付き表示処理の手順の一例を示すフローチャートである。以下、図17に示す処理をステップ番号に沿って説明する。
[ステップS131]データリネージュ出力部140は、データリネージュ112内のエンティティを1つ選択する。
[ステップS131]データリネージュ出力部140は、データリネージュ112内のエンティティを1つ選択する。
[ステップS132]データリネージュ出力部140は、選択したエンティティに対応するプロセスの実行周期またはデータの更新周期に基づいて、次回の実行日時または更新日時を判定する。
[ステップS133]データリネージュ出力部140は、次回の実行日時または更新日時と現在時刻とを比較し、次回の実行日時または更新日時が過ぎているか否かを判断する。データリネージュ出力部140は、次回の実行日時または更新日時が過ぎている場合、処理をステップS134に進める。またデータリネージュ出力部140は、次回の実行日時または更新日時が過ぎていない場合、処理をステップS135に進める。
[ステップS134]データリネージュ出力部140は、選択したエンティティに定期実行・更新停止ラベルを付与する。
[ステップS135]データリネージュ出力部140は、未選択のエンティティがあるか否かを判断する。データリネージュ出力部140は、未選択のエンティティがある場合、処理をステップS131に進める。またデータリネージュ出力部140は、すべてのエンティティが選択済みであれば、処理をステップS136に進める。
[ステップS135]データリネージュ出力部140は、未選択のエンティティがあるか否かを判断する。データリネージュ出力部140は、未選択のエンティティがある場合、処理をステップS131に進める。またデータリネージュ出力部140は、すべてのエンティティが選択済みであれば、処理をステップS136に進める。
[ステップS136]データリネージュ出力部140は、定期実行・更新停止ラベル付きのデータリネージュ112を端末装置200に送信し、データリネージュ112を端末装置200に表示させる。
図18は、定期実行・更新停止ラベル付きのデータリネージュの一例を示す図である。例えば「データ#1」の定期更新と「プロセス#1」の定期実行が停止しているものとする。この場合、端末装置200に表示されるデータリネージュ112bにおいて、「データ#1」に対応するエンティティ51は、定期更新停止を示す定期実行・更新停止ラベル51b付きで表示される。また「プロセス#1」に対応するエンティティ61は、定期実行停止を示す定期実行・更新停止ラベル61b付きで表示される。
このように定期実行・更新停止ラベル51b,61b付きでデータリネージュ112bが表示される。これにより、ユーザは、例えばあるデータに直近に登録された項目値の来歴を確認する際に、該当項目値の登録前に定期実行または定期更新が停止しているプロセスまたはデータの影響を考慮せずにすむ。その結果、データ管理の負荷が軽減される。
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
1a,1b,・・・ データ
2 データ更新日時情報
3 プロセス実行日時情報
4 データリネージュ
4a 部分データリネージュ
5a~5e 表示オブジェクト
6a~6c 周期表示オブジェクト
7 表示画面
10 情報処理装置
11 記憶部
12 処理部
2 データ更新日時情報
3 プロセス実行日時情報
4 データリネージュ
4a 部分データリネージュ
5a~5e 表示オブジェクト
6a~6c 周期表示オブジェクト
7 表示画面
10 情報処理装置
11 記憶部
12 処理部
Claims (6)
- コンピュータに、
複数のデータの来歴を示すデータリネージュにおける管理対象の前記複数のデータが更新されるごとに、更新されたデータに対応付けて更新日時を格納し、
指定日時または指定期間の入力に応じて、前記複数のデータそれぞれに対応付けて格納された前記更新日時に基づいて、前記指定日時を含む所定期間または指定された前記指定期間内に更新されたデータを注目対象データと判断し、
前記データリネージュの一部であり、前記注目対象データに対応する表示オブジェクトを含む部分データリネージュを生成する、
処理を実行させる情報処理プログラム。 - 前記注目対象データの判断では、前記複数のデータのうちの問題のある第1データが更新された日時が前記指定日時として入力された場合、前記第1データと、前記データリネージュ上で前記第1データが生成されるまでに実行されたプロセスの入力として使用されており、かつ前記所定期間内に更新されている第2データとを、前記注目対象データと判断する、
請求項1記載の情報処理プログラム。 - 前記コンピュータに、さらに、
前記複数のデータそれぞれに対応付けて格納された前記更新日時に基づいて、前記複数のデータそれぞれの更新周期を判断し、
前記部分データリネージュにおける前記注目対象データに対応する表示オブジェクトに、前記注目対象データの更新周期を示す周期表示オブジェクトを付与する、
処理を実行させる請求項1または2に記載の情報処理プログラム。 - 前記コンピュータに、さらに、
前記複数のデータそれぞれに対応付けて格納された前記更新日時に基づいて、前記複数のデータそれぞれの更新周期を判断し、
前記複数のデータそれぞれに対応付けて格納された最新の更新日時に基づいて、前記複数のデータそれぞれの更新周期に従った次回の更新予定日時が過ぎているか否かを判断し、
データリネージュにおける次回の更新予定日時が過ぎている第3データに対応する表示オブジェクトに、定期更新が停止したことを示す更新停止オブジェクトを付与する、
処理を実行させる請求項1ないし3のいずれかに記載の情報処理プログラム。 - コンピュータが、
複数のデータの来歴を示すデータリネージュにおける管理対象の前記複数のデータが更新されるごとに、更新されたデータに対応付けて更新日時を格納し、
指定日時または指定期間の入力に応じて、前記複数のデータそれぞれに対応付けて格納された前記更新日時に基づいて、前記指定日時を含む所定期間または指定された前記指定期間内に更新されたデータを注目対象データと判断し、
前記データリネージュの一部であり、前記注目対象データに対応する表示オブジェクトを含む部分データリネージュを生成する、
情報処理方法。 - 複数のデータの来歴を示すデータリネージュにおける管理対象の前記複数のデータが更新されるごとに、更新されたデータに対応付けて更新日時を格納し、指定日時または指定期間の入力に応じて、前記複数のデータそれぞれに対応付けて格納された前記更新日時に基づいて、前記指定日時を含む所定期間または指定された前記指定期間内に更新されたデータを注目対象データと判断し、前記データリネージュの一部であり、前記注目対象データに対応する表示オブジェクトを含む部分データリネージュを生成する処理部、
を有する情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021041009A JP2022140929A (ja) | 2021-03-15 | 2021-03-15 | 情報処理プログラム、情報処理方法、および情報処理装置 |
US17/568,903 US11775497B2 (en) | 2021-03-15 | 2022-01-05 | Computer-readable recording medium storing information processing program for generating partial data lineage, method of generating partial data lineage, and information processing device for generating partial data lineage |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021041009A JP2022140929A (ja) | 2021-03-15 | 2021-03-15 | 情報処理プログラム、情報処理方法、および情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022140929A true JP2022140929A (ja) | 2022-09-29 |
Family
ID=83194763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021041009A Pending JP2022140929A (ja) | 2021-03-15 | 2021-03-15 | 情報処理プログラム、情報処理方法、および情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11775497B2 (ja) |
JP (1) | JP2022140929A (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146118A (ja) | 2006-12-06 | 2008-06-26 | Hitachi Ltd | コンピュータシステムにおけるデータベースの更新と回復の方法 |
US20110047056A1 (en) * | 2008-10-11 | 2011-02-24 | Stephen Overman | Continuous measurement and independent verification of the quality of data and processes used to value structured derivative information products |
JP2011238165A (ja) | 2010-05-13 | 2011-11-24 | Hitachi Ltd | 計算機システム及びメタデータ管理サーバ |
US10120923B2 (en) * | 2015-11-30 | 2018-11-06 | Bank Of America Corporation | Data discovery and analysis tool |
CN110023925A (zh) * | 2016-12-01 | 2019-07-16 | 起元技术有限责任公司 | 生成、访问和显示沿袭元数据 |
US11294916B2 (en) * | 2020-05-20 | 2022-04-05 | Ocient Holdings LLC | Facilitating query executions via multiple modes of resultant correctness |
US11455588B2 (en) * | 2020-09-04 | 2022-09-27 | TADA Cognitive Solutions, LLC | Data validation and master network techniques |
-
2021
- 2021-03-15 JP JP2021041009A patent/JP2022140929A/ja active Pending
-
2022
- 2022-01-05 US US17/568,903 patent/US11775497B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11775497B2 (en) | 2023-10-03 |
US20220292070A1 (en) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612372B2 (en) | Detection rule-generating facility | |
US11263071B2 (en) | Enabling symptom verification | |
JP5423904B2 (ja) | 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム | |
JP5285084B2 (ja) | 検出イベントに応じたアクション実行を支援するシステム、検出イベントに応じたアクション実行を支援する方法、支援装置及びコンピュータプログラム | |
JP2019520649A (ja) | プロセス視覚化プラットフォーム | |
JP6260130B2 (ja) | ジョブ遅延検知方法、情報処理装置、およびプログラム | |
EP2634733A1 (en) | Operations task management system and method | |
US8566345B2 (en) | Enterprise intelligence (‘EI’) reporting in an EI framework | |
JP6048957B2 (ja) | 情報処理装置、プログラム、及び情報処理方法 | |
JP2019219848A (ja) | ソースコード解析方法およびソースコード解析装置 | |
US9639815B2 (en) | Managing processes in an enterprise intelligence (‘EI’) assembly of an EI framework | |
US9659266B2 (en) | Enterprise intelligence (‘EI’) management in an EI framework | |
US20130019246A1 (en) | Managing A Collection Of Assemblies In An Enterprise Intelligence ('EI') Framework | |
US20130018695A1 (en) | Enterprise Intelligence ('EI') Assembly Analysis In An EI Framework | |
JP2022140929A (ja) | 情報処理プログラム、情報処理方法、および情報処理装置 | |
JP2017033079A (ja) | ソフトウェア導入支援プログラム、ソフトウェア導入支援装置およびソフトウェア導入支援方法 | |
US9646278B2 (en) | Decomposing a process model in an enterprise intelligence (‘EI’) framework | |
JP5623950B2 (ja) | It障害予兆検知装置及びプログラム | |
JP6340990B2 (ja) | メッセージ表示方法、メッセージ表示装置、およびメッセージ表示プログラム | |
US10789166B2 (en) | Computer system | |
JP2017199118A (ja) | 静観候補特定装置、静観候補特定方法及び静観候補特定プログラム | |
JP6609216B2 (ja) | ソースコードの静的解析結果の分析装置及び分析方法 | |
US11921496B2 (en) | Information processing apparatus, information processing method and computer readable medium | |
WO2022157891A1 (ja) | ロギング支援装置、ロギングシステム、ロギング支援方法及びプログラム | |
US10489272B2 (en) | Automatic instrumentation of code |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231109 |