JP7481283B2 - メタデータ管理装置、データ管理システムおよびデータ再現方法 - Google Patents
メタデータ管理装置、データ管理システムおよびデータ再現方法 Download PDFInfo
- Publication number
- JP7481283B2 JP7481283B2 JP2021033040A JP2021033040A JP7481283B2 JP 7481283 B2 JP7481283 B2 JP 7481283B2 JP 2021033040 A JP2021033040 A JP 2021033040A JP 2021033040 A JP2021033040 A JP 2021033040A JP 7481283 B2 JP7481283 B2 JP 7481283B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- metadata
- processing
- management device
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 192
- 238000000034 method Methods 0.000 title claims description 119
- 238000013523 data management Methods 0.000 title claims description 40
- 238000012545 processing Methods 0.000 claims description 291
- 230000014509 gene expression Effects 0.000 claims description 72
- 238000007405 data analysis Methods 0.000 claims description 38
- 230000004044 response Effects 0.000 claims description 17
- 230000010365 information processing Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 238000013461 design Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
入力されたデータの分析を行うデータ分析装置および前記データが格納されるデータベースの管理を行うデータ管理装置が実行したデータ処理に係るメタデータを管理するメタデータ管理装置であって、
前記データ分析装置における前記データ処理の実行に応じて当該実行時のタイムスタンプを生成するタイムスタンプ管理部と、
前記データ処理の入力となったデータの特定に必要な条件式を生成する条件式管理部と、
前記タイムスタンプと前記条件式と前記データ処理とをリネージとして管理するメタデータ管理部と、
時刻指定を有するデータ再現処理要求に対し、前記リネージを用いて、前記データ処理を前記条件式に従って更新し、該更新されたデータにデータ再現処理を適用することにより、前記データ再現処理要求で指定された時刻におけるデータを再現するデータ再現処理管理部と、
を備える。
上述のデータ分析装置、データ管理装置、およびメタデータ管理装置が互いに接続され、これら装置の協働によってデータおよびメタデータの管理を行うデータ管理システムであって、
RDBMS(Relational DataBase Management System)を用いて前記データおよび前記メタデータの管理を行う。
入力されたデータの分析を行うデータ分析装置および前記データが格納されるデータベースの管理を行うデータ管理装置が実行したデータ処理に係るメタデータを管理するメタデータ管理装置におけるデータ再現方法であって、
前記データ処理の実行に応じて当該実行時のタイムスタンプを生成し、
前記データ処理の入力となったデータの特定に必要な条件式を生成し、
前記タイムスタンプと前記条件式と前記データ処理とをリネージとして管理し、
時刻指定を有するデータ再現処理要求に対し、前記リネージを用いて、前記データ処理を前記条件式に従って更新し、
更新されたデータにデータ再現処理を適用することにより、前記データ再現処理要求で指定された時刻におけるデータを再現する。
言い換えると、図6に示すデータテーブル630を含むメタデータテーブル610は、本発明の「メタデータ」に対応する。
この問い合わせは、データ管理装置120におけるデータベース(122,123)を管理するデータベースシステムに対応する問い合わせ言語を用いて行うことができる。例えば、問い合わせ言語としてSQL(Structured Query Language)が使用される場合、例えば「SELECT ts, id, val FROM “第1のデータテーブル”」等の式(条件式)により、問い合わせを行うことができる。
この保存処理は、Extract処理711と同様に、データ分析装置110がデータ管理装置120にSQL等の問い合わせ言語を用いて問い合わせを行うことで実現することができる。また、かかるS322の保存処理の後に、メタデータ管理装置100のメタデータ管理部101は、例えば予め定められた時刻の到来により、図5で上述したメタデータ更新処理フローを実行し、図6に示すように、メタデータテーブル610をメタデータテーブル620に更新することになる。
なお、本実施形態において、「データ処理内容」とは、データ処理フロー管理画面700を用いて設計されたデータ処理フロー(いわゆる自動処理)と、後に説明する手動データ処理管理画面1300でユーザが命令文を入力しデータテーブルを直接更新する手動データ処理と、の2種類が存在する。また、図8に示すデータ処理内容テーブル800では、「type」列805の値によって、自動処理か手動処理かが区別され、自動処理すなわちデータ処理フローが「flow」で示され、手動処理すなわち手動データ処理が「manual」で示される。
なお、「id」列1111は必要に応じてリネージを一意に特定するために付与される値である。また、「data_source」列1112、及び「data_target」列1114には、図6の下側に示すメタデータテーブル620の「id」列611のデータ(この例では101、及び102)が格納される。さらに、「process」列1113には、図8に示すデータ処理内容テーブル800の「id」列804のうち該当するもの(この例では201)が格納される。
上記の制約条件は、第1のデータテーブル420に対し、タイムスタンプに関する列「_ts」を追加(ADD)し、既定の値として現在のタイムスタンプ(CURRENT_TIMESTAMP)を、データの挿入時に挿入せよ、という命令である。この命令により、第1のデータテーブル420は、第1のデータテーブル430のように変更され、すなわち図4の右下側に示すように、データの追加に応じてタイムスタンプが自動で挿入され、図12で説明した一連の処理が適用可能となる。
すなわち、図3中のA301の操作の後、A302の処理を行う前に、データ処理フローに係る情報の送信(A303)と、メタデータ生成、及び登録(S321)の処理をそれぞれ追加的に実施する。加えて、データの書き換え処理(S322)の実行前及び実行後に、それぞれ条件式を生成し、これら2つの条件式が一致するか否かを判定する。
データ分析装置110のデータ処理内容管理部111は、手動データ処理管理画面1300が表示されている端末1301(ここでは自機すなわちデータ分析装置110)に対するユーザ300の入力を受け付け、受け付けた内容、すなわち、図8のデータ処理内容テーブル800に記載されている、「id」列804、「type」列805、「process」列806のそれぞれの内容、及びプログラム803を、手動データ処理に係る情報として、メタデータ管理装置100に送信する。
上記のようにステップ1007の処理が実行されることによって、リネージテーブル1130がリネージテーブル1140へと更新(変更)される。
時間が経過し、例えば、第1センサからの新たなセンシングデータが情報処理システム1に入力されたような場合、第1のデータテーブル410に新たなデータが追記され、図4中の左下に示すような第1のデータテーブル440として更新される。図4に示す例では、第1のデータテーブル440は、同図左上側に示す第1のデータテーブル410と比較して、2020年8月9日に第1センサ(id=1)から「189」の値を示すデータ欄(行414)が追加されている。
ユーザ300は、前述のデータ処理フローに係る操作(図3中のA301)と、手動データ処理に係る操作(図3中のA304)を再度繰り返し、新たなデータが反映された第2のデータテーブル(適宜、図9を参照)を再度作成する。
図15は、本システムのメタデータ管理装置100が実行するデータ再現処理の流れを示すフローチャートである。以下、図15および図3を参照して、メタデータ管理装置100によるデータ再現処理の内容を説明する。
なお、データ再現処理管理部104は、ステップ1503に処理を戻した場合は、すでに取得したリネージを除外してデータ(リネージテーブル)の走査を行う。本実施形態においては、リネージテーブル1150(図11参照)のid=302のデータ処理内容(process=202)の種類は「manual」すなわち手動入力操作であるため(図8参照)、さらにid=301のデータ処理内容(process=201)までさかのぼってデータ処理内容が取得される。
このステップ1602の処理により、更新されたデータ処理フローがデータ処理フロー1700であり(図17を参照)、図17中に下線で強調して示すように、where項のデータ欄1702がリネージテーブル1150(図11を参照)の条件式で更新されることになる。なお、本実施形態において「条件式に係る式」とは、SQL(Structured Query Language)におけるWHERE句にて指定可能な式に相当するものであり、図7に示すデータ処理フロー管理画面700でのwhere項726の指定に該当する。
かくして、ステップ1602の処理が実行されることにより、新規にデータが追加されている場合でも、過去に入力データとして使用したデータのみが選択ひいては再現されるように、データ処理フローが更新される(適宜、図3中のS326も参照)。
なお、かかる再適用の処理は、メタデータ管理装置100のデータ再現処理管理部104が、データ分析装置110に対し、更新済みのデータ処理フロー1700の再適用要求を発行することにより実現される(図3中のA308を参照)。データ分析装置110は、A301、及びA302の処理と同様に、データ管理装置120に対し、データ処理フロー1700で定義された処理を実施することによって、データ処理内容の再適用を実現する。
この判定の手法の一具体例として、データ再現処理管理部104は、リネージテーブル1150を、現在のリネージの「id」列1111を、時刻「ts」列1115がより新しい行に向かって走査し、リネージの存在の有無を確認することによって行う。そして、データ再現処理管理部104は、リネージが存在すると判定した場合(ステップ1604、YES)には処理をステップ1605に進め、存在しないと判定した場合(ステップ1604、NO)には処理を終える。但し、ステップ1604の処理は、時刻指定1412未満のリネージのみが対象となる。本実施形態においては、リネージid=302の処理のみが該当する。
100 メタデータ管理装置
101 メタデータ管理部
102 タイムスタンプ管理部
103 条件式管理部
104 データ再現処理管理部
105 メタデータ格納部
110 データ分析装置
111 データ処理内容管理部
112 データ処理内容格納部
120 データ管理装置
121 データベース管理部
122 第1のデータベース
123 第2のデータベース
201,211,221 CPU
202,212,222 主メモリ
203,213,223 ストレージ
204,214,224 バス
205,215,225 NIC
206,216,226 キーボード
207,217,227 マウス
208,218,228 ディスプレイ(表示部)
610 メタデータテーブル
630 データテーブル(メタデータ)
700 データ処理フロー管理画面
710 設計画面
720 詳細画面
731 検索画面
740 実行ボタン
750 登録ボタン
800 データ処理内容テーブル
902、903 第2のテーブル
903 第2のテーブル(再現対象)
1110、1120、1130、1140、1150 リネージテーブル
1111 id列
1112 data_source列
1113 process列
1114 data_target列
1300 手動データ処理管理画面
1400 データ再現処理管理画面
Claims (8)
- 入力されたデータの分析を行うデータ分析装置および前記データが格納されるデータベースの管理を行うデータ管理装置が実行したデータ処理に係るメタデータを管理するメタデータ管理装置であって、
前記データ分析装置における前記データ処理の実行に応じて当該実行時のタイムスタンプを生成するタイムスタンプ管理部と、
前記データ処理の入力となったデータの特定に必要な条件式を生成する条件式管理部と、
前記タイムスタンプと前記条件式と前記データ処理とをリネージとして管理するメタデータ管理部と、
時刻指定を有するデータ再現処理要求に対し、前記リネージを用いて、前記データ処理を前記条件式に従って更新し、該更新されたデータにデータ再現処理を適用することにより、前記データ再現処理要求で指定された時刻におけるデータを再現するデータ再現処理管理部と、
を備えるメタデータ管理装置。 - 請求項1に記載のメタデータ管理装置において、
前記メタデータ管理部は、前記データ処理において該データ処理のフローが定義されていないデータ処理が行われた場合、該データ処理を手動更新と判断して前記リネージとして管理し、
前記データ再現処理管理部は、前記データ再現処理によって前記データを再現した後、当該データに対し手動更新が前記リネージとして存在する場合には、該当する手動更新を適用する、
メタデータ管理装置。 - 請求項1に記載のメタデータ管理装置において、
前記メタデータ管理部は、管理対象となるデータに対し、タイムスタンプに相当するデータ構造の有無を判定し、前記タイムスタンプに相当する前記データ構造が無い場合、当該データの更新に応じてタイムスタンプを自動で付与する制約条件を付与する、
メタデータ管理装置。 - 請求項1に記載のメタデータ管理装置において、
前記データ処理の前後で、前記タイムスタンプ管理部によるタイムスタンプの生成、及び前記条件式管理部による前記条件式の生成をそれぞれ行い、
前記メタデータ管理部は、
前記リネージの生成時に、生成された2つの前記条件式の一致を判定することで、実際の入力データと生成される条件式との不整合を検知する、
メタデータ管理装置。 - 請求項1に記載のメタデータ管理装置において、
前記データ再現処理に関する情報を入力する画面を表示する表示部を備える、
メタデータ管理装置。 - 請求項1に記載のデータ分析装置、データ管理装置、およびメタデータ管理装置が互いに接続され、これら装置の協働によってデータおよびメタデータの管理を行うデータ管理システムであって、
RDBMS(Relational DataBase Management System)を用いて前記データおよび前記メタデータの管理を行う、
データ管理システム。 - 請求項6に記載のメタデータ管理装置において、
前記条件式管理部は、前記条件式として、SQL(Structured Query Language)におけるWHERE句にて指定可能な式を生成する、
メタデータ管理装置。 - 入力されたデータの分析を行うデータ分析装置および前記データが格納されるデータベースの管理を行うデータ管理装置が実行したデータ処理に係るメタデータを管理するメタデータ管理装置におけるデータ再現方法であって、
前記データ処理の実行に応じて当該実行時のタイムスタンプを生成し、
前記データ処理の入力となったデータの特定に必要な条件式を生成し、
前記タイムスタンプと前記条件式と前記データ処理とをリネージとして管理し、
時刻指定を有するデータ再現処理要求に対し、前記リネージを用いて、前記データ処理を前記条件式に従って更新し、
更新されたデータにデータ再現処理を適用することにより、前記データ再現処理要求で指定された時刻におけるデータを再現する、
データ再現方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021033040A JP7481283B2 (ja) | 2021-03-02 | 2021-03-02 | メタデータ管理装置、データ管理システムおよびデータ再現方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021033040A JP7481283B2 (ja) | 2021-03-02 | 2021-03-02 | メタデータ管理装置、データ管理システムおよびデータ再現方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022134032A JP2022134032A (ja) | 2022-09-14 |
JP7481283B2 true JP7481283B2 (ja) | 2024-05-10 |
Family
ID=83230068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021033040A Active JP7481283B2 (ja) | 2021-03-02 | 2021-03-02 | メタデータ管理装置、データ管理システムおよびデータ再現方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7481283B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103115A (ja) | 2014-11-27 | 2016-06-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | データベースを管理するシステム及び方法 |
WO2018011895A1 (ja) | 2016-07-12 | 2018-01-18 | 株式会社日立製作所 | データ処理フロー管理システムおよび方法 |
-
2021
- 2021-03-02 JP JP2021033040A patent/JP7481283B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016103115A (ja) | 2014-11-27 | 2016-06-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | データベースを管理するシステム及び方法 |
WO2018011895A1 (ja) | 2016-07-12 | 2018-01-18 | 株式会社日立製作所 | データ処理フロー管理システムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2022134032A (ja) | 2022-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7269580B2 (en) | Application integration system and method using intelligent agents for integrating information access over extended networks | |
US8886617B2 (en) | Query-based searching using a virtual table | |
US6782387B1 (en) | System for document management and information processing | |
US7234112B1 (en) | Presenting query plans of a database system | |
JP5570608B2 (ja) | エクセル基盤の分析レポート作成システム及び方法 | |
KR101013810B1 (ko) | 엑셀기반 db테이블 갱신 시스템 및 방법 | |
RU2406115C2 (ru) | Доступ к сложным данным | |
US20110154296A1 (en) | Multi trace parser | |
JP2000148461A (ja) | ソフトウェアモデル及び既存のソ―スコ―ドを同期化させる方法及びその装置 | |
US7792851B2 (en) | Mechanism for defining queries in terms of data objects | |
JP2006012146A (ja) | 影響分析のためのシステムおよび方法 | |
US20070083543A1 (en) | XML schema template builder | |
US20070255685A1 (en) | Method and system for modelling data | |
JP2022504205A (ja) | インタラクティブなデータプレップアプリケーションのための複数のデータセットの相関増分ロード | |
CN110941629A (zh) | 元数据处理方法、装置、设备及计算机可读存储介质 | |
KR100877156B1 (ko) | 비정형 질의언어에 대한 사전 성능 분석 시스템 및 방법 | |
US7707211B2 (en) | Information management system and method | |
CN110245037B (zh) | 一种基于日志的Hive用户操作行为还原方法 | |
KR100581687B1 (ko) | 이기종의 데이타베이스 관리시스템 통합방법 및 그 방법을실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는기록매체 | |
JP3914081B2 (ja) | アクセス権限設定方法および構造化文書管理システム | |
JP7481283B2 (ja) | メタデータ管理装置、データ管理システムおよびデータ再現方法 | |
JPH11265368A (ja) | 作業手順管理システム | |
Fehily | SQL | |
US8825707B2 (en) | Generating BPEL control flows | |
US10534761B2 (en) | Significant cleanse change information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7481283 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |