JP2019121181A - Data management system and data management method - Google Patents

Data management system and data management method Download PDF

Info

Publication number
JP2019121181A
JP2019121181A JP2018000586A JP2018000586A JP2019121181A JP 2019121181 A JP2019121181 A JP 2019121181A JP 2018000586 A JP2018000586 A JP 2018000586A JP 2018000586 A JP2018000586 A JP 2018000586A JP 2019121181 A JP2019121181 A JP 2019121181A
Authority
JP
Japan
Prior art keywords
data
mart
information
data mart
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018000586A
Other languages
Japanese (ja)
Other versions
JP6824915B2 (en
Inventor
雅文 露木
Masafumi Tsuyuki
雅文 露木
幸徳 坂下
Yukinori Sakashita
幸徳 坂下
洋司 小澤
Yoji Ozawa
洋司 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018000586A priority Critical patent/JP6824915B2/en
Publication of JP2019121181A publication Critical patent/JP2019121181A/en
Application granted granted Critical
Publication of JP6824915B2 publication Critical patent/JP6824915B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To flexibly re-use a data mart in response to a request from a user and to effectively concentrate analyzed results regarding the data mart.SOLUTION: A data catalog management server 100 of a data management system 10 is arranged so as to have: a storage apparatus 101 for holding data store information 125 and data store application connection information 126; and an arithmetic apparatus 104 for, based on a refining request of analyzed results received from a terminal 001 and the data store information 125, if a target data mart indicated by the reduction request does not include a predetermined meta information, selecting a data mart including the meta information from data marts on a data path including the target data mart, generating a new data path including a filter and the like applied to the data mart, and generating a predetermined analysis result corresponding to the refining request in accordance with the new data path.SELECTED DRAWING: Figure 1B

Description

本発明は、データ管理システムおよびデータ管理方法に関するものであり、具体的には、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みを効率的なものとする技術に関する。   The present invention relates to a data management system and a data management method, and more specifically, flexibly reuses a data mart in response to a user's request, and efficiently narrows down analysis results regarding the data mart. Related to technology.

工場における生産効率の分析や工作機械の故障予知のために、工場内に設置したセンサーや工作機械から所定のデータを収集し、利用するIoTプラットフォームの導入が進んでいる。一般に、IoTプラットフォームでは、データレイク、データマート、ETL (Extract Transform Load)、および、分析アプリケーションの4つが動作する。   The IoT platform has been introduced to collect and use predetermined data from sensors and machine tools installed in the factory for analysis of production efficiency in the factory and failure prediction of machine tools. In general, in the IoT platform, there are four operating data lake, data mart, ETL (Extract Transform Load), and analysis application.

このようなプログラム群が動作するIoTプラットフォームでは、上述の分析アプリケーションやETLの無駄な開発工程を回避するため、データマートに保存したデータの適宜な再利用を図っている。データの再利用に際しては、ETLや分析アプリが、データマートからデータを読みだして加工し、これを別途データマートへ保存する過程を繰り返す。このことで、データマートとETLや分析アプリケーションが論理的に多段接続されることになる。   In the IoT platform on which such programs operate, the data saved in the data mart is properly reused to avoid the wasteful development process of the analysis application and ETL described above. When reusing data, the ETL and analysis application repeat the process of reading and processing data from the data mart and separately storing it in the data mart. As a result, the data mart and ETL and analysis applications are logically connected in multiple stages.

上述のように、データマートに保存したデータの再利用等に関連した従来技術としては、例えば、定義済みのETLテンプレートを用いて、分析アプリケーションの開発者や利用者が必要とするデータを含むデータマートを自動生成する技術(特許文献1参照)などが提案されている。   As described above, as a conventional technique related to reuse of data stored in a data mart, for example, data including data required by a developer or user of an analysis application using a predefined ETL template A technique (see Patent Document 1) for automatically generating a mart has been proposed.

US9519695B2US9519695 B2

ところが、従来技術においては以下の課題が残されている。従来技術では、定義済みのETLテンプレートを用い、入力パラメータとして表現された要件(分析アプリケーションの開発者あるいは利用者の指定)に応じたデータマートを自動生成する。しかし実際には、そうした要件に適した定義済みのETLテンプレートが用意されていないケースが多い。   However, the following problems remain in the prior art. In the prior art, a defined ETL template is used to automatically generate a data mart according to the requirements (designated by the developer or user of the analysis application) expressed as input parameters. In practice, however, there are many cases where no predefined ETL template suitable for such requirements is prepared.

そのため、上述の要件を指定した分析アプリケーションの開発者あるいは利用者は、データマート中に保存されている膨大で多様なデータと既存の分析アプリケーションとの接続状態を逐一確認して、ETLテンプレートを自ら定義しなければならない。このことは、分析アプリケーションの開発者や利用者にとって大きな負担であり、該当者のスキルや知見によっては対応できないケースもありうる。   Therefore, the developer or user of the analysis application that specified the above-mentioned requirements checks the connection status between the huge and diverse data stored in the data mart and the existing analysis application one by one, and carries out the ETL template itself. It must be defined. This is a heavy burden on the developer or user of the analysis application, and it may be impossible in some cases depending on the skill and knowledge of the person concerned.

また、ETLだけでは複雑な分析処理を実行できないため、所定のメタ情報(例:データの収集条件や分析条件)によって分析結果を絞り込むことも困難である。具体的には、絞り込みの条件として分析アプリケーションの開発者から指定されるメタ情報の値が固定ではなく、絞り込みの要求ごとに変化しうる場合、データレイクやデータマートのデータを再利用できない状況に起因する。   In addition, since complicated analysis processing can not be executed only by ETL, it is also difficult to narrow down the analysis results by predetermined meta information (eg, data collection conditions and analysis conditions). Specifically, if the meta information value specified by the analysis application developer as the condition for narrowing is not fixed but can change for each narrowing request, data in the data lake or data mart can not be reused. to cause.

例えば、特定種類の部品を生産する工作機械の故障率データを、データレイクから入力として取り出し、分析対象に再利用する場合を考える。上述の故障率データを分析する分析アプリケーションは、その分析結果に対し、当該工作機械の情報をメタ情報として付与し、所定のデータマートに格納することは一般的である。しかし、当該工作機械が生産する部品のメタ情報を付与することは一般的とは言えない。するとその後に、当該データマートを再利用するとしても、分析の絞り込みの条件として、上述の特定種類とは別の種類の部品が指定されていれば、そもそも当該データマートが別種の部品を生産する工作機械に関するデータを保持している故、分析対象として利用できず、分析自体も実行できないこととなる。   For example, consider a case where failure rate data of a machine tool producing a specific type of part is taken as an input from a data lake and reused as an analysis target. An analysis application that analyzes the above-mentioned failure rate data generally adds information of the machine tool as meta information to the analysis result, and generally stores the information in a predetermined data mart. However, it is not common to add meta information on parts produced by the machine tool. Then, even if the data mart is reused, the data mart produces another type of component if the other type of component is specified as a condition for narrowing down the analysis. Since the data on the machine tool is held, it can not be used as an analysis target, and the analysis itself can not be executed.

そこで本発明の目的は、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みを効率的なものとする技術を提供することにある。   Therefore, an object of the present invention is to provide a technology for flexibly reusing a data mart in response to a user's request and efficiently narrowing down the analysis result on the data mart.

上記課題を解決する本発明のデータ管理システムは、所定データを格納するデータレイクおよび前記所定データに対する所定の分析結果を格納するデータマートのそれぞれに関する情報を格納したデータストア情報と、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに対する分析処理を担うアルゴリズム、の一連の関係を示すデータパスの情報を格納したデータストア・アプリケーション接続情報と、を保持する記憶装置と、所定端末から受信した分析結果の絞り込み要求と前記データストア情報とに基づき、前記絞り込み要求の示す対象データマートに所定のメタ情報が含まれるか判定し、当該メタ情報が含まれていない場合、前記データストア情報および前記データストア・アプリケーション接続情報に基づき、前記対象データマートを含むデータパスにおいて、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択し、当該データマートに対して適用する前記アルゴリズムの一種たる前記メタ情報に関するフィルタ、当該フィルタの適用で得た新たなデータマート、および、当該新たなデータマートに適用する所定アルゴリズム、を含む新規データパスを所定ルールで生成し、当該新規データパスに従って前記選択したデータマートへの前記フィルタの適用および前記新たなデータマートへの所定アルゴリズムの適用を実行することで、前記絞り込み要求に対応した所定の分析結果を生成する演算装置と、を備えることを特徴とする。   A data management system according to the present invention for solving the above problems comprises: data store information storing data rake storing predetermined data; and data store information respectively storing data analysis results storing predetermined analysis results for the predetermined data; Storage device for storing data path / application connection information storing data path information indicating a series of relationships of the data mart and an algorithm responsible for analysis processing for the data rake or the data mart Based on the analysis narrowing request received from the analysis result and the data store information, it is determined whether the target data mart indicated by the narrowing down request includes predetermined meta information, and if the meta information is not included, the data store Information and said data store application In the data path including the target data mart, among the data mart from the target data mart to the data lake, one including the meta information is selected based on the serial information, and the data mart is applied to the data mart A new data path including a filter related to the meta information, which is a type of algorithm, a new data mart obtained by applying the filter, and a predetermined algorithm to be applied to the new data mart is generated according to a predetermined rule, and the new data is An arithmetic device generating a predetermined analysis result corresponding to the narrowing request by executing application of the filter to the selected data mart and application of a predetermined algorithm to the new data mart according to a path It is characterized by

また、本発明のデータ管理方法は、所定データを格納するデータレイクおよび前記所定データに対する所定の分析結果を格納するデータマートのそれぞれに関する情報を格納したデータストア情報と、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに対する分析処理を担うアルゴリズム、の一連の関係を示すデータパスの情報を格納したデータストア・アプリケーション接続情報と、を保持する記憶装置を備えた情報処理システムが、所定端末から受信した分析結果の絞り込み要求と前記データストア情報とに基づき、前記絞り込み要求の示す対象データマートに所定のメタ情報が含まれるか判定し、当該メタ情報が含まれていない場合、前記データストア情報および前記データストア・アプリケーション接続情報に基づき、前記対象データマートを含むデータパスにおいて、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択し、当該データマートに対して適用する前記アルゴリズムの一種たる前記メタ情報に関するフィルタ、当該フィルタの適用で得た新たなデータマート、および、当該新たなデータマートに適用する所定アルゴリズム、を含む新規データパスを所定ルールで生成し、当該新規データパスに従って前記選択したデータマートへの前記フィルタの適用および前記新たなデータマートへの所定アルゴリズムの適用を実行することで、前記絞り込み要求に対応した所定の分析結果を生成する、ことを特徴とす
る。
Further, according to the data management method of the present invention, there are provided data store information storing information on each of a data lake storing predetermined data and a data mart storing a predetermined analysis result on the predetermined data, the data lake, and the data mart An information processing system comprising: a storage device for storing data path / application connection information storing information on a data path indicating a series of relationships of an analysis process for the data lake or the data mart or the data mart; Based on the narrowing request of the analysis result received from the predetermined terminal and the data store information, it is determined whether the target data mart indicated by the narrowing request includes predetermined meta information, and when the meta information is not included, The data store information and the data store application Data path including the target data mart, among the data mart from the target data mart to the data lake, which includes the meta information, is selected based on the connection information and is applied to the data mart A new data path including a filter related to the meta information, which is a type of the algorithm, a new data mart obtained by applying the filter, and a predetermined algorithm applied to the new data mart is generated according to a predetermined rule, and the new data path is generated. A predetermined analysis result corresponding to the narrowing request is generated by executing application of the filter to the selected data mart and application of a predetermined algorithm to the new data mart according to a data path. Do.

本発明によれば、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みを効率的なものとできる。   According to the present invention, it is possible to flexibly reuse the data mart in response to the user's request and efficiently narrow down the analysis result on the data mart.

本実施形態のデータ管理システムを含むネットワーク構成例を示す図である。It is a figure showing an example of network composition including a data management system of this embodiment. 本実施形態のデータ管理システムのハードウェア構成例を示す図である。It is a figure showing the example of hardware constitutions of the data management system of this embodiment. 本実施形態のデータストア情報の構成例を示す図である。It is a figure showing an example of composition of data store information of this embodiment. 本実施形態のデータストア・アプリ接続情報の構成例を示す図である。It is a figure which shows the structural example of data store * application connection information of this embodiment. 本実施形態のアプリケーション情報の構成例を示す図である。It is a figure which shows the structural example of the application information of this embodiment. 本実施形態におけるデータレイクの構成例を示す図である。It is a figure which shows the structural example of the data lake in this embodiment. 本実施形態における第1データマートの構成例を示す図である。It is a figure which shows the structural example of the 1st data mart in this embodiment. 本実施形態における第2データマートの構成例を示す図である。It is a figure which shows the structural example of the 2nd data mart in this embodiment. 本実施形態のデータストアと分析アプリケーションの論理構成の一例を示す図である。It is a figure which shows an example of the logical configuration of the data store of this embodiment, and an analysis application. 本実施形態の新規データパス作成後のデータストア情報の一例を示す図である。It is a figure which shows an example of the data store information after the new data path creation of this embodiment. 本実施形態の新規データパス作成後のデータストア・アプリ接続情報の一例を示す図である。It is a figure which shows an example of the data store * application connection information after the new data path creation of this embodiment. 本実施形態の新規データパス作成後のアプリケーション情報の一例を示す図である。It is a figure which shows an example of the application information after the novel data path creation of this embodiment. 本実施形態の新規データパス作成後の第1’データマートの内容の一例を示す図である。It is a figure which shows an example of the content of 1st 'data mart after novel data path creation of this embodiment. 本実施形態の新規データパス作成後の第2’データマートの内容の一例を示す図である。It is a figure which shows an example of the content of 2nd 'data mart after novel data path creation of this embodiment. 本実施形態の新規データパスの内容の一例を示す図である。It is a figure which shows an example of the content of the new data path of this embodiment. 本実施形態の分析アプリ開発者端末における処理例を示すフロー図である。It is a flowchart which shows the process example in the analysis application developer terminal of this embodiment. 本実施形態におけるデータ管理方法のフロー例1を示す図である。It is a figure which shows the example 1 of a flow of the data management method in this embodiment. 本実施形態におけるデータ管理方法のフロー例2を示す図である。It is a figure which shows the example 2 of a flow of the data management method in this embodiment. 本実施形態におけるデータ管理方法のフロー例3を示す図である。It is a figure which shows the example 3 of a flow of the data management method in this embodiment. 本実施形態におけるデータ管理方法のフロー例4を示す図である。It is a figure which shows the example 4 of a flow of the data management method in this embodiment. 本実施形態におけるデータ管理方法のフロー例5を示す図である。It is a figure which shows the example 5 of a flow of the data management method in this embodiment. 本実施形態におけるデータ管理方法のフロー例6を示す図である。It is a figure which shows the example 6 of a flow of the data management method in this embodiment.

−−−システム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1Aは、本実施形態のデータ管理システム10を含むネットワーク構成図である。図1Aに示すデータ管理システム10は、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みを効率的なものとするコンピュータシステムである。
--- System configuration ---
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1A is a network configuration diagram including a data management system 10 of the present embodiment. The data management system 10 illustrated in FIG. 1A is a computer system that flexibly reuses a data mart in response to a user's request and efficiently narrows down the analysis result on the data mart.

また、こうしたデータ管理システム10は、一例として、データカタログ管理サーバ100およびIoT基盤実行サーバ200により構成されたものを想定できる。ただし、本実施形態のデータ管理システム10の最小構成としてデータカタログ管理サーバ100のみなど、単体の装置に必要な機能を実装する形態を想定するとしてもよい。   Further, as an example, such data management system 10 can be assumed to be configured by a data catalog management server 100 and an IoT-based execution server 200. However, as a minimum configuration of the data management system 10 according to the present embodiment, a mode may be assumed in which functions required for a single device such as only the data catalog management server 100 are implemented.

本実施形態のデータ管理システム10を運用する組織としては、例えば、或る工場にお
ける生産効率の分析や工作機械の故障予知を行う事業体を想定できる。この事業体が管理する工場では、当該工場に設置したセンサーや工作機械など工場設備002が、一定時間毎に監視データを発信し、これをIoT基盤実行サーバ200が収集する仕組みが形成、運用されているものとする。
As an organization that operates the data management system 10 of the present embodiment, for example, a business entity that analyzes production efficiency in a certain factory or predicts failure of a machine tool can be assumed. At a factory managed by this business entity, a mechanism is established and operated in which factory equipment 002 such as sensors and machine tools installed in the factory sends monitoring data at regular intervals and the IoT platform execution server 200 collects it. It shall be.

よって、既に述べたように、IoT基盤実行サーバ200では、工場設備002から得た収集データを蓄積するデータレイク225、このデータレイク225や他のデータマート226を目的別に適宜に加工・分析して得たデータマート226、データレイク225やデータマート226に対してデータの抽出・変換等を行うETL(Extract Transform Load)、および、このETLにより用意されたデータマート226に対して分析処理を行う分析アプリケーション、の4つが動作することとなる。   Therefore, as described above, the IoT-based execution server 200 appropriately processes and analyzes the data lake 225 for accumulating collected data obtained from the factory equipment 002, the data lake 225, and other data mart 226 according to the purpose. ETL (Extract Transform Load) that performs data extraction and conversion on the acquired data mart 226, data lake 225 and data mart 226, and analysis that performs analysis processing on the data mart 226 prepared by this ETL The four applications will work.

このうちデータレイク225は、上述のセンサーや工作機械など工場設備002から収集したデータを、加工等の処理を経ずに保存するデータベースである。また、データマート226は、ETLや分析アプリケーションが加工したデータを保存するデータベースである。こうしたデータレイク225とデータマート226は、その総称としてデータストアと呼称されている。   Among them, the data lake 225 is a database for storing data collected from the factory equipment 002 such as the above-described sensor or machine tool without processing such as processing. The data mart 226 is a database for storing data processed by the ETL and the analysis application. The data lake 225 and the data mart 226 are generically called a data store.

またETLは、上述の分析アプリケーションが必要とするデータを用意することを目的とし、データレイク225またはデータマートか226らデータを抽出し、これを適宜に変換した結果をデータマート226へ保存するソフトウェアである。   In addition, ETL aims to prepare the data required by the above-mentioned analysis application, and it is software that extracts the data from Data Lake 225 or Data Mart or 226 and stores the converted result into Data Mart 226 as appropriate. It is.

また分析アプリケーションは、目的に応じてデータをデータマート226から読み出し、その分析結果をデータマート226へ保存するソフトウェアである。なお、こうした分析アプリケーションは、データマート226から読み出したデータあるいは分析結果を、所定のインターフェイスや外部端末等を介してユーザに表示する機能も含みうる。   The analysis application is software that reads data from the data mart 226 according to the purpose and stores the analysis result in the data mart 226. Such an analysis application may also include a function of displaying data or analysis results read out from the data mart 226 to the user via a predetermined interface or an external terminal.

このようなプログラム群が動作するIoT基盤実行サーバ200では、上述の分析アプリケーションやETLの再開発を避けるため、分析アプリケーションやETLがデータマート226に保存したデータを再利用する。このデータ再利用のために、データマート226から読みだしたデータをETLや分析アプリが加工し、別途のデータマート226へ保存する過程を繰り返すことで、データマート226とETLや分析アプリケーションとが論理的に多段接続されることになる。   The IoT-based execution server 200 in which such a program group operates reuses data stored in the data mart 226 by the analysis application or the ETL in order to avoid redevelopment of the above-described analysis application or ETL. In order to reuse this data, the ETL or analysis application processes the data read from the data mart 226 and repeats the process of storing the data in the separate data mart 226, so that the data mart 226 and ETL or analysis application are logical. It will be connected in multiple stages.

こうした、データストア(データレイク225、データマート226)、分析アプリケーション、および、ETLが接続された構造をデータパスと呼ぶ。また、このデータパスにおいて、データレイク225に近づく方向を上流と呼び、データレイク225から遠ざかる方向を下流と定義する。   Such a data store (data lake 225, data mart 226), analysis application, and a structure in which ETLs are connected are called data paths. Also, in this data path, the direction approaching the data lake 225 is referred to as the upstream, and the direction away from the data lake 225 is defined as the downstream.

また、本実施形態のデータ管理システム10は、図1Aに示すごとく、適宜なネットワーク003を介して、上述の工場設備002や分析アプリケーション開発者・利用者端末001と、通信可能に接続されているものとする。   Further, as shown in FIG. 1A, the data management system 10 according to the present embodiment is communicably connected to the above-mentioned factory equipment 002 and the analysis application developer / user terminal 001 via an appropriate network 003. It shall be.

このうちデータカタログ管理サーバ100は、情報検索部110と、データパス作成部111と、フィルタ作成部112と、データストア情報作成部113と、データストア・アプリケーション接続情報作成部114の各機能部を有している。また、データカタログ管理サーバ100は、適宜な記憶装置において、データストア情報125、データストア・アプリケーション接続情報126、および、アプリケーション情報127を保持するものとする。   Among them, the data catalog management server 100 includes functional units of an information search unit 110, a data path creation unit 111, a filter creation unit 112, a data store information creation unit 113, and a data store / application connection information creation unit 114. Have. The data catalog management server 100 holds data store information 125, data store / application connection information 126, and application information 127 in an appropriate storage device.

一方、IoT基盤実行サーバ200は、アプリケーション実行部210およびデータ収集部212の各機能部を有している。また、IoT基盤実行サーバ200は、適宜な記憶装置に実装したデータ記録部212に、上述のデータストア(データレイク225、データマート226)に保存されるデータを保存している。こうしたデータストアの実体は、データベースあるいはキーバリューストアあるいはデータベースのテーブルでも良い。   On the other hand, the IoT-based execution server 200 has each function unit of the application execution unit 210 and the data collection unit 212. Further, the IoT-based execution server 200 stores the data stored in the above-mentioned data store (data lake 225, data mart 226) in the data storage unit 212 implemented in an appropriate storage device. Such data store entities may be databases or key-value stores or tables of databases.

また、分析アプリケーション開発者・利用者端末001は、上述のIoT基盤実行サーバ200における分析アプリケーションの開発者あるいは利用者が操作する端末である。こうした開発者あるいは利用者は、分析アプリケーション開発者・利用者端末001を操作して、上述のデータストアを一意に示すIDであるデータストアIDと、メタ情報名(例:車種)と、当該メタ情報の値(例:A)とからなる絞り込み要求を、データカタログ管理サーバ100へ送信する。この絞り込み要求は、データマート226のデータを、所望のメタ情報(例:“車種”=“A”)を条件として絞り込む指示となる。   The analysis application developer / user terminal 001 is a terminal operated by the developer or user of the analysis application in the above-described IoT-based execution server 200. Such a developer or user operates the analysis application developer / user terminal 001 to obtain a data store ID which is an ID uniquely indicating the above-mentioned data store, a meta information name (eg, car type), and the meta A narrowing request consisting of information values (example: A) is sent to the data catalog management server 100. This narrowing-down request is an instruction to narrow the data of the data mart 226 on the condition of desired meta information (eg, “vehicle type” = “A”).

他方、データカタログ管理サーバ100は、上述の絞り込み要求を受けて、この絞り込み要求が含むデータストアIDに対応したデータストアよりも、データパスにおいて上流に位置するデータストアのうち、当該絞り込み要求に記載のメタ情報名のデータを含むデータストアを特定する。   On the other hand, in response to the above-described narrowing request, the data catalog management server 100 describes the narrowing request among the data stores located upstream in the data path from the data store corresponding to the data store ID included in the narrowing request. Identify a data store that contains data for the meta information name of

また、データカタログ管理サーバ100は、上述のように特定したデータストアを含むデータパスにおいて、当該データストアから絞り込み要求に記載のデータストア(対象データマート)との間に位置する分析アプリケーション、ETL、データストアの各IDからなる新規データパス506を作成する。   In addition, the data catalog management server 100, in the data path including the data store identified as described above, an analysis application, ETL, etc., located between the data store and the data store (target data mart) described in the narrowing request. Create a new data path 506 consisting of each ID of the data store.

また、データカタログ管理サーバ100は、上述の絞り込み要求に記載のメタ情報名およびメタ情報の値を用いて、上述のように特定したデータストア(分析アプリケーションによる分析結果を保持するデータマート226や、工場設備002から得た収集データを保持するデータレイク225)の格納データを絞り込むETLとして、フィルタを作成する。データカタログ管理サーバ100は、ここで作成したフィルタを、上述の新規データパス506の最上流(すなわち、既存のデータストアと新規データパスとの境界)に追加したうえで、新規データパス506に記載のフィルタ、データマート、ETL、および、分析アプリケーション、の新規配置および実行を、新規データパス作成要求としてIoT基盤実行サーバ200に指示する。   Further, the data catalog management server 100 uses the meta information name and the meta information value described in the above-described narrowing request to specify the data store identified as described above (a data mart 226 that holds the analysis result by the analysis application, A filter is created as an ETL that narrows down the stored data of the data lake 225) holding collected data obtained from the factory equipment 002. The data catalog management server 100 adds the filter created here to the uppermost stream of the new data path 506 described above (that is, the boundary between the existing data store and the new data path), and then describes the filter in the new data path 506. The IoT-based execution server 200 is instructed as a new data path creation request as to new placement and execution of the filter, data mart, ETL, and analysis application.

なお、IoT基盤実行サーバ200では、工場設備002に含まれる機械やセンサーから監視データ等を収集し、データ記録部211のデータレイク225に保存するほか、ETLや分析アプリケーションを実行した結果をデータマート226に保存する。   The IoT platform execution server 200 collects monitoring data etc. from machines and sensors included in the factory equipment 002 and stores it in the data lake 225 of the data recording unit 211, and results of executing the ETL and analysis application as a data mart Save to 226.

また、IoT基盤実行サーバ200は、上述のデータカタログ管理サーバ100から、新規データパスの作成要求を受信した場合、この作成要求に含まれる新規データパス506に従って、フィルタ、データマート、ETL、および、分析アプリケーションを配置した上で実行する。また、IoT基盤実行サーバ200は、こうして実行中の分析アプリケーションの情報すなわちアプリケーション情報127の更新指示を、データカタログ管理サーバ100へ送信する。また、IoT基盤実行サーバ200は、その内部で適宜に管理するETLとデータストアの各情報をそれぞれ更新する。
上述のような機能等を備えたデータカタログ管理サーバ100およびIoT基盤実行サーバ200の内部動作を以下で説明する。
Further, when the IoT-based execution server 200 receives a creation request of a new data path from the data catalog management server 100 described above, the filter, data mart, ETL, and according to the new data path 506 included in the creation request. Deploy and run an analysis application. In addition, the IoT-based execution server 200 transmits, to the data catalog management server 100, information on the analysis application being executed, that is, an update instruction of the application information 127. In addition, the IoT-based execution server 200 updates each piece of information of the ETL and data store which are appropriately managed therein.
The internal operations of the data catalog management server 100 and the IoT-based execution server 200 having the above-described functions and the like will be described below.

このうちデータカタログ管理サーバ100の情報検索部110は、分析アプリケーション開発者・利用者端末001から絞り込み要求を受け付けた(B1)場合、データストア
情報125とデータストア・アプリケーション接続情報126とに記録されている各情報を取得(B2,B3,B4,B5)し、上述の新規データパス506を作成する。 また、データカタログ管理サーバ100は、上述のように作成した新規データパス506と、分析アプリケーション開発者・利用者端末001から受けた上述の絞り込み要求とを、データパス作成部111へ送信する(B6)。
Among them, when the information search unit 110 of the data catalog management server 100 receives a narrowing request from the analysis application developer / user terminal 001 (B1), the information search unit 110 is recorded in the data store information 125 and the data store / application connection information 126. The respective information is acquired (B2, B3, B4, B5), and the above-mentioned new data path 506 is created. In addition, the data catalog management server 100 transmits the new data path 506 created as described above and the above-mentioned narrowing-down request received from the analysis application developer / user terminal 001 to the data path creation unit 111 (B6 ).

この時、データカタログ管理サーバ100のデータパス作成部111は、情報検索部110から新規データパス506と絞り込み要求を受け付けて、当該新規データパス506と絞り込み要求とをデータストア情報作成部113へ送信する(B7)。また、データパス作成部111は、当該新規データパス506および絞り込み要求を、フィルタ作成部112へ送信する(B9)。   At this time, the data path creation unit 111 of the data catalog management server 100 receives the new data path 506 and the narrowing request from the information search unit 110, and transmits the new data path 506 and the narrowing request to the data store information generation unit 113. To do (B7). Further, the data path creation unit 111 transmits the new data path 506 and the narrowing-down request to the filter creation unit 112 (B9).

また、データカタログ管理サーバ100のデータストア情報作成部113は、任意の時刻に、IoT基盤実行サーバ200のデータ記録部211からデータストアID1201と当該データストアIDの示すデータストアに含まれるメタ情報名1202とデータ名1203と接続先情報1204とを取得し(A1)、これらをデータストア情報125に記録する(A2)。   In addition, the data store information creation unit 113 of the data catalog management server 100 receives the meta information name included in the data store indicated by the data store ID 1201 and the data store ID from the data recording unit 211 of the IoT-based execution server 200 at any time. The data 1202, the data name 1203 and the connection destination information 1204 are acquired (A 1), and these are recorded in the data store information 125 (A 2).

また、データストア情報作成部113は、データパス作成部111から新規データパス506および絞り込み要求を受け付け(B7)たら、当該絞り込み要求に含まれるメタ情報名と当該メタ情報名の値と、新規データパス506に含まれる複製後オブジェクトID2033と複製元オブジェクトID2032とから、データストアIDに対応する絞り込み済みメタ情報1205と複製先データストアID1206を算出し、算出した絞り込み済みメタ情報1205と複製先データストアID1206をデータストア情報125に記録する(B8)。   Further, when the data store information creating unit 113 receives the new data path 506 and the narrowing request from the data path creating unit 111 (B7), the meta information name included in the narrowing request, the value of the meta information name, and the new data The narrowed meta information 1205 and the copy destination data store ID 1206 corresponding to the data store ID are calculated from the post-replication object ID 2033 and the copy source object ID 2032 included in the path 506, and the calculated narrowed meta information 1205 and the copy destination data store The ID 1206 is recorded in the data store information 125 (B8).

また、データカタログ管理サーバ100のフィルタ作成部112は、上述の新規データパス506および絞り込み要求に従って、絞り込み用のフィルタを作成し、当該フィルタのIDと実行方法をアプリケーション情報127に記録する(B9)。これと同時に、フィルタ作成部112は、作成したフィルタのIDを新規データパス506に追記したうえで、当該フィルタと新規データパス506をデータパス作成部111へ送信する(B10)。   Further, the filter creation unit 112 of the data catalog management server 100 creates a filter for narrowing down according to the above-mentioned new data path 506 and narrowing-down request, and records the ID of the filter and the execution method in the application information 127 (B9) . At the same time, the filter creation unit 112 adds the created filter ID to the new data path 506, and transmits the filter and the new data path 506 to the data path creation unit 111 (B10).

一方、データパス作成部111は、上述のフィルタ作成部112から、フィルタと新規データパス506を受け付けて、IoT基盤実行サーバ200内のアプリケーション実行部210へ、当該フィルタと新規データパス506を送信して、上述のフィルタと分析アプリケーションョンとETLとデータストアの作成を指示(B12)する。またデータパス作成部111は、新規データパス506の先頭要素であるデータストアIDを情報検索部110へ送信する(B15)。   On the other hand, the data path creation unit 111 receives the filter and the new data path 506 from the above-mentioned filter creation unit 112, and transmits the filter and the new data path 506 to the application execution unit 210 in the IoT-based execution server 200. Then, the creation of the above-described filter, analysis application, ETL, and data store is instructed (B12). In addition, the data path creation unit 111 transmits a data store ID, which is the top element of the new data path 506, to the information search unit 110 (B15).

一方、IoT基盤実行サーバ200のアプリケーション実行部210は、データパス作成部111から新規データパス506の要素を受け付け(B12)たら、この要素がETLや分析アプリケーションを指す場合は、分析アプリケーションの実行方法をアプリケーション情報127から取得(B13)し、これを実行する。   On the other hand, when the application execution unit 210 of the IoT-based execution server 200 receives an element of the new data path 506 from the data path generation unit 111 (B12), the method of executing the analysis application when this element points to ETL or analysis application Are acquired from the application information 127 (B13) and executed.

また、アプリケーション実行部210は、データパス作成部111から受け付けた新規データパス506の要素がデータストアを指すのであれば、データ記録部211にて、データストアを新規作成する(B14)。   If the element of the new data path 506 received from the data path creation unit 111 points to a data store, the application execution unit 210 creates a new data store in the data storage unit 211 (B14).

なお、アプリケーション実行部210は、データパス作成部111からの入力の有無に
かかわらず、分析アプリケーションやETLを実行する、あるいはデータストアを新規作成したら、当該分析アプリケーション、あるいはETL、あるいはデータストアの1つ上流と1つ下流に位置する分析アプリケーション、あるいはETL、あるいはデータストアのIDを引数にデータストア・アプリケーション接続情報126を呼び出す(D1)。
Note that the application execution unit 210 executes an analysis application or ETL regardless of the presence or absence of an input from the data path generation unit 111, or creates a new data store, one of the analysis application, ETL, or data store. The data store / application connection information 126 is called with the analysis application located upstream and one downstream, or the ID of the ETL or data store as an argument (D1).

また、データカタログ管理サーバ100の情報検索部110は、データパス作成部111からデータストアIDを受け付けたら、当該データストアIDに対応するデータストアの接続情報をデータストア情報125から取得し、取得したデータストアの接続情報を分析アプリケーション開発者・利用者端末へ応答する(B16)。   In addition, when the information search unit 110 of the data catalog management server 100 receives the data store ID from the data path creation unit 111, the information search unit 110 acquires connection information of the data store corresponding to the data store ID from the data store information 125 Data store connection information is returned to the analysis application developer / user terminal (B16).

また、データカタログ管理サーバ100のデータストア・アプリケーション接続情報作成部114は、IoT基盤実行サーバ200のアプリケーション実行部210から、分析アプリケーションあるいは、ETLあるいは、データストアIDと、その1つ上流と1つ下流の分析アプリケーションあるいは、ETLあるいは、データストアIDと、を受け付け(D1)たら、データストア・アプリケーション接続情報126に記録する(D2)。   In addition, the data store / application connection information creation unit 114 of the data catalog management server 100 is an analysis application, an ETL, or a data store ID, and one upstream thereof from the application execution unit 210 of the IoT-based execution server 200. When the downstream analysis application or ETL or data store ID is accepted (D1), it is recorded in the data store / application connection information 126 (D2).

−−−ハードウェア構成−−−
また、本実施形態のデータ管理システム10を主として構成するデータカタログ管理サーバ100のハードウェア構成は図1Aに示す如くとなる。
--- Hardware configuration ---
The hardware configuration of the data catalog management server 100 mainly constituting the data management system 10 of this embodiment is as shown in FIG. 1A.

本実施形態のデータカタログ管理サーバ100は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される記憶装置101、RAMなど揮発性記憶素子で構成されるメモリ103、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算装置104、ネットワーク003と接続し他装置との通信処理を担う通信装置105、を備える。   The data catalog management server 100 according to the present embodiment includes a storage device 101 configured of an appropriate non-volatile storage element such as a solid state drive (SSD) or a hard disk drive, a memory 103 configured of a volatile storage element such as a RAM, The program 102 held in the unit 101 is read out to the memory 103 or the like to execute the overall control of the apparatus itself and to execute various determinations, calculations and control processing as well as to an arithmetic unit 104 such as a CPU and a network 003 to connect with other apparatuses. A communication device 105 responsible for communication processing is provided.

なお、記憶装置101内には、本実施形態のデータ管理システム10を構成するデータカタログ管理サーバ100として必要な機能を実装する為のプログラム102に加えて、データストア情報125、データストア・アプリケーション接続情報126、および、アプリケーション情報127が少なくとも記憶されている。これらの情報の詳細については後述する。   Note that, in addition to the program 102 for implementing the functions necessary as the data catalog management server 100 constituting the data management system 10 of the present embodiment, the data store information 125, data store and application connection in the storage device 101. Information 126 and application information 127 are at least stored. Details of these pieces of information will be described later.

また、上述の演算装置104がプログラム102を実行することで、情報検索部110、データパス作成部111、フィルタ作成部112、データストア情報作成部113、および、データストア・アプリケーション接続情報作成部114が実装される。これら機能部の働きの詳細についても後述する。   In addition, when the above-mentioned arithmetic unit 104 executes the program 102, the information search unit 110, the data path creation unit 111, the filter creation unit 112, the data store information creation unit 113, and the data store / application connection information creation unit 114. Is implemented. The details of the functions of these functional units will also be described later.

−−−データ構造例−−−
続いて、本実施形態のデータ管理システム10を構成する、上述のデータカタログ管理サーバ100およびIoT基盤実行サーバ200らが用いるデータ類について説明する。
--- Data structure example ---
Next, data used by the above-described data catalog management server 100 and the IoT-based execution server 200, which constitute the data management system 10 of this embodiment, will be described.

図2Aは、本実施形態におけるデータストア情報125の構成例を示す図である。このデータストア情報125は、データストアID1201、メタ情報名1202、データ名1203、接続先情報1204、絞り込み済みメタ情報1205、および、複製先データストアID1206、の各値を含むレコードの集合体となっている。
このうちデータストアID1201は、対応するデータストアのインスタンスを一意に指し示すために使うIDであり、数値あるいは文字列である。
また、メタ情報名1202は、データストアID1201で示されるデータストアに含まれているメタ情報名のリストである。
また、データ名1203は、データストアID1201で示されるデータストアに含まれているデータ名のリストである。
また、接続先情報1204は、データストアID1201で示されるデータストアにアクセスしてデータを取得するために必要となる接続先の情報である。
また、絞り込み済みメタ情報1205は、特定のメタ情報の値で絞り込んだデータストアの場合に、当該絞り込みに用いたメタ情報を示す情報である。
FIG. 2A is a view showing a configuration example of the data store information 125 in the present embodiment. This data store information 125 is a set of records including values of data store ID 1201, meta information name 1202, data name 1203, connection destination information 1204, narrowed meta information 1205, and copy destination data store ID 1206. ing.
Among these, the data store ID 1201 is an ID used to uniquely indicate the instance of the corresponding data store, and is a numerical value or a character string.
Also, the meta information name 1202 is a list of meta information names included in the data store indicated by the data store ID 1201.
Also, the data name 1203 is a list of data names included in the data store indicated by the data store ID 1201.
Also, connection destination information 1204 is information of a connection destination that is required to access the data store indicated by the data store ID 1201 and acquire data.
In addition, in the case of a data store narrowed down by the value of a specific meta information, the narrowed meta information 1205 is information indicating the meta information used for the narrowing.

また、複製先データストアID1206は、データストアID1201で示されるデータストアを、特定のメタ情報の値で絞り込んで別のデータストアを複製した場合、その複製したデータストアを示す情報である。   The copy destination data store ID 1206 is information indicating the copied data store when the data store indicated by the data store ID 1201 is narrowed down by a specific meta information value and another data store is copied.

なお、上述の絞り込み済みメタ情報1205と複製先データストアID1206の値は、データカタログ管理サーバ100により、データストアを複製した場合に記録されることとなる。   The values of the above-described narrowed meta information 1205 and the copy destination data store ID 1206 are recorded by the data catalog management server 100 when the data store is copied.

続いて図2Bは、本実施形態におけるデータストア・アプリケーション接続情報126の構成例を示す図である。このデータストア・アプリケーション接続情報126は、上流側オブジェクトID1211、および、下流側オブジェクトID1212、の各値を含むレコードの集合体となっている。   Next, FIG. 2B is a view showing a configuration example of the data store / application connection information 126 in the present embodiment. The data store / application connection information 126 is a collection of records including the values of the upstream object ID 1211 and the downstream object ID 1212.

このうち上流側オブジェクトID1211は、下流側オブジェクトID1212で示されるオブジェクト(データレイク、データマート、分析アプリケーション、ETL、フィルタ)に対して、データパスにおいて1つ上流側に位置するオブジェクトのIDである。   Among them, the upstream object ID 1211 is an ID of an object located one upstream side in the data path with respect to the object (data lake, data mart, analysis application, ETL, filter) indicated by the downstream object ID 1212.

一方、下流側オブジェクトID1212は、上述の上流側オブジェクトID1211で示されるオブジェクトに対して、データパスにおいて1つ下流側に位置するオブジェクトのIDである。   On the other hand, the downstream object ID 1212 is an ID of an object positioned one downstream in the data path with respect to the object indicated by the upstream object ID 1211 described above.

また図2Cは、本実施形態におけるアプリケーション情報127の構成例を示す図である。このアプリケーション情報127は、アプリケーションID1221およびインスタンス作成方法1222の各値を含むレコードの集合体となっている。
このうちアプリケーションID1221は、分析アプリケーションあるいはETLのインスタンスを一意に指し示すIDであり、数値あるいは文字列である。
Further, FIG. 2C is a view showing a configuration example of the application information 127 in the present embodiment. The application information 127 is a collection of records including each value of the application ID 1221 and the instance creation method 1222.
Among these, the application ID 1221 is an ID uniquely indicating an instance of an analysis application or ETL, and is a numerical value or a character string.

一方、インスタンス作成方法1222は、IoT基盤実行サーバ200のアプリケーション実行部210において、上述のアプリケーションID1221で示される分析アプリケーションあるいはETLの実行に必要なコマンドと、引数のリストを記述した情報である。   On the other hand, the instance creation method 1222 is information in which a list of commands and arguments required to execute the analysis application or ETL indicated by the application ID 1221 described above is described in the application execution unit 210 of the IoT-based execution server 200.

また図3Aは、本実施形態におけるデータレイク225のデータ構成例を示す図である。このデータレイク225は、時刻1231、機器ID1232、製品種別1233、および、回転継続時間1234、の各値を含むレコードの集合体となっている。
このうち時刻1231は、回転継続時間1234の値の収集対象時刻を表すメタ情報である。
また、機器ID1232は、工場設備002において製品の生産に使われる機器を一意に示すメタ情報であり、数値あるいは文字列である。
また、製品種別1233は、上述の機器ID1232で示される機器が、時刻1231において生産していた製品の種類を表すメタ情報である。
Moreover, FIG. 3A is a figure which shows the data structural example of the data lake 225 in this embodiment. The data lake 225 is a collection of records including the values of time 1231, device ID 1232, product type 1233, and rotation duration 1234.
Among these, time 1231 is meta information representing a collection target time of the value of the rotation continuation time 1234.
The device ID 1232 is meta information uniquely indicating a device used for producing a product in the factory equipment 002, and is a numerical value or a character string.
The product type 1233 is meta information indicating the type of product that the device indicated by the device ID 1232 described above has produced at time 1231.

また、回転継続時間1234は、上述の機器ID1232で示される機器の電源を時刻
1231に遮断してから、当該機器における所定の回転軸が停止するまでに要した時間の値である。
Further, the rotation continuation time 1234 is a value of the time required from the power supply of the device indicated by the device ID 1232 described above being shut off at time 1231 to the stop of the predetermined rotation axis in the device.

また図3Bは、本実施形態におけるデータマート226の1つである、第1データマート2261の構成例を示す図である。この第1データマート2261は、時刻1241、機器ID1242、製品種別1243、および、故障判定1244、の各値を含むレコードの集合体となっている。
このうち時刻1241は、故障判定1244の分析対象時刻を表すメタ情報である。
また機器ID1242は、工場設備002において製品の生産に使われる機器を一意に示すメタ情報であり、数値あるいは文字列である。
また製品種別1243は、機器ID1242で示される機器が、時刻1241において生産していた製品の種類を表すメタ情報である。
Moreover, FIG. 3B is a figure which shows the structural example of the 1st data mart 2261 which is one of the data mart 226 in this embodiment. The first data mart 2261 is a set of records including the values of time 1241, device ID 1242, product type 1243, and failure determination 1244.
Among these, time 1241 is meta information indicating the analysis target time of the failure determination 1244.
The device ID 1242 is meta information uniquely indicating a device used for producing a product in the factory facility 002, and is a numerical value or a character string.
The product type 1243 is meta information indicating the type of product that the device indicated by the device ID 1242 has produced at time 1241.

また、故障判定1244は、上述の時刻1241に相当する時刻1231の回転継続時間1234をデータレイク225から取得して行った分析で得られた、当該機器の故障状態に関する分析結果である。   In addition, the failure determination 1244 is an analysis result on the failure state of the device obtained by analysis performed by acquiring from the data lake 225 the rotation continuation time 1234 of the time 1231 corresponding to the above-mentioned time 1241.

また図3Cは、本実施形態におけるデータマート226の1つである、第2データマート2262の構成例を示す図である。この第2データマート2262は、時刻1251、および、故障率1252、各値を含むレコードの集合体となっている。
このうち時刻1251は、故障率1252の分析対象時刻を表すメタ情報である。
また故障率1252は、上述の第1データマート2261に保存されている故障判定1244から計算した故障判定の統計値を表す情報である。
Further, FIG. 3C is a view showing a configuration example of a second data mart 2262 which is one of the data mart 226 in the present embodiment. The second data mart 2262 is a collection of records including the time 1251, the failure rate 1252, and each value.
Among these, time 1251 is meta information representing analysis target time of failure rate 1252.
The failure rate 1252 is information representing a statistical value of failure determination calculated from the failure determination 1244 stored in the first data mart 2261 described above.

−−−データパスの具体例−−−
図4は、本実施形態におけるIoT基盤実行サーバ200で実行済みの既存データパス505と、本実施形態のデータ管理方法を実行することで追加される新規データパス506とについて、それらの論理構造例を示す図である。
---Specific example of data path---
FIG. 4 shows an example of the logical structure of the existing data path 505 already executed by the IoT-based execution server 200 in this embodiment and the new data path 506 added by executing the data management method of this embodiment. FIG.

この場合、本実施形態におけるIoT基盤実行サーバ200のデータ収集部212が、工場設備002から機器等の監視データを収集し、これを収集データとしてデータレイク225に保存しているものとする。   In this case, it is assumed that the data collection unit 212 of the IoT-based execution server 200 in the present embodiment collects monitoring data of equipment and the like from the factory equipment 002 and stores the monitoring data in the data lake 225 as collection data.

ここで、IoT基盤実行サーバ200のアプリケーション実行部210は、上述のデータレイク225の収集データから回転収集時刻1234を取得して、これを入力として第1分析アプリケーション401(IoT基盤実行サーバ200が予め保持)を実行する。   Here, the application execution unit 210 of the IoT-based execution server 200 acquires the rotation collection time 1234 from the collected data of the data lake 225 described above, and uses this as an input to the first analysis application 401 (the IoT-based execution server 200 obtains in advance Hold).

この第1分析アプリケーション401は、当該回転収集時刻1234の値から、工場設備002における所定機器が故障しているか分析した結果として、故障判定1244の値を第1データマート2261に保存する。   The first analysis application 401 stores the value of the failure determination 1244 in the first data mart 2261 as a result of analyzing whether or not a predetermined device in the plant facility 002 is broken from the value of the rotation collection time 1234.

続いて、上述のアプリケーション実行部210は、第1データマート2261から故障判定1244の値を取得して、これを入力として第2分析アプリケーション402(IoT基盤実行サーバ200が予め保持)を実行する。   Subsequently, the application execution unit 210 described above acquires the value of the failure determination 1244 from the first data mart 2261 and uses this as an input to execute a second analysis application 402 (previously held by the IoT-based execution server 200).

この第2分析アプリケーション402は、上述の故障判定1244の値を該当機器における故障率として所定の統計的手法により集計し、その結果すなわち分析結果を第2データマート2262に保存する。   The second analysis application 402 tabulates the value of the above-mentioned failure determination 1244 as a failure rate in the corresponding device by a predetermined statistical method, and stores the result, that is, the analysis result in the second data mart 2262.

IoT実行基盤サーバ200が上記の状態にあるときに、データカタログ管理サーバ1
00に対し、分析アプリケーション開発者・利用者端末001から、分析結果の絞り込み要求が送信されたとする。この絞り込み要求は、対象データマートを上述の第2データマート2262とし、その格納情報たる分析結果を、メタ情報“製品種別”が“A”について絞り込む要求であるとする。
When the IoT execution base server 200 is in the above state, the data catalog management server 1
It is assumed that the analysis application developer / user terminal 001 sends a request for narrowing down the analysis results to 00. It is assumed that this narrowing-down request is a request to narrow the target data mart to the above-mentioned second data mart 2262 and the analysis result, which is the stored information, for the meta information “product type” for “A”.

その場合のデータカタログ管理サーバ100は、上述のメタ情報“製品種別”が“A”の値を含むデータマートをデータストア・アプリケーション接続情報126で検索し、データレイク225からみて最も下流のデータストアの、第1データマート2261を特定したものとする。   In that case, the data catalog management server 100 searches the data store / application connection information 126 for a data mart including the above meta information “product type” has a value of “A”, and the most downstream data store viewed from the data lake 225 It is assumed that the first data mart 2261 is identified.

そこでデータカタログ管理サーバ100は、この第1データマート2261から分岐した新規データパス506を作成する要求を、IoT基盤実行サーバへ送信する。   Therefore, the data catalog management server 100 transmits a request for creating a new data path 506 branched from the first data mart 2261 to the IoT-based execution server.

一方、IoT基盤実行サーバ200のアプリケーション実行部210は、データカタログ管理サーバ100から受け付けた新規データパス506の作成要求に基づいてフィルタ410を作成し、これを第1データマート2261に適用して第1’データマート2263(図6A)を生成する。   On the other hand, the application execution unit 210 of the IoT-based execution server 200 creates the filter 410 based on the creation request of the new data path 506 received from the data catalog management server 100 and applies this to the first data mart 2261 to Generate the 1 'data mart 2263 (FIG. 6A).

また、アプリケーション実行部210は、第2分析アプリケーション402に関してアプリケーション情報127から取得したインスタンス作成方法1222に記載のコマンドを実行し、第2’分析アプリケーション403、および、これに第1’データマートを入力として与えた第2’データマート2264(図6B)を生成する。   In addition, the application execution unit 210 executes the command described in the instance creation method 1222 acquired from the application information 127 regarding the second analysis application 402, and inputs the second 'analysis application 403 and, to this, the first 1' data mart. To generate the second 2 'data mart 2264 (FIG. 6B) given as

図6A、図6Bは、新規データパス506に配置された第1’データマート2263と第2’データマート2264に保存する内容の一例を示す説明図である。図6Aの第1’データマート2263は、第1データマート2261をメタ情報名「製品種別」の値「A」で絞り込んだデータマートであるため、メタ情報である「製品種別」が「A」のデータのみが格納される。   FIGS. 6A and 6B are explanatory diagrams showing an example of contents stored in the 1 'data mart 2263 and the 2' data mart 2264 disposed in the new data path 506. FIG. The first 1 'data mart 2263 in FIG. 6A is a data mart obtained by narrowing down the first data mart 2261 with the value "A" of the meta information name "product type", so the "product type" as meta information is "A". Only the data of are stored.

また図6Bの第2’データマート2264は、メタ情報である「製品種別」のカラムはないが、この第2’データマート2264を生成する第2’分析アプリケーション403の入力情報が上述の第1’データマート、すなわち、「製品種別」が「A」に関するデータのみであることにより、分析結果である故障率2022の値も、「製品種別」が「A」に関するもののみとなっている。したがって、既存の分析アプリケーションの処理をそのまま利用し、特定のメタ情報の値で絞り込んだ処理結果を得ることができる。   Further, although the 2 'data mart 2264 of FIG. 6B does not have a column of "product type" which is meta information, the input information of the 2' 'analysis application 403 for generating the 2' data mart 2264 is the above-mentioned first Since the 'data mart, ie,' product type 'is only data relating to' A ', the value of failure rate 2022 that is the analysis result is also only for' product type 'as' A'. Therefore, the processing of the existing analysis application can be used as it is, and processing results narrowed down by the value of specific meta information can be obtained.

アプリケーション実行部210は、こうして得た、フィルタ410、第1’データマート2263、第2’分析アプリケーション403、および、第2’データマート2264、を論理的に接続し、新規データパス506とする。なお、アプリケーション実行部210は、上述の新規データパス506に従い、データストア情報125、データストア・アプリケーション接続情報126、および、アプリケーション情報127に、対応する新たなレコードを格納する。   The application execution unit 210 logically connects the filter 410, the first ′ data mart 2263, the second ′ analysis application 403, and the second ′ data mart 2264 thus obtained, and forms a new data path 506. The application execution unit 210 stores corresponding new records in the data store information 125, the data store / application connection information 126, and the application information 127 in accordance with the new data path 506 described above.

図5A〜図5Cに、上述の新規データパス506に関してレコードを追加した場合の、データストア情報125、データストア・アプリケーション接続情報126、および、アプリケーション情報127の構成例を示す。   5A to 5C show configuration examples of the data store information 125, the data store / application connection information 126, and the application information 127 in the case where a record is added with respect to the new data path 506 described above.

図5Aにおけるデータストア情報125の例では、データストア1およびデータストア2をそれぞれ複製元とした、複製先のデータストア1’、データストア2’の各レコードが追加された構成となっている。よって、該当レコードでは、複製先データストアID3
016の値が、それぞれ、“1’”、“2’”となる。なお、これらのレコードには、対応するデータマート、すなわち複製した第1’データマート’および第2’データマートのそれぞれ情報が追加されることとなる。
In the example of the data store information 125 in FIG. 5A, each record of the copy destination data store 1 ′ and the data store 2 ′ with the data store 1 and the data store 2 as copy sources is added. Therefore, in the corresponding record, copy destination data store ID 3
The values of 016 are "1 '" and "2'", respectively. It should be noted that the information of the corresponding data mart, that is, the duplicated 1 'data mart' and 2 'data mart will be added to these records.

第1’データマートおよび第2’データマートは、メタ情報名「製品種別」の値「A」で、それぞれ第1データマートおよび第2データマートを絞り込んでいるものであるため、絞り込み済みメタ情報3016の値が「{メタ情報名:製品種別、メタ情報の値:A}」となる。図5Bでは、図4に記載のように、第1データマート2261から複製し、新規データパスを作成したため、新規に作成されたデータパスを示す下3行が追加される。図5Cでは、第2’アプリケーションを複製し、またフィルタ410を配置したため、新規に作成された第2’アプリケーションとフィルタ410を示す最終行が追加される。   The first data mart and the second 2 'data mart are the meta data name "product type" value "A", which narrows down the first data mart and the second data mart respectively, so the narrowed meta information The value 3016 is “{meta information name: product type, value of meta information: A}”. In FIG. 5B, as described in FIG. 4, since the first data mart 2261 is replicated to create a new data path, the lower three lines indicating the newly created data path are added. In FIG. 5C, since the 2 'application is duplicated and the filter 410 is placed, the final line showing the newly created 2' application and the filter 410 is added.

こうして新規データパス506を得たアプリケーション実行部210は、第1データマート2261に保存されているデータとメタ情報を引数に、フィルタ410を実行することとなる。   The application execution unit 210 that has obtained the new data path 506 in this way executes the filter 410 with the data and meta information stored in the first data mart 2261 as arguments.

上述のフィルタ410は、第1データマート2261から受け取ったデータとメタ情報の値のうち、メタ情報である製品種別1243の値が“A”であるときのデータの値のみに絞り込こんだ上で、第1’データマート2263へ保存するフィルタである。   The filter 410 described above narrows down to only the data values when the value of the product type 1243 which is meta information is “A” among the values of the data and meta information received from the first data mart 2261. Is a filter to be stored in the first 1 'data mart 2263.

また、第2’分析アプリケーション403は、第1’データマート2263から故障判定1264の値を取得し、第2分析アプリケーション402と同様の処理で故障判定1264を集計した故障率1272を第2’データマート2264に保存する。   Further, the second 'analysis application 403 acquires the value of the failure judgment 1264 from the first' data mart 2263, and calculates the failure rate 1272 obtained by totaling the failure judgments 1264 in the same process as the second analysis application 402 as the second 'data. Save to Mart 2264

データストア情報に第2’データマート2264の接続先情報が追加されたら、データカタログサーバ100は、第2’データマート2264の接続先情報を分析アプリケーション開発者・利用者端末001へ送信する。これにより、分析アプリケーションの開発者あるいは利用者は、第2’データマート2264へ接続することで、メタ情報の値で絞り込まれたデータを入手できるようになる。   When the connection destination information of the 2 'data mart 2264 is added to the data store information, the data catalog server 100 transmits the connection destination information of the 2' data mart 2 264 to the analysis application developer / user terminal 001. As a result, the developer or user of the analysis application can obtain data narrowed down by the value of the meta information by connecting to the second 'data mart 2264.

なお、上述のように生成した新規データパス506の具体例を図7に示す。新規データパス506は、ユーザが分析アプリケーション開発者・利用者端末001からデータカタログ管理サーバ100に対し、データマート取得要求を行うたびに、データカタログ管理サーバ100ないしIoT基盤実行サーバ200のメモリ上に生成される。   A specific example of the new data path 506 generated as described above is shown in FIG. The new data path 506 is stored on the memory of the data catalog management server 100 or the IoT-based execution server 200 each time the user makes a data mart acquisition request to the data catalog management server 100 from the analysis application developer / user terminal 001. It is generated.

新規データパス506の要素は、複製元オブジェクトID2033について重複無く生成される。リスト要素番号2031は、データパスの要素を一意に指し示す情報である。また、複製元オブジェクトID2032は、複製元オブジェクトを示すIDである。複製後オブジェクトID2033は、複製後オブジェクトを示すIDである。上流側オブジェクトID2034は、複製後オブジェクトの1つ上流のオブジェクトを示すIDである。下流側オブジェクトID2035は、複製後オブジェクトの1つ下流のオブジェクトを示すIDである。   The elements of the new data path 506 are generated for the copy source object ID 2033 without duplication. The list element number 2031 is information uniquely indicating an element of the data path. The copy source object ID 2032 is an ID indicating a copy source object. The after-duplication object ID 2033 is an ID indicating a after-duplication object. The upstream object ID 2034 is an ID indicating an object one upstream of the copied object. The downstream object ID 2035 is an ID indicating an object one downstream of the copied object.

−−−フロー例−−−
以下、本実施形態におけるデータ管理方法の実際手順について図に基づき説明する。以下で説明するデータ管理方法に対応する各種動作は、データ管理システム10を構成するデータカタログ管理サーバ100やIoT基盤実行サーバ200がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of flow ---
Hereinafter, the actual procedure of the data management method in the present embodiment will be described based on the drawings. Various operations corresponding to the data management method described below are realized by a program that the data catalog management server 100 and the IoT-based execution server 200 that configure the data management system 10 read out to a memory or the like and execute. The program is composed of code for performing various operations described below.

図8は、本実施形態におけるデータ管理方法のフロー例1を示す図であり、具体的には、本実施形態の分析アプリケーション開発者・利用者端末001の動作を示すフローチャートである。   FIG. 8 is a diagram showing a flow example 1 of the data management method in the present embodiment, and more specifically, is a flowchart showing the operation of the analysis application developer / user terminal 001 in the present embodiment.

分析アプリケーションの開発者あるいは利用者が、特定のメタ情報の特定の値で絞り込んだ分析結果を必要とする状況を想定する。この場合、分析アプリケーションの開発者あるいは利用者は、当該分析結果を含むと推定しているデータストア(対象データマート)のID(例:1)と、絞り込みに使用するメタ情報名(例:製品種別)、絞り込むメタ情報の値(例:A)からなる絞り込み要求を分析アプリケーション開発者・利用者端末001に入力する。   Suppose that the developer or user of the analysis application needs analysis results narrowed down to specific values of specific meta information. In this case, the developer or user of the analysis application uses the ID (for example, 1) of the data store (target data mart) assumed to include the analysis result and the meta information name (for example, product) used for narrowing down. A narrowing request consisting of the type) and the value of meta information to be narrowed (example: A) is input to the analysis application developer / user terminal 001.

一方、分析者アプリケーション開発者・利用者端末001は、上述の絞り込み要求を受け付ける(S101)。また、分析アプリケーション開発者・利用者端末001は、S101で受け付けた絞り込み要求を引数に、データカタログ管理サーバ100の情報検索部110を呼び出し(S102)、処理を終了する。   On the other hand, the analyst application developer / user terminal 001 receives the narrowing-down request described above (S101). In addition, the analysis application developer / user terminal 001 calls the information search unit 110 of the data catalog management server 100 with the narrowing-down request accepted in S101 as an argument (S102), and ends the process.

図9A、図9Bは、本実施形態におけるデータ管理方法のフロー例2を示す図であり、具体的には、データカタログ管理サーバ100における情報検索部110の動作を示すフローチャートである。このうち図9Aは、情報検索部110が分析アプリケーション開発者・利用者端末001から絞り込み要求を受信した時に開始される動作を示す。   FIG. 9A and FIG. 9B are diagrams showing a second flow example of the data management method in the present embodiment, and more specifically, a flowchart showing the operation of the information search unit 110 in the data catalog management server 100. Among these, FIG. 9A shows an operation started when the information search unit 110 receives a narrowing request from the analysis application developer / user terminal 001.

この場合、情報検索部110は分析アプリケーション開発者・利用者端末001から絞り込み要求を受けつけ(S201)、データストアのID(例:1)を変数iに代入する(S202)。   In this case, the information search unit 110 receives a narrowing-down request from the analysis application developer / user terminal 001 (S201), and substitutes the ID (example: 1) of the data store into a variable i (S202).

次に、情報検索部110は、データストア情報125にて、S202で得ているデータストアのIDに関連するレコードを特定し、当該レコードそれぞれにおける、メタ情報名3012、絞り込み済みメタ情報3015、および、複製先データストアID3016、の各値を取得し、これをメモリ上に保存する(S203)。   Next, the information search unit 110 specifies a record related to the ID of the data store obtained in S202 in the data store information 125, and the meta information name 3012, the narrowed meta information 3015, and the like in each record. The respective values of the copy destination data store ID 3016 are acquired and stored in the memory (S203).

その後、情報検索部110は、上述の変数iの値を例えば複製後オブジェクトID2033としたレコードを生成し、これを新たな新規データパス506の構成レコードとして追加する(S204)。ここで、新規データパス506(の一部)が生成された。   Thereafter, the information search unit 110 generates a record in which the value of the variable i described above is, for example, the copied object ID 2033, and adds the record as a configuration record of a new new data path 506 (S204). Here, (a part of) a new data path 506 is generated.

また、情報検索部110は、この変数iの値がデータストアIDであるか、データストア情報125にて該当値をデータストアIDとして含むレコードがあるか否かで、チェックする(S205)。   Further, the information search unit 110 checks whether the value of the variable i is a data store ID or whether there is a record including the corresponding value as the data store ID in the data store information 125 (S205).

上述のチェックの結果、変数iの値が、データストアIDでなかった場合(S205:NO)、情報検索部110は、当該変数iの示すオブジェクトIDから1つ上流のオブジェクトIDをデータストア・アプリケーション接続情報から取得し(S209)、このオブジェクトIDを変数iに代入し(S210)、処理をS203に戻す。   If the value of the variable i is not a data store ID as a result of the above check (S205: NO), the information search unit 110 stores an object ID one upstream from the object ID indicated by the variable i in the data store / application The object ID is acquired from the connection information (S209), this object ID is substituted for the variable i (S210), and the process returns to S203.

一方、上述のチェックの結果、変数iの値が、データストアIDであった場合(S205:YES)、情報検索部110は、S203で取得した複製先データストアIDの値が空か判定する(S206)。   On the other hand, when the value of the variable i is the data store ID as a result of the above check (S205: YES), the information search unit 110 determines whether the value of the copy destination data store ID acquired in S203 is empty ( S206).

上述の判定の結果、複製先データストアIDの値が空であった場合(S206:YES)、情報検索部110は、続いて、S203で取得した絞り込み済みメタ情報の値が空か判定する(S207)。   If the value of the copy destination data store ID is empty as a result of the above determination (S206: YES), the information search unit 110 subsequently determines whether the value of the narrowed meta information acquired in S203 is empty (S206). S207).

上述の判定の結果、複製先データストアIDの値が空であった場合(S207:YES)、情報検索部110は、上述の絞り込み要求に含まれるメタ情報名(例:製品種別)が、S203で取得したメタ情報名に含まれるか判定する(S208)。   As a result of the above determination, when the value of the copy destination data store ID is empty (S207: YES), the information search unit 110 determines that the meta information name (e.g., product type) included in the above narrowing request is S203. It is determined whether it is included in the meta information name acquired in step S208.

また、上述の判定の結果、絞り込み要求に含まれるメタ情報名が、S203で取得したメタ情報名に含まれていなかった場合(S208:NO)、情報検索部110は、処理をS209に戻し、当該S209以降の処理を繰り返すこととなる。   Also, as a result of the above determination, if the meta information name included in the narrowing-down request is not included in the meta information name acquired in S203 (S208: NO), the information search unit 110 returns the process to S209. The processes after S209 will be repeated.

他方、上述の判定の結果、絞り込み要求に含まれるメタ情報名が、S203で取得したメタ情報名に含まれていた場合(S208:YES)、情報検索部110は、当該絞り込み要求と、上述のS204で生成した新規データパス506とを引数に、データパス作成部111を呼び出し(S220)、処理を終了する。   On the other hand, as a result of the above determination, when the meta information name included in the narrowing request is included in the meta information name acquired in S203 (S208: YES), the information search unit 110 determines that the narrowing request is The data path creation unit 111 is called with the new data path 506 generated in S204 as an argument (S220), and the process is ended.

なお、上述のS206における判定の結果、複製先データストアIDの値が空ではなかった場合(S206:NO)、情報検索部110は、S203で取得した複製先データストアIDの値を使ってデータストア情報125を検索し、当該データストアIDの値をデータストアID3011として含むレコードから、メタ情報名3012および絞り込み済みメタ情報3015の各値を取得し、メモリ上で上書きする(S211)。   If the value of the copy destination data store ID is not empty as a result of the determination in S206 described above (S206: NO), the information search unit 110 uses the value of the copy destination data store ID acquired in S203 to perform data. The store information 125 is searched, each value of the meta information name 3012 and the narrowed meta information 3015 is acquired from the record including the value of the data store ID as the data store ID 3011, and is overwritten on the memory (S211).

続いて、情報検索部110は、S211で取得した絞り込み済みメタ情報3015の値が空であるか調べ(S212)、空であった場合(S212:YES)、S207のステップに移って処理を継続する。   Subsequently, the information search unit 110 checks whether the value of the narrowed meta information 3015 acquired in S211 is empty (S212). If it is empty (S212: YES), the process proceeds to S207 and the process is continued Do.

他方、S212の結果、絞り込み済みメタ情報3015の値が空でなかった場合(S212:NO)、情報検索部110は、上述の複製先データストアIDの値で、S204にて生成した新規データパス506のレコードにおける対応要素、すなわち複製元オブジェクトID2032の値を置換する(S213)。   On the other hand, as a result of S212, when the value of the narrowed meta information 3015 is not empty (S212: NO), the information search unit 110 uses the value of the above copy destination data store ID to generate the new data path generated in S204. The corresponding element in the record of 506, that is, the value of the copy source object ID 2032 is replaced (S213).

また、情報検索部110は、S211で取得した絞り込み済みメタ情報3015の値が、絞り込み要求に含まれるメタ情報名および当該メタ情報の値に一致するか判定する(S214)。   In addition, the information search unit 110 determines whether the value of the narrowed meta information 3015 acquired in S211 matches the meta information name included in the narrowing request and the value of the meta information (S214).

上述の判定の結果、S211で取得した絞り込み済みメタ情報3015の値が、絞り込み要求に含まれるメタ情報名および当該メタ情報の値に一致しない場合(S214:NO)、情報検索部110は、絞り込み不可エラーを分析アプリケーション開発者・利用者端末001へ応答し(S215)、処理を終了する。   As a result of the above-described determination, when the value of the narrowed meta information 3015 acquired in S211 does not match the meta information name included in the narrowing request and the value of the meta information (S214: NO), the information search unit 110 A notable error is returned to the analysis application developer / user terminal 001 (S215), and the process is ended.

他方、上述の判定の結果、S211で取得した絞り込み済みメタ情報3015の値が、絞り込み要求に含まれるメタ情報名および当該メタ情報の値に一致した場合(S214:YES)、情報検索部110は、現在の新規データパス506の要素数が1か判定する(S216)。   On the other hand, as a result of the above determination, if the value of the narrowed meta information 3015 acquired in S211 matches the meta information name included in the narrowing request and the value of the meta information (S214: YES), the information search unit 110 It is determined whether the number of elements of the current new data path 506 is one (S216).

上述の判定の結果、新規データパス506の要素数が1、すなわちレコードが1つであった場合(S216:YES)、情報検索部110は、新規データパス506の当該レコードにおける複製後オブジェクトID2033が示すデータストアの接続先情報を、データストア情報125にて取得する(S217)。
また、情報検索部110は、上述のS217で取得した接続先情報を、分析アプリケーション開発者・利用者端末へ応答し(S218)、処理を終了する。
As a result of the above determination, if the number of elements of the new data path 506 is 1, that is, there is one record (S216: YES), the information searching unit 110 determines that the after-duplication object ID 2033 in the record of the new data path 506 is The connection destination information of the indicated data store is acquired in the data store information 125 (S217).
In addition, the information search unit 110 responds to the analysis application developer / user terminal with the connection destination information acquired in the above-described S217 (S218), and ends the processing.

一方、上述の判定の結果、新規データパス506の要素数が1ではなかった場合(S216:NO)、情報検索部110は、上述の絞り込み要求に含まれるメタ情報名とメタ情報の値を削除し(S219)、当該絞り込み要求と新規データパス506を引数にデータパス作成部を呼び出して(S220)、処理を終了する。   On the other hand, as a result of the above determination, if the number of elements of the new data path 506 is not 1 (S216: NO), the information search unit 110 deletes the meta information name and meta information value included in the above narrowing request. Then, the data path creation unit is called with the narrowing request and the new data path 506 as arguments (S220), and the process is ended.

図9Bは、上述の情報検索部110が、接続先情報の応答要求を分析アプリケーション開発者・利用者端末001から受信した時に開始される動作を示すフローチャートである。   FIG. 9B is a flowchart showing an operation started when the above-mentioned information search unit 110 receives a response request of connection destination information from the analysis application developer / user terminal 001.

この場合の情報検索部110は、データパス作成部111から、データストアのID、例えば“a´”と共に、接続先情報の応答要求を受け付けて(S301)、データストア情報125から、データストア“a´”の接続先情報を取得する(S302)。   In this case, the information search unit 110 receives a response request for connection destination information from the data path creation unit 111 together with the ID of the data store, for example, "a '" (S301). The connection destination information of a ′ ′ ′ is acquired (S302).

また、情報検索部110は、S302で取得したデータストア“a´”の接続先情報を、分析アプリケーション開発者・利用者端末001へ応答し(S303)、処理を終了する。   Further, the information search unit 110 returns the connection destination information of the data store “a ′” acquired in S302 to the analysis application developer / user terminal 001 (S303), and ends the processing.

また図10は、本実施形態のデータパス作成部111の動作を示すフローチャートである。この場合のデータパス作成部111は、上述の情報検索部110から絞り込み要求と新規データパスを受け付けて(S401)、当該新規データパスおよび絞り込み要求を引数に、データストア情報作成部113を呼び出す(S402)。   FIG. 10 is a flowchart showing the operation of the data path creation unit 111 of this embodiment. In this case, the data path creation unit 111 receives the narrowing request and the new data path from the information search unit 110 described above (S 401), and calls the data store information creation unit 113 with the new data path and the narrowing request as arguments ( S402).

また、データパス作成部111は、上述の絞り込み要求と、新規データパス506の末尾のデータストアIDとを引数に、フィルタ作成部112を呼び出し(S403)、処理を終了する。   In addition, the data path creation unit 111 calls the filter creation unit 112 with the narrowing request described above and the last data store ID of the new data path 506 as arguments (S403), and ends the processing.

一方、フィルタ作成部112は、図11のフローチャートに示す動作を実行する。この場合のフィルタ作成部112は、データパス作成部111から、上述の引数である絞り込み要求およびデータストアIDを受け付け(S501)、当該絞り込み要求のメタ情報名とメタ情報の値は空か調べる(S502)。   On the other hand, the filter creation unit 112 executes the operation shown in the flowchart of FIG. In this case, the filter creation unit 112 receives from the data path creation unit 111 the narrowing request and the data store ID that are the above arguments (S501), and checks whether the meta information name and the meta information of the narrowing request are empty ( S502).

上述のS502において、当該絞り込み要求のメタ情報名とメタ情報の値が空でなかった場合(S502:NO)、フィルタ作成部112は、S501で得たデータストアIDに対応知るデータストアのデータを、上述の絞り込み要求が示すメタ情報名の値(例:“製品種別”)が、当該絞り込み要求が示すメタ情報の値(例:“A”)となるときの値のみに絞り込むフィルタを作成する(S503)。このフィルタの作成は、例えば、IoT基盤実行サーバ200において用意されている、データストアに対するデータ抽出アルゴリズムに対し、上述の絞り込み要求が示すメタ情報名の値(例:“製品種別”)が、当該絞り込み要求が示すメタ情報の値(例:“A”)であるとの抽出条件を設定する、処理などを想定できる(この場合、作成されるフィルタは、抽出条件が設定されたデータ抽出アルゴリズムとなる)。   If the meta information name and the meta information value of the narrowing-down request are not empty in the above-described S502 (S502: NO), the filter creation unit 112 recognizes data of a data store that corresponds to the data store ID obtained in S501. Create a filter that narrows down only to the value when the value of the meta information name indicated by the above narrowing request (example: "product type") becomes the value of the meta information indicated by the narrowing request (example: "A") (S503). For the creation of this filter, for example, with respect to the data extraction algorithm for the data store prepared in the IoT-based execution server 200, the value of the meta information name indicated by the above-mentioned narrowing request (example: "product type") It is possible to set an extraction condition that is a value of meta information (for example, “A”) indicated by the narrowing-down request, a process, etc. (in this case, a filter to be created has a data extraction algorithm with an extraction condition set and Become).

次に、フィルタ作成部112は、S503で作成したフィルタについて、これを一意に示すフィルタIDを所定ルールにて作成し(S504)、当該フィルタIDと上述のフィルタのインスタンス作成方法(例:上述のごとく、データ抽出アルゴリズムに抽出条件を設定する記述)とをアプリケーション情報127に記録する(S505)。   Next, the filter creation unit 112 creates a filter ID uniquely indicating the filter created in S503 according to a predetermined rule (S504), and creates an instance creation method of the filter ID and the above-mentioned filter (example: the above-mentioned) As described above, the description for setting extraction conditions in the data extraction algorithm is recorded in the application information 127 (S505).

最後に、フィルタ作成部112は、上述のフィルタとフィルタIDとを引数に、データパス作成部111を呼び出し(S506)、処理を終了する。なお、上述のS502の結果、絞り込み要求のメタ情報名とメタ情報の値は空であった場合(S502:YES)、
フィルタ作成部112は、データを絞り込まない空のフィルタを作成し(S507)、S504へ移って処理を継続する。
Finally, the filter creation unit 112 calls the data path creation unit 111 with the above-described filter and filter ID as arguments (S506), and ends the process. Note that, as a result of the above-described S502, if the meta information name and the meta information value of the narrowing-down request are empty (S502: YES),
The filter creation unit 112 creates an empty filter that does not narrow down the data (S507), and proceeds to S504 to continue the processing.

他方、上述のフィルタ作成部112により呼び出されたデータパス作成部111は、図12のフローチャートに示す動作を実行する。この場合のデータパス作成部111は、上述のフィルタ作成部112から、フィルタおよびフィルタIDを受け付け(S451)、当該フィルタが空か調べる(S452)。   On the other hand, the data path creation unit 111 called by the above-described filter creation unit 112 executes the operation shown in the flowchart of FIG. The data path creation unit 111 in this case receives the filter and the filter ID from the above-described filter creation unit 112 (S 451), and checks whether the filter is empty (S 452).

上述のS452の結果、フィルタおよびフィルタIDが空でなかった場合(S452:NO)、データパス作成部111は、受け付けたフィルタIDを複製後オブジェクトIDにセットしたレコードを生成し、これを新規データパス506の末尾に追加する(S453)。   As a result of the above-described S452, when the filter and the filter ID are not empty (S452: NO), the data path generation unit 111 generates a record in which the received filter ID is set in the copied object ID, and generates a new data It adds to the end of the path 506 (S 453).

次に、データパス作成部111は、新規データパス506の末尾の要素を引数に、アプリケーション実行部210を呼び出し(S455)、新規データパス506の末尾の要素を新規データパス506から削除する(S455)。   Next, the data path creation unit 111 calls the application execution unit 210 with the last element of the new data path 506 as an argument (S455), and deletes the last element of the new data path 506 from the new data path 506 (S455) ).

上述のS455によって新規データパス506の要素数が1になっていない場合(S456:NO)、データパス作成部111は、処理をS454に戻し、以後のステップを繰り返す(S456)。   If the number of elements of the new data path 506 is not 1 at S455 described above (S456: NO), the data path creation unit 111 returns the process to S454 and repeats the subsequent steps (S456).

一方、上述のS456によって新規データパス506の要素数が1になった場合(S456:YES)、データパス作成部111は、新規データパス506の末尾の要素を引数に、IoT基盤実行サーバ200のアプリケーション実行部210を呼び出す(S457)。
また、データパス作成部111は、当該新規データパス506の先頭要素を引数に、情報検索部110を呼び出し(S458)、処理を終了する。
他方、上述のS452の結果、フィルタが空であった場合(S452:YES)、データパス作成部111は、処理をS455に遷移させて処理を継続する。
他方、上述のS457でデータパス作成部111から呼び出されたアプリケーション実行部210は、図13のフローチャートに示す動作を実行する。
On the other hand, when the number of elements of the new data path 506 becomes 1 by the above-described S456 (S456: YES), the data path creation unit 111 uses the last element of the new data path 506 as an argument. The application execution unit 210 is called (S457).
Further, the data path generation unit 111 calls the information search unit 110 with the top element of the new data path 506 as an argument (S458), and ends the process.
On the other hand, as a result of the above-described S452, when the filter is empty (S452: YES), the data path creation unit 111 shifts the process to S455 and continues the process.
On the other hand, the application execution unit 210 called from the data path creation unit 111 in S457 described above executes the operation shown in the flowchart of FIG.

この場合のアプリケーション実行部210は、上述のデータカタログ管理サーバ100のデータパス作成部111から、新規データパス506の末尾レコードが示す分析アプリケーションのアプリケーションID、例えばアプリケーションkの実行要求を受け付け(S601)、アプリケーション情報127から当該アプリケーションkのインスタンス作成方法を取得する(S602)。
次に、アプリケーション実行部210は、上述のS602で得た、上述のアプリケーションkのインスタンス作成方法を実行し(S603)、処理を終了する。
The application execution unit 210 in this case receives, from the data path creation unit 111 of the data catalog management server 100 described above, the application ID of the analysis application indicated by the end record of the new data path 506, for example, an execution request for application k (S601) The method for creating an instance of the application k is acquired from the application information 127 (S602).
Next, the application execution unit 210 executes the above-described method for creating an instance of the application k obtained in the above-described S602 (S603), and ends the processing.

以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。   As mentioned above, although the best mode etc. for carrying out the present invention were concretely explained, the present invention is not limited to this, and can be variously changed in the range which does not deviate from the gist.

こうした本実施形態によれば、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みを効率的なものとできる。   According to the present embodiment, it is possible to flexibly reuse the data mart in response to the user's request, and to narrow down the analysis result on the data mart efficiently.

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態のデータ管理システムにおいて、前記演算装置は、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択するに際し、前記メタ情報を含むデータマートのうち前記対象データマートから最も近いデータマートを選択す
るものである、としてもよい。
At least the following matters will be made clear by the description of the present specification. That is, in the data management system of the present embodiment, when the arithmetic device selects the data mart including the meta information among the data mart from the target data mart to the data lake, the data mart including the meta information The data mart closest to the target data mart may be selected from the above.

これによれば、新規データパスに含まれて、絞り込み要求に対応した分析結果をえる際に用いる新たなデータマートの生成が無駄なく効率的なものとなる。ひいては、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みをより効率的なものとできる。   According to this, generation of a new data mart included in the new data path and used when obtaining an analysis result corresponding to the narrowing request becomes efficient without waste. As a result, it is possible to flexibly reuse the data mart in response to the user's request, and to narrow down the analysis result on the data mart more efficiently.

また、本実施形態のデータ管理システムにおいて、前記演算装置は、前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートについて、前記絞り込み要求で指定されたメタ情報の所定属性を、絞り込み済みメタ情報として前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と異なるものであれば、前記新たな絞り込み要求に対応する処理を回避するものである、としてもよい。   Further, in the data management system according to the present embodiment, the arithmetic device narrows down the predetermined attribute of the meta information designated by the narrowing request for the new data mart obtained by the application of the filter or the application of the predetermined algorithm. When the new data mart is to be applied with the target data mart or filter or algorithm due to a new narrowing request after the recording, the data is recorded as the finished meta information in the data store information. If the meta information indicated by the narrowing request is different from the narrowed meta information recorded regarding the new data mart, the process corresponding to the new narrowing request may be avoided.

これによれば、例えば、特定の事象に関してフィルタの適用やアルゴリズム(分析アプリケーション)の適用を行って得た新たなデータマート、すなわち絞り込み済みのデータマートは、上述の事象とは異なる事象に関する値は含んでいないことを踏まえ、こうしたデータマートに関する絞り込み要求に応じた処理を回避可能となる。ひいては、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みをより効率的なものとできる。   According to this, for example, a new data mart obtained by applying a filter or applying an algorithm (analysis application) for a specific event, that is, a narrowed data mart, has a value for an event different from the above-mentioned event Based on the fact that it does not include, it becomes possible to avoid processing in response to the narrowing request for such data mart. As a result, it is possible to flexibly reuse the data mart in response to the user's request, and to narrow down the analysis result on the data mart more efficiently.

また、本実施形態のデータ管理システムにおいて、前記演算装置は、前記対象データマートと前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートとを紐付ける情報を、前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と同じものであれば、前記新たな絞り込み要求に対して、前記新たなデータマートを前記対象データマートないしフィルタまたはアルゴリズムの適用対象として再利用するものである、としてもよい。   Further, in the data management system according to the present embodiment, the arithmetic unit associates, with the data store information, information associating the target data mart with a new data mart obtained by applying the filter or applying the predetermined algorithm. When the new data mart becomes an application target of the target data mart or filter or algorithm due to a new narrowing request after recording and recording, meta information indicated by the new narrowing request is Reuse the new data mart as the target of the target data mart or filter or algorithm in response to the new narrowing request if it is identical to the narrowed meta information recorded for the new data mart It may be a thing.

これによれば、例えば、特定の事象に関してフィルタの適用やアルゴリズム(分析アプリケーション)の適用を行って得た新たなデータマート、すなわち絞り込み済みのデータマートは、上述の事象と同じ事象に関する絞り込み要求にそのまま転用できることとなる。ひいては、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みをより効率的なものとできる。   According to this, for example, a new data mart obtained by applying a filter or applying an algorithm (analytical application) for a specific event, that is, a narrowed data mart, generates a request for narrowing the same event as the above-mentioned event. It can be diverted as it is. As a result, it is possible to flexibly reuse the data mart in response to the user's request, and to narrow down the analysis result on the data mart more efficiently.

また、本実施形態のデータ管理システムにおいて、前記演算装置は、所定装置に備わる前記データレイクおよび前記データマートから、前記データストア情報の各項目に対応する値を収集し、前記データレイクおよび前記データマートのそれぞれに対応したレコードを生成して前記データストア情報に格納する処理と、前記データレイクまたは前記データマートに対する前記アルゴリズムの適用イベントを監視して、前記データストア・アプリケーション接続情報の各項目に対応する値を収集し、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに適用するアルゴリズム、の一連の関係に対応したレコードを生成して前記データストア・アプリケーション接続情報に格納する処理と、を更に実行するものである、としてもよい。   Further, in the data management system of the present embodiment, the arithmetic device collects values corresponding to respective items of the data store information from the data lake and the data mart provided in a predetermined device, and the data lake and the data A process of generating a record corresponding to each of the mart and storing the record in the data store information, and an application event of the algorithm to the data lake or the data mart by monitoring each item of the data store / application connection information Collect corresponding values, generate records corresponding to a series of relationships of the data lake, the data mart, and an algorithm applied to the data lake or the data mart, and store the records in the data store / application connection information Further processing In it, it may be used as the.

これによれば、本実施形態のデータ管理方法を実行するごとに、データストア情報およびデータストア・アプリケーション接続情報を蓄積し、以後のデータ管理に利用可能とな
る。ひいては、ユーザの要求に対応してデータマートを柔軟に再利用し、当該データマートに関する分析結果の絞り込みをより効率的なものとできる。
According to this, each time the data management method of this embodiment is executed, the data store information and the data store / application connection information are stored, and can be used for data management thereafter. As a result, it is possible to flexibly reuse the data mart in response to the user's request, and to narrow down the analysis result on the data mart more efficiently.

また、本実施形態のデータ管理方法において、前記情報処理システムが、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択するに際し、前記メタ情報を含むデータマートのうち前記対象データマートから最も近いデータマートを選択する、としてもよい。   Further, in the data management method of the present embodiment, when the information processing system selects the data mart including the meta information among the data mart from the target data mart to the data lake, the data including the meta information The data mart closest to the target data mart may be selected from the mart.

また、本実施形態のデータ管理方法において、前記情報処理システムが、前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートについて、前記絞り込み要求で指定されたメタ情報の所定属性を、絞り込み済みメタ情報として前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と異なるものであれば、前記新たな絞り込み要求に対応する処理を回避する、としてもよい。   Further, in the data management method of the present embodiment, for the new data mart obtained by the application of the filter or the application of the predetermined algorithm, the information processing system performs a predetermined attribute of meta information designated by the narrowing request. When the new data mart is subject to application of the target data mart or filter or algorithm due to a new narrowing request after recording in the data store information as narrowed meta information If the meta information indicated by the new narrowing request is different from the narrowed meta information recorded regarding the new data mart, the process corresponding to the new narrowing request may be avoided.

また、本実施形態のデータ管理方法において、前記情報処理システムが、前記対象データマートと前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートとを紐付ける情報を、前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と同じものであれば、前記新たな絞り込み要求に対して、前記新たなデータマートを前記対象データマートないしフィルタまたはアルゴリズムの適用対象として再利用する、としてもよい。   Further, in the data management method according to the present embodiment, the information processing system associates the data store information with the target data mart and a new data mart obtained by applying the filter or applying the predetermined algorithm. If the new data mart is subject to application of the target data mart or filter or algorithm due to a new narrowing request after the recording, the meta information indicated by the new narrowing request is , Reuse the new data mart as an application target of the target data mart or filter or algorithm in response to the new narrowing request if it is the same as the narrowed meta information recorded regarding the new data mart. You may do it.

また、本実施形態のデータ管理方法において、前記情報処理システムが、所定装置に備わる前記データレイクおよび前記データマートから、前記データストア情報の各項目に対応する値を収集し、前記データレイクおよび前記データマートのそれぞれに対応したレコードを生成して前記データストア情報に格納する処理と、前記データレイクまたは前記データマートに対する前記アルゴリズムの適用イベントを監視して、前記データストア・アプリケーション接続情報の各項目に対応する値を収集し、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに適用するアルゴリズム、の一連の関係に対応したレコードを生成して前記データストア・アプリケーション接続情報に格納する処理と、を更に実行する、としてもよい。   Further, in the data management method according to the present embodiment, the information processing system collects values corresponding to respective items of the data store information from the data lake and the data mart provided in a predetermined device, and A process of generating a record corresponding to each of the data mart and storing it in the data store information, and monitoring an application event of the algorithm to the data lake or the data mart, and each item of the data store / application connection information Collecting values corresponding to the data store, generating a record corresponding to a series of relationships of the data lake, the data mart, and an algorithm applied to the data lake or the data mart to the data store / application connection information Execute further processing to store That may be.

001 分析アプリケーション開発者・利用者端末
002 工場設備
003 ネットワーク
10 データ管理システム
100 データカタログ管理サーバ
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 通信装置
110 情報検索部
111 データパス作成部
112 フィルタ作成部
113 データストア情報作成部
114 データストア・アプリケーション接続情報作成部
125 データストア情報
126 データストア・アプリケーション接続情報
127 アプリケーション情報
200 IoT基盤実行サーバ
210 アプリケーション実行部
211 データ記録部
212 データ収集部
225 データレイク
226 データマート
2261 第1データマート
2262 第2データマート
2263 第1’データマート
2264 第2’データマート
001 Analysis Application Developer / User Terminal 002 Factory Equipment 003 Network 10 Data Management System 100 Data Catalog Management Server 101 Storage Device 102 Program 103 Memory 104 Arithmetic Unit 105 Communication Device 110 Information Retrieval Unit 111 Data Path Creation Unit 112 Filter Creation Unit 113 Data store information creation unit 114 Data store / application connection information creation unit 125 Data store information 126 Data store / application connection information 127 application information 200 IoT infrastructure execution server 210 application execution unit 211 data recording unit 212 data collection unit 225 data lake 226 data Mart 2261 1st data mart 2262 2nd data mart 2263 1st data mart 2264 2nd data mer

Claims (10)

所定データを格納するデータレイクおよび前記所定データに対する所定の分析結果を格納するデータマートのそれぞれに関する情報を格納したデータストア情報と、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに対する分析処理を担うアルゴリズム、の一連の関係を示すデータパスの情報を格納したデータストア・アプリケーション接続情報と、を保持する記憶装置と、
所定端末から受信した分析結果の絞り込み要求と前記データストア情報とに基づき、前記絞り込み要求の示す対象データマートに所定のメタ情報が含まれるか判定し、当該メタ情報が含まれていない場合、前記データストア情報および前記データストア・アプリケーション接続情報に基づき、前記対象データマートを含むデータパスにおいて、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択し、当該データマートに対して適用する前記アルゴリズムの一種たる前記メタ情報に関するフィルタ、当該フィルタの適用で得た新たなデータマート、および、当該新たなデータマートに適用する所定アルゴリズム、を含む新規データパスを所定ルールで生成し、当該新規データパスに従って前記選択したデータマートへの前記フィルタの適用および前記新たなデータマートへの所定アルゴリズムの適用を実行することで、前記絞り込み要求に対応した所定の分析結果を生成する演算装置と、
を備えることを特徴とするデータ管理システム。
Data store information storing information on each of a data lake storing predetermined data and a data mart storing a predetermined analysis result on the predetermined data, the data lake, the data mart, and the data lake or the data mart A storage / application connection information storing data path information indicating a series of relationships of an algorithm responsible for analysis processing for the
Based on the narrowing request of the analysis result received from the predetermined terminal and the data store information, it is determined whether the target data mart indicated by the narrowing request includes predetermined meta information, and when the meta information is not included, the above In the data path including the target data mart based on the data store information and the data store / application connection information, the data mart from the target data mart to the data lake including the meta information is selected in the data path including the target data mart, A new data path including a filter related to the meta information, which is a type of the algorithm applied to the data mart, a new data mart obtained by applying the filter, and a predetermined algorithm applied to the new data mart Generate according to a predetermined rule and follow the new data path By executing the application of said predetermined algorithm to application and the new data mart filter to the selected data marts, an arithmetic unit for generating a predetermined analysis result corresponding to the narrowing request,
A data management system comprising:
前記演算装置は、
前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択するに際し、前記メタ情報を含むデータマートのうち前記対象データマートから最も近いデータマートを選択するものである、
ことを特徴とする請求項1に記載のデータ管理システム。
The arithmetic device is
In the data mart from the target data mart to the data lake, when selecting the data mart including the meta information, the data mart closest to the target data mart is selected from the data mart including the meta information. is there,
The data management system according to claim 1, characterized in that:
前記演算装置は、
前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートについて、前記絞り込み要求で指定されたメタ情報の所定属性を、絞り込み済みメタ情報として前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と異なるものであれば、前記新たな絞り込み要求に対応する処理を回避するものである、
ことを特徴とする請求項1に記載のデータ管理システム。
The arithmetic device is
For a new data mart obtained by the application of the filter or the application of the predetermined algorithm, the predetermined attribute of the meta information designated by the narrowing request is recorded as the narrowed meta information in the data store information, and When the new data mart is subject to application of the target data mart or filter or algorithm due to a new narrowing request, the meta information indicated by the new narrowing request is recorded for the new data mart. If it is different from the narrowed down meta information, the process corresponding to the new narrowing request is avoided.
The data management system according to claim 1, characterized in that:
前記演算装置は、
前記対象データマートと前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートとを紐付ける情報を、前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と同じものであれば、前記新たな絞り込み要求に対して、前記新たなデータマートを前記対象データマートないしフィルタまたはアルゴリズムの適用対象として再利用するものである、
ことを特徴とする請求項3に記載のデータ管理システム。
The arithmetic device is
Information linking the target data mart and a new data mart obtained by application of the filter or application of the predetermined algorithm is recorded in the data store information, and after the recording, due to a new narrowing request If the new data mart is to be applied to the target data mart or filter or algorithm, the meta information indicated by the new narrowing request is the same as the narrowed meta information recorded for the new data mart Then, in response to the new narrowing request, the new data mart is reused as an application target of the target data mart or filter or algorithm.
The data management system according to claim 3, characterized in that:
前記演算装置は、
所定装置に備わる前記データレイクおよび前記データマートから、前記データストア情報の各項目に対応する値を収集し、前記データレイクおよび前記データマートのそれぞれに対応したレコードを生成して前記データストア情報に格納する処理と、前記データレイ
クまたは前記データマートに対する前記アルゴリズムの適用イベントを監視して、前記データストア・アプリケーション接続情報の各項目に対応する値を収集し、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに適用するアルゴリズム、の一連の関係に対応したレコードを生成して前記データストア・アプリケーション接続情報に格納する処理と、を更に実行するものである、
ことを特徴とする請求項1に記載のデータ管理システム。
The arithmetic device is
Values corresponding to the respective items of the data store information are collected from the data lake and the data mart provided in a predetermined device, records corresponding to the data lake and the data mart are respectively generated, and the data store information is generated. Monitoring the process of storing and application of the algorithm to the data lake or the data mart to collect values corresponding to respective items of the data store / application connection information; and the data lake, the data mart, and Generating a record corresponding to a series of relationships of the algorithm applied to the data lake or the data mart, and storing the record in the data store / application connection information.
The data management system according to claim 1, characterized in that:
所定データを格納するデータレイクおよび前記所定データに対する所定の分析結果を格納するデータマートのそれぞれに関する情報を格納したデータストア情報と、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに対する分析処理を担うアルゴリズム、の一連の関係を示すデータパスの情報を格納したデータストア・アプリケーション接続情報と、を保持する記憶装置を備えた情報処理システムが、
所定端末から受信した分析結果の絞り込み要求と前記データストア情報とに基づき、前記絞り込み要求の示す対象データマートに所定のメタ情報が含まれるか判定し、当該メタ情報が含まれていない場合、前記データストア情報および前記データストア・アプリケーション接続情報に基づき、前記対象データマートを含むデータパスにおいて、前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択し、当該データマートに対して適用する前記アルゴリズムの一種たる前記メタ情報に関するフィルタ、当該フィルタの適用で得た新たなデータマート、および、当該新たなデータマートに適用する所定アルゴリズム、を含む新規データパスを所定ルールで生成し、当該新規データパスに従って前記選択したデータマートへの前記フィルタの適用および前記新たなデータマートへの所定アルゴリズムの適用を実行することで、前記絞り込み要求に対応した所定の分析結果を生成する、
ことを特徴とするデータ管理方法。
Data store information storing information on each of a data lake storing predetermined data and a data mart storing a predetermined analysis result on the predetermined data, the data lake, the data mart, and the data lake or the data mart An information processing system comprising: a storage device holding data store application connection information storing information of a data path indicating a series of relationships of an algorithm responsible for analysis processing for
Based on the narrowing request of the analysis result received from the predetermined terminal and the data store information, it is determined whether the target data mart indicated by the narrowing request includes predetermined meta information, and when the meta information is not included, the above In the data path including the target data mart based on the data store information and the data store / application connection information, the data mart from the target data mart to the data lake including the meta information is selected in the data path including the target data mart, A new data path including a filter related to the meta information, which is a type of the algorithm applied to the data mart, a new data mart obtained by applying the filter, and a predetermined algorithm applied to the new data mart Generate according to a predetermined rule and follow the new data path By executing the application of predetermined algorithms of application and the to a new data mart of the filter to the selected data mart, generates a predetermined analysis result corresponding to the narrowing request,
Data management method characterized by
前記情報処理システムが、
前記対象データマートからデータレイクに至る間のデータマートのうち、前記メタ情報を含むものを選択するに際し、前記メタ情報を含むデータマートのうち前記対象データマートから最も近いデータマートを選択する、
ことを特徴とする請求項6に記載のデータ管理方法。
The information processing system
When selecting data mart including the meta information among the data mart from the target data mart to the data lake, select the data mart closest to the target data mart from the data mart including the meta information.
7. The data management method according to claim 6, wherein:
前記情報処理システムが、
前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートについて、前記絞り込み要求で指定されたメタ情報の所定属性を、絞り込み済みメタ情報として前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と異なるものであれば、前記新たな絞り込み要求に対応する処理を回避する、
ことを特徴とする請求項6に記載のデータ管理方法。
The information processing system
For a new data mart obtained by the application of the filter or the application of the predetermined algorithm, the predetermined attribute of the meta information designated by the narrowing request is recorded as the narrowed meta information in the data store information, and When the new data mart is subject to application of the target data mart or filter or algorithm due to a new narrowing request, the meta information indicated by the new narrowing request is recorded for the new data mart. If it is different from the filtered down meta information, the process corresponding to the new narrowing request is avoided.
7. The data management method according to claim 6, wherein:
前記情報処理システムが、
前記対象データマートと前記フィルタの適用または前記所定アルゴリズムの適用で得た新たなデータマートとを紐付ける情報を、前記データストア情報に記録し、当該記録の後、新たな絞り込み要求に起因して、前記新たなデータマートが前記対象データマートないしフィルタまたはアルゴリズムの適用対象となった場合、当該新たな絞り込み要求が示すメタ情報が、前記新たなデータマートに関して記録された絞り込み済みメタ情報と同じものであれば、前記新たな絞り込み要求に対して、前記新たなデータマートを前記対象データマートないしフィルタまたはアルゴリズムの適用対象として再利用する、
ことを特徴とする請求項8に記載のデータ管理方法。
The information processing system
Information linking the target data mart and a new data mart obtained by application of the filter or application of the predetermined algorithm is recorded in the data store information, and after the recording, due to a new narrowing request If the new data mart is to be applied to the target data mart or filter or algorithm, the meta information indicated by the new narrowing request is the same as the narrowed meta information recorded for the new data mart Then, in response to the new narrowing request, the new data mart is reused as an application target of the target data mart or filter or algorithm.
The data management method according to claim 8, characterized in that:
前記情報処理システムが、
所定装置に備わる前記データレイクおよび前記データマートから、前記データストア情報の各項目に対応する値を収集し、前記データレイクおよび前記データマートのそれぞれに対応したレコードを生成して前記データストア情報に格納する処理と、前記データレイクまたは前記データマートに対する前記アルゴリズムの適用イベントを監視して、前記データストア・アプリケーション接続情報の各項目に対応する値を収集し、前記データレイク、前記データマート、および、前記データレイクまたは前記データマートに適用するアルゴリズム、の一連の関係に対応したレコードを生成して前記データストア・アプリケーション接続情報に格納する処理と、を更に実行する、
ことを特徴とする請求項6に記載のデータ管理方法。
The information processing system
Values corresponding to the respective items of the data store information are collected from the data lake and the data mart provided in a predetermined device, records corresponding to the data lake and the data mart are respectively generated, and the data store information is generated. Monitoring the process of storing and application of the algorithm to the data lake or the data mart to collect values corresponding to respective items of the data store / application connection information; and the data lake, the data mart, and Generating a record corresponding to a series of relationships of the algorithm applied to the data lake or the data mart, and storing the record in the data store / application connection information.
7. The data management method according to claim 6, wherein:
JP2018000586A 2018-01-05 2018-01-05 Data management system and data management method Active JP6824915B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018000586A JP6824915B2 (en) 2018-01-05 2018-01-05 Data management system and data management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018000586A JP6824915B2 (en) 2018-01-05 2018-01-05 Data management system and data management method

Publications (2)

Publication Number Publication Date
JP2019121181A true JP2019121181A (en) 2019-07-22
JP6824915B2 JP6824915B2 (en) 2021-02-03

Family

ID=67306381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018000586A Active JP6824915B2 (en) 2018-01-05 2018-01-05 Data management system and data management method

Country Status (1)

Country Link
JP (1) JP6824915B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366401A (en) * 2001-06-06 2002-12-20 Nippon Yunishisu Kk Integral data mart structure, and operation supporting system
US20120005151A1 (en) * 2010-07-01 2012-01-05 Vineetha Vasudevan Methods and systems of content development for a data warehouse
JP2012160013A (en) * 2011-01-31 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> Data analysis and machine learning processing unit, method, and program
US20150347542A1 (en) * 2010-07-09 2015-12-03 State Street Corporation Systems and Methods for Data Warehousing in Private Cloud Environment
JP2017010376A (en) * 2015-06-24 2017-01-12 株式会社日立製作所 Mart-less verification support system and mart-less verification support method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366401A (en) * 2001-06-06 2002-12-20 Nippon Yunishisu Kk Integral data mart structure, and operation supporting system
US20120005151A1 (en) * 2010-07-01 2012-01-05 Vineetha Vasudevan Methods and systems of content development for a data warehouse
US20150347542A1 (en) * 2010-07-09 2015-12-03 State Street Corporation Systems and Methods for Data Warehousing in Private Cloud Environment
JP2012160013A (en) * 2011-01-31 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> Data analysis and machine learning processing unit, method, and program
JP2017010376A (en) * 2015-06-24 2017-01-12 株式会社日立製作所 Mart-less verification support system and mart-less verification support method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
山中遼太: "システム間データ連携におけるセマンティック層の活用", 一般社団法人人工知能学会 研究会SWO:セマンティックウェブとオントロジー研究会[ONLINE], JPN6020050111, 4 September 2017 (2017-09-04), pages 03 - 1, ISSN: 0004416713 *
有澤達也,遠山元道: "SuperSQL処理系における中間データキャッシュの実装と効率化", DEWS2006論文集[ONLINE], JPN6020050113, 30 June 2006 (2006-06-30), ISSN: 0004416714 *

Also Published As

Publication number Publication date
JP6824915B2 (en) 2021-02-03

Similar Documents

Publication Publication Date Title
US8024305B2 (en) Updating a data warehouse schema based on changes in an observation model
CN107958057B (en) Code generation method and device for data migration in heterogeneous database
JP2624753B2 (en) How to create higher-level specifications
CN110532019B (en) Method for tracing history of software code segment
US20070022023A1 (en) Method and apparatus for populating a software catalogue with software knowledge gathering
CN108829505A (en) A kind of distributed scheduling system and method
JP2019169044A (en) Software robot definition information generation system, software robot definition information generation method, and program
US20100077382A1 (en) Computer-readable recording medium string a bug detection support program, similar structure identification information list output program, bug detection support apparatus, and bug detection support method
CN111489135A (en) System and method for analyzing and managing audit data
CN108073582A (en) A kind of Computational frame selection method and device
JPH09212353A (en) Method and device for supporting reused design
JP2009129067A (en) File retrieval method, file retrieval device, retrieval system, and file retrieval program
JP2011039884A (en) System and program for collecting document
JP6824915B2 (en) Data management system and data management method
JP7381290B2 (en) Computer system and data management method
JP4846736B2 (en) Parallel processing support device
JP3886872B2 (en) Access log information multidimensional analysis system and multidimensional analysis environment construction method
JP2020038527A (en) Information processing device, analysis model managing method and analysis model managing program
JP5514682B2 (en) Batch processing program analysis method and apparatus
JPS6284337A (en) Specification information analyzing system
WO2023063172A1 (en) Work information management system and data search method
US11681721B2 (en) Systems and methods for spark lineage data capture
JP4905989B2 (en) Metadata search device
JP3689596B2 (en) Product development process management system
US20230035836A1 (en) Data analysis device and model management method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210113

R150 Certificate of patent or registration of utility model

Ref document number: 6824915

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150