JP6668513B2 - Data management method and computer - Google Patents

Data management method and computer Download PDF

Info

Publication number
JP6668513B2
JP6668513B2 JP2018566664A JP2018566664A JP6668513B2 JP 6668513 B2 JP6668513 B2 JP 6668513B2 JP 2018566664 A JP2018566664 A JP 2018566664A JP 2018566664 A JP2018566664 A JP 2018566664A JP 6668513 B2 JP6668513 B2 JP 6668513B2
Authority
JP
Japan
Prior art keywords
system information
information
attribute
data
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018566664A
Other languages
Japanese (ja)
Other versions
JPWO2018146716A1 (en
Inventor
和秀 愛甲
和秀 愛甲
アリフ ヘルセティヨ ウィチャックソノ
アリフ ヘルセティヨ ウィチャックソノ
敬太郎 上原
敬太郎 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2018146716A1 publication Critical patent/JPWO2018146716A1/en
Application granted granted Critical
Publication of JP6668513B2 publication Critical patent/JP6668513B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Description

本発明は、Data Lakeシステムにおけるデータ処理に関する。   The present invention relates to data processing in a Data Lake system.

ビックデータ分野では、RDB形式のデータ、Json形式のデータ、及び表形式のデータ等の様々なデータ構造のデータを統合管理するData Lake方式が知られている(例えば、特許文献1参照)。ここで、Data Lakeは、データの種別及びデータの大きさ等に依存することなく、多種多様なデータを格納するリポジトリを示す。   2. Description of the Related Art In the field of big data, a Data Lake method for integrally managing data of various data structures such as RDB data, JSON data, and tabular data is known (for example, see Patent Document 1). Here, Data Lake indicates a repository that stores a wide variety of data without depending on the type of data, the size of data, and the like.

米国特許出願公開第2014/0280333号明細書US Patent Application Publication No. 2014/0280333 米国特許出願公開第2014/0108467号明細書US Patent Application Publication No. 2014/0108467 特開2016−14944号公報JP 2016-14944 A

Data Lake方式のシステムを用いることによってデータの管理は容易になる。しかし、データの検索処理等を行う場合、データ間の関連性が定義されたクエリを用いる必要がある。そのため、データの検索処理が複雑であるという問題がある。   The use of the Data Lake system facilitates data management. However, when performing data search processing or the like, it is necessary to use a query in which relevance between data is defined. Therefore, there is a problem that the data search process is complicated.

データの検索処理を効率化する手法として、簡易な操作によって分析が可能なData Discoveryツールが注目されている(例えば、特許文献2及び特許文献3参照)。特許文献2には、異なるデータテーブル間の関連性を抽出することによって、簡単なクエリでデータ検索することができることが記載されている。また、特許文献3には、「データベースに格納されたデータから、当該データベースのDBカラムのデータ依存関係や制約条件等を抽出する相関ルール分析装置であって、入力されたDBテーブルデータから、複数カラム間のデータの同時出現関係の情報を相関ルールとして抽出する手段と、抽出した相関ルールを特定の共通性に基づいて集約する手段と、集約された各相関ルールの出現頻度および組み合わせから、データ依存関係や制約条件としての有用性指標を算出する手段を有する。」ことが記載されている。   As a technique for improving the efficiency of data search processing, a Data Discovery tool that can be analyzed by a simple operation has been attracting attention (for example, see Patent Documents 2 and 3). Patent Literature 2 describes that data can be retrieved with a simple query by extracting the relevance between different data tables. Patent Document 3 discloses a correlation rule analyzer that extracts data dependencies, constraints, and the like of DB columns of a database from data stored in the database. A means for extracting information on the simultaneous occurrence relationship of data between columns as an association rule, a means for aggregating the extracted association rules based on a specific commonality, and a method for extracting data from the appearance frequency and combination of each aggregated association rule It has means for calculating a usefulness index as a dependency or a constraint. "

データ管理及び検索処理の簡略化を両立するために、特許文献1と、特許文献2又は特許文献3とを組み合わせることが考えられる。しかし、特許文献2に記載の技術では、語彙の共通性に基づいてデータ間の関連性が抽出されているため、共通性のある語彙以外の関連性を特定するためにはデータ統合時に複雑なETL(Extract Transform Load)ロジックの入力が必要となる。特許文献3に記載の技術は、データベースがRDB(Relational Database)であることが前提である。また、前述した組合せによって実現される発明では、相関ルール等の情報をクエリに使用することが記載されていない。   In order to achieve both data management and simplification of search processing, it is conceivable to combine Patent Document 1 with Patent Document 2 or Patent Document 3. However, in the technology described in Patent Literature 2, the relevance between data is extracted based on the commonality of vocabulary. Input of ETL (Extract Transform Load) logic is required. The technique described in Patent Document 3 is based on the premise that the database is an RDB (Relational Database). Further, the invention realized by the above-described combination does not describe using information such as an association rule for a query.

本発明は、データ間の関連性が定義されていないデータの統合管理及びデータの検索処理を容易にすることを目的とする。   SUMMARY OF THE INVENTION It is an object of the present invention to facilitate integrated management and search processing of data in which the relationship between data is not defined.

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、データストアを構成する少なくとも一つの計算機のデータ管理方法であって、前記少なくとも一つの計算機は、プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを有し、前記データストアには、少なくとも一つの属性から構成されるデータブロックを複数含むシステム情報が、前記システム情報のデータ構造に依存しない形式で格納され、前記メモリは、関連性を有する二つのシステム情報の識別情報、及び前記二つのシステム情報の関連付ける属性の対応関係によって定義されるアクセスパスを管理するレコードを含む関連性管理情報を格納し、前記データ管理方法は、前記プロセッサが、新規システム情報の登録要求を受け付ける第1のステップと、前記プロセッサが、前記新規システム情報を前記データストアに格納する第2のステップと、前記プロセッサが、前記データストアに格納されるシステム情報の中から、前記新規システム情報と関連性を有する第1のシステム情報を特定する第3のステップと、前記プロセッサが、前記新規システム情報及び前記第1のシステム情報の識別情報と、前記新規システム情報及び前記第1のシステム情報を関連付ける属性の対応関係によって定義される第1のアクセスパスとを含むレコードを前記関連性管理情報に登録する第4のステップと、前記プロセッサが、前記データストアに対するクエリを受け付けた場合、前記関連性管理情報に基づいて、前記クエリを、前記システム情報間の参照を行うための情報が付加されたクエリに変換する第5のステップと、前記プロセッサが、前記変換されたクエリを実行する第6のステップと、を含むことを特徴とする。   A typical example of the invention disclosed in the present application is as follows. That is, a data management method of at least one computer configuring a data store, wherein the at least one computer has a processor, a memory connected to the processor, and a network interface connected to the processor, In the data store, system information including a plurality of data blocks each including at least one attribute is stored in a format independent of a data structure of the system information. The memory stores identification information of two related system information. Information and a relationship management information including a record for managing an access path defined by a correspondence relationship between attributes associated with the two pieces of system information, wherein the data management method comprises the steps of: A first step of receiving A second system in which the processor stores the new system information in the data store; and a first system in which the processor has a relationship with the new system information from among the system information stored in the data store. A third step of specifying information, wherein the processor is defined by a correspondence relationship between identification information of the new system information and the first system information and an attribute for associating the new system information and the first system information. A fourth step of registering a record including the first access path in the relevance management information, and when the processor receives a query for the data store, based on the relevance management information, To a query to which information for making a reference between the system information is added , Wherein said processor comprises a the steps of the sixth to execute the converted query.

本発明によれば、計算機は、Data Lake方式のシステムにおいて、システム情報の登録時にシステム情報間の関連性を特定し、クエリ実行時にシステム情報間の関連性に基づいてクエリを変換する。これによって、データの統合管理が容易となり、また、データの検索処理も容易となる。上記以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。   According to the present invention, in a Data Lake system, a computer specifies a relationship between system information at the time of registration of system information, and converts a query based on the relationship between system information at the time of executing a query. This facilitates integrated management of data and facilitates data search processing. Problems, configurations, and effects other than those described above will be clarified by the following description of the embodiments.

実施例1の計算機システムの構成例である。2 is a configuration example of a computer system according to the first embodiment. 実施例1のデータ管理ノードのハードウェア構成及びソフトウェア構成を説明するブロック図である。FIG. 3 is a block diagram illustrating a hardware configuration and a software configuration of the data management node according to the first embodiment. 実施例1の現場データの一例を示す図である。FIG. 4 is a diagram illustrating an example of site data according to the first embodiment. 実施例1の現場データの一例を示す図である。FIG. 4 is a diagram illustrating an example of site data according to the first embodiment. 実施例1の現場データの一例を示す図である。FIG. 4 is a diagram illustrating an example of site data according to the first embodiment. 実施例1の業務データの一例を示す図である。FIG. 4 is a diagram illustrating an example of business data according to the first embodiment. 実施例1の属性管理情報の一例を示す図である。FIG. 7 is a diagram illustrating an example of attribute management information according to the first embodiment. 実施例1の属性グループ管理情報の一例を示す図である。FIG. 6 is a diagram illustrating an example of attribute group management information according to the first embodiment. 実施例1の関連性管理情報の一例を示す図である。FIG. 6 is a diagram illustrating an example of relevance management information according to the first embodiment. 実施例1のデータ管理モジュールがシステム情報の登録要求を受け付けた場合に実行する処理の一例を説明するフローチャートである。9 is a flowchart illustrating an example of a process performed when the data management module according to the first embodiment receives a registration request for system information. 実施例1の関連性解析モジュールが実行する属性管理情報の更新処理の一例を説明するフローチャートである。9 is a flowchart illustrating an example of an attribute management information update process performed by a relevance analysis module according to the first embodiment. 実施例1の関連性解析モジュールが実行する属性グループ管理情報の更新処理の一例を説明するフローチャートである。9 is a flowchart illustrating an example of an attribute group management information update process executed by a relevance analysis module according to the first embodiment. 実施例1の関連性解析モジュールが実行する関連性管理情報の更新処理の一例を説明するフローチャートである。6 is a flowchart illustrating an example of a process of updating the relevance management information executed by the relevance analysis module according to the first embodiment. 実施例1のデータ管理モジュールがクエリを受け付けた場合に実行する処理の一例を説明するフローチャートである。9 is a flowchart illustrating an example of a process performed when the data management module according to the first embodiment receives a query. 実施例1の変換モジュールが実行するクエリ展開処理の一例を説明するフローチャートである。9 is a flowchart illustrating an example of a query expansion process executed by the conversion module according to the first embodiment. 実施例1のデータ管理モジュールがクエリを実行することによって出力される出力データの一例を示す図である。FIG. 7 is a diagram illustrating an example of output data output by executing a query by the data management module according to the first embodiment.

以下、図面を参照しながら、実施形態を説明する。なお、以後の説明では、「AAAテーブル」等の表現にて情報を説明することがあるが、これら情報はテーブル等のデータ構造以外で表現されていてもよい。そのため、データ構造に依存しないことを示すために「AAAテーブル」等について「AAA情報」と呼ぶことがある。各情報の内容を説明する際に、「番号」、「名称」という表現の識別情報が採用されるが、他種の識別情報が使用されて良い。以後の説明における「AAA処理」は、「AAAプログラム」であってもよい。以後の説明における「処理」を主語とした説明は、プロセッサを主語とした説明としてもよい。処理の一部又は全ては、専用ハードウェアによって実現されてもよい。各種プログラムは、プログラム配布サーバや、計算機が読み取り可能な記憶媒体によって各計算機にインストールされてもよい。   Hereinafter, embodiments will be described with reference to the drawings. In the following description, information may be described in terms of “AAA table” or the like, but such information may be represented in a data structure other than a table or the like. Therefore, the "AAA table" or the like may be referred to as "AAA information" in order to show that it does not depend on the data structure. In describing the contents of each information, identification information expressed as “number” and “name” is adopted, but other types of identification information may be used. The “AAA processing” in the following description may be an “AAA program”. In the following description, the description with "processing" as the subject may be a description with the processor as the subject. Part or all of the processing may be realized by dedicated hardware. Various programs may be installed in each computer by a program distribution server or a computer-readable storage medium.

図1は、実施例1の計算機システム10の構成例である。   FIG. 1 is a configuration example of a computer system 10 according to the first embodiment.

計算機システム10は、現場システム110、業務システム120、分析システム130、及びデータ管理ノード100から構成される。現場システム110、業務システム120、分析システム130、及びデータ管理ノード100は、ネットワークスイッチ140を介して互いに接続される。   The computer system 10 includes a site system 110, a business system 120, an analysis system 130, and a data management node 100. The site system 110, the business system 120, the analysis system 130, and the data management node 100 are connected to each other via a network switch 140.

なお、本発明は、装置間を接続するネットワークの種別に限定されず、また、装置間の接続形式に限定されない。また、現場システム110、業務システム120、分析システム130、及びデータ管理ノード100は、二つ以上存在してもよい。   Note that the present invention is not limited to the type of network connecting the devices and is not limited to the type of connection between the devices. Further, two or more field systems 110, business systems 120, analysis systems 130, and data management nodes 100 may exist.

本実施例では、データ管理ノード100の記憶領域を用いてData Lakeが実現される。複数のデータ管理ノード100を用いてData Lakeを実現する場合、複数のデータ管理ノード100は分散クラスタ構成を取り、データが分散して配置される。ここで、Data Lakeは、データの種別及びデータの大きさ等に依存することなく、多種多様なデータを格納するリポジトリを示す。   In this embodiment, Data Lake is realized using the storage area of the data management node 100. When Data Lake is implemented using a plurality of data management nodes 100, the plurality of data management nodes 100 have a distributed cluster configuration, and data is arranged in a distributed manner. Here, Data Lake indicates a repository that stores a wide variety of data without depending on the type of data, the size of data, and the like.

データ管理ノード100は、制御プログラム群101及び管理情報群102を含む。制御プログラム群101及び管理情報群102の詳細については、図2を用いて説明する。   The data management node 100 includes a control program group 101 and a management information group 102. Details of the control program group 101 and the management information group 102 will be described with reference to FIG.

現場システム110は、任意の目的を達成するために運用されるシステムであり、一つ以上の計算機を含む。計算機は、データ通信モジュール111を実現するプログラムを実行し、また、現場データ112を保持する。なお、現場システム110に含まれる計算機は、当該システムが扱うデータのデータ構造を管理する構造情報等を保持してもよい。   The field system 110 is a system operated to achieve any purpose, and includes one or more computers. The computer executes a program for realizing the data communication module 111, and holds field data 112. The computer included in the site system 110 may hold structural information for managing the data structure of data handled by the system.

データ通信モジュール111は現場データ112を送信する。現場データ112は、現場システム110の運用状態を示すデータ等である。現場データ112は、例えば、複数の属性(フィールド)の列から構成されるレコードを複数含むテーブル形式のデータが考えられる。なお、本発明は現場データ112のデータ構造に限定されない。例えば、CSV形式、リスト形式、及びセンサ情報のようなメッセージ形式のデータ構造でもよい。現場データ112の詳細は、図3A、図3B、及び図3Cを用いて説明する。   The data communication module 111 transmits the site data 112. The site data 112 is data indicating the operation state of the site system 110 and the like. The site data 112 may be, for example, data in a table format including a plurality of records including columns of a plurality of attributes (fields). Note that the present invention is not limited to the data structure of the site data 112. For example, a data structure in a message format such as a CSV format, a list format, and sensor information may be used. Details of the site data 112 will be described with reference to FIGS. 3A, 3B, and 3C.

業務システム120は、現場システム110のデータ等を用いた業務処理を実行するシステムであり、一つ以上の計算機を含む。計算機は、データ通信モジュール121を実現するプログラムを実行し、また、業務データ122を保持する。なお、業務システム120に含まれる計算機は、当該システムが扱うデータのデータ構造を管理する構造情報等を保持してもよい。   The business system 120 is a system that executes business processing using data and the like of the site system 110, and includes one or more computers. The computer executes a program for realizing the data communication module 121 and holds business data 122. Note that a computer included in the business system 120 may hold structural information or the like for managing the data structure of data handled by the system.

データ通信モジュール121は業務データ122を送信する。なお、データ通信モジュール121は、業務処理の結果であるログデータを送信してもよい。業務データ122は、業務処理に用いるデータ等である。業務データ122は、現場データ112と同様に、テーブル形式、CSV形式、リスト形式、及びメッセージ形式のデータ構造が考えられる。業務データ122の詳細は、図4を用いて説明する。   The data communication module 121 transmits the business data 122. Note that the data communication module 121 may transmit log data that is a result of business processing. The business data 122 is data used for business processing. The business data 122 may have a data structure of a table format, a CSV format, a list format, and a message format, like the site data 112. Details of the business data 122 will be described with reference to FIG.

分析システム130は、現場データ112及び業務データ122を用いて所定の分析処理を実行するシステムであり、一つ以上の計算機を含む。計算機は、データ通信モジュール131を実現するプログラムを実行し、また、分析データ132を保持する。   The analysis system 130 is a system that executes a predetermined analysis process using the site data 112 and the business data 122, and includes one or more computers. The computer executes a program that implements the data communication module 131, and holds the analysis data 132.

データ通信モジュール131は、分析処理の結果を含む分析データ等を送信する。分析データ132は、分析処理に用いるデータである。分析データ132は、現場データ112と同様に、テーブル形式、CSV形式、リスト形式、及びメッセージ形式のデータ構造が考えられる。   The data communication module 131 transmits analysis data including a result of the analysis processing. The analysis data 132 is data used for the analysis processing. As in the case of the site data 112, the analysis data 132 may have a data structure of a table format, a CSV format, a list format, and a message format.

本実施例のData Lakeには、現場データ112、業務データ122、及び分析データ132が格納されるものとする。   In the data lake of the present embodiment, it is assumed that site data 112, business data 122, and analysis data 132 are stored.

以下の説明では、Data Lakeに格納される各システムの情報を区別しない場合、システム情報とも記載する。本実施例では、現場データ112、業務データ122、及び分析データ132がシステム情報に該当する。以下の説明では、Data Lakeに格納される情報の管理単位のデータをデータブロックとも記載する。例えば、RDBに対応する現場データ112の場合、一つのレコードが一つのデータブロックに対応する。以下の説明では、「属性」は、一つのデータブロックを構成するカラム(フィールド)の識別情報を表すものとする。また、以下の説明では、「属性値」は、「属性」の具体的な値を表すものとする。   In the following description, when the information of each system stored in Data Lake is not distinguished, it is also described as system information. In this embodiment, the site data 112, the business data 122, and the analysis data 132 correspond to the system information. In the following description, data of a management unit of information stored in Data Lake is also described as a data block. For example, in the case of the site data 112 corresponding to the RDB, one record corresponds to one data block. In the following description, “attribute” indicates identification information of a column (field) that constitutes one data block. In the following description, “attribute value” indicates a specific value of “attribute”.

ここで、データ管理ノード100のハードウェア構成及びソフトウェア構成について説明する。図2は、実施例1のデータ管理ノード100のハードウェア構成及びソフトウェア構成を説明するブロック図である。   Here, a hardware configuration and a software configuration of the data management node 100 will be described. FIG. 2 is a block diagram illustrating a hardware configuration and a software configuration of the data management node 100 according to the first embodiment.

データ管理ノード100は、ハードウェア構成として、CPU(Central Processing Unit)201、メモリ202、ネットワークインタフェース203、及び記憶装置204を有する。CPU201、メモリ202、ネットワークインタフェース203、及び記憶装置204は、内部バス等によって互いに接続される。   The data management node 100 has a CPU (Central Processing Unit) 201, a memory 202, a network interface 203, and a storage device 204 as a hardware configuration. The CPU 201, the memory 202, the network interface 203, and the storage device 204 are connected to each other by an internal bus or the like.

CPU201は、データ管理ノード100の各種処理を実行する演算装置であり、メモリ202に格納されるプログラムを実行する。CPU201は、メモリ202に格納されるプログラムにしたがって処理を実行することによって、特定の機能を実現するモジュールとして動作する。以下の説明では、モジュールを主語に処理を説明する場合、CPU201が当該モジュールを実現するプログラムを実行していることを示す。   The CPU 201 is an arithmetic unit that executes various processes of the data management node 100, and executes a program stored in the memory 202. The CPU 201 operates as a module that realizes a specific function by executing processing according to a program stored in the memory 202. In the following description, when a process is described using a module as a subject, it indicates that the CPU 201 is executing a program for realizing the module.

メモリ202は、データ管理ノード100の主記憶装置であり、CPU201が実行するプログラム及び各種データを格納する。本実施例では、メモリ202は、制御プログラム群101及び管理情報群102を格納する。メモリ202は、CPU201が処理に使用するワークエリアを含む。   The memory 202 is a main storage device of the data management node 100, and stores programs executed by the CPU 201 and various data. In this embodiment, the memory 202 stores the control program group 101 and the management information group 102. The memory 202 includes a work area used by the CPU 201 for processing.

ネットワークインタフェース203は、ネットワークを介して他の装置と接続するインタフェースである。本実施例では、データ管理ノード100は、ネットワークインタフェース203を介して、ネットワークスイッチ140と接続する。   The network interface 203 is an interface for connecting to another device via a network. In this embodiment, the data management node 100 connects to the network switch 140 via the network interface 203.

記憶装置204は、データ管理ノード100の副記憶装置であり、大容量データを格納する。記憶装置204は、例えばFC(Fibre Channel)ディスク、SCSI(Small Computer System Interface)ディスク、SATAディスク、ATA(AT Attachment)ディスク、又はSAS(Serial Attached SCSI)ディスク等である。   The storage device 204 is a secondary storage device of the data management node 100 and stores a large amount of data. The storage device 204 is, for example, an FC (Fibre Channel) disk, a SCSI (Small Computer System Interface) disk, a SATA disk, an ATA (AT Attachment) disk, a SAS (Serial Attached SCSI) disk, or the like.

ここで、メモリ202に格納される制御プログラム群101及び管理情報群102について説明する。   Here, the control program group 101 and the management information group 102 stored in the memory 202 will be described.

管理情報群102は、属性管理情報221、属性グループ管理情報222、関連性管理情報223、及びデータストア224を含む。   The management information group 102 includes attribute management information 221, attribute group management information 222, relevancy management information 223, and a data store 224.

属性管理情報221は、システム情報に含まれるデータブロックを構成する属性を管理する情報である。例えば、複数の属性に対応するカラム群から構成されるレコードを含むテーブルがデータストア224に格納される場合、属性管理情報221には、各カラムに関する情報が格納される。属性管理情報221の詳細は、図5を用いて説明する。   The attribute management information 221 is information for managing the attributes of the data block included in the system information. For example, when a table including a record composed of a column group corresponding to a plurality of attributes is stored in the data store 224, information on each column is stored in the attribute management information 221. Details of the attribute management information 221 will be described with reference to FIG.

属性グループ管理情報222は、二つのシステム情報を結合等する場合に用いられる属性の組合せを管理する情報である。属性グループ管理情報222の詳細は、図6を用いて説明する。   The attribute group management information 222 is information for managing a combination of attributes used when two pieces of system information are combined. Details of the attribute group management information 222 will be described with reference to FIG.

関連性管理情報223は、システム情報間の関連性を管理する情報である。関連性管理情報223の詳細は、図7を用いて説明する。   The association management information 223 is information for managing the association between the system information. Details of the relevance management information 223 will be described with reference to FIG.

データストア224は、Data Lakeを実現するストレージであり、現場システム110、業務システム120、及び分析システム130が扱う各種データを格納する。具体的には、データストア224は、現場データ112、業務データ122、及び分析データ132等を含むシステム情報群225を格納する。データストア224には、システム情報のデータ構造に依存しないデータ形式のデータが格納される。例えば、キーバリューストアをデータストア224として採用することが考えられる。   The data store 224 is a storage for realizing Data Lake, and stores various data handled by the site system 110, the business system 120, and the analysis system 130. Specifically, the data store 224 stores a system information group 225 including the site data 112, the business data 122, the analysis data 132, and the like. The data store 224 stores data in a data format that does not depend on the data structure of the system information. For example, a key value store may be adopted as the data store 224.

本実施例のデータストア224は、データ管理ノード100のメモリ202の記憶領域を用いて構成される。なお、データ管理ノード100の記憶装置204の記憶領域を用いてデータストア224が構成されてもよい。データ管理ノード100が複数存在する場合、各データ管理ノード100のメモリ202又は記憶装置204の記憶領域を用いてデータストア224を実現する。   The data store 224 of this embodiment is configured using a storage area of the memory 202 of the data management node 100. Note that the data store 224 may be configured using the storage area of the storage device 204 of the data management node 100. When there are a plurality of data management nodes 100, the data store 224 is realized by using the storage area of the memory 202 or the storage device 204 of each data management node 100.

制御プログラム群101は、データ管理モジュール211、関連性解析モジュール212、及び変換モジュール213を実現するプログラムを含む。なお、説明のわかりやすさのために複数のモジュールとして図示しているが、複数のモジュールを一つのモジュールにまとめてもよい。また、機能毎に任意の数のモジュールに分割してもよい。   The control program group 101 includes programs for realizing the data management module 211, the association analysis module 212, and the conversion module 213. Although a plurality of modules are shown for simplicity of description, a plurality of modules may be combined into one module. Further, the functions may be divided into an arbitrary number of modules.

データ管理ノード100が複数存在する場合、全てのデータ管理ノード100に同一のプログラムが格納されていなくてもよい。例えば、一つのデータ管理ノード100がデータ管理モジュール211を実現するプログラムを格納してもよい。関連性解析モジュール212及び変換モジュール213についても同様である。   When there are a plurality of data management nodes 100, the same program may not be stored in all data management nodes 100. For example, one data management node 100 may store a program that implements the data management module 211. The same applies to the association analysis module 212 and the conversion module 213.

データ管理モジュール211は、データストア224を管理する。また、データ管理モジュール211は、データストア224に対するデータの書込処理及び読出処理等を制御する。   The data management module 211 manages the data store 224. Further, the data management module 211 controls a data write process, a data read process, and the like for the data store 224.

データ管理モジュール211は、現場システム110から現場データ112を含む登録要求、業務システム120から業務データ122を含む登録要求、分析システム130から分析データ132を含む登録要求を受け付けた場合、所定のデータ形式に変換し、データストア224に格納する。また、データ管理モジュール211は、関連性解析モジュール212を呼び出す。   The data management module 211 receives a registration request including the site data 112 from the site system 110, a registration request including the business data 122 from the business system 120, and a registration request including the analysis data 132 from the analysis system 130. And store it in the data store 224. Further, the data management module 211 calls the association analysis module 212.

データ管理モジュール211は、業務システム120から検索要求を受け付けた場合、変換モジュール213を呼び出す。   When receiving a search request from the business system 120, the data management module 211 calls the conversion module 213.

関連性解析モジュール212は、システム情報間の関連性を解析する。関連性解析モジュール212は、解析結果に基づいて、属性管理情報221、属性グループ管理情報222、及び関連性管理情報223を生成し、又は、更新する。   The association analysis module 212 analyzes the association between the system information. The relevance analysis module 212 generates or updates the attribute management information 221, the attribute group management information 222, and the relevancy management information 223 based on the analysis result.

変換モジュール213は、関連性管理情報223等に基づいて、データストア224に対するクエリを変換する。   The conversion module 213 converts a query for the data store 224 based on the relevance management information 223 and the like.

次に計算機システム10に含まれる情報について説明する。   Next, information included in the computer system 10 will be described.

図3A、図3B、及び図3Cは、実施例1の現場データ112の一例を示す図である。   FIGS. 3A, 3B, and 3C are diagrams illustrating an example of the site data 112 according to the first embodiment.

図3Aは、現場データ112の一つであるセンサ情報300である。センサ情報300は、装置ID301、センサID302、センサ種別ID303、時刻304、及び値305から構成されるレコードを含む。   FIG. 3A shows sensor information 300 which is one of the site data 112. The sensor information 300 includes a record including a device ID 301, a sensor ID 302, a sensor type ID 303, a time 304, and a value 305.

センサ情報300の一番目のレコードは、装置ID301が「EQ001」である装置が、センサID302が「T001」かつセンサ種別ID303が「1」であるセンサを有し、当該センサが「2016/06/15:24:23」に計測した値が「42」であることを示す。   In the first record of the sensor information 300, the device whose device ID 301 is “EQ001” has the sensor whose sensor ID 302 is “T001” and the sensor type ID 303 is “1”, and the sensor is “2016/06 / 15:24:23 "indicates that the value measured is" 42 ".

図3Bは、現場データ112の一つである辞書情報310の一例を示す図である。辞書情報310は、センサ種別ID311及びセンサ種別312から構成されるレコードを含む。   FIG. 3B is a diagram illustrating an example of the dictionary information 310 which is one of the site data 112. The dictionary information 310 includes a record including a sensor type ID 311 and a sensor type 312.

辞書情報310の一番目のレコードは、センサ種別ID311が「1」であるセンサは「温度」を計測する温度センサであることを示す。   The first record of the dictionary information 310 indicates that the sensor whose sensor type ID 311 is “1” is a temperature sensor that measures “temperature”.

図3Cは、現場データ112の一つである設定情報320の一例を示す図である。設定情報320は、センサ種別321、設定情報322、及び設定値323から構成されるレコードを含む。   FIG. 3C is a diagram illustrating an example of the setting information 320 that is one of the site data 112. The setting information 320 includes a record including a sensor type 321, setting information 322, and a setting value 323.

設定情報320の一番目のレコードは、温度センサに設定されている閾値の値が「40」であることを示す。   The first record of the setting information 320 indicates that the threshold value set for the temperature sensor is “40”.

図4は、実施例1の業務データ122の一例を示す図である。   FIG. 4 is a diagram illustrating an example of the business data 122 according to the first embodiment.

装置情報400は、業務データ122に含まれる。装置情報400は、拠点401、装置ID402、及びセンサID403から構成されるレコードを含む。   The device information 400 is included in the business data 122. The device information 400 includes a record including a base 401, a device ID 402, and a sensor ID 403.

装置情報400の一番目のレコードは、「東京」の拠点には、装置IDが「EQ001」である装置が設置され、当該装置はセンサIDが「T001」であるセンサを搭載していることを示す。   The first record of the device information 400 indicates that a device whose device ID is “EQ001” is installed at the base “Tokyo”, and that the device has a sensor whose sensor ID is “T001”. Show.

図5は、実施例1の属性管理情報221の一例を示す図である。   FIG. 5 is a diagram illustrating an example of the attribute management information 221 according to the first embodiment.

属性管理情報221は、ID501、データソース名502、属性名503、主キー504、及び複合キー505から構成されるレコードを含む。一つのレコードが、システム情報に含まれる一つのデータブロックを構成する一つの属性に対応する。   The attribute management information 221 includes a record including an ID 501, a data source name 502, an attribute name 503, a primary key 504, and a composite key 505. One record corresponds to one attribute that constitutes one data block included in the system information.

ID501は、属性管理情報221に含まれるレコードを一意に識別するための識別情報である。データソース名502は、システム情報の識別情報である。属性名503は、システム情報に含まれるデータブロックを構成する属性の識別情報である。   The ID 501 is identification information for uniquely identifying a record included in the attribute management information 221. The data source name 502 is identification information of system information. The attribute name 503 is identification information of an attribute constituting a data block included in the system information.

主キー504は、システム情報に含まれるデータブロックを一意に識別する主キーとなる属性であるか否かを示す値である。主キーとなる属性の主キー504には、所定の記号が格納される。なお、主キーとなる属性は一つでなくてもよい。   The primary key 504 is a value indicating whether or not the attribute is a primary key for uniquely identifying a data block included in the system information. A predetermined symbol is stored in the primary key 504 of the attribute serving as the primary key. Note that the number of attributes serving as the primary key need not be one.

複合キー505は、主キーとなる属性群、すなわち、複合キーを構成する属性の識別情報である。複合キー505には、レコードに対応する属性を含む属性群のうち、レコードに対応する属性以外の属性の識別情報が格納される。例えば、「C1」と「C2」、「C1」と「C3」、「C1」と「C4」、及び「C1」と「C5」のそれぞれが複合キーである場合、ID501が「C1」のレコードの複合キー505には、「C2」、「C3」、「C4」、及び「C5」が格納され、ID501が「C2」、「C3」、「C4」、及び「C5」のレコードには、「C1」が格納される。   The composite key 505 is identification information of an attribute group serving as a primary key, that is, an attribute constituting the composite key. The composite key 505 stores identification information of attributes other than the attribute corresponding to the record among the attribute group including the attribute corresponding to the record. For example, if each of “C1” and “C2”, “C1” and “C3”, “C1” and “C4”, and “C1” and “C5” are composite keys, a record with ID 501 “C1” In the composite key 505, “C2”, “C3”, “C4”, and “C5” are stored, and records with IDs 501 of “C2”, “C3”, “C4”, and “C5” include: “C1” is stored.

以下の説明では、主キー及び複合キーを区別しない場合、検索キーとも記載する。   In the following description, when the primary key and the composite key are not distinguished, they are also described as search keys.

図6は、実施例1の属性グループ管理情報222の一例を示す図である。   FIG. 6 is a diagram illustrating an example of the attribute group management information 222 according to the first embodiment.

属性グループ管理情報222は、属性グループID601及びメンバ602から構成されるレコードを含む。   The attribute group management information 222 includes a record including an attribute group ID 601 and a member 602.

属性グループID601は、属性グループ管理情報222に含まれるレコードを一意に識別するための識別情報である。   The attribute group ID 601 is identification information for uniquely identifying a record included in the attribute group management information 222.

メンバ602は、二つのシステム情報を結合する場合に用いられる属性の組合せの情報である。本実施例では、属性管理情報221のID501の組合せがメンバ602に格納される。   The member 602 is information on a combination of attributes used when combining two pieces of system information. In this embodiment, the combination of the IDs 501 of the attribute management information 221 is stored in the member 602.

図6に示す属性グループ管理情報222の一番目のレコードは、「C3」の値と「C6」の値が同一であるデータブロックを結合させることを示す。また、三番目のレコードは、「(C1,C2)」の値と「(C12,13)」の値とが同一であるデータブロックを結合させることを示す。   The first record of the attribute group management information 222 shown in FIG. 6 indicates that data blocks having the same value of “C3” and the value of “C6” are to be combined. The third record indicates that data blocks having the same value of “(C1, C2)” and the value of “(C12, 13)” are combined.

図7は、実施例1の関連性管理情報223の一例を示す図である。   FIG. 7 is a diagram illustrating an example of the relevance management information 223 according to the first embodiment.

関連性管理情報223は、第1データソース名701、第2データソース名702、及びアクセスパス703から構成されるレコードを含む。   The association management information 223 includes a record including a first data source name 701, a second data source name 702, and an access path 703.

第1データソース名701及び第2データソース名702は、関連性があるシステム情報の識別情報である。第1データソース名701は、第2データソース名702に対応するシステム情報に含まれる外部キーに基づいてアクセスできるシステム情報の識別情報である。第2データソース名702は、第1データソース名701に対応するシステム情報に含まれる外部キーに基づいてアクセスできるシステム情報の識別情報である。第1データソース名701及び第2データソース名702には、データソース名502に設定された値と同一の値が設定される。   The first data source name 701 and the second data source name 702 are identification information of relevant system information. The first data source name 701 is identification information of system information that can be accessed based on the foreign key included in the system information corresponding to the second data source name 702. The second data source name 702 is identification information of system information that can be accessed based on a foreign key included in the system information corresponding to the first data source name 701. The same value as the value set in the data source name 502 is set in the first data source name 701 and the second data source name 702.

アクセスパス703は、二つのシステム情報を関連付ける属性の対応関係によって定義されるパスの情報である。本実施例では、属性一致パス、属性群一致パス、及び踏み台一致パスの三種類のパスが存在する。   The access path 703 is path information defined by the correspondence between attributes that associate two pieces of system information. In this embodiment, there are three types of paths: an attribute matching path, an attribute group matching path, and a springboard matching path.

属性一致パスは、一つのシステム情報に含まれる一つの属性と、他方のシステム情報に含まれる一つ属性との対応関係によって定義されるパスである。属性一致パスの場合、アクセスパス703には、一つのシステム情報に含まれる一つの属性と、他方のシステム情報に含まれる一つの属性との対応関係を示す情報が格納される。参照元となるシステム情報に含まれる属性が外部キーとして用いられる。   The attribute matching path is a path defined by the correspondence between one attribute included in one system information and one attribute included in the other system information. In the case of the attribute matching path, the access path 703 stores information indicating the correspondence between one attribute included in one system information and one attribute included in the other system information. An attribute included in the reference system information is used as a foreign key.

図7の一番目及び二番目のレコードは、属性一致パスに対応するレコードである。例えば、一番目のレコードは、C3の値を外部キーとして用いて、C6の値が外部キーに一致するデータブロックを検索できることを示す。   The first and second records in FIG. 7 are records corresponding to the attribute matching path. For example, the first record indicates that a data block in which the value of C6 matches the foreign key can be searched using the value of C3 as the foreign key.

属性群一致パスは、一つのシステム情報に含まれる複数の属性と、他方のシステム情報に含まれる複数の属性との対応関係によって定義されるパスである。属性群一致パスの場合、アクセスパス703には、一つのシステム情報に含まれる属性群と、他方のシステム情報に含まれる属性群との対応関係を示す情報が格納される。   The attribute group matching path is a path defined by a correspondence between a plurality of attributes included in one system information and a plurality of attributes included in the other system information. In the case of the attribute group matching path, the access path 703 stores information indicating the correspondence between the attribute group included in one system information and the attribute group included in the other system information.

図7の三番目のレコードは、属性群一致パスに対応するレコードである。三番目のレコードは、C1及びC2の値の組合せを外部キーとして用いて、C12及びC13の値の組合せが外部キーに一致するデータブロックを検索できることを示す。   The third record in FIG. 7 is a record corresponding to the attribute group matching path. The third record indicates that a data block in which the combination of the values of C12 and C13 matches the foreign key can be searched using the combination of the values of C1 and C2 as the foreign key.

踏み台一致パスは、一つのシステム情報に含まれる属性と中継用のシステム情報に含まれる属性との対応関係、及び中継用のシステム情報に含まれる属性と他方のシステム情報に含まれる属性との対応関係によって定義されるパスである。踏み台一致パスの場合、二つ以上のパスが接続されたパスとなる。本実施例では、異なるパスの接続をセミコロンを用いて表す。セミコロンを用いて接続するパスは、属性一致パス又は属性群一致パスのどちらでもよい。なお、セミコロンを介して接続する属性は、同一のシステム情報に含まれる属性である。   The springboard matching path is a correspondence between the attribute included in one system information and the attribute included in the relay system information, and the correspondence between the attribute included in the relay system information and the attribute included in the other system information. A path defined by a relationship. In the case of a springboard-matching path, two or more paths are connected. In the present embodiment, connections of different paths are represented using semicolons. The path connected using a semicolon may be either an attribute matching path or an attribute group matching path. Note that the attribute connected via the semicolon is an attribute included in the same system information.

図7の四番目のレコードは、踏み台一致パスに対応するレコードである。四番目のレコードは、C3の値を第1の外部キーとして用いて、C6の値が第1の外部キーに一致する第1のデータブロックを検索し、第1のデータブロックのC7の値を第2の外部キーとして用いて、C8の値が第2の外部キーに一致する第2のデータブロックを検索できることを示す。なお、セミコロンを介して接続する属性C6、C7は、同一のシステム情報(辞書情報310)に含まれる属性である。   The fourth record in FIG. 7 is a record corresponding to the springboard matching path. The fourth record uses the value of C3 as the first foreign key, searches for the first data block in which the value of C6 matches the first foreign key, and retrieves the value of C7 in the first data block. Used as a second foreign key, indicates that a second data block whose C8 value matches the second foreign key can be retrieved. The attributes C6 and C7 connected via the semicolon are attributes included in the same system information (dictionary information 310).

図8は、実施例1のデータ管理モジュール211がシステム情報の登録要求を受け付けた場合に実行する処理の一例を説明するフローチャートである。   FIG. 8 is a flowchart illustrating an example of a process performed when the data management module 211 according to the first embodiment receives a registration request for system information.

データ管理モジュール211は、任意のシステムからシステム情報の登録要求を受け付ける(ステップS801)。以下の説明では、登録要求に基づいて登録するシステム情報をターゲットシステム情報とも記載する。   The data management module 211 receives a registration request for system information from an arbitrary system (step S801). In the following description, system information to be registered based on a registration request is also described as target system information.

データ管理モジュール211は、データストア224に登録要求に含まれるターゲットシステム情報を格納する(ステップS802)。なお、登録要求にはデータブロックが含まれてよい。データストア224へのデータの登録方法は公知の技術であるため詳細な説明を省略する。   The data management module 211 stores the target system information included in the registration request in the data store 224 (Step S802). Note that the registration request may include a data block. Since the method of registering data in the data store 224 is a known technique, a detailed description is omitted.

データ管理モジュール211は、ターゲットシステム情報に関するレコードが関連性管理情報223に登録されているか否かを判定する(ステップS803)。   The data management module 211 determines whether a record related to the target system information is registered in the relevance management information 223 (Step S803).

具体的には、データ管理モジュール211は、第1データソース名701及び第2データソース名702の少なくともいずれかにターゲットシステム情報の識別情報が設定されたレコードが存在するか否かを判定する。前述のレコードが存在しない場合、データ管理モジュール211は、ターゲットシステム情報に関するレコードが関連性管理情報223に登録されていないと判定する。   Specifically, the data management module 211 determines whether there is a record in which the identification information of the target system information is set in at least one of the first data source name 701 and the second data source name 702. If the above-mentioned record does not exist, the data management module 211 determines that the record related to the target system information is not registered in the relevance management information 223.

ターゲットシステム情報に関するレコードが関連性管理情報223に登録されていると判定された場合、データ管理モジュール211は、処理を終了する。   When it is determined that the record related to the target system information is registered in the relevance management information 223, the data management module 211 ends the processing.

ターゲットシステム情報に関するレコードが関連性管理情報223に登録されていないと判定された場合、データ管理モジュール211は、関連性解析モジュール212に属性管理情報221の更新を指示する(ステップS804)。属性管理情報221の更新処理の詳細は、図9を用いて説明する。   When it is determined that the record related to the target system information is not registered in the relevance management information 223, the data management module 211 instructs the relevancy analysis module 212 to update the attribute management information 221 (step S804). Details of the process of updating the attribute management information 221 will be described with reference to FIG.

データ管理モジュール211は、関連性解析モジュール212から処理の完了を示す応答を受け付けた場合、関連性解析モジュール212に属性グループ管理情報222の更新を指示する(ステップS805)。属性グループ管理情報222の更新処理の詳細は、図10を用いて説明する。   When the data management module 211 receives a response indicating the completion of the process from the relevance analysis module 212, it instructs the relevance analysis module 212 to update the attribute group management information 222 (step S805). Details of the process of updating the attribute group management information 222 will be described with reference to FIG.

データ管理モジュール211は、関連性解析モジュール212から処理の完了を示す応答を受け付けた場合、関連性解析モジュール212に関連性管理情報223の更新を指示する(ステップS806)。関連性管理情報223の詳細は、図11を用いて説明する。   When the data management module 211 receives a response indicating the completion of the process from the relevance analysis module 212, it instructs the relevancy analysis module 212 to update the relevancy management information 223 (step S806). Details of the relationship management information 223 will be described with reference to FIG.

データ管理モジュール211は、関連性解析モジュール212から処理の完了を示す応答を受け付けた場合、処理を終了する。   When the data management module 211 receives a response indicating the completion of the process from the association analysis module 212, the process ends.

なお、データストア224に一つもシステム情報が登録されていない場合、データ管理モジュール211は、ステップS804では初期化された属性管理情報221を生成し、ステップS805では初期化された属性グループ管理情報222を生成し、また、ステップS806では初期化された関連性管理情報223を生成する。   If no system information is registered in the data store 224, the data management module 211 generates initialized attribute management information 221 in step S804, and initializes the initialized attribute group management information 222 in step S805. Is generated, and in step S806, the initialized relationship management information 223 is generated.

図9は、実施例1の関連性解析モジュール212が実行する属性管理情報221の更新処理の一例を説明するフローチャートである。   FIG. 9 is a flowchart illustrating an example of an update process of the attribute management information 221 performed by the association analysis module 212 according to the first embodiment.

関連性解析モジュール212は、ターゲットシステム情報に含まれる属性を特定する(ステップS901)。   The relevance analysis module 212 specifies an attribute included in the target system information (Step S901).

具体的には、関連性解析モジュール212は、ターゲットシステム情報のデータ本体部分のデータ構造を解析し、ターゲットシステム情報のデータ本体部分に含まれる属性を特定する。また、関連性解析モジュール212は、ターゲットシステム情報のメタデータを解析し、ターゲットシステム情報のメタデータからターゲットシステム情報の識別情報を取得する。このとき、関連性解析モジュール212は、メタデータの属性も特定してもよい。   Specifically, the association analysis module 212 analyzes the data structure of the data body part of the target system information, and specifies the attributes included in the data body part of the target system information. Further, the association analysis module 212 analyzes the metadata of the target system information, and acquires the identification information of the target system information from the metadata of the target system information. At this time, the association analysis module 212 may also specify the attribute of the metadata.

例えば、ターゲットシステム情報のスキーマ定義情報に基づいて、ターゲットシステム情報のデータ構造を解析する方法が考えられる。なお、本実施例は、ターゲットシステム情報のデータ構造の解析方法に依存しない。   For example, a method of analyzing the data structure of the target system information based on the schema definition information of the target system information can be considered. The present embodiment does not depend on a method of analyzing the data structure of the target system information.

次に、関連性解析モジュール212は、特定された属性を属性管理情報221に追加する(ステップS902)。   Next, the association analysis module 212 adds the specified attribute to the attribute management information 221 (step S902).

具体的には、関連性解析モジュール212は、属性管理情報221に特定された属性の数だけレコードを追加し、追加されたレコードのID501にレコードの識別情報を設定する。関連性解析モジュール212は、追加されたレコードのデータソース名502にターゲットシステム情報の識別情報を設定する。関連性解析モジュール212は、追加された各レコードの属性名503に特定された属性の識別情報を設定する。   Specifically, the association analysis module 212 adds records by the number of attributes specified in the attribute management information 221 and sets the record identification information in the ID 501 of the added record. The association analysis module 212 sets the identification information of the target system information in the data source name 502 of the added record. The relevance analysis module 212 sets the identification information of the specified attribute in the attribute name 503 of each added record.

次に、関連性解析モジュール212は、ターゲットシステム情報に主キーが存在するか否かを判定する(ステップS903)。   Next, the association analysis module 212 determines whether or not a primary key exists in the target system information (step S903).

具体的には、関連性解析モジュール212は、ターゲットシステム情報に含まれる各属性の属性値を参照し、データブロックを一意に識別可能な属性を特定する。例えば、関連性解析モジュール212は、重複する属性値が存在しない属性を主キーとして特定する。   Specifically, the association analysis module 212 refers to the attribute value of each attribute included in the target system information, and specifies an attribute that can uniquely identify the data block. For example, the relevance analysis module 212 specifies, as a primary key, an attribute having no duplicate attribute value.

例えば、設定情報320がターゲットシステム情報である場合、センサ種別321及び設定値323のそれぞれの属性値には重複が発生しないため、センサ種別321及び設定値323のそれぞれが主キーとして特定される。   For example, when the setting information 320 is the target system information, since the attribute values of the sensor type 321 and the setting value 323 do not overlap, each of the sensor type 321 and the setting value 323 is specified as the primary key.

ターゲットシステム情報に主キーが存在すると判定された場合、関連性解析モジュール212は、主キーとなる属性のレコードの主キー504に、主キーであることを示す値を設定する(ステップS904)。その後、関連性解析モジュール212は、処理の完了を示す応答をデータ管理モジュール211に出力し、処理を終了する。   If it is determined that the primary key exists in the target system information, the relevance analysis module 212 sets a value indicating the primary key in the primary key 504 of the record of the attribute to be the primary key (step S904). Thereafter, the association analysis module 212 outputs a response indicating the completion of the process to the data management module 211, and ends the process.

ターゲットシステム情報に主キーが存在しないと判定された場合、関連性解析モジュール212は、複合キーを特定する(ステップS905)。   When it is determined that the primary key does not exist in the target system information, the association analysis module 212 specifies the composite key (step S905).

具体的には、関連性解析モジュール212は、属性の組合せを生成し、データブロックを一意に識別可能な属性の組み合わせを特定する。例えば、関連性解析モジュール212は、重複する属性値の組合せが存在しない属性の組合せを複合キーとして特定する。   Specifically, the association analysis module 212 generates a combination of attributes and specifies a combination of attributes that can uniquely identify the data block. For example, the association analysis module 212 specifies, as a composite key, an attribute combination in which no duplicate attribute value combination exists.

例えば、センサ情報300がターゲットシステム情報である場合、装置ID301と他の属性との組合せによって、レコードを一意に識別できるため、装置ID301及び他の属性との組合せが複合キーとして特定される。なお、本実施例では、属性の組合せに含まれる属性の数が最小となる複合キーを特定するものとする。したがって、装置ID301及びセンサID302、装置ID301及びセンサ種別ID303、装置ID301及び時刻304、並びに、装置ID301及び値305がそれぞれ複合キーとして特定される。   For example, when the sensor information 300 is the target system information, a record can be uniquely identified by a combination of the device ID 301 and another attribute, so that the combination of the device ID 301 and another attribute is specified as a composite key. In the present embodiment, it is assumed that a composite key that minimizes the number of attributes included in the combination of attributes is specified. Therefore, the device ID 301 and the sensor ID 302, the device ID 301 and the sensor type ID 303, the device ID 301 and the time 304, and the device ID 301 and the value 305 are specified as the composite keys.

次に、関連性解析モジュール212は、複合キーを構成する属性のレコードの複合キー505に値を設定する(ステップS906)。その後、関連性解析モジュール212は、処理の完了を示す応答をデータ管理モジュール211に出力し、処理を終了する。   Next, the relevance analysis module 212 sets a value to the composite key 505 of the record of the attribute constituting the composite key (step S906). Thereafter, the association analysis module 212 outputs a response indicating the completion of the process to the data management module 211, and ends the process.

具体的には、関連性解析モジュール212は、複合キーを構成する属性のレコードの複合キー505に当該レコードに対応する属性以外の属性の識別情報を設定する。以上の処理によって、図5に示すような属性管理情報221が生成される。   Specifically, the relevance analysis module 212 sets the identification information of the attribute other than the attribute corresponding to the record in the composite key 505 of the attribute record forming the composite key. By the above processing, attribute management information 221 as shown in FIG. 5 is generated.

なお、システム情報の登録要求に主キー又は複合キーとなる属性を示す情報が含まれてもよい。この場合、関連性解析モジュール212は、当該情報に基づいて属性管理情報221を更新する。   It should be noted that the system information registration request may include information indicating an attribute serving as a primary key or a composite key. In this case, the association analysis module 212 updates the attribute management information 221 based on the information.

図10は、実施例1の関連性解析モジュール212が実行する属性グループ管理情報222の更新処理の一例を説明するフローチャートである。   FIG. 10 is a flowchart illustrating an example of an update process of the attribute group management information 222 performed by the association analysis module 212 according to the first embodiment.

関連性解析モジュール212は、データストア224に登録されたシステム情報の中から、ターゲットシステム情報と比較するシステム情報を一つ選択する(ステップS1001)。以下の説明では、ターゲットシステム情報と比較するシステム情報をサブターゲットシステム情報とも記載する。   The relevance analysis module 212 selects one system information to be compared with the target system information from among the system information registered in the data store 224 (step S1001). In the following description, the system information to be compared with the target system information is also described as sub-target system information.

例えば、関連性解析モジュール212は、属性管理情報221のデータソース名502に基づいて、サブターゲットシステム情報を選択する。   For example, the association analysis module 212 selects sub-target system information based on the data source name 502 of the attribute management information 221.

次に、関連性解析モジュール212は、ターゲットシステム情報及びサブターゲットシステム情報のそれぞれの検索キーを比較する(ステップS1002)。具体的には、以下のような処理が実行される。   Next, the association analysis module 212 compares the search keys of the target system information and the sub-target system information (step S1002). Specifically, the following processing is executed.

関連性解析モジュール212は、ターゲットシステム情報及びサブターゲットシステム情報のそれぞれの検索キーが同一種類の検索キーであるか否かを判定する。すなわち、ターゲットシステム情報の検索キーが主キーである場合、関連性解析モジュール212は、サブターゲットシステム情報の検索キーが主キーであるか否かを判定する。   The relevance analysis module 212 determines whether each search key of the target system information and the sub-target system information is the same type of search key. That is, when the search key of the target system information is the primary key, the association analysis module 212 determines whether the search key of the sub-target system information is the primary key.

ターゲットシステム情報及びサブターゲットシステム情報のそれぞれの検索キーが同一種類の検索キーでないと判定された場合、各システム情報の検索キーが一致しないと判定する。この場合、関連性解析モジュール212は、ステップS1003からステップS1005の処理を実行することなく、ステップS1006に進む。   When it is determined that the search keys of the target system information and the sub-target system information are not the same type of search key, it is determined that the search keys of the respective system information do not match. In this case, the relevance analysis module 212 proceeds to step S1006 without executing the processing from step S1003 to step S1005.

ターゲットシステム情報及びサブターゲットシステム情報のそれぞれの検索キーが同一種類の検索キーであると判定された場合、関連性解析モジュール212は、各システム情報の検索キーに対応する属性の名称又は属性値を比較する。   When it is determined that the respective search keys of the target system information and the sub-target system information are the same type of search key, the association analysis module 212 sets the name or attribute value of the attribute corresponding to the search key of each system information. Compare.

次に、関連性解析モジュール212は、比較結果に基づいて、各システム情報の検索キーが同一であるか否かを判定する(ステップS1003)。   Next, the relevance analysis module 212 determines whether the search key of each system information is the same based on the comparison result (step S1003).

例えば、属性の名称を比較する方法又は属性値の種別を比較する方法等が考えられる。属性値の名称が一致する場合、又は、属性値の種別が一致する場合、関連性解析モジュール212は、各システム情報の検索キーが同一であると判定する。   For example, a method of comparing attribute names or a method of comparing types of attribute values can be considered. When the names of the attribute values match or the types of the attribute values match, the association analysis module 212 determines that the search key of each system information is the same.

各システム情報の検索キーが同一でないと判定された場合、関連性解析モジュール212は、類語辞書等を用いて、属性の名称又は属性値の類似判定を行い、各システム情報の検索キーが類似する検索キーであるか否かを判定する(ステップS1004)。なお、類似辞書等は、データ管理ノード100が予め保持してもよいし、外部から入力されてもよい。   When it is determined that the search key of each system information is not the same, the relevance analysis module 212 performs similarity determination of the attribute name or the attribute value using a thesaurus and the like, and the search key of each system information is similar. It is determined whether the key is a search key (step S1004). Note that the similar dictionary or the like may be held in advance by the data management node 100 or may be input from outside.

各システム情報の検索キーが類似しないと判定された場合、関連性解析モジュール212は、ステップS1006に進む。   If it is determined that the search keys of the respective system information are not similar, the relevance analysis module 212 proceeds to step S1006.

各システム情報の検索キーが同一であると判定された場合、又は、各システム情報の検索キーが類似すると判定された場合、関連性解析モジュール212は、属性グループ管理情報222にレコードを追加する(ステップS1005)。その後、関連性解析モジュール212は、ステップS1006に進む。   When it is determined that the search key of each system information is the same, or when it is determined that the search key of each system information is similar, the association analysis module 212 adds a record to the attribute group management information 222 ( Step S1005). Thereafter, the relevance analysis module 212 proceeds to step S1006.

具体的には、関連性解析モジュール212は、属性グループ管理情報222にレコードを追加し、追加されたレコードの属性グループID601に識別情報を設定する。関連性解析モジュール212は、追加されたレコードのメンバ602に、各システム情報の検索キーを設定する。すなわち、同一視できる属性の組合せがメンバ602に設定される。検索キーが主キーである場合、各システム情報の主キーを対応付けた値がメンバ602に設定される。検索キーが複合キーである場合、各システム情報の複合キーを対応付けた値がメンバ602に設定される。   Specifically, the relevance analysis module 212 adds a record to the attribute group management information 222 and sets identification information to the attribute group ID 601 of the added record. The relevance analysis module 212 sets a search key of each system information in the member 602 of the added record. That is, a combination of attributes that can be identified is set to the member 602. If the search key is a primary key, a value associated with the primary key of each system information is set in the member 602. When the search key is a composite key, a value corresponding to the composite key of each system information is set in the member 602.

ステップS1006では、関連性解析モジュール212は、データストア224に登録された全てのシステム情報について処理が完了したか否かを判定する(ステップS1006)。   In step S1006, the relevance analysis module 212 determines whether the processing has been completed for all the system information registered in the data store 224 (step S1006).

データストア224に登録された全てのシステム情報について処理が完了していないと判定された場合、関連性解析モジュール212は、ステップS1001に戻り、同様の処理を実行する。   If it is determined that the processing has not been completed for all the system information registered in the data store 224, the relevance analysis module 212 returns to step S1001 and executes the same processing.

データストア224に登録された全てのシステム情報について処理が完了したと判定された場合、関連性解析モジュール212は、処理の完了を示す応答をデータ管理モジュール211に出力し、処理を終了する。   When it is determined that the processing has been completed for all the system information registered in the data store 224, the association analysis module 212 outputs a response indicating the completion of the processing to the data management module 211, and ends the processing.

図11は、実施例1の関連性解析モジュール212が実行する関連性管理情報223の更新処理の一例を説明するフローチャートである。   FIG. 11 is a flowchart illustrating an example of an update process of the relevance management information 223 performed by the relevance analysis module 212 according to the first embodiment.

関連性解析モジュール212は、データストア224に登録されたシステム情報の中から、サブターゲットシステム情報を一つ選択する(ステップS1101)。ステップS1101の処理は、ステップS1001の処理と同一である。   The association analysis module 212 selects one piece of sub-target system information from the system information registered in the data store 224 (step S1101). The processing in step S1101 is the same as the processing in step S1001.

次に、関連性解析モジュール212は、属性管理情報221及び属性グループ管理情報222を参照して、ターゲットシステム情報及びサブターゲットシステム情報に関連するレコードを検索する(ステップS1102)。   Next, the relevance analysis module 212 refers to the attribute management information 221 and the attribute group management information 222 to search for records related to the target system information and the sub-target system information (step S1102).

具体的には、関連性解析モジュール212は、属性管理情報221のID501から、各システム情報に含まれる属性に割り当てられた識別情報を取得する。関連性解析モジュール212は、属性グループ管理情報222のメンバ602を参照して、ターゲットシステム情報に含まれる属性の識別情報、及び、サブターゲットシステム情報に含まれる属性の識別情報が設定されたレコードを検索する。   Specifically, the relevance analysis module 212 obtains, from the ID 501 of the attribute management information 221, identification information assigned to an attribute included in each system information. The relevance analysis module 212 refers to the member 602 of the attribute group management information 222 and stores a record in which the identification information of the attribute included in the target system information and the identification information of the attribute included in the sub-target system information are set. Search for.

次に、関連性解析モジュール212は、検索結果に基づいて、ターゲットシステム情報及びサブターゲットシステム情報に関連するレコードが属性グループ管理情報222に存在するか否かを判定する(ステップS1103)。   Next, the relevance analysis module 212 determines whether or not a record related to the target system information and the sub-target system information exists in the attribute group management information 222 based on the search result (step S1103).

ターゲットシステム情報及びサブターゲットシステム情報に関連するレコードが属性グループ管理情報222に存在しないと判定された場合、関連性解析モジュール212は、ステップS1105に進む。   If it is determined that the record related to the target system information and the sub-target system information does not exist in the attribute group management information 222, the process proceeds to step S1105.

ターゲットシステム情報及びサブターゲットシステム情報に関連するレコードが属性グループ管理情報222に存在すると判定された場合、関連性解析モジュール212は、関連性管理情報223にレコードを追加する(ステップS1104)。具体的には、以下のような処理が実行される。   If it is determined that a record related to the target system information and the sub-target system information exists in the attribute group management information 222, the relationship analysis module 212 adds a record to the relationship management information 223 (step S1104). Specifically, the following processing is executed.

関連性解析モジュール212は、関連性管理情報223にレコードを追加し、追加されたレコードの第1データソース名701にターゲットシステム情報の識別情報を設定し、また、追加されたレコードの第2データソース名702にサブターゲットシステム情報の識別情報を設定する。さらに、関連性解析モジュール212は、属性グループ管理情報222から検索されたレコードのメンバ602に設定された値に基づいて、追加されたレコードのアクセスパス703に値を設定する。   The relevance analysis module 212 adds a record to the relevance management information 223, sets the identification information of the target system information in the first data source name 701 of the added record, and sets the second data of the added record. The identification information of the sub target system information is set in the source name 702. Further, the relevance analysis module 212 sets a value in the access path 703 of the added record based on the value set in the member 602 of the record retrieved from the attribute group management information 222.

ここで、ステップS1104の処理の具体例を説明する。ここでは、ターゲットシステム情報がセンサ情報300であり、また、サブターゲットシステム情報が辞書情報310であるものとする。   Here, a specific example of the process of step S1104 will be described. Here, it is assumed that the target system information is the sensor information 300 and the sub target system information is the dictionary information 310.

センサ情報300に含まれる属性の識別情報は、C1、C2、C3、C4、C5であり、また、辞書情報310に含まれる属性の識別情報は、C6、C7である。この場合、属性グループ管理情報222には、C3及びC6が設定されたレコードが含まれる。したがって、関連性解析モジュール212は、第1データソース名701に「センサ情報」、第2データソース名702に「辞書情報」、並びに、アクセスパス703にC3及びC6を関連付けたパスを設定したレコードを関連性管理情報223に追加する。   The identification information of the attributes included in the sensor information 300 is C1, C2, C3, C4, and C5, and the identification information of the attributes included in the dictionary information 310 is C6 and C7. In this case, the attribute group management information 222 includes a record in which C3 and C6 are set. Therefore, the relevance analysis module 212 sets a record in which “sensor information” is set as the first data source name 701, “dictionary information” is set as the second data source name 702, and a path in which C3 and C6 are associated with the access path 703. Is added to the relevance management information 223.

データ管理ノード100は、前述の処理によって追加されたレコードに基づいて、センサ情報300のC3に対応する属性と、辞書情報310のC6に対応する属性との値が一致するレコードを結合することによって二つのシステム情報を結合できる。以上がステップS1104の処理の説明である。   The data management node 100 combines the records in which the attribute corresponding to C3 of the sensor information 300 and the attribute corresponding to C6 of the dictionary information 310 match based on the record added by the above-described processing. Two system information can be combined. The above is the description of the process in step S1104.

ステップS1103の判定結果がNOの場合、又は、ステップS1104の処理が完了した後、関連性解析モジュール212は、データストア224に登録された全てのシステム情報について処理が完了したか否かを判定する(ステップS1105)。   If the decision result in the step S1103 is NO, or after the process in the step S1104 is completed, the relevance analysis module 212 decides whether or not the process has been completed for all the system information registered in the data store 224. (Step S1105).

データストア224に登録された全てのシステム情報について処理が完了していないと判定された場合、関連性解析モジュール212は、ステップS1101に戻り、同様の処理を実行する。   If it is determined that the processing has not been completed for all the system information registered in the data store 224, the relevance analysis module 212 returns to step S1101 and executes the same processing.

データストア224に登録された全てのシステム情報について処理が完了したと判定された場合、関連性解析モジュール212は、踏み台一致パスに対応するレコードの追加処理を開始する。   If it is determined that the processing has been completed for all the system information registered in the data store 224, the relevance analysis module 212 starts the processing for adding the record corresponding to the springboard matching path.

まず、関連性解析モジュール212は、関連性管理情報223に新たに追加されたレコードの中からターゲットレコードを一つ選択する(ステップS1106)。例えば、上のレコードから順に選択する方法が考えられる。   First, the relationship analysis module 212 selects one target record from records newly added to the relationship management information 223 (step S1106). For example, a method of selecting the records in order from the upper record can be considered.

関連性解析モジュール212は、ターゲットレコードに設定されるシステム情報のいずれか一方を経由してアクセス可能なシステム情報を特定する(ステップS1107)。具体的には、以下のような処理が実行される。   The relevance analysis module 212 specifies system information that can be accessed via one of the system information set in the target record (step S1107). Specifically, the following processing is executed.

関連性解析モジュール212は、ターゲットレコードの第1データソース名701及び第2データソース名702に設定されたシステム情報の識別情報を取得し、一つのシステム情報を起点システム情報に設定し、もう一方のシステム情報を中継システム情報に設定する。   The relevance analysis module 212 acquires the identification information of the system information set in the first data source name 701 and the second data source name 702 of the target record, sets one system information as the starting system information, and sets the other system information as the starting system information. Set the system information of the relay system information.

関連性解析モジュール212は、第1データソース名701及び第2データソース名702のいずれかに中継システム情報の識別情報が格納されるレコードを検索する。関連性解析モジュール212は、起点システム情報及び中継システム情報を入れ替えて同様の処理を実行する。ただし、ターゲットレコードのアクセスパス703に設定されるパスの種類と同一種類のパスが設定されたレコードのみが検索対象となる。検索されたレコードの中継システム情報とは異なるシステム情報が踏み台システム情報となる。   The relevance analysis module 212 searches for a record in which the identification information of the relay system information is stored in one of the first data source name 701 and the second data source name 702. The relevance analysis module 212 performs the same processing by exchanging the origin system information and the relay system information. However, only records in which a path of the same type as the type of the path set in the access path 703 of the target record is set as a search target. System information that is different from the relay system information of the retrieved record is used as the platform system information.

前述の処理によって踏み台一致パスを特定することができる。すなわち、中継システム情報を介して、起点システム情報及び踏み台システム情報を関連付けたパスが踏み台一致パスとなる。なお、該当するレコードが存在しない場合、関連性解析モジュール212は、ステップS1108を実行せずに、ステップS1109に進む。以上がステップS1107の処理の説明である。   By the above-described processing, the pedestal matching path can be specified. In other words, a path in which the starting point system information and the ladder system information are associated with each other via the relay system information is a ladder platform matching path. If there is no corresponding record, the relevance analysis module 212 proceeds to step S1109 without executing step S1108. The above is the description of the process in step S1107.

関連性解析モジュール212は、ステップS1107の処理結果に基づいて、関連性管理情報223に踏み台一致パスのレコードを追加する(ステップS1108)。   The relevance analysis module 212 adds a step ladder matching path record to the relevance management information 223 based on the processing result of step S1107 (step S1108).

具体的には、関連性解析モジュール212は、特定された踏み台一致パスの数だけエントリを追加する。関連性解析モジュール212は、追加された各エントリの第1データソース名701及び第2データソース名702に、起点システム情報及び踏み台システム情報の識別情報を設定する。また、関連性解析モジュール212は、追加された各エントリのアクセスパス703に踏み台一致パスを設定する。   Specifically, the relevance analysis module 212 adds entries as many as the number of the identified ladder matching paths. The association analysis module 212 sets the identification information of the starting system information and the stepping system information in the first data source name 701 and the second data source name 702 of each of the added entries. Further, the association analysis module 212 sets a springboard matching path in the access path 703 of each of the added entries.

なお、踏み台一致パスは、ターゲットレコードのアクセスパス703に含まれる中継システム情報の属性と、検索されたレコードのアクセスパス703に含まれる中継システム情報の属性とをセミコロンで接続することによって生成できる。   Note that the springboard matching path can be generated by connecting the attribute of the relay system information included in the access path 703 of the target record and the attribute of the relay system information included in the access path 703 of the searched record with a semicolon.

次に、関連性解析モジュール212は、関連性管理情報223に新たに追加された全てのレコードについて処理が完了したか否かを判定する(ステップS1109)。   Next, the relationship analysis module 212 determines whether or not the processing has been completed for all records newly added to the relationship management information 223 (step S1109).

関連性管理情報223に新たに追加された全てのレコードについて処理が完了していないと判定された場合、関連性解析モジュール212は、ステップS1106に戻り、同様の処理を実行する。   If it is determined that the processing has not been completed for all records newly added to the relevance management information 223, the relevance analysis module 212 returns to step S1106 and executes the same processing.

関連性管理情報223に新たに追加された全てのレコードについて処理が完了したと判定された場合、関連性解析モジュール212は、処理の完了を示す応答をデータ管理モジュール211に出力し、処理を終了する。   When it is determined that the processing has been completed for all records newly added to the relevance management information 223, the relevance analysis module 212 outputs a response indicating the completion of the processing to the data management module 211, and ends the processing. I do.

ステップS1107の処理の実行後、関連性解析モジュール212は、踏み台システム情報を新たな中継システム情報に設定し、同様の処理を実行してもよい。具体的には、以下のように処理を変更すればよい。   After performing the processing in step S1107, the relevance analysis module 212 may set the stepping system information to new relay system information and execute the same processing. Specifically, the processing may be changed as follows.

関連性解析モジュール212は、第1データソース名701及び第2データソース名702に起点システム情報及び踏み台システム情報の識別情報が設定され、かつ、アクセスパス703に中継システム情報を経由する踏み台一致パスが設定された一時レコードを生成する。また、関連性解析モジュール212は、踏み台システム情報を新たな中継システム情報に設定し、ステップS1107と同一の処理を実行する。   The relevance analysis module 212 sets the first data source name 701 and the second data source name 702 to the identification information of the starting system information and the ladder system information, and sets the access path 703 to the pedestal matching path via the relay system information. Generates a temporary record with. Further, the association analysis module 212 sets the stepping system information as new relay system information, and executes the same processing as step S1107.

該当するレコードが存在しない場合、関連性解析モジュール212は、ステップS1108に進み、一時レコードをそのまま関連性管理情報223に追加する。該当するレコードが存在する場合、関連性解析モジュール212は、検索されたレコードの数だけ一時レコードをコピーし、各レコードに検索されたレコードのシステム情報の識別情報を新たな踏み台システム情報の識別情報として登録する。また、関連性解析モジュール212は、検索されたレコードのアクセスパス703と、一時レコードのアクセスパス703とを接続することによって、一時レコードのアクセスパス703を更新する。   If there is no corresponding record, the relationship analysis module 212 proceeds to step S1108, and adds the temporary record to the relationship management information 223 as it is. If the corresponding record exists, the relevance analysis module 212 copies the temporary records by the number of the searched records, and replaces the identification information of the system information of the searched record in each record with the identification information of the new platform system information. Register as Further, the relevance analysis module 212 updates the access path 703 of the temporary record by connecting the access path 703 of the searched record and the access path 703 of the temporary record.

以後、同様のループ処理が繰り返し実行される。全てのループ処理が完了したあと、関連性解析モジュール212は、関連性管理情報223に生成された一時レコードを追加する。   Thereafter, the same loop processing is repeatedly executed. After all the loop processing is completed, the relationship analysis module 212 adds the generated temporary record to the relationship management information 223.

前述した処理によって、複数のシステム情報を中継する踏み台一致パスを設定できる。なお、中継するシステム情報の数に上限を設けてもよい。   By the above-described processing, a ladder matching path for relaying a plurality of pieces of system information can be set. Note that an upper limit may be set for the number of relayed system information.

なお、ターゲットシステム情報と踏み台システム情報との間のパスが複数存在する場合、全てのパスをアクセスパス703に設定してもよいし、また、最短となるパスをアクセスパス703に設定してもよい。   When there are a plurality of paths between the target system information and the ladder system information, all the paths may be set as the access path 703, or the shortest path may be set as the access path 703. Good.

ここで、具体例を用いてステップS1106からステップS1109までの処理を説明する。以下の説明では、センサ情報300がターゲットシステム情報であり、関連性管理情報223には二番目のレコードのみが登録されているものとする。この場合、ステップS1101からステップS1105までの処理によって、一番目のレコード及び三番目のレコードが関連性管理情報223に登録される。   Here, the processing from step S1106 to step S1109 will be described using a specific example. In the following description, it is assumed that the sensor information 300 is target system information, and only the second record is registered in the relevance management information 223. In this case, the first record and the third record are registered in the relevance management information 223 by the processing from step S1101 to step S1105.

ステップS1106において、関連性解析モジュール212は、一番目のレコードをターゲットレコードに選択する。   In step S1106, the relevance analysis module 212 selects the first record as the target record.

ステップS1107において、関連性解析モジュール212は、センサ情報300の識別情報及び辞書情報310のそれぞれの識別情報をキーとしてレコードを検索する。辞書情報310の識別情報をキーとした場合、二番目のレコードが検索される。したがって、関連性解析モジュール212は、設定情報320を踏み台システム情報として特定する。   In step S1107, the association analysis module 212 searches for a record using the identification information of the sensor information 300 and the identification information of the dictionary information 310 as keys. When the identification information of the dictionary information 310 is used as a key, a second record is searched. Therefore, the association analysis module 212 specifies the setting information 320 as the platform system information.

なお、ターゲットレコードは属性一致パスに対応するレコードであるため、属性群一致パスに対応する三番目のレコードは検索対象にはならない。   Since the target record is a record corresponding to the attribute matching path, the third record corresponding to the attribute group matching path is not a search target.

ステップS1108において、関連性解析モジュール212は、一番目のレコードのアクセスパス703に含まれる辞書情報310の属性C6と、二番目のレコードのアクセスパス703に含まれる辞書情報310の属性C7とをセミコロンで接続することによって踏み台一致パスを生成する。関連性解析モジュール212は、レコードを追加し、追加されたレコードの第1データソース名701にセンサ情報300の識別情報を設定し、追加されたレコードの第2データソース名702に設定情報320の識別情報を設定する。さらに、関連性解析モジュール212は、追加されたレコードのアクセスパス703に生成された踏み台一致パスを設定する。   In step S1108, the association analysis module 212 converts the attribute C6 of the dictionary information 310 included in the access path 703 of the first record and the attribute C7 of the dictionary information 310 included in the access path 703 of the second record into a semicolon. A stepboard matching path is generated by connecting with. The relevance analysis module 212 adds a record, sets the identification information of the sensor information 300 to the first data source name 701 of the added record, and sets the identification information of the setting information 320 to the second data source name 702 of the added record. Set identification information. Further, the association analysis module 212 sets the generated springboard matching path in the access path 703 of the added record.

ステップS1109において、関連性解析モジュール212は、処理していない踏み台システム情報が存在すると判定し、ステップS1106に戻る。三番目のレコードをターゲットレコードに設定した場合、条件を満たすレコードは存在しない。以上の処理によって、関連性管理情報223は、図7に示すような状態になる。   In step S1109, the relevance analysis module 212 determines that there is step platform system information that has not been processed, and returns to step S1106. When the third record is set as the target record, no record satisfies the condition. By the above processing, the relevance management information 223 is in a state as shown in FIG.

図12は、実施例1のデータ管理モジュール211がクエリを受け付けた場合に実行する処理の一例を説明するフローチャートである。   FIG. 12 is a flowchart illustrating an example of a process performed when the data management module 211 according to the first embodiment receives a query.

データ管理モジュール211は、任意のシステムからクエリを受け付ける(ステップS1201)。   The data management module 211 receives a query from any system (step S1201).

データ管理モジュール211は、変換モジュール213にクエリ展開処理の実行を指示する(ステップS1202)。クエリ展開処理の詳細は、図13を用いて説明する。   The data management module 211 instructs the conversion module 213 to execute the query expansion processing (Step S1202). Details of the query expansion process will be described with reference to FIG.

データ管理モジュール211は、変換モジュール213から処理の完了を示す応答を受け付けた場合、変換されたクエリを実行する(ステップS1203)。クエリの実行方法は、公知の技術であるため説明を省略する。   When receiving the response indicating the completion of the processing from the conversion module 213, the data management module 211 executes the converted query (step S1203). The method of executing the query is a known technique, and thus the description is omitted.

データ管理モジュール211は、クエリの実行結果を出力データとして任意のシステムに送信する(ステップS1204)。   The data management module 211 transmits the execution result of the query as output data to any system (step S1204).

図13は、実施例1の変換モジュール213が実行するクエリ展開処理の一例を説明するフローチャートである。図14は、実施例1のデータ管理モジュール211がクエリを実行することによって出力される出力データの一例を示す図である。   FIG. 13 is a flowchart illustrating an example of a query expansion process performed by the conversion module 213 according to the first embodiment. FIG. 14 is a diagram illustrating an example of output data output when the data management module 211 of the first embodiment executes a query.

変換モジュール213は、クエリを解析し、参照が必要なシステム情報の組合せを特定する(ステップS1301)。なお、参照が必要なシステム情報の組合せが存在しない場合、変換モジュール213は、データ管理モジュール211に処理の完了を示す応答を出力し、処理を終了する。この場合、クエリは変換されない。   The conversion module 213 analyzes the query and specifies a combination of system information that needs to be referred to (Step S1301). If there is no combination of system information that needs to be referred to, the conversion module 213 outputs a response indicating completion of the processing to the data management module 211, and ends the processing. In this case, the query is not transformed.

変換モジュール213は、参照が必要なシステム情報の組合せの中からターゲット組合せを選択する(ステップS1302)。   The conversion module 213 selects a target combination from combinations of system information that need to be referred to (step S1302).

変換モジュール213は、関連性管理情報223を参照し、ターゲット組合せに対応するシステム情報間の参照が可能か否かを判定する(ステップS1303)。   The conversion module 213 refers to the relevance management information 223 and determines whether or not reference between the system information corresponding to the target combination is possible (step S1303).

具体的には、変換モジュール213は、第1データソース名701及び第2データソース名702に設定された識別情報の組合せがターゲット組合せに一致するレコードが存在するか否かを判定する。前述の条件を満たすレコードが存在する場合、変換モジュール213は、ターゲット組合せに対応するシステム情報間の参照が可能であると判定する。   Specifically, the conversion module 213 determines whether there is a record in which the combination of the identification information set in the first data source name 701 and the second data source name 702 matches the target combination. When there is a record that satisfies the above-described condition, the conversion module 213 determines that it is possible to refer to the system information corresponding to the target combination.

ターゲット組合せに対応するシステム情報間の参照が可能でないと判定された場合、変換モジュール213は、エラーを示す応答をデータ管理モジュール211に出力する(ステップS1304)。その後、変換モジュール213は処理を終了する。このとき、変換されたクエリは破棄される。データ管理モジュール211は、エラーを示す応答を受け取った場合、クエリの送信元にエラーメッセージを送信する。   If it is determined that it is not possible to refer to the system information corresponding to the target combination, the conversion module 213 outputs a response indicating an error to the data management module 211 (Step S1304). After that, the conversion module 213 ends the processing. At this time, the converted query is discarded. When receiving the response indicating the error, the data management module 211 transmits an error message to the transmission source of the query.

ターゲット組合せに対応するシステム情報間の参照が可能であると判定された場合、変換モジュール213は、特定されたパスが踏み台一致パスであるか否かを判定する(ステップS1305)。   If it is determined that the system information corresponding to the target combination can be referred to, the conversion module 213 determines whether the specified path is a step-coincidence path (step S1305).

具体的には、変換モジュール213は、ステップS1303において検索されたレコードのアクセスパス703を参照して、特定されたパスが踏み台一致パスであるか否かを判定する。例えば、変換モジュール213は、アクセスパス703の値にセミコロンが含まれるか否かを判定する。   Specifically, the conversion module 213 refers to the access path 703 of the record searched in step S1303, and determines whether the specified path is a springboard-matching path. For example, the conversion module 213 determines whether the value of the access path 703 includes a semicolon.

特定されたパスが踏み台一致パスではないと判定された場合、変換モジュール213は、受け付けたクエリを、ターゲット組合せに直接参照するための外部キーが設定されたクエリに変換する(ステップS1306)。その後、変換モジュール213は、ステップS1308に進む。例えば、外部キーに関するON句又はWHERE句等が追加されたクエリに変換される。   When it is determined that the specified path is not the platform matching path, the conversion module 213 converts the received query into a query in which a foreign key for directly referring to the target combination is set (step S1306). Thereafter, the conversion module 213 proceeds to step S1308. For example, it is converted into a query to which an ON clause or a WHERE clause relating to a foreign key has been added.

具体的には、変換モジュール213は、特定されたパスに基づいて二つのシステム情報に含まれる属性の識別情報を特定し、特定された属性の識別情報を外部キーとするクエリを生成する。   Specifically, the conversion module 213 specifies the identification information of the attribute included in the two pieces of system information based on the specified path, and generates a query using the identification information of the specified attribute as a foreign key.

特定されたパスが踏み台一致パスであると判定された場合、変換モジュール213は、受け付けたクエリを、中継システム情報を介してターゲット組合せに参照するための外部キーが設定されたクエリに変換する(ステップS1307)。その後、変換モジュール213は、ステップS1308に進む。具体的には、以下のような処理が実行される。   When it is determined that the specified path is a springboard-matching path, the conversion module 213 converts the received query into a query in which a foreign key is set to refer to the target combination via the relay system information ( Step S1307). Thereafter, the conversion module 213 proceeds to step S1308. Specifically, the following processing is executed.

変換モジュール213は、特定されたパスに基づいて、ターゲット組合せに含まれる属性の識別情報、及び、中継システム情報に含まれる属性の識別情報を特定する。また、変換モジュール213は、中継システム情報に含まれる属性の識別情報に基づいて属性管理情報221を参照し、中継システム情報の識別情報を特定する。   The conversion module 213 specifies the identification information of the attribute included in the target combination and the identification information of the attribute included in the relay system information based on the specified path. The conversion module 213 refers to the attribute management information 221 based on the attribute identification information included in the relay system information, and specifies the identification information of the relay system information.

変換モジュール213は、一つのシステム情報と中継システム情報との間の参照を行う第1クエリ、及び他のシステム情報と中継システム情報との間の参照を行う2クエリを結合したクエリを生成する。   The conversion module 213 generates a query that combines a first query that makes a reference between one system information and the relay system information and a two query that makes a reference between another system information and the relay system information.

なお、第1クエリは、一つのシステム情報及び中継システム情報のそれぞれに含まれる属性の識別情報を外部キーとして含み、第2クエリは、他のシステム情報及び中継システム情報のそれぞれに含まれる属性の識別情報を外部キーとして含む。以上がステップS1307の処理の説明である。   The first query includes, as a foreign key, the identification information of the attribute included in each of the one system information and the relay system information, and the second query includes the identification information of the attribute included in each of the other system information and the relay system information. Contains identification information as a foreign key. The above is the description of the processing in step S1307.

ステップS1308では、変換モジュール213は、特定された全ての組合せについて処理が完了したか否かを判定する(ステップS1308)。   In step S1308, the conversion module 213 determines whether the processing has been completed for all the specified combinations (step S1308).

特定された全ての組合せについて処理が完了していないと判定された場合、変換モジュール213は、ステップS1302に戻り、同様の処理を実行する。   If it is determined that the processing has not been completed for all the specified combinations, the conversion module 213 returns to step S1302 and executes the same processing.

特定された全ての組合せについて処理が完了したと判定された場合、変換モジュール213は、変換されたクエリを含む応答をデータ管理モジュール211に出力し(ステップS1309)、処理を終了する。   If it is determined that the processing has been completed for all the specified combinations, the conversion module 213 outputs a response including the converted query to the data management module 211 (step S1309), and ends the processing.

ここで、具体例を用いてクエリ展開処理を説明する。以下の説明では、Join(センサ情報、設定情報)を含むクエリを受け付けたものとする。また、関連性管理情報223は、図7に示す状態であるものとする。   Here, the query expansion processing will be described using a specific example. In the following description, it is assumed that a query including Join (sensor information, setting information) has been received. It is assumed that the relevance management information 223 is in the state shown in FIG.

ステップS1301において、変換モジュール213は、センサ情報300及び設定情報320の組合せを特定する。また、ステップS1302において、変換モジュール213は、センサ情報300及び設定情報320の組合せをターゲット組合せとして選択する。   In step S1301, the conversion module 213 specifies a combination of the sensor information 300 and the setting information 320. In step S1302, the conversion module 213 selects a combination of the sensor information 300 and the setting information 320 as a target combination.

ステップS1303において、変換モジュール213は、第1データソース名701及び第2データソース名702に設定された識別情報の組合せがターゲット組合せに一致するレコードを検索する。ここでは、四番目のレコードが検索される。したがって、ステップS1303の判定結果はYESとなる。また、四番目のレコードのアクセスパス703には、踏み台一致パスが設定されているため、ステップS1305の判定結果はYESとなる。   In step S1303, the conversion module 213 searches for a record in which the combination of the identification information set in the first data source name 701 and the second data source name 702 matches the target combination. Here, the fourth record is searched. Therefore, the determination result of step S1303 is YES. In addition, the access path 703 of the fourth record is set to the step-coincidence path, so that the determination result in step S1305 is YES.

ステップS1307では、変換モジュール213は、踏み台システム情報の属性の識別情報に基づいて属性管理情報221を参照することによって、辞書情報310が踏み台システム情報であることを特定する。そこで、Join(センサ情報、設定情報)をJoin(Join(センサ情報、辞書情報)、Join(辞書情報、設定情報))に変換する。このとき、Join(センサ情報、辞書情報)にはC3が外部キーとして指定され、Join(辞書情報、設定情報)にはC7が外部キーとして指定される。   In step S1307, the conversion module 213 specifies that the dictionary information 310 is the platform system information by referring to the attribute management information 221 based on the attribute identification information of the platform system information. Therefore, Join (sensor information, setting information) is converted into Join (Join (sensor information, dictionary information), Join (dictionary information, setting information)). At this time, C3 is specified as an external key in Join (sensor information, dictionary information), and C7 is specified as an external key in Join (dictionary information, setting information).

データ管理モジュール211は、前述のように変換されたクエリを実行することによって、図14に示すような出力データを、クエリを送信したシステムに送信する。   The data management module 211 transmits the output data as illustrated in FIG. 14 to the system that transmitted the query by executing the query converted as described above.

前述したように、ユーザが辞書情報310を知らずに入力したクエリであっても、自動的にシステム情報間の関連性を補完したクエリに変換される。これによって、Data Lake方式のシステムにおける検索処理が容易になる。   As described above, even a query input by the user without knowing the dictionary information 310 is automatically converted to a query that complements the relevance between system information. This facilitates search processing in the Data Lake system.

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。   Note that the present invention is not limited to the above-described embodiment, and includes various modifications. Further, for example, in the above-described embodiment, the configuration has been described in detail for easy understanding of the present invention, and the present invention is not necessarily limited to the configuration including all the described configurations. Further, a part of the configuration of each embodiment can be added, deleted, or replaced with another configuration.

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。   In addition, each of the above-described configurations, functions, processing units, processing means, and the like may be partially or entirely realized by hardware, for example, by designing an integrated circuit. The present invention can also be realized by software program codes that realize the functions of the embodiments. In this case, a storage medium storing the program code is provided to a computer, and a processor included in the computer reads the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the function of the above-described embodiment, and the program code itself and the storage medium storing the program code constitute the present invention. As a storage medium for supplying such a program code, for example, a flexible disk, a CD-ROM, a DVD-ROM, a hard disk, an SSD (Solid State Drive), an optical disk, a magneto-optical disk, a CD-R, a magnetic tape, A non-volatile memory card, ROM, or the like is used.

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java等の広範囲のプログラム又はスクリプト言語で実装できる。   Further, the program code for realizing the functions described in the present embodiment can be implemented by a wide range of programs or script languages such as assembler, C / C ++, perl, Shell, PHP, and Java.

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。   Further, by distributing the program code of the software for realizing the functions of the embodiment via a network, the program code is stored in a storage means such as a hard disk or a memory of a computer or a storage medium such as a CD-RW or a CD-R. Alternatively, a processor included in a computer may read and execute a program code stored in the storage unit or the storage medium.

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。   In the above-described embodiment, the control lines and the information lines are considered to be necessary for the description, and do not necessarily indicate all the control lines and the information lines on the product. All components may be interconnected.

Claims (10)

データストアを構成する少なくとも一つの計算機のデータ管理方法であって、
前記少なくとも一つの計算機は、プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを有し、
前記データストアには、少なくとも一つの属性から構成されるデータブロックを複数含むシステム情報が、前記システム情報のデータ構造に依存しない形式で格納され、
前記メモリは、関連性を有する二つのシステム情報の識別情報、及び前記二つのシステム情報の関連付ける属性の対応関係によって定義されるアクセスパスを管理するレコードを含む関連性管理情報を格納し、
前記データ管理方法は、
前記プロセッサが、新規システム情報の登録要求を受け付ける第1のステップと、
前記プロセッサが、前記新規システム情報を前記データストアに格納する第2のステップと、
前記プロセッサが、前記データストアに格納されるシステム情報の中から、前記新規システム情報と関連性を有する第1のシステム情報を特定する第3のステップと、
前記プロセッサが、前記新規システム情報及び前記第1のシステム情報の識別情報と、前記新規システム情報及び前記第1のシステム情報を関連付ける属性の対応関係によって定義される第1のアクセスパスとを含むレコードを前記関連性管理情報に登録する第4のステップと、
前記プロセッサが、前記データストアに対するクエリを受け付けた場合、前記関連性管理情報に基づいて、前記クエリを、前記システム情報間の参照を行うための情報が付加されたクエリに変換する第5のステップと、
前記プロセッサが、前記変換されたクエリを実行する第6のステップと、を含むことを特徴とするデータ管理方法。
A data management method for at least one computer constituting a data store,
The at least one computer has a processor, a memory connected to the processor, and a network interface connected to the processor,
In the data store, system information including a plurality of data blocks including at least one attribute is stored in a format independent of a data structure of the system information,
The memory stores identification information of two system information having a relationship, and relationship management information including a record for managing an access path defined by a correspondence relationship between attributes to be associated with the two system information,
The data management method includes:
A first step in which the processor receives a registration request for new system information;
A second step in which the processor stores the new system information in the data store;
A third step in which the processor specifies, from among the system information stored in the data store, first system information that is relevant to the new system information;
A record including identification information of the new system information and the first system information, and a first access path defined by a correspondence relationship of an attribute for associating the new system information with the first system information; A fourth step of registering in the relevance management information;
A fifth step of, when the processor receives the query for the data store, converting the query into a query to which information for performing a reference between the system information is added based on the relevance management information; When,
A sixth step in which the processor executes the converted query.
請求項1に記載のデータ管理方法であって、
前記第3のステップは、
前記プロセッサが、前記新規システム情報に含まれる属性と、前記第1のシステム情報に含まれる属性とを比較することによって、同一視可能な属性を含むか否かを判定する第7のステップと、
前記プロセッサが、前記同一視可能な属性を含むと判定された場合、前記第1のシステム情報を前記新規システム情報と関連性を有するシステム情報として特定する第8のステップと、
前記プロセッサが、前記同一視可能な属性に基づいて前記第1のアクセスパスを生成する第9のステップと、を含むことを特徴とするデータ管理方法。
The data management method according to claim 1, wherein
The third step is
A seventh step in which the processor compares the attribute included in the new system information with the attribute included in the first system information to determine whether or not the attribute includes an attribute that can be identified;
An eighth step of, when the processor is determined to include the attribute that can be identified, identifying the first system information as system information having relevance to the new system information;
A ninth step in which the processor generates the first access path based on the attribute that can be identified.
請求項2に記載のデータ管理方法であって、
前記メモリは、前記データストアに格納される前記システム情報のデータブロックに含まれる属性を管理する属性管理情報を保持し、
前記第2のステップは、
前記プロセッサが、前記新規システム情報のデータブロックに含まれる属性を特定するステップと、
前記新規システム情報のデータブロックに含まれる属性を前記属性管理情報に設定するステップと、を含み、
前記第7のステップは、前記プロセッサが、前記属性管理情報に基づいて、前記新規システム情報に含まれる属性及び前記第1のシステム情報に含まれる属性を比較するステップを含むことを特徴とするデータ管理方法。
The data management method according to claim 2, wherein
The memory holds attribute management information for managing attributes included in a data block of the system information stored in the data store,
The second step is
Wherein the processor specifies an attribute included in a data block of the new system information;
Setting an attribute included in a data block of the new system information in the attribute management information,
The seventh step includes a step in which the processor compares the attribute included in the new system information and the attribute included in the first system information, based on the attribute management information. Management method.
請求項2に記載のデータ管理方法であって、
前記第3のステップは、
前記プロセッサが、前記関連性管理情報を参照して、前記第1のシステム情報と関連性を有する第2のシステム情報を特定するステップと、
前記第1のシステム情報及び前記第2のシステム情報を関連付ける属性の対応関係によって定義される第2のアクセスパスを取得するステップと、
前記プロセッサが、前記第1のアクセスパス及び前記第2のアクセスパスに基づいて、前記第1のシステム情報を介した前記新規システム情報と前記第2のシステム情報を関連付ける属性の対応関係によって定義される第3のアクセスパスを生成するステップと、
前記プロセッサが、前記新規システム情報及び前記第2のシステム情報の識別情報と、前記第3のアクセスパスとを含むレコードを前記関連性管理情報に設定するステップと、を含むことを特徴とするデータ管理方法。
The data management method according to claim 2, wherein
The third step is
The processor referring to the association management information to identify second system information having an association with the first system information;
Acquiring a second access path defined by a correspondence relationship of an attribute that associates the first system information and the second system information;
The processor is defined by a correspondence relationship of an attribute that associates the new system information via the first system information with the second system information based on the first access path and the second access path. Generating a third access path,
The processor setting, in the relevance management information, a record including identification information of the new system information and the second system information, and a record including the third access path. Management method.
請求項4に記載のデータ管理方法であって、
前記第5のステップは、
前記プロセッサが、関連性を有するシステム情報の組合せを特定するステップと、
前記プロセッサが、前記関連性管理情報を参照して、前記特定されたシステム情報の組合せに対応するレコードを検索するステップと、
前記プロセッサが、前記検索されたレコードに含まれるアクセスパスに基づいて、前記クエリを変換するステップと、を含むことを特徴とするデータ管理方法。
The data management method according to claim 4, wherein
The fifth step is:
The processor identifying combinations of relevant system information;
The processor refers to the association management information, and searches for a record corresponding to the specified combination of system information;
Converting the query based on an access path included in the searched record by the processor.
データストアを構成する計算機であって、
プロセッサ、前記プロセッサに接続されるメモリ、及び前記プロセッサに接続されるネットワークインタフェースを備え、
前記データストアには、少なくとも一つの属性から構成されるデータブロックを複数含むシステム情報が、前記システム情報のデータ構造に依存しない形式で格納され、
前記メモリは、関連性を有する二つのシステム情報の識別情報、及び前記二つのシステム情報の関連付ける属性の対応関係によって定義されるアクセスパスを管理するレコードを含む関連性管理情報を格納し、
前記データストアを管理するデータ管理部と、
前記データストアに格納されるシステム情報間の関連性を解析することによって、前記関連性管理情報を更新する関連性解析部と、
前記関連性管理情報に基づいて、前記データ管理部が受け付けたクエリを、前記システム情報間の参照を行うための情報が付加されたクエリに変換する変換部と、を有し、
前記データ管理部は、
新規システム情報の登録要求を受け付けた場合、前記データストアに前記新規システム情報を格納し、前記関連性解析部に前記関連性管理情報の更新を指示し、
前記データストアに対するクエリを受け付けた場合、前記変換部に前記クエリの変換を指示し、前記変換部によって変換されたクエリを実行し、
前記関連性解析部は、
前記データストアに格納されるシステム情報の中から、前記新規システム情報と関連性を有する第1のシステム情報を特定し、
前記新規システム情報及び前記第1のシステム情報の識別情報と、前記新規システム情報及び前記第1のシステム情報を関連付ける属性の対応関係によって定義される第1のアクセスパスとを含むレコードを前記関連性管理情報に登録することを特徴とする計算機。
A computer constituting a data store,
A processor, a memory connected to the processor, and a network interface connected to the processor,
In the data store, system information including a plurality of data blocks including at least one attribute is stored in a format independent of a data structure of the system information,
The memory stores identification information of two pieces of system information having relevance, and relevance management information including a record for managing an access path defined by a correspondence between attributes to be associated with the two pieces of system information,
A data management unit that manages the data store;
By analyzing the association between the system information stored in the data store, an association analysis unit that updates the association management information,
A conversion unit that converts the query received by the data management unit into a query to which information for performing a reference between the system information is added, based on the association management information,
The data management unit includes:
If a registration request for new system information is received, the new system information is stored in the data store, and the relevance analysis unit is instructed to update the relevance management information,
When receiving a query for the data store, instruct the conversion unit to convert the query, execute the query converted by the conversion unit,
The relevance analyzer,
From the system information stored in the data store, first system information having a relationship with the new system information is specified,
A record including the identification information of the new system information and the first system information and a first access path defined by a correspondence relationship of an attribute for associating the new system information and the first system information is stored in the association table. A computer characterized by registering in management information.
請求項6に記載の計算機であって、
前記関連性解析部は、
前記新規システム情報に含まれる属性と、前記第1のシステム情報に含まれる属性とを比較することによって、同一視可能な属性を含むか否かを判定し、
前記同一視可能な属性を含むと判定された場合、前記第1のシステム情報を前記新規システム情報と関連性を有するシステム情報として特定し、
前記同一視可能な属性に基づいて前記第1のアクセスパスを生成することを特徴とする計算機。
The computer according to claim 6, wherein
The relevance analyzer,
By comparing an attribute included in the new system information with an attribute included in the first system information, it is determined whether or not an attribute that can be identified is included,
If it is determined to include the attribute that can be identified, the first system information is specified as system information having a relationship with the new system information,
A computer that generates the first access path based on the attribute that can be identified.
請求項7に記載の計算機であって、
前記メモリは、前記データストアに格納される前記システム情報のデータブロックに含まれる属性を管理する属性管理情報を保持し、
前記関連性解析部は、
前記新規システム情報のデータブロックに含まれる属性を特定し、
前記新規システム情報のデータブロックに含まれる属性を前記属性管理情報に設定し、
前記属性管理情報から取得された前記新規システム情報に含まれる属性及び前記第1のシステム情報に含まれる属性を比較することを特徴とする計算機。
The computer according to claim 7, wherein
The memory holds attribute management information for managing attributes included in a data block of the system information stored in the data store,
The relevance analyzer,
Identify the attributes included in the data block of the new system information,
Setting an attribute included in the data block of the new system information in the attribute management information,
A computer that compares an attribute included in the new system information acquired from the attribute management information with an attribute included in the first system information.
請求項7に記載の計算機であって、
前記関連性解析部は、
前記関連性管理情報を参照して、前記第1のシステム情報と関連性を有する第2のシステム情報を特定し、
前記第1のシステム情報及び前記第2のシステム情報を関連付ける属性の対応関係によって定義される第2のアクセスパスを取得し、
前記第1のアクセスパス及び前記第2のアクセスパスに基づいて、前記第1のシステム情報を介した前記新規システム情報と前記第2のシステム情報を関連付ける属性の対応関係によって定義される第3のアクセスパスを生成し、
前記新規システム情報及び前記第2のシステム情報の識別情報と、前記第3のアクセスパスとを含むレコードを前記関連性管理情報に設定する、ことを特徴とする計算機。
The computer according to claim 7, wherein
The relevance analyzer,
With reference to the relevance management information, specifying second system information having relevance to the first system information,
Acquiring a second access path defined by a correspondence relationship of an attribute that associates the first system information and the second system information;
A third system defined by a correspondence relationship of an attribute for associating the new system information with the second system information via the first system information based on the first access path and the second access path; Generate an access path,
A computer, wherein a record including identification information of the new system information and the second system information and the third access path is set in the association management information.
請求項9に記載の計算機であって、
前記変換部は、
関連性を有するシステム情報の組合せを特定し、
前記関連性管理情報を参照して、前記特定されたシステム情報の組合せに対応するレコードを検索し、
前記検索されたレコードに含まれるアクセスパスに基づいて、前記クエリを変換することを特徴とする計算機。
The computer according to claim 9,
The conversion unit,
Identify relevant combinations of system information,
With reference to the relationship management information, search for a record corresponding to the specified combination of system information,
A computer that converts the query based on an access path included in the searched record.
JP2018566664A 2017-02-07 2017-02-07 Data management method and computer Active JP6668513B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/004350 WO2018146716A1 (en) 2017-02-07 2017-02-07 Data management method and computer

Publications (2)

Publication Number Publication Date
JPWO2018146716A1 JPWO2018146716A1 (en) 2019-07-04
JP6668513B2 true JP6668513B2 (en) 2020-03-18

Family

ID=63107293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018566664A Active JP6668513B2 (en) 2017-02-07 2017-02-07 Data management method and computer

Country Status (2)

Country Link
JP (1) JP6668513B2 (en)
WO (1) WO2018146716A1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739223B2 (en) * 2003-08-29 2010-06-15 Microsoft Corporation Mapping architecture for arbitrary data models
JP6244274B2 (en) * 2014-07-01 2017-12-06 株式会社日立製作所 Correlation rule analysis apparatus and correlation rule analysis method
JP2016149049A (en) * 2015-02-13 2016-08-18 日本電気株式会社 Information processor, information processing system, and pair data updating method and program

Also Published As

Publication number Publication date
WO2018146716A1 (en) 2018-08-16
JPWO2018146716A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
US9177021B2 (en) Relational query planning for non-relational data sources
KR101083563B1 (en) Method and System for Managing Database
CN107145549B (en) Database cache control method and system
JP5927886B2 (en) Query system and computer program
JP4237813B2 (en) Structured document management system
WO2013175611A1 (en) Data distributed search system, data distributed search method, and administrative computer
WO2013111287A1 (en) Sparql query optimization method
US20140067853A1 (en) Data search method, information system, and recording medium storing data search program
CN110109951B (en) Correlation query method, database application system and server
CN110008448B (en) Method and device for automatically converting SQL code into Java code
JP6668513B2 (en) Data management method and computer
JP3786233B2 (en) Information search method and information search system
JP3565117B2 (en) Access method for multiple different information sources, client device, and storage medium storing multiple different information source access program
JP2011059845A (en) Device, method for operating database and program
JP4091586B2 (en) Structured document management system, index construction method and program
US11954107B2 (en) Information processing apparatus, method and storage medium
JP6589317B2 (en) Rewriting device, processing method and program thereof, and information processing device
Xia et al. A novel data schema integration framework for the human-centric services in smart city
JP4304226B2 (en) Structured document management system, structured document management method and program
JP2019028933A (en) Multi-dimensional data management system and multi-dimensional data management method
JP4160627B2 (en) Structured document management system and program
JP5358981B2 (en) Information processing apparatus, information processing apparatus control method, and information processing apparatus control program
JP2015219672A (en) Data management device, method and program therefor
JP2001222452A (en) Inquiry processing optimization device in relational data base system
CN117762975A (en) Data query method, device, electronic equipment and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200226

R150 Certificate of patent or registration of utility model

Ref document number: 6668513

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150