JP2023063180A - Data management system, data management method, and data management program - Google Patents

Data management system, data management method, and data management program Download PDF

Info

Publication number
JP2023063180A
JP2023063180A JP2021173529A JP2021173529A JP2023063180A JP 2023063180 A JP2023063180 A JP 2023063180A JP 2021173529 A JP2021173529 A JP 2021173529A JP 2021173529 A JP2021173529 A JP 2021173529A JP 2023063180 A JP2023063180 A JP 2023063180A
Authority
JP
Japan
Prior art keywords
data
series
nodes
report
data management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021173529A
Other languages
Japanese (ja)
Other versions
JP7022472B1 (en
Inventor
英隆 飯銅
Hidetaka Iido
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cagla Inc
Original Assignee
Cagla Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cagla Inc filed Critical Cagla Inc
Priority to JP2021173529A priority Critical patent/JP7022472B1/en
Application granted granted Critical
Publication of JP7022472B1 publication Critical patent/JP7022472B1/en
Publication of JP2023063180A publication Critical patent/JP2023063180A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a data management system which can represent a time-series relation between nodes of graph data and high value-added information such as tags of the nodes, clearly on a user interface, a data management method, and a data management program.SOLUTION: A data management system manages multiple pieces of data by using the data as nodes, and defining a relation between the nodes as edges. A group of nodes is managed as a dataset. The dataset is displayed in a matrix structure having a first system and a second system that intersects with the first system, on a user interface. The first system and the second system have a tree structure in accordance with the types of tags of the systems. The types of the tags of the first and second systems include time series and/or data types, and can be selected and modified. The systems can be rearranged in accordance with the selected type of the tag.SELECTED DRAWING: Figure 1

Description

本発明は、データ管理システム、データ管理方法及びデータ管理プログラムに関する。 The present invention relates to a data management system, data management method and data management program.

情報検索可能なデータ管理システムにおいて、グラフ理論を用いたデータ管理方法が採用されている。例えば、特許文献1には、与えられたグラフデータに基づいて情報検索用の新たなグラフデータを生成するグラフデータ生成装置が記載されている。 A data management method using graph theory is adopted in a data management system that enables information retrieval. For example, Patent Literature 1 describes a graph data generation device that generates new graph data for information retrieval based on given graph data.

特許第6293335号Patent No. 6293335

特許文献1では、検索用の新たなグラフデータを自動生成可能であるが、各データは単純な定型データに限定されており、しかも、生成されたグラフデータは、複数ノードとその間の入力エッジと出力エッジだけからなる単純なグラフデータの構造であるにも関わらず、ループや多重辺を多数含むために、グラフデータの中の各ノード間の関係を簡潔に表現できないうえに、各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに表現することは困難であった。 In Patent Document 1, new graph data for searching can be automatically generated, but each data is limited to simple fixed data, and the generated graph data consists of multiple nodes and input edges between them. Despite the simple structure of graph data consisting of only output edges, it contains many loops and multiple edges. It has been difficult to express high value-added information such as chronological relationships and tags of each node on the user interface.

本発明は、グラフデータの各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに分かりやすく表現することができるデータ管理システム、データ管理方法又はデータ管理プログラムを提供することを目的とする。 The present invention provides a data management system, data management method, or data management program capable of expressing time-series relationships between nodes of graph data and high value-added information such as tags of each node in an easy-to-understand user interface. intended to provide

本発明の一態様に係るデータ管理システムは、データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、前記ノードのグループをデータセットとして管理し、前記データセットがユーザインターフェイスに、第1系列と該第1系列と交差する第2系列とを有するマトリックス状の構造として表示され、前記第1系列及び前記第2系列が、各系列のタグの種類に応じたツリー構造であり、前記第1系列及び前記第2系列それぞれのタグの種類が、時系列及び/又はデータタイプを少なくとも含むと共に、選択変更可能であり、各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とする。 A data management system according to an aspect of the present invention is a data management system that defines data as nodes, defines relationships between the nodes as edges, and manages a plurality of data, wherein groups of the nodes are managed as datasets. and the data set is displayed in a user interface as a matrix-like structure having a first series and a second series intersecting with the first series, the first series and the second series being tags for each series. wherein each tag type of the first series and the second series includes at least a time series and/or a data type and can be selectively changed, and each series is selected It is characterized in that it can be rearranged according to the type of tag.

本発明の一態様に係るデータ管理システムによれば、グラフデータの各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに分かりやすく表現することができる。 According to the data management system according to an aspect of the present invention, it is possible to express high-value-added information such as time-series relationships between nodes in graph data and tags of each node in an easy-to-understand user interface.

図1は、実施形態1に係るデータ管理システムのブロック図である。FIG. 1 is a block diagram of a data management system according to Embodiment 1. FIG. 図2は、実施形態1に係る、グラフデータとレポートとの関係の説明図である。FIG. 2 is an explanatory diagram of the relationship between graph data and reports according to the first embodiment. 図3は、実施形態1に係るレポート、データのマップ表示の説明図である。FIG. 3 is an explanatory diagram of map display of reports and data according to the first embodiment. 図4は、レポート内のデータ表示の説明図である。FIG. 4 is an explanatory diagram of data display in a report. 図5は、レポート作成操作の説明図である。FIG. 5 is an explanatory diagram of the report creation operation. 図6は、レポートへのデータ引用操作の説明図である。FIG. 6 is an explanatory diagram of a data citation operation for a report. 図7は、新たなレポートの登録表示の説明図である。FIG. 7 is an explanatory diagram of registration display of a new report. 図8は、レポートのデータ参照表示の説明図である。FIG. 8 is an explanatory diagram of the data reference display of the report. テキスト検索の結果表示の説明図である。FIG. 10 is an explanatory diagram of a text search result display; 図10は、データの引用関係表示の説明図である。FIG. 10 is an explanatory diagram of the display of data citation relationships. 図11は、レポート作成の手順の説明図である。FIG. 11 is an explanatory diagram of the procedure for creating a report. 図12は、データ入力の手順の説明図である。FIG. 12 is an explanatory diagram of the data input procedure. 図13は、実施形態2に係るレポート、データのマップ表示の説明図である。FIG. 13 is an explanatory diagram of map display of reports and data according to the second embodiment.

以下、図面を参照して本発明の実施形態に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。但し、以下に示す実施形態は本発明の技術思想を具体化するためのデータ管理システム、データ管理方法及びデータ管理プログラムを例示するものであって、本発明をこれらに特定するものではなく、特許請求の範囲に含まれるその他の実施形態のものにも等しく適用し得るものである。 Hereinafter, a data management system, a data management method, and a data management program according to embodiments of the present invention will be described with reference to the drawings. However, the embodiments shown below are examples of a data management system, a data management method, and a data management program for embodying the technical idea of the present invention, and the present invention is not limited to these. It is equally applicable to other embodiments within the scope of the claims.

[実施形態1]
図1~図12を参照して、実施態様1に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。
[Embodiment 1]
A data management system, a data management method, and a data management program according to the first embodiment will be described with reference to FIGS. 1 to 12. FIG.

[システムブロック図について]
図1は、本開示の一態様に係るデータ管理システムのブロック図である。本実施形態のデータ管理システムは、ノード及び各ノードの関係を規定したエッジからなるグラフデータを扱うことができる。ノード及びエッジにはタグが付されている。タグはデータタイプに応じてスキーマが定義されているので、データタイプに適合したタグが付されることにより、データ管理がし易くなる。例えば、ファイルの種類がCSVファイルかINGファイルかに応じて、また、画像や動画については解像度やサイズに応じて、タグのスキーマは異なる。タグの必須情報としては、特に限定されるものではないが、例えば日時、データタイプ、担当者等の情報が含まれる。
[About the system block diagram]
1 is a block diagram of a data management system according to one aspect of the present disclosure; FIG. The data management system of this embodiment can handle graph data consisting of nodes and edges that define the relationship between each node. Nodes and edges are tagged. Since the tag schema is defined according to the data type, data management can be facilitated by attaching a tag suitable for the data type. For example, the tag schema differs depending on whether the file type is a CSV file or an ING file, and for images and videos, depending on the resolution and size. The essential information of the tag includes, but is not limited to, information such as date and time, data type, and person in charge.

中央演算システム10は、ログイン機能部11、機械学習部12及び中央処理部13を有している。また、中央演算システム10は、ユーザ管理システム30を介してユーザ端末45に接続されている。ログイン機能部11は、外部SSO(Single Sign-On)16と通信することにより、ユーザ管理システム30を介してユーザによりユーザ端末46からのログイン操作があると、外部SSO16を利用することにより中央処理システム10からアクセスする全てのWebサービス、クラウドサービス、アプリケーション等にログインすることができる。機械学習部12は、例えば学習モデルによって、分類モデル、ベクトル距離、エッジ生成、レポート欠損値補間等の演算を行うことができる。 The central processing system 10 has a login function section 11 , a machine learning section 12 and a central processing section 13 . The central processing system 10 is also connected to user terminals 45 via the user management system 30 . The login function unit 11 communicates with an external SSO (Single Sign-On) 16, so that when a user performs a login operation from a user terminal 46 via the user management system 30, central processing is performed using the external SSO 16. All web services, cloud services, applications, etc. accessed from the system 10 can be logged into. The machine learning unit 12 can perform calculations such as classification model, vector distance, edge generation, report missing value interpolation, and the like, for example, using a learning model.

中央演算部13はユーザセッション管理部14及びグラフデータ管理部15を備えている。中央処理部13は、メタデータ記憶部20とサブメタデータ記憶部25に接続されている。メタデータ記憶部20は、データ群をタグ付け管理する記憶部であり、ドキュメントノードテーブル21とデータノードテーブル22とを有するデータベースである。サブメタデータ記憶部25はデータ群の各データに関連する情報をエッジ情報として保持するデータベースであり、エッジテーブル26を有している。ユーザセッション管理部14は、各ユーザ管理システム30に対応する各ユーザからの操作指令に応じた管理や、操作履歴の管理を行う。グラフデータ管理部は、メタデータ記憶部20に記憶されているメタデータと、サブメタデータ記憶部25に記憶されているサブメタデータとにより、タグ付きデータとそのデータ間の関連をエッジとして管理し、「全てのデータがつながる」ことを実現している。 The central processing unit 13 has a user session management unit 14 and a graph data management unit 15 . The central processing unit 13 is connected to the metadata storage unit 20 and the sub-metadata storage unit 25 . The metadata storage unit 20 is a storage unit that tags and manages data groups, and is a database that has a document node table 21 and a data node table 22 . The sub-metadata storage unit 25 is a database that holds information related to each data of the data group as edge information, and has an edge table 26 . The user session management unit 14 performs management according to operation instructions from each user corresponding to each user management system 30 and management of operation history. The graph data management unit manages the tagged data and the relationship between the data as edges using the metadata stored in the metadata storage unit 20 and the sub-metadata stored in the sub-metadata storage unit 25. We have realized that "all data is connected".

また、中央演算部13は、外部のクラウドストレージ17に接続されている。中央処理システム10では、メタデータ記憶部20とサブメタデータ記憶部25にタグデータのみを記憶させ、膨大な記憶容量を要する実データ、例えば画像データ、動画データ、文章データ等は、外部のクラウドストレージ17に記憶させている。具体的には、中央演算システム10は、ノードデータをメタデータ記憶部20に記憶し、エッジデータをサブメタデータ記憶部25に記憶する一方、実データ自体、例えば動画データ、画像データ、文章データ等は、クラウドストレージ17に記憶する。また、フィルターリング機能により、必要なデータだけに絞り込んでから演算を行うことにより、データ処理量をさらに低減することが可能である。これにより、本実施形態のデータ管理システム自体はタグデータのみを記憶して、記憶するデータ量を少なし、しかもフィルタリング機能により必要なデータに絞り込んだ上でデータ処理を行うことにより、膨大な数のグラフデータ、例えば1億件以上のデータ数であっても、高速演算を実現している。このため、汎用PCを用いて本実施形態のデータ管理システムを構築することができる。また、本実施形態のデータ管理システムでは、従来の表計算ソフトでは実現できなかった、例えば「cycle」というタブにより、エッジデータを深堀するランダムウォーク機能を実現している。例えば、フィルター機能により絞り込んだノードデータに対して、ノードのグループをデータセットとして管理し、横軸を時系列に、縦軸をデータタイプに設定してユーザ端末45にデータセットを表示し、デーアセット又はデータセット中の各ノードからのエッジデータを深堀し、各ノードに紐づいた開発コード、価格情報、購入者情報等、次々にエッジを辿っていくことが可能である。 The central processing unit 13 is also connected to an external cloud storage 17 . In the central processing system 10, only the tag data is stored in the metadata storage unit 20 and the sub-metadata storage unit 25, and actual data requiring a huge storage capacity, such as image data, moving image data, text data, etc., is stored in an external cloud. It is stored in the storage 17. Specifically, the central processing system 10 stores the node data in the metadata storage unit 20 and stores the edge data in the sub-metadata storage unit 25, while storing the actual data itself, such as video data, image data, text data, etc. etc. are stored in the cloud storage 17 . In addition, the amount of data processing can be further reduced by performing calculations after narrowing down to only necessary data using the filtering function. As a result, the data management system itself of this embodiment stores only tag data to reduce the amount of data to be stored. graph data, for example, 100 million or more data, high-speed calculation is realized. Therefore, the data management system of this embodiment can be constructed using a general-purpose PC. In addition, the data management system of this embodiment realizes a random walk function for digging deep into edge data, which could not be realized with conventional spreadsheet software, for example, by using a tab called "cycle". For example, for the node data narrowed down by the filter function, a node group is managed as a data set, and the data set is displayed on the user terminal 45 by setting the horizontal axis to the time series and the vertical axis to the data type. It is possible to dig deeper into the edge data from each node in the asset or data set, and trace the edges one after another, such as the development code, price information, purchaser information, etc. linked to each node.

ユーザ管理システム30は、ユーザ情報管理部31、マップビュア32、ファイルラッパ33、ユーザインターフェイス35、BIツール36、レポート作成部37等備えている。ユーザ管理システム30は、1以上のユーザ端末45、及び、データマート40に接続されている。また、データマート40とユーザ端末45とも接続されている。 The user management system 30 includes a user information management section 31, a map viewer 32, a file wrapper 33, a user interface 35, a BI tool 36, a report creation section 37, and the like. User management system 30 is connected to one or more user terminals 45 and data mart 40 . It is also connected to the data mart 40 and the user terminal 45 .

ユーザ情報管理部31は、ユーザからのログイン情報を中央処理システム10のログイン機能部11に渡すことにより、ユーザのログイン状態の管理を行う。マップビュア32は、中央処理部13から得られたグラフデータからMAP Viewを生成する。ファイルラッパ33は、ユーザ端末45から入力されるデータの変換を行う機能を有している。ファイルラッパ33は、ファイルアップローダ34を備えており、ファイルアップローダ34は、ユーザ端末45から入力されたデータの加工及びマイニングを行うことにより、中央処理部13が扱えるデータに変換する。ユーザインターフェイス35は、ユーザ端末45の入出力管理を行う。BIツール36は、データを分析、可視化して、経営や業務に役立てるソフトウェアである。データマート40は、中央処理システム10、メタデータ記憶部20、サブメタデータ記憶部25に蓄積された情報から、ユーザ管理システムにおいて必要な情報を抽出して、集計し、管理することにより、利用しやすい形に格納したデータベースであり、ユーザ属性情報を管理するユーザ属性管理テーブル41及び種別ごとに情報を管理する1つ以上のマスターテーブル42を有している。 The user information management unit 31 manages the user's login state by passing the login information from the user to the login function unit 11 of the central processing system 10 . A map viewer 32 generates a MAP View from the graph data obtained from the central processing unit 13 . The file wrapper 33 has a function of converting data input from the user terminal 45 . The file wrapper 33 has a file uploader 34 , and the file uploader 34 processes and mines data input from the user terminal 45 to convert the data into data that can be handled by the central processing unit 13 . The user interface 35 performs input/output management of the user terminal 45 . The BI tool 36 is software that analyzes and visualizes data and uses it for management and operations. The data mart 40 extracts necessary information in the user management system from information accumulated in the central processing system 10, the metadata storage unit 20, and the sub-metadata storage unit 25. It is a database stored in an easy-to-use form, and has a user attribute management table 41 for managing user attribute information and one or more master tables 42 for managing information for each type.

ユーザ端末45は、ユーザインターフェイス35を利用すると共に、BIツール36及びレポート作成部37の機能を利用可能であり、ユーザ自身がデータの分析やレポートの作成を行うことができる。図1では、ユーザ管理システム30内に、ユーザインターフェイス35、BIツール36及びレポート作成部37を有する構成が示されているが、本実施例はこれに限定されるものではなく、例えば、BIツール36及びレポート作成部37をユーザインターフェイス35と一体に組み込んだり、ユーザインターフェイス35を中央処理システム10側に共通の機能として設ける構成としてもよい。 The user terminal 45 can use the user interface 35 and the functions of the BI tool 36 and the report creation unit 37, so that the user himself or herself can analyze data and create reports. FIG. 1 shows a configuration having a user interface 35, a BI tool 36, and a report creation unit 37 in the user management system 30, but this embodiment is not limited to this. 36 and the report creation unit 37 may be integrated with the user interface 35, or the user interface 35 may be provided as a common function on the central processing system 10 side.

従来、データ群はファイルサーバーに保存されていたため、汎用性、再利用性がなかったが、本実施形態では、データ郡をメタデータ記憶部20、サブメタデータ記憶部25にてタグ付け管理することにより、再利用性や検索性能を向上させた。また、関連する情報をエッジ情報として保持することで、各データの関連も同様に保存される。エッジには、例えば車種、部品名、諸元名、値などの物理的な名称だけではなく、諸元値に対するエビデンスやバージョン管理情報といった付加情報も同様に保持することにより、全てのデータがつながることを実現した。実ファイルに対応するノードをメタデータ記憶部20に書き出し、メタ情報をプロパティとして保持する。また、サブメタ情報(エビデンス、ナレッジ、バージョン管理)をエッジとしてサブメタデータ記憶部25に書き出し、それによって各ノードを紐付ける。そして、膨大なデータ量となる実ファイル自体は、クラウドストレージ17に記憶する。これにより、本実施形態のデータ管理システムは、それぞれのデータが繋がるため、全てのデータを横断的に管理することが可能となると共に、演算負荷を低減している。 In the past, data groups were stored in a file server, so they lacked versatility and reusability. This has improved reusability and search performance. Also, by holding related information as edge information, the relationship between each data is similarly saved. Edges connect all data by holding not only physical names such as vehicle models, parts names, specification names, and values, but also additional information such as evidence and version management information for specification values. realized. A node corresponding to the actual file is written to the metadata storage unit 20, and the meta information is held as a property. Also, the sub-metadata storage unit 25 writes out sub-metadata information (evidence, knowledge, version management) as an edge, thereby linking each node. Then, the actual file itself, which has a huge amount of data, is stored in the cloud storage 17 . As a result, the data management system of the present embodiment connects each data, so that all data can be managed cross-sectionally, and the computational load is reduced.

ユーザ管理システム30のフィルラッパ33は、各システムのデータの加工、マイニングを行い、中央処理システムで扱えるデータに変換するものであり、顧客の属性データと対応させるために、ユーザ管理システム毎に個別に作成される。 The fill wrapper 33 of the user management system 30 processes and mines the data of each system and converts it into data that can be handled by the central processing system. created in

中央処理システム10の中央処理部13は、本実施形態のシステムのコアアルゴリズムを有しており、ここではメタデータ記憶部20及びサブメタデータ記憶部25等からなるリレーショナルデータベースRDBとユーザ管理システム30とを連携し、高速な検索や系譜管理を行う。また、中央処理部13は、グラフデータ分析クラウド18にも接続されており、後述のとおり、系譜管理や表示マップ等にグラフデータ分析クラウド18の機能を利用することが可能である。このように、本実施形態のデータ管理システムは、外部のクラウドを利用することにより、自システムの処理負担を軽減し、大規模なデータ数のグラフデータに対する高速演算を実現している。 The central processing unit 13 of the central processing system 10 has the core algorithm of the system of this embodiment. to perform high-speed searches and genealogy management. The central processing unit 13 is also connected to the graph data analysis cloud 18, and as described later, it is possible to use the functions of the graph data analysis cloud 18 for genealogy management, display maps, and the like. As described above, the data management system of the present embodiment uses an external cloud to reduce the processing load of the system itself, and realizes high-speed calculation for a large amount of graph data.

データマート40には、ユーザインターフェイス35、BIツール36、レポート作成部37等で必要なデータ等が格納されている。 The data mart 40 stores data necessary for the user interface 35, the BI tool 36, the report creation section 37, and the like.

ドキュメントノードテーブル21は、レポートやドキュメントといった形でデータノードをグループ化して保持するためのテーブルである。データノードテーブル22は、各種データを保持するためのノードのためのテーブルであり、データとしてはグラフデータ等の様々な情報が含まれている。エッジテーブル26は、データ間の紐付け情報を保持するためのテーブルである。本実施形態では、日付やリビジョン、エビデンス等の様々な条件による紐付け情報が保持されている。 The document node table 21 is a table for grouping and holding data nodes in the form of reports and documents. The data node table 22 is a table for nodes for holding various data, and the data includes various information such as graph data. The edge table 26 is a table for holding linking information between data. In this embodiment, linking information is held according to various conditions such as date, revision, and evidence.

ユーザインターフェイス35を中央処理システム10で集中管理することも可能である。ファイルアップローダ34は、定型フォーマット、例えばCSVまたはTSV等でアップロードされたデータに対応する。ユーザインターフェイス35には、例えばNode Editor & viewerが含まれており、ノードやエッジの単体追加、削除、プロパティ編集を行うことができ、ユーザ端末45にグラフのイメージで表示することができる。 It is also possible to centralize the user interface 35 on the central processing system 10 . File uploader 34 accepts data uploaded in a fixed format, such as CSV or TSV. The user interface 35 includes, for example, a Node Editor & viewer, which allows single addition, deletion, and property editing of nodes and edges, and can be displayed on the user terminal 45 as a graph image.

ファイルラッパ33は、中央処理システム10の持つFile upload機能に対応できるようユーザのデータフォーマットを整形、変換する。 The file wrapper 33 shapes and converts the user's data format so that it can correspond to the file upload function of the central processing system 10 .

中央処理システム10は、様々なAPIを用意している。例えば、Searchは、簡単な検索処理を、クエリを書かずに実行するためのAPIであり、また、QueryAPIは、グラフにクエリを投げるための汎用的なAPIである。ファイルラッパ33は、中央処理システム10のQuery APIを利用し、各データを中央処理システムのデータ形式に変換して登録する。 The central processing system 10 prepares various APIs. For example, Search is an API for executing simple search processing without writing queries, and QueryAPI is a general-purpose API for querying graphs. The file wrapper 33 uses the query API of the central processing system 10 to convert each data into the data format of the central processing system and register it.

ユーザインターフェイス35は、さらに、次の機能を有する。Report makerは、レポートを作成、編集する画面を提供する。Report Viewer & 検索画面は、レポート検索や複製を行う画面であり、データマートへの出力等を行う。Report makerは、レポートを作成、編集する画面であり、矛盾検出クローラーは、レポートの欠損等をユーザに報知する。機械学習部12により訓練した学習モデルに基づき、矛盾、欠損、誤記等を判断する。 The user interface 35 also has the following functions. Report maker provides screens for creating and editing reports. The Report Viewer & Search screen is a screen for searching and duplicating reports, and for outputting to the data mart. The Report maker is a screen for creating and editing reports, and the contradiction detection crawler notifies the user of missing reports. Based on the learning model trained by the machine learning unit 12, discrepancies, deficiencies, typographical errors, etc. are judged.

[用語の説明]
ここで、本実施形態で使用する用語について説明する。
(1)ドキュメントについて
「ドキュメント」は、WordやExcel等のドキュメント形式だけでなく、MATLAB(登録商標)の入出力となるデータ等も含めたファイルで管理される単位のことを意味している。ドキュメントには「レポート」と「データ」の2つのタイプがある。「データ」は、計測、シミュレーション、予測等の結果を客観的事実として格納したものであり、画像やチャート一枚であることもあれば、それらを束ねたファイルであることもある。「レポート」は、これらのデータに基づいて客観的考察を含めて決定への思考プロセスや議論の内容を記述したものである。
[Explanation of terms]
Here, the terms used in this embodiment will be explained.
(1) Documents A "document" means a unit managed by a file including not only document formats such as Word and Excel, but also data to be input/output to/from MATLAB (registered trademark). There are two types of documents: "report" and "data". "Data" is the result of measurement, simulation, prediction, etc., stored as objective facts, and may be a single image or chart, or a file containing them. The "report" is a description of the thought process and the content of the discussion, including objective considerations, based on these data.

ノード、エッジには、様々なタグが付与されている。ノードには、作成者、作成日時、オブジェクトID、種別、名称等のタグが付与される。エッジには、作成者、作成日時、種別、データ番号、コメント等のタグが付与される。ノードについて、例えば種別としては例えば企画、テスト計画書、実測データ、諸元値、シミュレーション結果、モデル等が挙げられる。エッジについて、例えば種別としては、レポート添付、エビデンス、次のプロセス、データ利用、エビデンス等が挙げられ、例えばデータ番号としては、1、2、3、・・・等の符号が挙げられ、例えばコメントとしては、再確認の際のレポート、データから図表作成等が挙げられる。 Various tags are assigned to nodes and edges. Nodes are given tags such as creator, date and time of creation, object ID, type, and name. Tags such as creator, date and time of creation, type, data number, and comment are attached to edges. As for the types of nodes, for example, plans, test plans, actual measurement data, specification values, simulation results, models, and the like can be cited. Regarding edges, for example, types include report attachment, evidence, next process, data use, evidence, etc. For example, data numbers include codes such as 1, 2, 3, . Examples include the creation of charts from data and reports at the time of reconfirmation.

(2)レポート画面
レポートは、ウェブ画面で作成されることよりも、WordやExcel等を用いて作成されることが一般的である。WordやExcel等を用いて作成されたレポートについて、該レポートとデータとの関連を、ノードとエッジの関係として保持しておくことにより、後々データに遡ることを可能にしている。このため、少なくともレポートに含まれるデータを登録しておけるようにしてある。各レポートに登録されているデータを一覧表示するウェブUIにより、「関連レポートを探す」といった作業等が可能である。その上で、必要に応じてWordやExcel等を用いて作成されたレポートのファイルをダウンロードして閲覧することができる。レポートを各ビュー上で登録、編集を行うと、メタデータ記憶部20及びサブメタデータ記憶部25にノードデータとエッジデータが自動的に追加、変更される。レポートを表示する場合には、グラフデータの中から目標とするサブグラフを抽出し、グラフデータ分析クラウド18、例えばグラフィッククライアント(Oracle)による画面描画表示用のデータが作成される。レポートに用いられているデータの引用関係を表示することも可能である。さらに、オブジェクトIDから、直接データにアクセスすることも可能である。
(2) Report screen Reports are generally created using Word, Excel, etc., rather than being created on a web screen. For a report created using Word, Excel, etc., the relationship between the report and data is held as the relationship between nodes and edges, making it possible to trace back to the data later. Therefore, at least the data included in the report can be registered. The web UI that displays a list of the data registered in each report enables tasks such as "searching for related reports." In addition, report files created using Word, Excel, etc. can be downloaded and viewed as needed. When a report is registered and edited on each view, node data and edge data are automatically added to and changed in the metadata storage section 20 and sub-metadata storage section 25 . When displaying a report, target subgraphs are extracted from the graph data, and data for screen drawing display is created by the graph data analysis cloud 18, for example, a graphic client (Oracle). It is also possible to display the citation relationship of the data used in the report. Furthermore, it is possible to access the data directly from the object ID.

(3)推論エンジンと機械学習
推論エンジンにより、論理式を適用して論理的帰結(entailment)を導出する。例えば、
A => B, B => C ならば A => C
という論理的帰結を得られる。機械学習を用いて、過去データに基づいた訓練により学習モデルを生成し、これを適用することにより、推論エンジンの論理式を介さず結果を得ることができる。例えば、学習モデルによって、分類モデル、ベクトル距離、エッジ生成、レポート欠損値補間等の演算が得ることができる。
(3) The inference engine and machine learning inference engine applies logical expressions to derive logical entailments. for example,
A => B, B => C then A => C
A logical conclusion is obtained. Using machine learning, a learning model is generated by training based on past data, and by applying this, results can be obtained without going through the logical formulas of the inference engine. For example, a learning model can provide operations such as classification models, vector distances, edge generation, report missing value interpolation, and the like.

(4)系譜に着目するメリット
従来、レポート及びデータを検索し、再利用性を高めるためのデータベース化の際には、検索に求められる要件によって、データベースの粒度や正規化度合いは異なる。例えば、集計が必要か、全文検索で十分か等の要件により、データベース化の要件が異なる。本実施形態のデータ管理データは、レポート及びデータの間の柔軟な関連性のデータベース化が可能である。データベースの構造化として、全文検索(テキスト)、メタデータ(タグの付与)、グラフ(タグと関係性の付与)、構造化ドキュメント(XML/JSON)、リレーショナル(表)、セマンティクス(RDF)等が考慮される。
(4) Advantages of focusing on genealogy Conventionally, when reports and data are searched and databased to improve reusability, the granularity and degree of normalization of the database differ depending on the requirements for searching. For example, database requirements differ depending on requirements such as whether aggregation is necessary or whether full-text search is sufficient. The data management data of the present embodiment enables a database of flexible relationships between reports and data. Database structuring includes full-text search (text), metadata (tags), graphs (tags and relationships), structured documents (XML/JSON), relational (tables), semantics (RDF), etc. considered.

(5)ノードとエッジ
グラフDBに実ファイルをノードとして書き出し、メタ情報をプロパティとして保持する。また、サブメタ情報(エビデンス、ナレッジ、バージョン管理)をエッジとして書き出し、それによって各ノードを紐付ける。これにより、各データが繋がり、全てのデータを横断的に管理することが可能となる。
(5) Nodes and edges Write actual files as nodes in the graph DB and retain meta information as properties. In addition, sub-meta information (evidence, knowledge, version control) is written out as an edge, which links each node. As a result, each data is connected, and all data can be managed cross-sectionally.

[ファイルラッパとレポートラッパ]
「ファイルラッパ」は、横軸(横系統)を「時系列ツリー構造」とし、縦軸(縦系列)を「関連性ツリー構造」として、あたかもEXCELのような視覚的に分かりやすいファイル構造を提供する。従来のグラフデータは、天気データのように固定的で単純なデータ構造に対してのみ、自動的にエッジを作成できていた。天気データは、日にち、地域、気温、湿度等からなる単純な定型のデータである。天気データのような単純な、いわゆるビッグデータとして扱える範囲の定型データしか自動でのエッジ生成はできなかった。
[File Wrapper and Report Wrapper]
"File wrapper" provides a visually easy-to-understand file structure similar to EXCEL, with the horizontal axis (horizontal system) as "time series tree structure" and the vertical axis (vertical series) as "relationship tree structure". do. Conventional graph data could automatically create edges only for fixed and simple data structures such as weather data. Weather data is simple fixed form data consisting of date, area, temperature, humidity, and the like. Automatic edge generation was only possible for standard data that could be handled as simple, so-called big data, such as weather data.

「レポートラッパ」(レポート作成部37)は、データノードグループとして「レポート」を登録する。ヘテロなデータ処理が必要。つまり、属性がいろいろと異なったデータが混在している実用上のシステムで活用可能なことが必要である。 The "report wrapper" (report creating unit 37) registers "report" as a data node group. Heterogeneous data processing is required. In other words, it is necessary to be able to utilize it in a practical system in which data with various different attributes are mixed.

[学習について]
学習によりエッジを貼るために、深層学習よりもシンプルな学習アルゴリズムが利用可能である。例えば、欠損値補間を利用した最短経路探索学習を行うことにより、ノードに対応するエッジを貼ることができる。別の学習の例としては、N次多項式ノンマルコフ定義(non-Markov process、非マルコフ過程)における強化学習を利用することにより、操作者が未入力の箇所を示唆することができる。例えば、「関連する前回のファイルには諸元値データとして、αが含まれているが、今回のファイルにはαをいれないでよいのでしょうか?」との修正の示唆を行う。
[About learning]
Learning algorithms that are simpler than deep learning are available for sticking edges by learning. For example, edges corresponding to nodes can be pasted by performing shortest path search learning using missing value interpolation. As another example of learning, reinforcement learning in an N-order polynomial non-Markov process can be used to suggest places where the operator has not yet entered. For example, a correction suggestion is made such as "Although the previous related file contains α as specification value data, is it okay to not include α in this file?"

[本実施形態のシステムの概要]
本実施形態のシステムは、例えば、横系統を時系列ツリー構造とし、縦系列を関連性ツリー構造として、視覚的に分かりやすいファイル構造としているため、実験、シミュレーションにまつわるデータの探索と参照を、これまでよりも効果的に実施することができる。データ一覧をリスト表示ではなくマップ表示(横系列と縦系列からなるマップ表示)し、データ間の関連を付けたうえで表示することで、視覚的に把握しやすい表示となっている。属性値の全文検索機能も併せてつけることで、使い慣れた検索エンジン、例えばEXCELを操作するような感覚でデータを探すことができる。
[Outline of the system of this embodiment]
The system of this embodiment, for example, has a time-series tree structure for the horizontal system and a relevance tree structure for the vertical system, and has a visually easy-to-understand file structure. can be implemented more effectively than The data list is displayed in a map display (a map display consisting of horizontal and vertical series) instead of a list display, and the display is easy to understand visually by displaying the data after associating it with each other. By adding a full-text search function for attribute values, you can search for data as if you were using a familiar search engine, such as EXCEL.

本実施形態のデータ管理システムは、データの登録の不便さを解消し、簡単な登録を可能にする。登録するデータは、ユーザの属性値などを加味し、デフォルト設定をベースとした属性値登録を実現した。最小限の入力項目で登録を可能にする。ユーザ端末45からのユーザの操作はDrag&Dropで行い、誰でもわかりやすく操作できる。システム間連携により、属性値等の情報の自動登録機能を設けている。視覚表現を実現するMapデータには、Graphベース(グラフ理論を利用する)のPaaS(Platform as a Service)を活用することができる。PaaSを用いることにより、本実施形態のデータ管理システムのアプリケーション開発に必要な実行環境、例えばアプリケーションのコードを実行するのに必要な言語のランタイムや、データベース等のミドルウェアをクラウド上で利用することができる。このサービス内にドキュメント管理機能も内包している。グラフデータ分析クラウド18として、例えば、Oracle分析クラウドを用いてデータの視覚化とレポート作成が可能である。Oracle分析クラウドのグラフ分析関数を使用すると、地理空間解析を実行できる。例えば、2つの頂点間の距離やホップ数を計算できまる。 The data management system of this embodiment eliminates the inconvenience of registering data and enables simple registration. The data to be registered takes into account the user's attribute value, etc., and the attribute value registration based on the default setting has been realized. Enable registration with minimal input items. The user's operation from the user terminal 45 is performed by Drag & Drop, so that anyone can operate it in an easy-to-understand manner. An automatic registration function for information such as attribute values is provided through inter-system cooperation. Graph-based (using graph theory) PaaS (Platform as a Service) can be used for map data that realizes visual representation. By using PaaS, it is possible to use the execution environment necessary for application development of the data management system of this embodiment, such as the runtime of the language necessary to execute the application code and middleware such as a database, on the cloud. can. This service also includes a document management function. As a graph data analysis cloud 18, for example, the Oracle analysis cloud can be used for data visualization and reporting. Geospatial analysis can be performed using graph analytics functions in Oracle Analytics Cloud. For example, you can calculate the distance and number of hops between two vertices.

ユーザ管理システム30における業務特化の属性値はAdd-on機能の中で開発し、開発量を最小限としている。データ内容の参照機能は、一般的なSelf Service BIツールを想定し、ユーザが使いやすいツールを選択できる形とした。すなわち、本実施形態のデータ管理システムでは、BIツール(Business Intelligence tools)36を用いてユーザ自身がデータの分析やレポートの作成を行うことができる。 The business-specific attribute values in the user management system 30 are developed in the Add-on function to minimize the amount of development. The data content reference function assumes a general Self Service BI tool and allows users to select an easy-to-use tool. That is, in the data management system of the present embodiment, the user himself/herself can analyze data and create reports using BI tools (Business Intelligence tools) 36 .

[表示画面におけるグラフデータの関係]
本実施形態のシステムでは、従来エクセルで作成、管理されていたレポートシステムをすべてWeb化するため、エクセルの代替えとなるレポート作成機能が追加されている。ユーザ端末では、データベース上のデータを表示したり、ローカル上のデータやコンテンツをアップロードしたりすることが可能である。
[Relationship of graph data on the display screen]
In the system of the present embodiment, a report creation function is added as an alternative to Excel in order to convert all report systems that were created and managed in Excel conventionally into a Web format. The user terminal can display data on the database and upload local data and content.

図2は、グラフデータとレポートとの関係の説明図である。グラフデータにおいて、データはノードとして表され、データ間の関係はエッジとして表されている。関連する複数のデータがデータセットとしてまとめて管理され、データセット間にエッジが形成される。データセットに対して、纏まりとしてエッジを形成することにより、データ群の管理が容易となり、例えばシミュレーション毎、実験毎のデータをまとめて管理し易くなる。
(1)ファイルラッパ33によって、それぞれのユーザ管理システム30から中央処理システム10にデータが取り込まれ、データを抽出して必要なノード、エッジを生成し、API経由で中央処理システム10に送られる。
(2)新しいノードの作成については、新規でレポートを作成した際には、新しいレポートノードが自動生成される。
(3)コンテンツの追加については、レポートにユーザが作成した新規のコンテンツ(例えば画像)を追加すると、そのコンテンツがノードとして追加され、かつ、レポートとの間にエッジが自動生成される。
(4)既存データの引用については、他の系列から取得した既存のデータをレポートで引用(ユーザ端末上で、既存のデータをdrag&dropすると、レポートと既存のデータに対応するノードとの間に、エッジが自動生成される。
(5)関連性をエッジで表現については、複数のデータノードから取得した既存のデータに基づくチャートをレポートに追加する場合、例えば同じチャートに2つのデータが使用された場合には、その2つのデータに対応するノード間に自動的にエッジが生成される。
FIG. 2 is an explanatory diagram of the relationship between graph data and reports. In graph data, data are represented as nodes, and relationships between data are represented as edges. A plurality of related data are collectively managed as data sets, and edges are formed between the data sets. Forming an edge as a group for the data set facilitates management of the data group, and facilitates collective management of data for each simulation or each experiment, for example.
(1) The file wrapper 33 takes data from each user management system 30 into the central processing system 10, extracts the data, generates the necessary nodes and edges, and sends them to the central processing system 10 via API.
(2) Regarding creation of a new node, when a new report is created, a new report node is automatically generated.
(3) Regarding addition of content, when new content (for example, an image) created by the user is added to the report, the content is added as a node and an edge is automatically generated between the content and the report.
(4) For citing existing data, existing data obtained from other series is quoted in the report (If you drag and drop the existing data on the user terminal, the node corresponding to the report and the existing data will Edges are automatically generated.
(5) Relations represented by edges, when adding a chart based on existing data acquired from multiple data nodes to a report, for example, when two data are used in the same chart, the two Edges are automatically generated between nodes corresponding to the data.

[ユーザインターフェイスへの表示態様]
図3は、レポート、データのマップ表示の説明図である。横系列が時系列ツリー、縦系列が関連性ツリーであり、見やすい表示形態となっている。画面最上部には、属性値絞り込み条件が表示されている。この属性値を持つノードだけが表示される。図3の例では、ユーザ情報に付与されたデフォルト値をもって、属性値絞り込み条件があらかじめ入力された状態にされているが、本実施形態はこれに限定されるものでは無く、例えばこの絞り込み条件はユーザ端末45から入力することも可能である。
[Mode of display on user interface]
FIG. 3 is an explanatory diagram of map display of reports and data. The horizontal series is a time-series tree, and the vertical series is a relevance tree. Attribute value narrowing conditions are displayed at the top of the screen. Only nodes with this attribute value are displayed. In the example of FIG. 3, attribute value filtering conditions are input in advance with default values assigned to user information, but the present embodiment is not limited to this. Input from the user terminal 45 is also possible.

図3では、横系列が時系列ツリー、縦系列が関連性ツリーとなっているが、いずれの系列もユーザ端末45からの指定で選択することができ、座標空間を表現している。データセットやデータポイントのタグは、データタイプによりタイプ別で分類されており、また、データセットのネスト構造により分類も可能である。データセットをネスト構造とし、データのエンティティの塊をデータセットとすることにより、データの塊で管理することができる。データの関係性はデータセット単位で行う。一方で指定をすればデータ個別の連携もとることは可能である。また、データタイプによりデータが分類されているため、グラフデータの管理やデータ検索がし易い。 In FIG. 3, the horizontal series is a time-series tree and the vertical series is a relevance tree. Data sets and data point tags are classified by data type, and can also be classified by the nested structure of the data set. Data sets can be managed as data chunks by forming a nested structure and using data entity chunks as datasets. Data relationships are established in units of datasets. On the other hand, if specified, it is possible to link individual data. In addition, since the data is classified by data type, it is easy to manage and search the graph data.

例えば試験車やシミュレーションモデルに関する情報等は、システム管理者側で登録(システム管理者端末は図示省略)、もしくはそれぞれの図示されない管理システムとの連携によって登録する。なお、システム管理者端末は試験・シミュレーションの実行者は、どの試験車(モデル)を利用したか、のみ選択することで、試験車と実績情報との関連をつけることができる。異なる試験/シミュレーション間での関連付けも、試験車やモデルのバージョン情報を基本情報としてつなげることにより可能である。 For example, information about test vehicles and simulation models is registered by the system administrator (the system administrator's terminal is not shown) or is registered in cooperation with each management system (not shown). It should be noted that the system manager terminal allows the test/simulation executor to select only which test vehicle (model) was used, thereby establishing a relationship between the test vehicle and the performance information. Associations between different tests/simulations are also possible by linking test vehicle and model version information as basic information.

図4は、レポート内のデータ表示の説明図である。ファイルには、複数のデータが含まれている。KPI(key performance indicators)を持つデータについては、単独数値としてのKPIとその値をデータポイントで保持する。KPIは目標達成の度合いを定義するための指標であり、具体的なプロセスや進捗状況を評価、改善するために用いられる。図4において、データの各エンティティをクリックすれば、データ単体のデータポイントまでブレイクダウンすることができる。 FIG. 4 is an explanatory diagram of data display in a report. The file contains multiple pieces of data. For data with KPIs (key performance indicators), KPIs as single numerical values and their values are retained as data points. KPIs are indicators that define the degree of goal achievement, and are used to evaluate and improve specific processes and progress. In FIG. 4, by clicking on each entity of data, it is possible to break down to the data point of the data alone.

図5は、レポート作成操作の説明図である。レポート作成操作のために、まずユーザ端末35のディスプレイ上で、レポート作成対象となるノードのエンティティを右クリックし、プルダウンメニューから「レポートを作成する」を選択する。レポート作成の選択画面からさらに、雛形一覧や自動フォーマット等の選択が可能であり、所定のひな形を選択したり、自動的に作成されたレポートの様式を利用したり、することができる。自動フォーマットの利用にあたり、機械学習部12において訓練された学習モデルを用いることにより、適切なレポートの様式を自動作成させることが可能である。この場合、機械学習部における訓練には、過去に作成されたレポート、そこで使用されたデータセット、データ、引用関係等が用いられる。 FIG. 5 is an explanatory diagram of the report creation operation. For the report creation operation, first, on the display of the user terminal 35, right-click the entity of the node for which the report is to be created, and select "create report" from the pull-down menu. From the report creation selection screen, it is also possible to select a model list, an automatic format, etc., and it is possible to select a predetermined model or use an automatically created report format. When using the automatic format, it is possible to automatically create an appropriate report format by using a learning model trained in the machine learning unit 12 . In this case, reports created in the past, data sets, data, citation relationships, and the like used therein are used for training in the machine learning unit.

図6は、レポートへのデータ引用操作の説明図である。引用したいデータのエンティティをクリックすれば、引用したいデータセットがズームアップされ、その中に含まれるデータ群が表示される。図5で選択されたレポートの様式に対して、引用したいデータをドラッグ&ドロップすることでレポートが作成される。他のファイルからのデータを検索して、ドラック操作で作成中レポートに貼り付けができる。レポート作成にあたっては前述のとおり各レポートのひな形が自動的に推奨される、あるいは、ひな形一覧からの選択可能である。さらに、入力漏れなどがあれば、AIが欠損値の入力アシストを行う。AIにより欠損が予測されたレポート部分に欠損があると思われる部分が反転表示されると共に、補完すべきデータ候補を表示可能である。AIとしては、特に限定されるものではないが、例えば欠損値補間を利用した最短経路探索学習、N次多項式ノンマルコフ定義における強化学習等が用いられる。なお、AIとして過去のデータ保管の履歴データを用いてCNNを学習させる深層学習を用いることもできる。 FIG. 6 is an explanatory diagram of a data citation operation for a report. Clicking on the entity of the data you want to cite zooms in on the dataset you want to cite and shows the data groups contained within. A report is created by dragging and dropping data to be quoted into the report format selected in FIG. You can retrieve data from other files and paste it into your report by dragging it. When creating a report, a template for each report is automatically recommended as described above, or it can be selected from a list of templates. Furthermore, if there is an input omission or the like, the AI assists in inputting missing values. In the report part predicted to be missing by AI, the part that seems to be missing is displayed in reverse video, and data candidates to be complemented can be displayed. Although the AI is not particularly limited, for example, shortest path search learning using missing value interpolation, reinforcement learning in the N-order polynomial non-Markov definition, and the like are used. It should be noted that it is also possible to use deep learning for learning CNN using history data stored in the past as AI.

図7は、新たなレポートの登録表示の説明図である。レポート作成操作によって、各データに自動的にエッジが貼られている。レポートが新たなデータセットノードとして追加され、このノードがユーザ端末45のディスプレイ上に、新たなエンティティとして追加される。 FIG. 7 is an explanatory diagram of registration display of a new report. Each data is automatically edged by the reporting operation. The report is added as a new dataset node, and this node is added as a new entity on the user terminal 45 display.

図8は、レポートのデータ参照表示の説明図である。ユーザ端末45のディスプレイ上で、分析したい対象となるレポートないしデータのエンティティを右クリックし、プルダウンメニューから「データ参照」を選択すると、データ参照用の分析画面へ進む。既に参照画面が構築されている場合は、構成済み画面へ進む。一方、まだ参照画面が構築されていない場合は、本データを読み込んだ分析プロジェクトのデフォルト画面に進む。参照画面の作成・編集は、プルダウンメニューの「参照画面編集」を選択し、前述のレポート作成と同様の手順により行う。 FIG. 8 is an explanatory diagram of the data reference display of the report. On the display of the user terminal 45, right-clicking a report or data entity to be analyzed and selecting "data reference" from the pull-down menu proceeds to an analysis screen for data reference. If you have already built a reference screen, go to the configured screen. On the other hand, if the reference screen has not yet been constructed, proceed to the default screen of the analysis project that loaded this data. To create and edit the reference screen, select "edit reference screen" from the pull-down menu and follow the same procedure as for creating the report described above.

図9は、テキスト検索の結果表示の説明図である。全データ及び全レポート内のファイルをテキスト検索可能である。図9の上段の「Search」欄に検索式、検索ワードを入力することにより、フルテキスト検索が可能である。検索式に応じて、近傍検索やデータカテゴリー指定検索等の条件付き検索も可能である。「Text Search Result」として、ユーザ端末45のディスプレイ上に検索結果がリスト表示される。 FIG. 9 is an explanatory diagram of the result display of the text search. Files within all data and all reports are text searchable. A full-text search can be performed by entering a search expression and a search word in the "Search" column at the top of FIG. Depending on the search formula, conditional searches such as proximity searches and data category specified searches are also possible. A list of search results is displayed on the display of the user terminal 45 as "Text Search Result".

図10は、データの引用関係表示の説明図である。エッジ検索が可能なので、各データの紐付け関係が表示できる。上段の「Parent Node Connection Search」は、一つ上の親ノードに関連するノードをサーチ結果である。中段の「Direct Node Connection Search」は、自身に直接連結するノード(親ノード以外)のサーチ結果である。下段の「Browse Log Node Connection Search」は、当該ノード(対象となるデータ自身のノード)を経由して閲覧したノードの検索結果である。 FIG. 10 is an explanatory diagram of the display of data citation relationships. Since edge search is possible, it is possible to display the linking relationship of each data. "Parent Node Connection Search" in the upper row is the result of searching for nodes related to the parent node one level above. "Direct Node Connection Search" in the middle row is the search result of the node (other than the parent node) that is directly connected to itself. "Browse Log Node Connection Search" in the lower part is the search result of the node browsed via the node (the node of the target data itself).

図11は、レポート作成の手順の説明図である。既存のデータをドラックアンドドロップすることにより、作成中のレポートに引用したいデータを挿入することができる。例えば、「Parent Node Connection Search」で選択された親ノードをクリックすると、そこに紐づく実績情報のデータセットがリスト表示される(図11の左上の図を参照)。上述のようにレポート作成画面を開いて(図11の右上の操作)、レポート上のデータ貼り付け位置に引用元のデータをドラックアンドドロップにより貼り付けることができる(図11の下の図)。この際、異なるデータポイントをレポートのキャンパス上にドラッグアンドドロップすることで、データの比較ができる。また、様々なデータポイントを並べて描画させることで、様々な項目の状況を同時に確認することができる。グラフ描画機能を用いて、データポイントをレポートのキャンパス上にドラッグアンドドロップすることで、グラフを描画することが可能である。このように、全データ及び全レポート内のファイルをテキスト検索し、また、エッジ検索した結果により抽出したデータを用いてレポートを作成することができる。 FIG. 11 is an explanatory diagram of the procedure for creating a report. By dragging and dropping existing data, you can insert the data you want to cite into the report you are creating. For example, when a parent node selected in "Parent Node Connection Search" is clicked, a list of performance information datasets associated therewith is displayed (see the upper left diagram in FIG. 11). By opening the report creation screen as described above (operation in the upper right of FIG. 11), the data of the citation source can be pasted on the data pasting position on the report by dragging and dropping (lower diagram in FIG. 11). You can compare data by dragging and dropping different data points onto the report canvas. In addition, by drawing various data points side by side, the status of various items can be checked at the same time. Using the graph drawing function, graphs can be drawn by dragging and dropping data points onto the report canvas. In this way, all data and files in all reports can be text-searched, and a report can be created using the data extracted as a result of the edge search.

図12は、データ入力の手順の説明図である。新規データを入力する際には、「新規登録ボタン」をクリックする(図示省略)か、あるいは、紐づける実験ノードを選択する。「属性値選択領域」(図12の上段の図の左側の属性値表示部分を参照。)には、ユーザ端末45から属性値を指定できるが、ユーザに付与された設定から予め初期設定値が選択された状態となっている。「連結ノード」には、基本的には設定値と前回の結果等を紐づける。連結対象ノードとしては、前回の登録オペレーションに鑑み、同様のノードが自動的に選択された状態となる。「登録ファイル」には、例えばユーザ端末45上のエクスプローラーから登録したいファイルをそのままDrag&Dropする。連結対象ノードとして、選択ノードを追加したい場合には、図12の上段の図のように、「新規ノードを選択」ボタンをクリックすることで、「ノードセレクタ」に条件に合致したノード候補の一覧を表示させる。この一覧表示された候補の中から、新たに連結させたいノードを選択して、登録ボタンをクリックする(図12の中段の図参照)と、先に選択された属性を持った情報として新たにデータが登録される。データが登録されるとユーザ端末45のディスプレイ上にエンティティが表示され、対応するノードが設定したエッジと共にデータ管理システムに反映される(図12の下段の図参照)。 FIG. 12 is an explanatory diagram of the data input procedure. When entering new data, click the "new registration button" (not shown) or select an experiment node to be linked. Attribute values can be specified from the user terminal 45 in the "attribute value selection area" (see the attribute value display portion on the left side of the upper diagram in FIG. 12), but the initial setting values are preset from the settings given to the user. It is in selected state. The "connection node" basically associates the setting value with the previous result. Similar nodes are automatically selected as connection target nodes in view of the previous registration operation. For the "registration file", for example, the user drags and drops the file to be registered from the explorer on the user terminal 45 as it is. If you want to add a selection node as a connection target node, click the "Select New Node" button as shown in the upper part of Fig. 12 to display a list of node candidates that match the conditions in the "node selector". display. From the list of candidates, select the node you want to newly connect and click the registration button (see the middle diagram in Fig. 12). Data is registered. When the data is registered, the entity is displayed on the display of the user terminal 45 and reflected in the data management system together with the edge set by the corresponding node (see the lower diagram in FIG. 12).

[内部動作の説明]
本実施形態のデータ管理システムにおけるファイルの登録に関する内部動作を説明する。ファイル登録は、指定がなければ最後に登録されたノードに紐づく想定で登録される。ファイルやデータセットを選択した場合は、そのノードに紐づくノードとして生成される。同一属性を持つノードは時系列ベースで自動的に連結させる。データの内部を判別し、内部の絡む情報をばらして個別ノードとして生成することもできる。ユーザが持つ属性は、基本的にそのまま保持される。データを保持するファイルについては、基本的に個別のデータ(カラム)ごとに内部で分割したデータを示すポインタを持ち、それをデータポイントとしてグラフ表示して管理する。データポイント単位で操作することができるようになれば、個別のデータポイントごとに比較したり、レポートに表示したりすることができるようになる。また、ファイルデータの中身を精査して、個別のカラム事にアクセスするために、Parseの機能(データ構造の変換機能)やファイル切り出しの機能を設けている。
[Description of internal operation]
An internal operation regarding file registration in the data management system of this embodiment will be described. File registration is registered on the assumption that it is associated with the last registered node unless otherwise specified. If you select a file or dataset, it will be generated as a node linked to that node. Nodes with the same attributes are automatically connected on a chronological basis. It is also possible to discriminate the inside of the data, disassemble the information related to the inside, and generate individual nodes. Attributes possessed by the user are basically retained as they are. Files that hold data basically have pointers that indicate internally divided data for each individual piece of data (column), and manage them by graphing them as data points. Being able to operate on a per-datapoint basis means that individual datapoints can be compared and presented in reports. In addition, the Parse function (data structure conversion function) and file extraction function are provided in order to examine the contents of the file data and access individual columns.

[関連付け方法(1)マスターノード連結法]
データセットノード中でもマスターノード(試験車/シミュレーションモデル)に関する情報は、データ登録時に厳密なバージョニングを行う。プロジェクト開始時のみ、連結ノードがない状態となる。その他のデータセットノードは必ずどれかのマスターノードに関連付けられた状態で登録される。その結果、マスターノードを介して必ず情報がつながる。
[Association method (1) Master node connection method]
Among data set nodes, information on master nodes (test vehicles/simulation models) is strictly versioned at the time of data registration. Only at the start of the project, there will be no connected nodes. Other dataset nodes are always registered in association with some master node. As a result, information is always connected through the masternode.

[関連付け方法(2)類似属性連結]
ある一定の属性値が同等、ないし同等に近いものを検索し、その類似度をスコアリングする。スコア値の高いものを自動で連結させる。
<スコアリングアルゴリズムの例>
属性値を下記a~dの4つに分類し、a)、c)、d)で合致する値であるか否か判断したうえで、b)をスコア(合致する数をカウント)としてエッジを自動生成する。
a)「完全同一が必須」(重要な文字列属性)イコールでヒットするかどうか
b)「必ずしも同じである必要はない」(重要ではない文字列属性)合致する数をカウント
c)「範囲内であれば同一とみなせる」(重要な数値属性)
d)範囲内に収まっているかどうか?
[Association method (2) Similar attribute linking]
A search is made for items that have a certain attribute value equal or close to equal, and the degree of similarity is scored. Automatically concatenate high score values.
<Example of scoring algorithm>
Attribute values are classified into four categories a to d below, and after judging whether or not the value matches with a), c), and d), b) is scored (counting the number of matches) and the edge is determined. Generate automatically.
a) "Must be exactly the same" (important string attribute) Equal to hit b) "Not necessarily the same" (unimportant string attribute) Count the number of matches c) "Within range can be considered identical if
d) Is it within range?

[関連付け方法(3)データ参照履歴による連結]
ユーザがあるノードから別のノードに移り、データを参照した、というログをすべて残す。どのノードからどのノードに飛んだかをログとして記録する。ある一定回数以上の記録があった場合に新たなエッジとして登録をする。
[Association method (3) Linking by data reference history]
Keep a log of all the times a user has moved from one node to another and viewed data. Record as a log which node flew to which node. A new edge is registered when it is recorded more than a certain number of times.

[関連付け方法(4)手動の併用]
上記(1)~(3)によって張られたエッジをもとに、人手でGraph空間をブラウズし、人の判断で必要なところにエッジを張ることも可能である。なお、このように人手でエッジを張る場合には、通常は管理者のみが利用できる機能であるブラウジング機能が用いられる。
[Association method (4) Manual combination]
Based on the edges drawn by (1) to (3) above, it is also possible to manually browse the Graph space and draw edges where necessary based on human judgment. In addition, when setting the edge manually in this way, a browsing function, which is normally available only to the administrator, is used.

[具体的事例への適用例]
システム連携により取得することが望ましいデータとしては、社内担当者情報およびその担当プロジェクト、プロジェクト一覧、登録すべきデータセットの自動登録、写真に写る数値の画像読み取り、及び、そのデータ内容の判別等が挙げられる。
[Examples of application to specific cases]
The data that should be obtained through system linkage includes the information of the person in charge in the company and the project in charge, the project list, the automatic registration of the data set to be registered, the image reading of the numerical values in the photograph, and the identification of the data content. mentioned.

事前設定として必要となる情報、例えば人事情報および担当プロジェクト情報は、ファイルラッパ33により、周辺システム(図示省略)より自動で取り込むことができる。顧客特有の事項については、事前にユーザ管理システムの設定が必要である。ユーザ情報定義は、例えば一般的なRDB形式で保持される。ただし、例えば、担当プロジェクト、担当業務領域/担当性能、最終実施実験/シミュレーション、最終作成レポート等については、様々な属性情報をつけられるようJSON形式での属性付与機能を持たせている。 Information necessary for presetting, such as personnel information and assigned project information, can be automatically retrieved from a peripheral system (not shown) by the file wrapper 33 . For customer-specific matters, it is necessary to set up the user management system in advance. User information definitions are held, for example, in a general RDB format. However, for example, for projects in charge, business areas in charge/performance in charge, final experiments/simulations, final reports, etc., a JSON format attribute function is provided so that various attribute information can be added.

ノード表、エッジ表に格納されたプロパティ値に対して全文検索Indexを付与されているため、全文検索が可能である。 A full-text search is possible because a full-text search index is assigned to the property values stored in the node table and edge table.

[実施形態2]
図13を参照して、実施態様2に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。図13は、本実施形態に係るレポート、データのマップ表示の説明図である。図1~12と同様の構成には同一の番号を付し、その説明は省略する。
[Embodiment 2]
A data management system, a data management method, and a data management program according to the second embodiment will be described with reference to FIG. FIG. 13 is an explanatory diagram of map display of reports and data according to the present embodiment. The same numbers are given to the same configurations as those in FIGS. 1 to 12, and the description thereof is omitted.

連結根拠として、作成されたレポートのバージョンを視覚的に表示することも可能である。横軸に時系列的なデータを配置し、バージョンが明確となる。縦軸には、関連項目として、計測・シミュレーションの種類、例えばNV、燃費、及び、操安等の項目が配列されている。これにより、縦軸の各項目同士の引用関係が明確となり、バージョンアップの状況を把握し易い。 As a basis for consolidation, it is also possible to visually display the version of the generated report. Arrange chronological data on the horizontal axis to clarify the version. On the vertical axis, measurement/simulation types such as NV, fuel efficiency, and steering stability are arranged as related items. This clarifies the citation relationship between the items on the vertical axis, making it easy to grasp the version upgrade status.

本実施形態では、縦軸の実例を示したが、縦軸、横軸共に、ユーザの見やすいように自由にタグの種類を選択することにより、任意のマップ表示が可能である。少なくとも、時系列、データタイプ等のタグの種類を選択することが可能である。この他に、各軸のタグの種類としては、担当者、製品コード、バージョン情報、実験条件、シミュレーション条件等、様々なタグが選択可能である。 In this embodiment, an example of the vertical axis is shown, but arbitrary map display is possible by freely selecting the type of tag for both the vertical axis and the horizontal axis so that the user can easily view the map. At least, it is possible to select the types of tags such as time series and data types. In addition, various tags such as person in charge, product code, version information, experiment conditions, and simulation conditions can be selected as the types of tags for each axis.

以上、本発明の実施形態に係るデータ管理システム、データ管理方法及びデータ管理プログラムを説明したが、各実施形態は本発明の技術思想を具体化するためのデータ管理システム、データ管理方法及びデータ管理プログラムを例示するものであって、本発明をこれらに特定するものではなく、その他の実施形態のものにも等しく適用し得るものであり、また、これらの実施形態の一部を省略、追加、変更することや、各実施形態の態様を組み合わせることも可能である。 The data management system, data management method, and data management program according to the embodiments of the present invention have been described above. These are examples of programs, and the present invention is not limited to these, and can be equally applied to other embodiments. Modifications and combinations of aspects of each embodiment are possible.

10…中央処理システム
11…ログイン機能部
12…機械学習部
13…中央処理部
14…ユーザセッション管理部
15…グラフデータ管理部
16…外部SSO
17…クラウドストレージ
18…グラフデータ分析クラウド
20…メタデータ記憶部
21…ドキュメントノードテーブル
22…データノードテーブル
25…サブメタデータ
26…エッジテーブル
30…ユーザ管理システム
31…ユーザ情報管理部
32…マップビュア
33…ファイルラッパ
34…ファイルアップローダ
35…ユーザインターフェイス
36…BIツール
40…データマート
41…ユーザ属性管理テーブル
42…マスターテーブル
45…ユーザ端末
10... Central processing system 11... Login function unit 12... Machine learning unit 13... Central processing unit 14... User session management unit 15... Graph data management unit 16... External SSO
17... Cloud storage 18... Graph data analysis cloud 20... Metadata storage unit 21... Document node table 22... Data node table 25... Sub metadata 26... Edge table 30... User management system 31... User information management unit 32... Map viewer 33... File wrapper 34... File uploader 35... User interface 36... BI tool 40... Data mart 41... User attribute management table 42... Master table 45... User terminal

本発明の一態様に係るデータ管理システムは、データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、前記ノードのグループをデータセットとして管理し、前記データセットがユーザインターフェイスに、第1系列と該第1系列と交差する第2系列とを有するマトリックス状の構造として表示され、前記第1系列及び前記第2系列が、各系列のタグの種類に応じたツリー構造であり、前記第1系列及び前記第2系列それぞれのタグの種類が、時系列及び/又はデータタイプを少なくとも含むと共に、ユーザからの選択入力に応じて変更可能であり、各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とする。 A data management system according to an aspect of the present invention is a data management system that defines data as nodes, defines relationships between the nodes as edges, and manages a plurality of data, wherein groups of the nodes are managed as datasets. and the data set is displayed in a user interface as a matrix-like structure having a first series and a second series intersecting with the first series, the first series and the second series being tags for each series. wherein each tag type of the first series and the second series includes at least a time series and/or a data type, and can be changed according to a selection input from a user. , each series can be rearranged according to the type of the selected tag.

中央処理システム10は、ログイン機能部11、機械学習部12及び中央処理部13を有している。また、中央処理システム10は、ユーザ管理システム30を介してユーザ端末45に接続されている。ログイン機能部11は、外部SSO(Single Sign-On)16と通信することにより、ユーザ管理システム30を介してユーザによりユーザ端末45からのログイン操作があると、外部SSO16を利用することにより中央処理システム10からアクセスする全てのWebサービス、クラウドサービス、アプリケーション等にログインすることができる。機械学習部12は、例えば学習モデルによって、分類モデル、ベクトル距離、エッジ生成、レポート欠損値補間等の演算を行うことができる。 The central processing system 10 has a login function section 11 , a machine learning section 12 and a central processing section 13 . The central processing system 10 is also connected to user terminals 45 via the user management system 30 . The login function unit 11 communicates with an external SSO (Single Sign-On) 16, so that when a user performs a login operation from the user terminal 45 via the user management system 30, central processing is performed using the external SSO 16. All web services, cloud services, applications, etc. accessed from the system 10 can be logged into. The machine learning unit 12 can perform calculations such as classification model, vector distance, edge generation, report missing value interpolation, and the like, for example, using a learning model.

中央処理部13はユーザセッション管理部14及びグラフデータ管理部15を備えている。中央処理部13は、メタデータ記憶部20とサブメタデータ記憶部25に接続されている。メタデータ記憶部20は、データ群をタグ付け管理する記憶部であり、ドキュメントノードテーブル21とデータノードテーブル22とを有するデータベースである。サブメタデータ記憶部25はデータ群の各データに関連する情報をエッジ情報として保持するデータベースであり、エッジテーブル26を有している。ユーザセッション管理部14は、各ユーザ管理システム30に対応する各ユーザからの操作指令に応じた管理や、操作履歴の管理を行う。グラフデータ管理部15は、メタデータ記憶部20に記憶されているメタデータと、サブメタデータ記憶部25に記憶されているサブメタデータとにより、タグ付きデータとそのデータ間の関連をエッジとして管理し、「全てのデータがつながる」ことを実現している。 The central processing unit 13 has a user session management unit 14 and a graph data management unit 15 . The central processing unit 13 is connected to the metadata storage unit 20 and the sub-metadata storage unit 25 . The metadata storage unit 20 is a storage unit that tags and manages data groups, and is a database that has a document node table 21 and a data node table 22 . The sub-metadata storage unit 25 is a database that holds information related to each data of the data group as edge information, and has an edge table 26 . The user session management unit 14 performs management according to operation instructions from each user corresponding to each user management system 30 and management of operation history. The graph data management unit 15 uses the metadata stored in the metadata storage unit 20 and the sub-metadata stored in the sub-metadata storage unit 25 to define the tagged data and the relationship between the data as edges. It manages and realizes that "all data is connected".

また、中央処理部13は、外部のクラウドストレージ17に接続されている。中央処理システム10では、メタデータ記憶部20とサブメタデータ記憶部25にタグデータのみを記憶させ、膨大な記憶容量を要する実データ、例えば画像データ、動画データ、文章データ等は、外部のクラウドストレージ17に記憶させている。具体的には、中央処理システム10は、ノードデータをメタデータ記憶部20に記憶し、エッジデータをサブメタデータ記憶部25に記憶する一方、実データ自体、例えば動画データ、画像データ、文章データ等は、クラウドストレージ17に記憶する。また、フィルタリング機能により、必要なデータだけに絞り込んでから演算を行うことにより、データ処理量をさらに低減することが可能である。これにより、本実施形態のデータ管理システム自体はタグデータのみを記憶して、記憶するデータ量を少なし、しかもフィルタリング機能により必要なデータに絞り込んだ上でデータ処理を行うことにより、膨大な数のグラフデータ、例えば1億件以上のデータ数であっても、高速演算を実現している。このため、汎用PCを用いて本実施形態のデータ管理システムを構築することができる。また、本実施形態のデータ管理システムでは、従来の表計算ソフトでは実現できなかった、例えば「cycle」というタブにより、エッジデータを深堀するランダムウォーク機能を実現している。例えば、フィルター機能により絞り込んだノードデータに対して、ノードのグループをデータセットとして管理し、横軸を時系列に、縦軸をデータタイプに設定してユーザ端末45にデータセットを表示し、デーアセット又はデータセット中の各ノードからのエッジデータを深堀し、各ノードに紐づいた開発コード、価格情報、購入者情報等、次々にエッジを辿っていくことが可能である。 The central processing unit 13 is also connected to an external cloud storage 17 . In the central processing system 10, only the tag data is stored in the metadata storage unit 20 and the sub-metadata storage unit 25, and actual data requiring a huge storage capacity, such as image data, moving image data, text data, etc., is stored in an external cloud. It is stored in the storage 17. Specifically, the central processing system 10 stores the node data in the metadata storage unit 20 and the edge data in the sub-metadata storage unit 25, while storing the actual data itself, such as video data, image data, text data. etc. are stored in the cloud storage 17 . In addition, the amount of data processing can be further reduced by narrowing down to only necessary data by the filtering function and performing the calculation. As a result, the data management system itself of this embodiment stores only tag data to reduce the amount of data to be stored. graph data, for example, 100 million or more data, high-speed calculation is realized. Therefore, the data management system of this embodiment can be constructed using a general-purpose PC. In addition, the data management system of this embodiment realizes a random walk function for digging deep into edge data, which could not be realized with conventional spreadsheet software, for example, by using a tab called "cycle". For example, for the node data narrowed down by the filter function, a node group is managed as a data set, and the data set is displayed on the user terminal 45 by setting the horizontal axis to the time series and the vertical axis to the data type. It is possible to dig deeper into the edge data from each node in the asset or data set, and trace the edges one after another, such as the development code, price information, purchaser information, etc. linked to each node.

ユーザ情報管理部31は、ユーザからのログイン情報を中央処理システム10のログイン機能部11に渡すことにより、ユーザのログイン状態の管理を行う。マップビュア32は、中央処理部13から得られたグラフデータからMAP Viewを生成する。ファイルラッパ33は、ユーザ端末45から入力されるデータの変換を行う機能を有している。ファイルラッパ33は、ファイルアップローダ34を備えており、ファイルアップローダ34は、ユーザ端末45から入力されたデータの加工及びマイニングを行うことにより、中央処理部13が扱えるデータに変換する。ユーザインターフェイス35は、ユーザ端末45の入出力管理を行う。BIツール36は、データを分析、可視化して、経営や業務に役立てるソフトウェアである。データマート40は、中央処理システム10、メタデータ記憶部20、サブメタデータ記憶部25に蓄積された情報から、ユーザ管理システム30において必要な情報を抽出して、集計し、管理することにより、利用しやすい形に格納したデータベースであり、ユーザ属性情報を管理するユーザ属性管理テーブル41及び種別ごとに情報を管理する1つ以上のマスターテーブル42を有している。 The user information management unit 31 manages the user's login state by passing the login information from the user to the login function unit 11 of the central processing system 10 . A map viewer 32 generates a MAP View from the graph data obtained from the central processing unit 13 . The file wrapper 33 has a function of converting data input from the user terminal 45 . The file wrapper 33 has a file uploader 34 , and the file uploader 34 processes and mines data input from the user terminal 45 to convert the data into data that can be handled by the central processing unit 13 . The user interface 35 performs input/output management of the user terminal 45 . The BI tool 36 is software that analyzes and visualizes data and uses it for management and operations. The data mart 40 extracts necessary information in the user management system 30 from the information accumulated in the central processing system 10, the metadata storage unit 20, and the sub-metadata storage unit 25, aggregates, and manages It is a database stored in an easy-to-use form, and has a user attribute management table 41 for managing user attribute information and one or more master tables 42 for managing information for each type.

ユーザ管理システム30のファイルラッパ33は、各システムのデータの加工、マイニングを行い、中央処理システム10で扱えるデータに変換するものであり、顧客の属性データと対応させるために、ユーザ管理システム30毎に個別に作成される。 The file wrapper 33 of the user management system 30 processes and mines the data of each system and converts it into data that can be handled by the central processing system 10. In order to correspond to customer attribute data, each user management system 30 created separately.

中央処理システム10は、様々なAPIを用意している。例えば、Searchは、簡単な検索処理を、クエリを書かずに実行するためのAPIであり、また、QueryAPIは、グラフにクエリを投げるための汎用的なAPIである。ファイルラッパ33は、中央処理システム10のQuery APIを利用し、各データを中央処理システム10のデータ形式に変換して登録する。 The central processing system 10 prepares various APIs. For example, Search is an API for executing simple search processing without writing queries, and QueryAPI is a general-purpose API for querying graphs. The file wrapper 33 uses the query API of the central processing system 10 to convert each data into the data format of the central processing system 10 and register it.

ユーザインターフェイス35は、さらに、次の機能を有する。Report makerは、レポートを作成、編集する画面を提供する。Report Viewer & 検索画面は、レポート検索や複製を行う画面であり、データマート40への出力等を行う。Report makerは、レポートを作成、編集する画面であり、矛盾検出クローラーは、レポートの欠損等をユーザに報知する。機械学習部12により訓練した学習モデルに基づき、矛盾、欠損、誤記等を判断する。 The user interface 35 also has the following functions. Report maker provides screens for creating and editing reports. The Report Viewer & Search screen is a screen for searching and duplicating reports, and for outputting to the data mart 40 and the like. The Report maker is a screen for creating and editing reports, and the contradiction detection crawler notifies the user of missing reports. Based on the learning model trained by the machine learning unit 12, discrepancies, deficiencies, typographical errors, etc. are determined.

[ファイルラッパとレポートラッパ]
「ファイルラッパ」(33)は、横軸(横系統)を「時系列ツリー構造」とし、縦軸(縦系列)を「関連性ツリー構造」として、あたかもEXCELのような視覚的に分かりやすいファイル構造を提供する。従来のグラフデータは、天気データのように固定的で単純なデータ構造に対してのみ、自動的にエッジを作成できていた。天気データは、日にち、地域、気温、湿度等からなる単純な定型のデータである。天気データのような単純な、いわゆるビッグデータとして扱える範囲の定型データしか自動でのエッジ生成はできなかった。
[File Wrapper and Report Wrapper]
"File wrapper" ( 33) is a visually easy-to-understand file like EXCEL with the horizontal axis (horizontal system) as "time series tree structure" and the vertical axis (vertical series) as "relationship tree structure". Provide structure. Conventional graph data could automatically create edges only for fixed and simple data structures such as weather data. Weather data is simple fixed form data consisting of date, area, temperature, humidity, and the like. Automatic edge generation was only possible for standard data that could be handled as simple, so-called big data, such as weather data.

[表示画面におけるグラフデータの関係]
本実施形態のシステムでは、従来エクセルで作成、管理されていたレポートシステムをすべてWeb化するため、エクセルの代替えとなるレポート作成機能が追加されている。ユーザ端末45では、データベース上のデータを表示したり、ローカル上のデータやコンテンツをアップロードしたりすることが可能である。
[Relationship of graph data on the display screen]
In the system of the present embodiment, a report creation function is added as an alternative to Excel in order to convert all report systems that were created and managed in Excel conventionally into a Web format. The user terminal 45 can display data on the database and upload local data and content.

図2は、グラフデータとレポートとの関係の説明図である。グラフデータにおいて、データはノードとして表され、データ間の関係はエッジとして表されている。関連する複数のデータがデータセットとしてまとめて管理され、データセット間にエッジが形成される。データセットに対して、纏まりとしてエッジを形成することにより、データ群の管理が容易となり、例えばシミュレーション毎、実験毎のデータをまとめて管理し易くなる。
(1)ファイルラッパ33によって、それぞれのユーザ管理システム30から中央処理システム10にデータが取り込まれ、データを抽出して必要なノード、エッジを生成し、API経由で中央処理システム10に送られる。
(2)新しいノードの作成については、新規でレポートを作成した際には、新しいレポートノードが自動生成される。
(3)コンテンツの追加については、レポートにユーザが作成した新規のコンテンツ(例えば画像)を追加すると、そのコンテンツがノードとして追加され、かつ、レポートとの間にエッジが自動生成される。
(4)既存データの引用については、他の系列から取得した既存のデータをレポートで引用(ユーザ端末45上で、既存のデータをdrag&dropすると、レポートと既存のデータに対応するノードとの間に、エッジが自動生成される。
(5)関連性をエッジで表現については、複数のデータノードから取得した既存のデータに基づくチャートをレポートに追加する場合、例えば同じチャートに2つのデータが使用された場合には、その2つのデータに対応するノード間に自動的にエッジが生成される。
FIG. 2 is an explanatory diagram of the relationship between graph data and reports. In graph data, data are represented as nodes, and relationships between data are represented as edges. A plurality of related data are collectively managed as data sets, and edges are formed between the data sets. Forming an edge as a group for the data set facilitates management of the data group, and facilitates collective management of data for each simulation or each experiment, for example.
(1) The file wrapper 33 takes data from each user management system 30 into the central processing system 10, extracts the data, generates the necessary nodes and edges, and sends them to the central processing system 10 via API.
(2) Regarding creation of a new node, when a new report is created, a new report node is automatically generated.
(3) Regarding addition of content, when new content (for example, an image) created by the user is added to the report, the content is added as a node and an edge is automatically generated between the content and the report.
(4) As for citing existing data, existing data acquired from other series is cited in the report (when existing data is dragged and dropped on the user terminal 45 , the node corresponding to the report and the existing data is , edges are automatically generated.
(5) Relations represented by edges, when adding a chart based on existing data acquired from multiple data nodes to a report, for example, when two data are used in the same chart, the two Edges are automatically generated between nodes corresponding to the data.

図5は、レポート作成操作の説明図である。レポート作成操作のために、まずユーザ端末45のディスプレイ上で、レポート作成対象となるノードのエンティティを右クリックし、プルダウンメニューから「レポートを作成する」を選択する。レポート作成の選択画面からさらに、雛形一覧や自動フォーマット等の選択が可能であり、所定のひな形を選択したり、自動的に作成されたレポートの様式を利用したり、することができる。自動フォーマットの利用にあたり、機械学習部12において訓練された学習モデルを用いることにより、適切なレポートの様式を自動作成させることが可能である。この場合、機械学習部12における訓練には、過去に作成されたレポート、そこで使用されたデータセット、データ、引用関係等が用いられる。 FIG. 5 is an explanatory diagram of the report creation operation. For the report creation operation, first, on the display of the user terminal 45 , right-click the entity of the node for which the report is to be created, and select "create report" from the pull-down menu. From the report creation selection screen, it is also possible to select a model list, an automatic format, etc., and it is possible to select a predetermined model or use an automatically created report format. When using the automatic format, it is possible to automatically create an appropriate report format by using a learning model trained in the machine learning unit 12 . In this case, reports created in the past, data sets, data, citation relationships, and the like used therein are used for training in the machine learning unit 12 .

事前設定として必要となる情報、例えば人事情報および担当プロジェクト情報は、ファイルラッパ33により、周辺システム(図示省略)より自動で取り込むことができる。顧客特有の事項については、事前にユーザ管理システム30の設定が必要である。ユーザ情報定義は、例えば一般的なRDB形式で保持される。ただし、例えば、担当プロジェクト、担当業務領域/担当性能、最終実施実験/シミュレーション、最終作成レポート等については、様々な属性情報をつけられるようJSON形式での属性付与機能を持たせている。 Information necessary for presetting, such as personnel information and assigned project information, can be automatically retrieved from a peripheral system (not shown) by the file wrapper 33 . For customer-specific matters, the user management system 30 must be set in advance. User information definitions are held, for example, in a general RDB format. However, for example, for projects in charge, business areas in charge/performance in charge, final experiments/simulations, final reports, etc., a JSON format attribute function is provided so that various attribute information can be added.

Claims (5)

データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、
前記ノードのグループをデータセットとして管理し、
前記データセットがユーザインターフェイスに、第1系列と該第1系列と交差する第2系列とを有するマトリックス状の構造として表示され、
前記第1系列及び前記第2系列が、各系列のタグの種類に応じたツリー構造であり、
前記第1系列及び前記第2系列それぞれのタグの種類が、時系列及び/又はデータタイプを少なくとも含むと共に、選択変更可能であり、
各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とするデータ管理システム。
A data management system that defines data as nodes and relationships between the nodes as edges, and manages a plurality of data,
managing the group of nodes as a dataset;
displaying the data set in a user interface as a matrix-like structure having a first series and a second series intersecting the first series;
The first series and the second series are tree structures according to the types of tags in each series,
the types of tags of each of the first series and the second series include at least a time series and/or a data type, and are selectable and changeable;
A data management system, wherein each series can be rearranged according to the type of tag selected.
前記エッジが前記データセット単位で付与され、
前記ノード及び前記エッジには、タグが付与されており、
前記ノードタグのスキーマは、データタイプに応じて定義されている、及び/又は、
前記ノードのタグとして、タイプ別の分類、及び/又は、ネスト構造となるような分類が定義されていることを特徴とする請求項1に記載のデータ管理システム。
The edge is given in units of the data set,
The nodes and edges are tagged,
the node tag schema is defined according to a data type; and/or
2. The data management system according to claim 1, wherein a classification by type and/or a classification having a nest structure are defined as tags of the nodes.
前記データセットが、ユーザインターフェイスにエンティティとして表示され、
前記データセットが、前記ユーザインターフェイスの操作により、次の機能群の中のいずれか少なくとも1つの機能を使用して操作されることを特徴とする請求項1又は2に記載のデータ管理システム。
前記データセットに属するデータの表示ないし操作、
前記データセットに属するデータのダウンロード、
前記データセットのレポートの表示、作成又は編集、
前記データセットのレポート作成用フォーマットの読み出し、作成又は編集、
前記データセットへのデータの追加、
レポート、データセット又はデータの検索、
前記ノードの検索、
他のデータセットのデータの参照ないし引用、
新規データの登録、
新規のデータないし他のデータセットのデータをドラッグアンドドロップにより引用する操作、
前記エッジのタグの設定、
前記データセットのノードの表示切替、
前記データセットの下位のノードの表示切替、
前記データの持つKPIの管理、
前記データセットないし前記ノードの関連性の検索、表示又は分析、
表示絞り込み条件の設定、プルダウンメニューの選択操作、
前記エンティティの選択ないし操作メニューの選択、
前記エンティティからデータ単体のデータポイントのブレイクダウン操作ないし選択操作、
ログイン機能、
前記データセットについてのレポートを作成機能、
他のノードのデータないし新規のデータを引用する機能、又は、
レポートの欠損ないし誤記の修正アシスト機能、
からなる機能群。
said dataset is represented as an entity in a user interface;
3. The data management system of claim 1 or 2, wherein the data set is manipulated using at least one of the following functional groups by manipulation of the user interface.
displaying or manipulating data belonging to said dataset;
downloading data belonging to said dataset;
viewing, creating or editing a report of said dataset;
reading, creating or editing a reporting format for said data set;
adding data to said dataset;
search for reports, datasets or data;
searching for said node;
referencing or citing data from other datasets;
registration of new data,
Operation of citing new data or data of other datasets by drag and drop,
setting tags for said edges;
switching display of nodes of the data set;
display switching of lower nodes of the data set;
management of KPIs held by the data;
searching, displaying or analyzing relevance of said dataset or said nodes;
Setting of display filter conditions, selection operation of pull-down menu,
selecting the entity or selecting an operation menu;
breakdown or selection of data points of data units from said entity;
login function,
the ability to create reports on said dataset;
A function to quote data of other nodes or new data, or
Missing or erroneous report correction assistance function,
A group of functions consisting of
データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理方法であって、
前記ノードのグループをデータセットとして管理する管理ステップと、
前記データセットがユーザインターフェイスに、タグの種類に応じたツリー構造である第1系列と、該第1系列と交差し、タグの種類に応じたツリー構造である第2系列とを有するマトリックス状の構造として表示するステップと、
前記第1系列及び前記第2系列それぞれのタグの種類が、選択変更を受け付けるステップと、
各系列が、選択されたタグの種類に応じて並び替えるステップと、
を備え、
前記第1系列及び前記第2系列それぞれのタグの種類が、時系列及び/又はデータタイプを少なくとも含むことを特徴とするデータ管理方法。
A data management method for managing a plurality of data by defining data as nodes and relationships between the nodes as edges,
a management step of managing the group of nodes as a dataset;
The data set is provided in a user interface as a matrix having a first series, which is a tree structure corresponding to the type of tag, and a second series, which intersects with the first series and is a tree structure corresponding to the type of tag. displaying as a structure;
a step in which the types of tags of each of the first series and the second series receive a selection change;
each series sorting according to the type of tag selected;
with
A data management method, wherein the types of tags for each of the first series and the second series include at least a time series and/or a data type.
請求項4に記載のデータ管理方法をコンピュータにより実行することを特徴とするデータ管理プログラム。 A data management program for executing the data management method according to claim 4 by a computer.
JP2021173529A 2021-10-22 2021-10-22 Data management system, data management method and data management program Active JP7022472B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021173529A JP7022472B1 (en) 2021-10-22 2021-10-22 Data management system, data management method and data management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021173529A JP7022472B1 (en) 2021-10-22 2021-10-22 Data management system, data management method and data management program

Publications (2)

Publication Number Publication Date
JP7022472B1 JP7022472B1 (en) 2022-02-18
JP2023063180A true JP2023063180A (en) 2023-05-09

Family

ID=81073879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021173529A Active JP7022472B1 (en) 2021-10-22 2021-10-22 Data management system, data management method and data management program

Country Status (1)

Country Link
JP (1) JP7022472B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102643776B1 (en) * 2023-07-03 2024-03-07 (주)유비디시전 System for providing software as a service standard linkage platform service for life-cycle electronic document total management

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046796A (en) * 2002-07-15 2004-02-12 Seiko Epson Corp Directory management program, object display program, directory management method and directory management device
JP2012252547A (en) * 2011-06-03 2012-12-20 Nippon Telegr & Teleph Corp <Ntt> Content management system, content management method, content management program and content management server

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102643776B1 (en) * 2023-07-03 2024-03-07 (주)유비디시전 System for providing software as a service standard linkage platform service for life-cycle electronic document total management

Also Published As

Publication number Publication date
JP7022472B1 (en) 2022-02-18

Similar Documents

Publication Publication Date Title
US10853387B2 (en) Data retrieval apparatus, program and recording medium
AU2020260374B2 (en) Building reports
KR101644418B1 (en) Visualizing relationships between data elements and graphical representations of data element attributes
US7418459B2 (en) Object oriented based, business class methodology for performing data metric analysis
KR101517460B1 (en) Graphic representations of data relationships
US10354002B2 (en) Interaction relationship building and explorer for dashboard
US7822795B2 (en) Apparatus and methods for displaying and determining dependency relationships among subsystems in a computer software system
US9075859B2 (en) Parameterized database drill-through
EP2463790B1 (en) Manipulation of elements and their attributes in graphical user interfaces
JP6492008B2 (en) Cohort identification system
JP7022472B1 (en) Data management system, data management method and data management program
Marjani et al. Measuring transaction performance based on storage approaches of Native XML database
Polášek et al. Information and knowledge retrieval within software projects and their graphical representation for collaborative programming
US20140344235A1 (en) Determination of data modification
US11216486B2 (en) Data retrieval apparatus, program and recording medium
Stempfhuber Adaptive and Context-Aware Information Environments based on ODIN–Using Semantic and Task Knowledge for User Interface Adaptation in Information Systems
Peukert et al. LEAP Data and Knowledge Integration Infrastructure
JP2002183178A (en) Device and method for supporting data analysis and storage medium
US20120089593A1 (en) Query optimization based on reporting specifications
CN117312774A (en) Intelligent aggregation visualization and management and control system for big data
San Martin et al. Personal management of social networks data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211104

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220131

R150 Certificate of patent or registration of utility model

Ref document number: 7022472

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150