JP7022472B1

JP7022472B1 - データ管理システム、データ管理方法及びデータ管理プログラム

Info

Publication number: JP7022472B1
Application number: JP2021173529A
Authority: JP
Inventors: 英隆飯銅
Original assignee: 株式会社Cagla
Priority date: 2021-10-22
Filing date: 2021-10-22
Publication date: 2022-02-18
Anticipated expiration: 2041-10-22
Also published as: JP2023063180A

Abstract

【課題】グラフデータの各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに分かりやすく表現することができるデータ管理システム、データ管理方法又はデータ管理プログラムを提供する。【解決手段】実施形態の一つのデータ管理システムは、データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、前記ノードのグループをデータセットとして管理し、前記データセットがユーザインターフェイスに、第１系列と該第１系列と交差する第２系列とを有するマトリックス状の構造として表示され、前記第１系列及び前記第２系列が、各系列のタグの種類に応じたツリー構造であり、前記第１系列及び前記第２系列それぞれのタグの種類が、時系列及び／又はデータタイプを少なくとも含むと共に、選択変更可能であり、各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とする。【選択図】図１

Description

本発明は、データ管理システム、データ管理方法及びデータ管理プログラムに関する。

情報検索可能なデータ管理システムにおいて、グラフ理論を用いたデータ管理方法が採用されている。例えば、特許文献１には、与えられたグラフデータに基づいて情報検索用の新たなグラフデータを生成するグラフデータ生成装置が記載されている。

特許第６２９３３３５号

特許文献１では、検索用の新たなグラフデータを自動生成可能であるが、各データは単純な定型データに限定されており、しかも、生成されたグラフデータは、複数ノードとその間の入力エッジと出力エッジだけからなる単純なグラフデータの構造であるにも関わらず、ループや多重辺を多数含むために、グラフデータの中の各ノード間の関係を簡潔に表現できないうえに、各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに表現することは困難であった。

本発明は、グラフデータの各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに分かりやすく表現することができるデータ管理システム、データ管理方法又はデータ管理プログラムを提供することを目的とする。

本発明の一態様に係るデータ管理システムは、データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、前記ノードのグループをデータセットとして管理し、前記データセットがユーザインターフェイスに、第１系列と該第１系列と交差する第２系列とを有するマトリックス状の構造として表示され、前記第１系列及び前記第２系列が、各系列のタグの種類に応じたツリー構造であり、前記第１系列及び前記第２系列それぞれのタグの種類が、時系列及び／又はデータタイプを少なくとも含むと共に、ユーザからの選択入力に応じて変更可能であり、各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とする。

本発明の一態様に係るデータ管理システムによれば、グラフデータの各ノード間の時系列の関係及び各ノードのタグ等の付加価値の高い情報をユーザインターフェイスに分かりやすく表現することができる。

図１は、実施形態１に係るデータ管理システムのブロック図である。図２は、実施形態１に係る、グラフデータとレポートとの関係の説明図である。図３は、実施形態１に係るレポート、データのマップ表示の説明図である。図４は、レポート内のデータ表示の説明図である。図５は、レポート作成操作の説明図である。図６は、レポートへのデータ引用操作の説明図である。図７は、新たなレポートの登録表示の説明図である。図８は、レポートのデータ参照表示の説明図である。テキスト検索の結果表示の説明図である。図１０は、データの引用関係表示の説明図である。図１１は、レポート作成の手順の説明図である。図１２は、データ入力の手順の説明図である。図１３は、実施形態２に係るレポート、データのマップ表示の説明図である。

以下、図面を参照して本発明の実施形態に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。但し、以下に示す実施形態は本発明の技術思想を具体化するためのデータ管理システム、データ管理方法及びデータ管理プログラムを例示するものであって、本発明をこれらに特定するものではなく、特許請求の範囲に含まれるその他の実施形態のものにも等しく適用し得るものである。

[実施形態１]
図１～図１２を参照して、実施態様１に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。

［システムブロック図について］
図１は、本開示の一態様に係るデータ管理システムのブロック図である。本実施形態のデータ管理システムは、ノード及び各ノードの関係を規定したエッジからなるグラフデータを扱うことができる。ノード及びエッジにはタグが付されている。タグはデータタイプに応じてスキーマが定義されているので、データタイプに適合したタグが付されることにより、データ管理がし易くなる。例えば、ファイルの種類がCSVファイルかINGファイルかに応じて、また、画像や動画については解像度やサイズに応じて、タグのスキーマは異なる。タグの必須情報としては、特に限定されるものではないが、例えば日時、データタイプ、担当者等の情報が含まれる。

中央処理システム１０は、ログイン機能部１１、機械学習部１２及び中央処理部１３を有している。また、中央処理システム１０は、ユーザ管理システム３０を介してユーザ端末４５に接続されている。ログイン機能部１１は、外部ＳＳＯ（Single Sign-On）１６と通信することにより、ユーザ管理システム３０を介してユーザによりユーザ端末４５からのログイン操作があると、外部ＳＳＯ１６を利用することにより中央処理システム１０からアクセスする全てのWebサービス、クラウドサービス、アプリケーション等にログインすることができる。機械学習部１２は、例えば学習モデルによって、分類モデル、ベクトル距離、エッジ生成、レポート欠損値補間等の演算を行うことができる。

中央処理部１３はユーザセッション管理部１４及びグラフデータ管理部１５を備えている。中央処理部１３は、メタデータ記憶部２０とサブメタデータ記憶部２５に接続されている。メタデータ記憶部２０は、データ群をタグ付け管理する記憶部であり、ドキュメントノードテーブル２１とデータノードテーブル２２とを有するデータベースである。サブメタデータ記憶部２５はデータ群の各データに関連する情報をエッジ情報として保持するデータベースであり、エッジテーブル２６を有している。ユーザセッション管理部１４は、各ユーザ管理システム３０に対応する各ユーザからの操作指令に応じた管理や、操作履歴の管理を行う。グラフデータ管理部１５は、メタデータ記憶部２０に記憶されているメタデータと、サブメタデータ記憶部２５に記憶されているサブメタデータとにより、タグ付きデータとそのデータ間の関連をエッジとして管理し、「全てのデータがつながる」ことを実現している。

また、中央処理部１３は、外部のクラウドストレージ１７に接続されている。中央処理システム１０では、メタデータ記憶部２０とサブメタデータ記憶部２５にタグデータのみを記憶させ、膨大な記憶容量を要する実データ、例えば画像データ、動画データ、文章データ等は、外部のクラウドストレージ１７に記憶させている。具体的には、中央処理システム１０は、ノードデータをメタデータ記憶部２０に記憶し、エッジデータをサブメタデータ記憶部２５に記憶する一方、実データ自体、例えば動画データ、画像データ、文章データ等は、クラウドストレージ１７に記憶する。また、フィルタリング機能により、必要なデータだけに絞り込んでから演算を行うことにより、データ処理量をさらに低減することが可能である。これにより、本実施形態のデータ管理システム自体はタグデータのみを記憶して、記憶するデータ量を少なし、しかもフィルタリング機能により必要なデータに絞り込んだ上でデータ処理を行うことにより、膨大な数のグラフデータ、例えば１億件以上のデータ数であっても、高速演算を実現している。このため、汎用ＰＣを用いて本実施形態のデータ管理システムを構築することができる。また、本実施形態のデータ管理システムでは、従来の表計算ソフトでは実現できなかった、例えば「cycle」というタブにより、エッジデータを深堀するランダムウォーク機能を実現している。例えば、フィルター機能により絞り込んだノードデータに対して、ノードのグループをデータセットとして管理し、横軸を時系列に、縦軸をデータタイプに設定してユーザ端末４５にデータセットを表示し、デーアセット又はデータセット中の各ノードからのエッジデータを深堀し、各ノードに紐づいた開発コード、価格情報、購入者情報等、次々にエッジを辿っていくことが可能である。

ユーザ管理システム３０は、ユーザ情報管理部３１、マップビュア３２、ファイルラッパ３３、ユーザインターフェイス３５、BIツール３６、レポート作成部３７等備えている。ユーザ管理システム３０は、１以上のユーザ端末４５、及び、データマート４０に接続されている。また、データマート４０とユーザ端末４５とも接続されている。

ユーザ情報管理部３１は、ユーザからのログイン情報を中央処理システム１０のログイン機能部１１に渡すことにより、ユーザのログイン状態の管理を行う。マップビュア３２は、中央処理部１３から得られたグラフデータからMAP Viewを生成する。ファイルラッパ３３は、ユーザ端末４５から入力されるデータの変換を行う機能を有している。ファイルラッパ３３は、ファイルアップローダ３４を備えており、ファイルアップローダ３４は、ユーザ端末４５から入力されたデータの加工及びマイニングを行うことにより、中央処理部１３が扱えるデータに変換する。ユーザインターフェイス３５は、ユーザ端末４５の入出力管理を行う。BIツール３６は、データを分析、可視化して、経営や業務に役立てるソフトウェアである。データマート４０は、中央処理システム１０、メタデータ記憶部２０、サブメタデータ記憶部２５に蓄積された情報から、ユーザ管理システム３０において必要な情報を抽出して、集計し、管理することにより、利用しやすい形に格納したデータベースであり、ユーザ属性情報を管理するユーザ属性管理テーブル４１及び種別ごとに情報を管理する１つ以上のマスターテーブル４２を有している。

ユーザ端末４５は、ユーザインターフェイス３５を利用すると共に、BIツール３６及びレポート作成部３７の機能を利用可能であり、ユーザ自身がデータの分析やレポートの作成を行うことができる。図１では、ユーザ管理システム３０内に、ユーザインターフェイス３５、BIツール３６及びレポート作成部３７を有する構成が示されているが、本実施例はこれに限定されるものではなく、例えば、BIツール３６及びレポート作成部３７をユーザインターフェイス３５と一体に組み込んだり、ユーザインターフェイス３５を中央処理システム１０側に共通の機能として設ける構成としてもよい。

従来、データ群はファイルサーバーに保存されていたため、汎用性、再利用性がなかったが、本実施形態では、データ郡をメタデータ記憶部２０、サブメタデータ記憶部２５にてタグ付け管理することにより、再利用性や検索性能を向上させた。また、関連する情報をエッジ情報として保持することで、各データの関連も同様に保存される。エッジには、例えば車種、部品名、諸元名、値などの物理的な名称だけではなく、諸元値に対するエビデンスやバージョン管理情報といった付加情報も同様に保持することにより、全てのデータがつながることを実現した。実ファイルに対応するノードをメタデータ記憶部２０に書き出し、メタ情報をプロパティとして保持する。また、サブメタ情報（エビデンス、ナレッジ、バージョン管理）をエッジとしてサブメタデータ記憶部２５に書き出し、それによって各ノードを紐付ける。そして、膨大なデータ量となる実ファイル自体は、クラウドストレージ１７に記憶する。これにより、本実施形態のデータ管理システムは、それぞれのデータが繋がるため、全てのデータを横断的に管理することが可能となると共に、演算負荷を低減している。

ユーザ管理システム３０のファイルラッパ３３は、各システムのデータの加工、マイニングを行い、中央処理システム１０で扱えるデータに変換するものであり、顧客の属性データと対応させるために、ユーザ管理システム３０毎に個別に作成される。

中央処理システム１０の中央処理部１３は、本実施形態のシステムのコアアルゴリズムを有しており、ここではメタデータ記憶部２０及びサブメタデータ記憶部２５等からなるリレーショナルデータベースRDBとユーザ管理システム３０とを連携し、高速な検索や系譜管理を行う。また、中央処理部１３は、グラフデータ分析クラウド１８にも接続されており、後述のとおり、系譜管理や表示マップ等にグラフデータ分析クラウド１８の機能を利用することが可能である。このように、本実施形態のデータ管理システムは、外部のクラウドを利用することにより、自システムの処理負担を軽減し、大規模なデータ数のグラフデータに対する高速演算を実現している。

データマート４０には、ユーザインターフェイス３５、BIツール３６、レポート作成部３７等で必要なデータ等が格納されている。

ドキュメントノードテーブル２１は、レポートやドキュメントといった形でデータノードをグループ化して保持するためのテーブルである。データノードテーブル２２は、各種データを保持するためのノードのためのテーブルであり、データとしてはグラフデータ等の様々な情報が含まれている。エッジテーブル２６は、データ間の紐付け情報を保持するためのテーブルである。本実施形態では、日付やリビジョン、エビデンス等の様々な条件による紐付け情報が保持されている。

ユーザインターフェイス３５を中央処理システム１０で集中管理することも可能である。ファイルアップローダ３４は、定型フォーマット、例えばCSVまたはTSV等でアップロードされたデータに対応する。ユーザインターフェイス３５には、例えばNode Editor & viewerが含まれており、ノードやエッジの単体追加、削除、プロパティ編集を行うことができ、ユーザ端末４５にグラフのイメージで表示することができる。

ファイルラッパ３３は、中央処理システム１０の持つFile upload機能に対応できるようユーザのデータフォーマットを整形、変換する。

中央処理システム１０は、様々なAPIを用意している。例えば、Searchは、簡単な検索処理を、クエリを書かずに実行するためのAPIであり、また、QueryAPIは、グラフにクエリを投げるための汎用的なAPIである。ファイルラッパ３３は、中央処理システム１０のQuery APIを利用し、各データを中央処理システム１０のデータ形式に変換して登録する。

ユーザインターフェイス３５は、さらに、次の機能を有する。Report makerは、レポートを作成、編集する画面を提供する。Report Viewer & 検索画面は、レポート検索や複製を行う画面であり、データマート４０への出力等を行う。Report makerは、レポートを作成、編集する画面であり、矛盾検出クローラーは、レポートの欠損等をユーザに報知する。機械学習部１２により訓練した学習モデルに基づき、矛盾、欠損、誤記等を判断する。

［用語の説明］
ここで、本実施形態で使用する用語について説明する。
（１）ドキュメントについて
「ドキュメント」は、WordやExcel等のドキュメント形式だけでなく、MATLAB（登録商標）の入出力となるデータ等も含めたファイルで管理される単位のことを意味している。ドキュメントには「レポート」と「データ」の２つのタイプがある。「データ」は、計測、シミュレーション、予測等の結果を客観的事実として格納したものであり、画像やチャート一枚であることもあれば、それらを束ねたファイルであることもある。「レポート」は、これらのデータに基づいて客観的考察を含めて決定への思考プロセスや議論の内容を記述したものである。

ノード、エッジには、様々なタグが付与されている。ノードには、作成者、作成日時、オブジェクトID、種別、名称等のタグが付与される。エッジには、作成者、作成日時、種別、データ番号、コメント等のタグが付与される。ノードについて、例えば種別としては例えば企画、テスト計画書、実測データ、諸元値、シミュレーション結果、モデル等が挙げられる。エッジについて、例えば種別としては、レポート添付、エビデンス、次のプロセス、データ利用、エビデンス等が挙げられ、例えばデータ番号としては、１、２、３、・・・等の符号が挙げられ、例えばコメントとしては、再確認の際のレポート、データから図表作成等が挙げられる。

（２）レポート画面
レポートは、ウェブ画面で作成されることよりも、WordやExcel等を用いて作成されることが一般的である。WordやExcel等を用いて作成されたレポートについて、該レポートとデータとの関連を、ノードとエッジの関係として保持しておくことにより、後々データに遡ることを可能にしている。このため、少なくともレポートに含まれるデータを登録しておけるようにしてある。各レポートに登録されているデータを一覧表示するウェブUIにより、「関連レポートを探す」といった作業等が可能である。その上で、必要に応じてWordやExcel等を用いて作成されたレポートのファイルをダウンロードして閲覧することができる。レポートを各ビュー上で登録、編集を行うと、メタデータ記憶部２０及びサブメタデータ記憶部２５にノードデータとエッジデータが自動的に追加、変更される。レポートを表示する場合には、グラフデータの中から目標とするサブグラフを抽出し、グラフデータ分析クラウド１８、例えばグラフィッククライアント（Oracle）による画面描画表示用のデータが作成される。レポートに用いられているデータの引用関係を表示することも可能である。さらに、オブジェクトIDから、直接データにアクセスすることも可能である。

（３）推論エンジンと機械学習
推論エンジンにより、論理式を適用して論理的帰結（entailment）を導出する。例えば、
A => B, B => C ならば A => C
という論理的帰結を得られる。機械学習を用いて、過去データに基づいた訓練により学習モデルを生成し、これを適用することにより、推論エンジンの論理式を介さず結果を得ることができる。例えば、学習モデルによって、分類モデル、ベクトル距離、エッジ生成、レポート欠損値補間等の演算が得ることができる。

（４）系譜に着目するメリット
従来、レポート及びデータを検索し、再利用性を高めるためのデータベース化の際には、検索に求められる要件によって、データベースの粒度や正規化度合いは異なる。例えば、集計が必要か、全文検索で十分か等の要件により、データベース化の要件が異なる。本実施形態のデータ管理データは、レポート及びデータの間の柔軟な関連性のデータベース化が可能である。データベースの構造化として、全文検索（テキスト）、メタデータ（タグの付与）、グラフ（タグと関係性の付与）、構造化ドキュメント（XML／JSON）、リレーショナル（表）、セマンティクス（RDF）等が考慮される。

（５）ノードとエッジ
グラフDBに実ファイルをノードとして書き出し、メタ情報をプロパティとして保持する。また、サブメタ情報（エビデンス、ナレッジ、バージョン管理）をエッジとして書き出し、それによって各ノードを紐付ける。これにより、各データが繋がり、全てのデータを横断的に管理することが可能となる。

［ファイルラッパとレポートラッパ］
「ファイルラッパ」（３３）は、横軸（横系統）を「時系列ツリー構造」とし、縦軸（縦系列）を「関連性ツリー構造」として、あたかもEXCELのような視覚的に分かりやすいファイル構造を提供する。従来のグラフデータは、天気データのように固定的で単純なデータ構造に対してのみ、自動的にエッジを作成できていた。天気データは、日にち、地域、気温、湿度等からなる単純な定型のデータである。天気データのような単純な、いわゆるビッグデータとして扱える範囲の定型データしか自動でのエッジ生成はできなかった。

「レポートラッパ」（レポート作成部３７）は、データノードグループとして「レポート」を登録する。ヘテロなデータ処理が必要。つまり、属性がいろいろと異なったデータが混在している実用上のシステムで活用可能なことが必要である。

［学習について］
学習によりエッジを貼るために、深層学習よりもシンプルな学習アルゴリズムが利用可能である。例えば、欠損値補間を利用した最短経路探索学習を行うことにより、ノードに対応するエッジを貼ることができる。別の学習の例としては、Ｎ次多項式ノンマルコフ定義（non-Markov process、非マルコフ過程）における強化学習を利用することにより、操作者が未入力の箇所を示唆することができる。例えば、「関連する前回のファイルには諸元値データとして、αが含まれているが、今回のファイルにはαをいれないでよいのでしょうか？」との修正の示唆を行う。

［本実施形態のシステムの概要］
本実施形態のシステムは、例えば、横系統を時系列ツリー構造とし、縦系列を関連性ツリー構造として、視覚的に分かりやすいファイル構造としているため、実験、シミュレーションにまつわるデータの探索と参照を、これまでよりも効果的に実施することができる。データ一覧をリスト表示ではなくマップ表示（横系列と縦系列からなるマップ表示）し、データ間の関連を付けたうえで表示することで、視覚的に把握しやすい表示となっている。属性値の全文検索機能も併せてつけることで、使い慣れた検索エンジン、例えばEXCELを操作するような感覚でデータを探すことができる。

本実施形態のデータ管理システムは、データの登録の不便さを解消し、簡単な登録を可能にする。登録するデータは、ユーザの属性値などを加味し、デフォルト設定をベースとした属性値登録を実現した。最小限の入力項目で登録を可能にする。ユーザ端末４５からのユーザの操作はDrag＆Dropで行い、誰でもわかりやすく操作できる。システム間連携により、属性値等の情報の自動登録機能を設けている。視覚表現を実現するMapデータには、Graphベース（グラフ理論を利用する）のPaaS(Platform as a Service)を活用することができる。PaaSを用いることにより、本実施形態のデータ管理システムのアプリケーション開発に必要な実行環境、例えばアプリケーションのコードを実行するのに必要な言語のランタイムや、データベース等のミドルウェアをクラウド上で利用することができる。このサービス内にドキュメント管理機能も内包している。グラフデータ分析クラウド１８として、例えば、Oracle分析クラウドを用いてデータの視覚化とレポート作成が可能である。Oracle分析クラウドのグラフ分析関数を使用すると、地理空間解析を実行できる。例えば、2つの頂点間の距離やホップ数を計算できまる。

ユーザ管理システム３０における業務特化の属性値はAdd-on機能の中で開発し、開発量を最小限としている。データ内容の参照機能は、一般的なSelf Service BIツールを想定し、ユーザが使いやすいツールを選択できる形とした。すなわち、本実施形態のデータ管理システムでは、BIツール（Business Intelligence tools）３６を用いてユーザ自身がデータの分析やレポートの作成を行うことができる。

［表示画面におけるグラフデータの関係］
本実施形態のシステムでは、従来エクセルで作成、管理されていたレポートシステムをすべてWeb化するため、エクセルの代替えとなるレポート作成機能が追加されている。ユーザ端末４５では、データベース上のデータを表示したり、ローカル上のデータやコンテンツをアップロードしたりすることが可能である。

図２は、グラフデータとレポートとの関係の説明図である。グラフデータにおいて、データはノードとして表され、データ間の関係はエッジとして表されている。関連する複数のデータがデータセットとしてまとめて管理され、データセット間にエッジが形成される。データセットに対して、纏まりとしてエッジを形成することにより、データ群の管理が容易となり、例えばシミュレーション毎、実験毎のデータをまとめて管理し易くなる。
（１）ファイルラッパ３３によって、それぞれのユーザ管理システム３０から中央処理システム１０にデータが取り込まれ、データを抽出して必要なノード、エッジを生成し、API経由で中央処理システム１０に送られる。
（２）新しいノードの作成については、新規でレポートを作成した際には、新しいレポートノードが自動生成される。
（３）コンテンツの追加については、レポートにユーザが作成した新規のコンテンツ（例えば画像）を追加すると、そのコンテンツがノードとして追加され、かつ、レポートとの間にエッジが自動生成される。
（４）既存データの引用については、他の系列から取得した既存のデータをレポートで引用（ユーザ端末４５上で、既存のデータをdrag&dropすると、レポートと既存のデータに対応するノードとの間に、エッジが自動生成される。
（５）関連性をエッジで表現については、複数のデータノードから取得した既存のデータに基づくチャートをレポートに追加する場合、例えば同じチャートに２つのデータが使用された場合には、その２つのデータに対応するノード間に自動的にエッジが生成される。

［ユーザインターフェイスへの表示態様］
図３は、レポート、データのマップ表示の説明図である。横系列が時系列ツリー、縦系列が関連性ツリーであり、見やすい表示形態となっている。画面最上部には、属性値絞り込み条件が表示されている。この属性値を持つノードだけが表示される。図３の例では、ユーザ情報に付与されたデフォルト値をもって、属性値絞り込み条件があらかじめ入力された状態にされているが、本実施形態はこれに限定されるものでは無く、例えばこの絞り込み条件はユーザ端末４５から入力することも可能である。

図３では、横系列が時系列ツリー、縦系列が関連性ツリーとなっているが、いずれの系列もユーザ端末４５からの指定で選択することができ、座標空間を表現している。データセットやデータポイントのタグは、データタイプによりタイプ別で分類されており、また、データセットのネスト構造により分類も可能である。データセットをネスト構造とし、データのエンティティの塊をデータセットとすることにより、データの塊で管理することができる。データの関係性はデータセット単位で行う。一方で指定をすればデータ個別の連携もとることは可能である。また、データタイプによりデータが分類されているため、グラフデータの管理やデータ検索がし易い。

例えば試験車やシミュレーションモデルに関する情報等は、システム管理者側で登録（システム管理者端末は図示省略）、もしくはそれぞれの図示されない管理システムとの連携によって登録する。なお、システム管理者端末は試験・シミュレーションの実行者は、どの試験車（モデル）を利用したか、のみ選択することで、試験車と実績情報との関連をつけることができる。異なる試験／シミュレーション間での関連付けも、試験車やモデルのバージョン情報を基本情報としてつなげることにより可能である。

図４は、レポート内のデータ表示の説明図である。ファイルには、複数のデータが含まれている。KPI（key performance indicators）を持つデータについては、単独数値としてのKPIとその値をデータポイントで保持する。KPIは目標達成の度合いを定義するための指標であり、具体的なプロセスや進捗状況を評価、改善するために用いられる。図４において、データの各エンティティをクリックすれば、データ単体のデータポイントまでブレイクダウンすることができる。

図５は、レポート作成操作の説明図である。レポート作成操作のために、まずユーザ端末４５のディスプレイ上で、レポート作成対象となるノードのエンティティを右クリックし、プルダウンメニューから「レポートを作成する」を選択する。レポート作成の選択画面からさらに、雛形一覧や自動フォーマット等の選択が可能であり、所定のひな形を選択したり、自動的に作成されたレポートの様式を利用したり、することができる。自動フォーマットの利用にあたり、機械学習部１２において訓練された学習モデルを用いることにより、適切なレポートの様式を自動作成させることが可能である。この場合、機械学習部１２における訓練には、過去に作成されたレポート、そこで使用されたデータセット、データ、引用関係等が用いられる。

図６は、レポートへのデータ引用操作の説明図である。引用したいデータのエンティティをクリックすれば、引用したいデータセットがズームアップされ、その中に含まれるデータ群が表示される。図５で選択されたレポートの様式に対して、引用したいデータをドラッグ＆ドロップすることでレポートが作成される。他のファイルからのデータを検索して、ドラック操作で作成中レポートに貼り付けができる。レポート作成にあたっては前述のとおり各レポートのひな形が自動的に推奨される、あるいは、ひな形一覧からの選択可能である。さらに、入力漏れなどがあれば、ＡＩが欠損値の入力アシストを行う。ＡＩにより欠損が予測されたレポート部分に欠損があると思われる部分が反転表示されると共に、補完すべきデータ候補を表示可能である。ＡＩとしては、特に限定されるものではないが、例えば欠損値補間を利用した最短経路探索学習、Ｎ次多項式ノンマルコフ定義における強化学習等が用いられる。なお、ＡＩとして過去のデータ保管の履歴データを用いてCNNを学習させる深層学習を用いることもできる。

図７は、新たなレポートの登録表示の説明図である。レポート作成操作によって、各データに自動的にエッジが貼られている。レポートが新たなデータセットノードとして追加され、このノードがユーザ端末４５のディスプレイ上に、新たなエンティティとして追加される。

図８は、レポートのデータ参照表示の説明図である。ユーザ端末４５のディスプレイ上で、分析したい対象となるレポートないしデータのエンティティを右クリックし、プルダウンメニューから「データ参照」を選択すると、データ参照用の分析画面へ進む。既に参照画面が構築されている場合は、構成済み画面へ進む。一方、まだ参照画面が構築されていない場合は、本データを読み込んだ分析プロジェクトのデフォルト画面に進む。参照画面の作成・編集は、プルダウンメニューの「参照画面編集」を選択し、前述のレポート作成と同様の手順により行う。

図９は、テキスト検索の結果表示の説明図である。全データ及び全レポート内のファイルをテキスト検索可能である。図９の上段の「Search」欄に検索式、検索ワードを入力することにより、フルテキスト検索が可能である。検索式に応じて、近傍検索やデータカテゴリー指定検索等の条件付き検索も可能である。「Text Search Result」として、ユーザ端末４５のディスプレイ上に検索結果がリスト表示される。

図１０は、データの引用関係表示の説明図である。エッジ検索が可能なので、各データの紐付け関係が表示できる。上段の「Parent Node Connection Search」は、一つ上の親ノードに関連するノードをサーチ結果である。中段の「Direct Node Connection Search」は、自身に直接連結するノード（親ノード以外）のサーチ結果である。下段の「Browse Log Node Connection Search」は、当該ノード（対象となるデータ自身のノード）を経由して閲覧したノードの検索結果である。

図１１は、レポート作成の手順の説明図である。既存のデータをドラックアンドドロップすることにより、作成中のレポートに引用したいデータを挿入することができる。例えば、「Parent Node Connection Search」で選択された親ノードをクリックすると、そこに紐づく実績情報のデータセットがリスト表示される（図１１の左上の図を参照）。上述のようにレポート作成画面を開いて（図１１の右上の操作）、レポート上のデータ貼り付け位置に引用元のデータをドラックアンドドロップにより貼り付けることができる（図１１の下の図）。この際、異なるデータポイントをレポートのキャンパス上にドラッグアンドドロップすることで、データの比較ができる。また、様々なデータポイントを並べて描画させることで、様々な項目の状況を同時に確認することができる。グラフ描画機能を用いて、データポイントをレポートのキャンパス上にドラッグアンドドロップすることで、グラフを描画することが可能である。このように、全データ及び全レポート内のファイルをテキスト検索し、また、エッジ検索した結果により抽出したデータを用いてレポートを作成することができる。

図１２は、データ入力の手順の説明図である。新規データを入力する際には、「新規登録ボタン」をクリックする（図示省略）か、あるいは、紐づける実験ノードを選択する。「属性値選択領域」（図１２の上段の図の左側の属性値表示部分を参照。）には、ユーザ端末４５から属性値を指定できるが、ユーザに付与された設定から予め初期設定値が選択された状態となっている。「連結ノード」には、基本的には設定値と前回の結果等を紐づける。連結対象ノードとしては、前回の登録オペレーションに鑑み、同様のノードが自動的に選択された状態となる。「登録ファイル」には、例えばユーザ端末４５上のエクスプローラーから登録したいファイルをそのままDrag＆Dropする。連結対象ノードとして、選択ノードを追加したい場合には、図１２の上段の図のように、「新規ノードを選択」ボタンをクリックすることで、「ノードセレクタ」に条件に合致したノード候補の一覧を表示させる。この一覧表示された候補の中から、新たに連結させたいノードを選択して、登録ボタンをクリックする（図１２の中段の図参照）と、先に選択された属性を持った情報として新たにデータが登録される。データが登録されるとユーザ端末４５のディスプレイ上にエンティティが表示され、対応するノードが設定したエッジと共にデータ管理システムに反映される（図１２の下段の図参照）。

［内部動作の説明］
本実施形態のデータ管理システムにおけるファイルの登録に関する内部動作を説明する。ファイル登録は、指定がなければ最後に登録されたノードに紐づく想定で登録される。ファイルやデータセットを選択した場合は、そのノードに紐づくノードとして生成される。同一属性を持つノードは時系列ベースで自動的に連結させる。データの内部を判別し、内部の絡む情報をばらして個別ノードとして生成することもできる。ユーザが持つ属性は、基本的にそのまま保持される。データを保持するファイルについては、基本的に個別のデータ（カラム）ごとに内部で分割したデータを示すポインタを持ち、それをデータポイントとしてグラフ表示して管理する。データポイント単位で操作することができるようになれば、個別のデータポイントごとに比較したり、レポートに表示したりすることができるようになる。また、ファイルデータの中身を精査して、個別のカラム事にアクセスするために、Parseの機能（データ構造の変換機能）やファイル切り出しの機能を設けている。

［関連付け方法（１）マスターノード連結法］
データセットノード中でもマスターノード（試験車/シミュレーションモデル）に関する情報は、データ登録時に厳密なバージョニングを行う。プロジェクト開始時のみ、連結ノードがない状態となる。その他のデータセットノードは必ずどれかのマスターノードに関連付けられた状態で登録される。その結果、マスターノードを介して必ず情報がつながる。

［関連付け方法（２）類似属性連結］
ある一定の属性値が同等、ないし同等に近いものを検索し、その類似度をスコアリングする。スコア値の高いものを自動で連結させる。
＜スコアリングアルゴリズムの例＞
属性値を下記ａ～ｄの4つに分類し、ａ）、ｃ）、ｄ）で合致する値であるか否か判断したうえで、ｂ）をスコア（合致する数をカウント）としてエッジを自動生成する。
ａ）「完全同一が必須」（重要な文字列属性）イコールでヒットするかどうか
ｂ）「必ずしも同じである必要はない」（重要ではない文字列属性）合致する数をカウント
ｃ）「範囲内であれば同一とみなせる」（重要な数値属性）
ｄ）範囲内に収まっているかどうか？

［関連付け方法（３）データ参照履歴による連結］
ユーザがあるノードから別のノードに移り、データを参照した、というログをすべて残す。どのノードからどのノードに飛んだかをログとして記録する。ある一定回数以上の記録があった場合に新たなエッジとして登録をする。

［関連付け方法（４）手動の併用］
上記（１）～（３）によって張られたエッジをもとに、人手でGraph空間をブラウズし、人の判断で必要なところにエッジを張ることも可能である。なお、このように人手でエッジを張る場合には、通常は管理者のみが利用できる機能であるブラウジング機能が用いられる。

［具体的事例への適用例］
システム連携により取得することが望ましいデータとしては、社内担当者情報およびその担当プロジェクト、プロジェクト一覧、登録すべきデータセットの自動登録、写真に写る数値の画像読み取り、及び、そのデータ内容の判別等が挙げられる。

事前設定として必要となる情報、例えば人事情報および担当プロジェクト情報は、ファイルラッパ３３により、周辺システム（図示省略）より自動で取り込むことができる。顧客特有の事項については、事前にユーザ管理システム３０の設定が必要である。ユーザ情報定義は、例えば一般的なRDB形式で保持される。ただし、例えば、担当プロジェクト、担当業務領域／担当性能、最終実施実験／シミュレーション、最終作成レポート等については、様々な属性情報をつけられるようJSON形式での属性付与機能を持たせている。

ノード表、エッジ表に格納されたプロパティ値に対して全文検索Indexを付与されているため、全文検索が可能である。

［実施形態２］
図１３を参照して、実施態様２に係るデータ管理システム、データ管理方法及びデータ管理プログラムについて説明する。図１３は、本実施形態に係るレポート、データのマップ表示の説明図である。図１～１２と同様の構成には同一の番号を付し、その説明は省略する。

連結根拠として、作成されたレポートのバージョンを視覚的に表示することも可能である。横軸に時系列的なデータを配置し、バージョンが明確となる。縦軸には、関連項目として、計測・シミュレーションの種類、例えばNV、燃費、及び、操安等の項目が配列されている。これにより、縦軸の各項目同士の引用関係が明確となり、バージョンアップの状況を把握し易い。

本実施形態では、縦軸の実例を示したが、縦軸、横軸共に、ユーザの見やすいように自由にタグの種類を選択することにより、任意のマップ表示が可能である。少なくとも、時系列、データタイプ等のタグの種類を選択することが可能である。この他に、各軸のタグの種類としては、担当者、製品コード、バージョン情報、実験条件、シミュレーション条件等、様々なタグが選択可能である。

以上、本発明の実施形態に係るデータ管理システム、データ管理方法及びデータ管理プログラムを説明したが、各実施形態は本発明の技術思想を具体化するためのデータ管理システム、データ管理方法及びデータ管理プログラムを例示するものであって、本発明をこれらに特定するものではなく、その他の実施形態のものにも等しく適用し得るものであり、また、これらの実施形態の一部を省略、追加、変更することや、各実施形態の態様を組み合わせることも可能である。

１０…中央処理システム
１１…ログイン機能部
１２…機械学習部
１３…中央処理部
１４…ユーザセッション管理部
１５…グラフデータ管理部
１６…外部ＳＳＯ
１７…クラウドストレージ
１８…グラフデータ分析クラウド
２０…メタデータ記憶部
２１…ドキュメントノードテーブル
２２…データノードテーブル
２５…サブメタデータ
２６…エッジテーブル
３０…ユーザ管理システム
３１…ユーザ情報管理部
３２…マップビュア
３３…ファイルラッパ
３４…ファイルアップローダ
３５…ユーザインターフェイス
３６…BIツール
４０…データマート
４１…ユーザ属性管理テーブル
４２…マスターテーブル
４５…ユーザ端末

Claims

データをノードとして、該ノード間の関係をエッジとして規定し、複数のデータを管理するデータ管理システムであって、
前記ノードのグループをデータセットとして管理し、
前記データセットがユーザインターフェイスに、第１系列と該第１系列と交差する第２系列とを有するマトリックス状の構造として表示され、
前記第１系列及び前記第２系列が、各系列のタグの種類に応じたツリー構造であり、
前記第１系列及び前記第２系列それぞれのタグの種類が、時系列及び／又はデータタイプを少なくとも含むと共に、ユーザからの選択入力に応じて変更可能であり、
各系列が、選択されたタグの種類に応じて並び替え可能であることを特徴とするデータ管理システム。
前記エッジが前記データセット単位で付与され、
前記ノード及び前記エッジには、タグが付与されており、
前記ノードタグのスキーマは、データタイプに応じて定義されている、及び／又は、
前記ノードのタグとして、タイプ別の分類、及び／又は、ネスト構造となるような分類が定義されていることを特徴とする請求項１に記載のデータ管理システム。
前記データセットが、ユーザインターフェイスにエンティティとして表示され、
前記データセットが、前記ユーザインターフェイスの操作により、次の機能群の中のいずれか少なくとも１つの機能を使用して操作されることを特徴とする請求項１又は２に記載のデータ管理システム。
前記データセットに属するデータの表示ないし操作、
前記データセットに属するデータのダウンロード、
前記データセットのレポートの表示、作成又は編集、
前記データセットのレポート作成用フォーマットの読み出し、作成又は編集、
前記データセットへのデータの追加、
レポート、データセット又はデータの検索、
前記ノードの検索、
他のデータセットのデータの参照ないし引用、
新規データの登録、
新規のデータないし他のデータセットのデータをドラッグアンドドロップにより引用する操作、
前記エッジのタグの設定、
前記データセットのノードの表示切替、
前記データセットの下位のノードの表示切替、
前記データの持つＫＰＩの管理、
前記データセットないし前記ノードの関連性の検索、表示又は分析、
表示絞り込み条件の設定、プルダウンメニューの選択操作、
前記エンティティの選択ないし操作メニューの選択、
前記エンティティからデータ単体のデータポイントのブレイクダウン操作ないし選択操作、
ログイン機能、
前記データセットについてのレポートを作成機能、
他のノードのデータないし新規のデータを引用する機能、又は、
レポートの欠損ないし誤記の修正アシスト機能、
からなる機能群。
少なくともメタデータ記憶部、サブメタデータ記憶部、及びユーザインターフェイスを備えるデータ管理システムにより、前記メタデータ記憶部に記憶されたデータをノードとして規定し、該ノード間の関係をエッジとして規定して前記サブメタデータ記憶部に記憶して、複数のデータを管理するデータ管理方法であって、
前記データ管理システムが、
前記ノードのグループをデータセットとして管理する管理ステップと、
前記データセットを前記ユーザインターフェイスに、タグの種類に応じたツリー構造である第１系列と、該第１系列と交差し、タグの種類に応じたツリー構造である第２系列とを有するマトリックス状の構造として表示するステップと、
前記第１系列及び前記第２系列それぞれのタグの種類の選択変更をユーザから前記ユーザインターフェイスを介して受け付けるステップと、
各系列を選択されたタグの種類に応じて並び替えて前記ユーザインターフェイスに表示するステップと、
を実行し、
前記第１系列及び前記第２系列それぞれのタグの種類が、時系列及び／又はデータタイプを少なくとも含むことを特徴とするデータ管理方法。
請求項４に記載のデータ管理方法をコンピュータに実行させることを特徴とするデータ管理プログラム。