JP7431100B2 - データ生成支援装置、データ生成支援方法、及びデータ生成支援システム - Google Patents
データ生成支援装置、データ生成支援方法、及びデータ生成支援システム Download PDFInfo
- Publication number
- JP7431100B2 JP7431100B2 JP2020085428A JP2020085428A JP7431100B2 JP 7431100 B2 JP7431100 B2 JP 7431100B2 JP 2020085428 A JP2020085428 A JP 2020085428A JP 2020085428 A JP2020085428 A JP 2020085428A JP 7431100 B2 JP7431100 B2 JP 7431100B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- workflow
- information
- content
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 147
- 230000008569 process Effects 0.000 claims description 135
- 238000012545 processing Methods 0.000 claims description 37
- 230000010365 information processing Effects 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 27
- 238000007726 management method Methods 0.000 description 173
- 238000000605 extraction Methods 0.000 description 94
- 238000010586 diagram Methods 0.000 description 32
- 230000008520 organization Effects 0.000 description 15
- 238000013439 planning Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013499 data model Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
密なデータが急増している。これらの機密データは、企業や研究機関などの組織がデータ分析に用いることでその事業に有意な洞察を得られることから、利用価値が高い。
-システム構成-
図1は、実施例1に係るデータ生成支援システム1の構成の一例を示す図である。
ークによって通信可能に接続される。
まず、利用者端末102は、利用者により入力された、成果データの生成を要求するデータ生成要求108を送信する。利用者端末102は、利用者が利用するインタフェースとして、GUI(Graphic User Interface)やCUI(Command User Interface)等を備える。
管理コンソール107は、管理者106からの入力により、データ生成支援装置101における後述するファイルメタデータ抽出規則115及びワークフローメタデータ抽出規則118を生成する。管理コンソール107は、管理者106が利用するインタフェースとして、GUI(Graphic User Interface)やCUI(Command User Interface)等を備える。
ファイル管理サーバ105は、ワークフローが利用する一次データのファイル(以下、データファイルともいう)を複数保持する。なお、ファイル管理サーバ105は、データ生成支援装置101に組み込まれていてもよいし、データ生成支援装置101の外部機能として提供されてもよい。すなわち、ファイル管理サーバ105が管理するデータファイルは、NAS(Network Attached Storage)やローカルファイルサーバ、クラウド上のオブ
ジェクトストレージなど、どのような形態で提供されていてもよい。
ここで、図2は、データファイルの一例を示す図である。データファイル150は、書
誌情報等が設定される部分であるデータヘッダ部R1001と、データボディ部R1021とを有する。データヘッダ部R1001は、データモデル、データボディ部R1021のサイズ、又は、データファイル150に対応づけられている外部のデータファイル150のID等の、サブ情報R1011~R1016を含む。データボディ部R1021は、データ本体であり、機密情報が含まれる。なお、同図では、データファイル150がバイナリファイル形式である場合の例を示しているが、データファイル150はテキスト形式でもよい。
次に、図1に示すように、データ生成支援装置101は、データ生成要求受付部111、データ生成管理部112、ファイルメタデータ抽出部113、及びワークフローメタデータ抽出部116の各機能部(プログラム)を備える。
図3は、データ生成管理部112の詳細を説明する図である。データ生成管理部112は、データ生成計画部301、入力ファイル特定部302、実行ワークフロー特定部303、及び計画管理部304を含む。
これらのワークフロー及びファイルの情報を、データ生成計画として計画管理部304に入力する。
図4は、ファイルメタデータ管理テーブル114の一例を示す図である。
図5は、ワークフローメタデータ管理テーブル117の一例を示す図である。ワークフローメタデータ管理テーブル117は、過去に実行された又はユーザにより予め設定された各ワークフローと各ワークフローの特徴情報とを蓄積している。
ファイル(以下、出力データという)の特徴情報が設定されるワークフロー出力603とを含む各項目を有する、1以上のレコードR(R631~R636)を備える。
すなわち、ファイルメタデータ抽出部113は、ファイル管理サーバ105が記憶している各データファイル150から、後述するファイルメタデータ抽出規則115に従って各データファイル150中のメタデータを抽出し、抽出したメタデータ(以下、ファイルメタデータという)をファイルメタデータ管理テーブル114に格納する。
図6は、ファイルメタデータ抽出規則115の一例を示す図である。ファイルメタデータ抽出規則115は、ファイル管理サーバ105に記録されている各データファイル150から、データファイル150の特徴情報(ファイルメタデータ管理テーブル114)を生成するための、1又は複数の規則を記憶している。
図7は、ワークフローメタデータ抽出規則118の一例を示す図である。ワークフローメタデータ抽出規則118は、ワークフロー実行ログ104に記録されている各ワークフローから、ワークフローのメタデータ(ワークフローメタデータ管理テーブル117)を生成するための、1又は複数の規則を記憶している。なお、ワークフロー実行ログ104における1つのワークフローに対して、ワークフローメタデータ抽出規則118に係る複数の規則が適用される場合がある。
次に、図1に示すように、ワークフロー実行装置120は、ワークフロー実行部103、ワークフロー管理部109、及びワークフロー実行ログ104を備える。
図8は、ワークフロー実行ログ104の一例を示す図である。ワークフロー実行ログ104は、過去に実行されたワークフローの情報である。ワークフロー実行ログ104は、ワークフローが実行された日時又は時刻が設定されるタイムスタンプ701と、実行されたワークフローのIDが設定されるワークフローID702と、ワークフローID702に係るワークフローの実行の際に入力されたデータ(データファイル150)が設定される入力データ703と、ワークフローID702に係るワークフローの実行により出力されたデータが設定される出力データ704とを含む各項目を有する、1以上のレコードR711~R714を備える。
次に、データ生成支援システム1において行われる処理を説明する。
図10は、データ生成支援処理の一例を説明するフロー図である。データ生成支援処理は、例えば、データ生成支援装置101が起動した際に実行される。
図11は、データ生成要求108の一例を示す図である。データ生成要求108は、二次データ(成果データ)を特定する情報である要求データ指定情報401と、成果データを生成するためのワークフロー(以下、指定WFという)のIDである利用ワークフローID402とを有する。
生成要求108におけるデータ指定情報(以下、指定データという)を入力ファイル特定部302に入力する(S1111)。
ここで、図12は、S1124で実行WFを発見した場合にデータ生成支援装置101が表示する画面(ワークフロー特定画面)の一例を示す図である。ワークフロー特定画面160は、実行WFを特定したことを示す情報161が表示される。なお、実行WFの名称やIDの情報、実行WFが用いる一次データの具体的な内容の情報が表示されてもよい。
図13は、ファイルメタデータ管理テーブル生成処理の一例を説明するフロー図である。ファイルメタデータ管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ファイル管理サーバ105に新たなデータファイル150が登録された場合等に実行される。
図14は、ワークフローメタデータ管理テーブル生成処理の一例を説明するフロー図で
ある。ワークフローメタデータ管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ワークフロー実行ログ104に新たにワークフローのデータが登録された場合等に実行される。
ータを生成するためのワークフローをオンデマンドに特定することができる。
実施例2のデータ生成支援システムは、一次データから成果データ(二次データ等)を生成するために複数のワークフローによる処理が必要な場合に適用されるシステムである。
図15は、実施例2に係るデータ生成支援システム2における構成例の一部を示す図である。なお、実施例1と同様の符号が付されている部分は、実施例1と同様の構成及び機能を備える。また、同図に示されていない部分は、実施例1と同様の構成及び機能が備わっているものとする。
ワークフロー計画管理テーブル1402は、連結ワークフロー算出部1401が生成したワークフロー計画を管理するテーブルである。ワークフロー計画管理テーブル1402には、複数のワークフローの実行を備えるワークフロー計画と、実施例1におけるワークフローメタデータ管理テーブル117と同様の、1つのワークフローの実行の構成とをそれぞれ記憶している。
部303からの入出力データの特徴情報(メタデータ)の取得をクエリとして受け付け、クエリに対する特徴情報を実行ワークフロー特定部303に返す仕組みとなっていたが、実施例2では、ワークフロー計画管理テーブル1402が、実行ワークフロー特定部303からのクエリを受け付けるようになっている。
図16は、ワークフロー計画管理テーブル1402の一例を示す図である。
図17は、ワークフロー計画管理テーブル生成処理の一例を説明するフロー図である。ワークフロー計画管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ワークフロー実行ログ104に新たにワークフローのデータが登録された場合等に実行される。
推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、を実行する、としてもよい。
0 ワークフロー実行装置、105 ファイル管理サーバ、108 データ生成要求、2
データ生成支援システム
Claims (13)
- 複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを第1モデルとして生成する第1モデル生成処理と、
機密情報から所定のデータの生成を要求する情報であって、前記機密情報の属性から推定される情報であるデータ指定情報を含む要求情報を受信するデータ生成要求受付処理と、
前記所定のデータの内容の特徴を、前記データ指定情報に基づき前記第1モデルを参照しつつ推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、
を実行する演算装置を備える、
データ生成支援装置。 - 前記演算装置は、前記第1モデル生成処理において、
前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、
請求項1に記載のデータ生成支援装置。 - 前記演算装置は、
前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、
請求項1に記載のデータ生成支援装置。 - 前記演算装置は、前記第2モデル生成処理において、
処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する複数の処理を特定する、
請求項3に記載のデータ生成支援装置。 - 前記演算装置は、
前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、
前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、
請求項3に記載のデータ生成支援装置。 - 前記演算装置は、
前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、
請求項1に記載のデータ生成支援装置。 - 情報処理装置が、
複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを第1モデルとして生成する第1モデル生成処理と、
機密情報から所定のデータの生成を要求する情報であって、前記機密情報の属性から推定される情報であるデータ指定情報を含む要求情報を受信するデータ生成要求受付処理と、
前記所定のデータの内容の特徴を、前記データ指定情報に基づき前記第1モデルを参照しつつ推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、
を実行する、データ生成支援方法。 - 前記情報処理装置が、前記第1モデル生成処理において、
前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、
請求項7に記載のデータ生成支援方法。 - 前記情報処理装置が、
前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、
請求項7に記載のデータ生成支援方法。 - 前記情報処理装置が、前記第2モデル生成処理において、
処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する処理を特定する、
請求項9に記載のデータ生成支援方法。 - 前記情報処理装置が、
前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、
前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、
請求項9に記載のデータ生成支援方法。 - 前記情報処理装置が、
前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、
請求項7に記載のデータ生成支援方法。 - 機密情報から所定のデータの生成を要求する情報であって、前記機密情報の属性から推定される情報であるデータ指定情報を含む要求情報を送信する利用者端末と、
複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを第1モデルとして生成する第1モデル生成処理、
前記要求情報を受信するデータ生成要求受付処理、及び、
前記所定のデータの内容の特徴を、前記データ指定情報に基づき前記第1モデルを参照しつつ推定し、推定した特徴の内容を備える、所定の情報処理装置が記憶している他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理を実行するデータ生成支援装置とを含んで構成され、
前記所定の情報処理装置は、前記他のデータを記憶していると共に、前記利用者端末による前記他のデータへのアクセスを禁止している、
データ生成支援システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020085428A JP7431100B2 (ja) | 2020-05-14 | 2020-05-14 | データ生成支援装置、データ生成支援方法、及びデータ生成支援システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020085428A JP7431100B2 (ja) | 2020-05-14 | 2020-05-14 | データ生成支援装置、データ生成支援方法、及びデータ生成支援システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021179857A JP2021179857A (ja) | 2021-11-18 |
JP2021179857A5 JP2021179857A5 (ja) | 2023-02-24 |
JP7431100B2 true JP7431100B2 (ja) | 2024-02-14 |
Family
ID=78511566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020085428A Active JP7431100B2 (ja) | 2020-05-14 | 2020-05-14 | データ生成支援装置、データ生成支援方法、及びデータ生成支援システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7431100B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005022428A1 (ja) | 2003-08-28 | 2005-03-10 | Ibm Japan, Ltd. | 属性情報提供サーバ、属性情報提供方法、およびプログラム |
JP2006011738A (ja) | 2004-06-24 | 2006-01-12 | Nec Corp | 個人情報管理システム、方法、個人情報データ変換装置、漏洩検出装置、漏洩検出方法、プログラム |
JP2007102706A (ja) | 2005-10-07 | 2007-04-19 | Konica Minolta Business Technologies Inc | ワークフローの表示方法及びワークフロー表示装置 |
JP2010067094A (ja) | 2008-09-11 | 2010-03-25 | Ricoh Co Ltd | 電子ドキュメント管理システム、電子ドキュメント管理方法およびそのプログラム |
JP2019008666A (ja) | 2017-06-27 | 2019-01-17 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
US20200004604A1 (en) | 2018-06-29 | 2020-01-02 | Optum, Inc. | Automated systems and methods for generating executable workflows |
-
2020
- 2020-05-14 JP JP2020085428A patent/JP7431100B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005022428A1 (ja) | 2003-08-28 | 2005-03-10 | Ibm Japan, Ltd. | 属性情報提供サーバ、属性情報提供方法、およびプログラム |
JP2006011738A (ja) | 2004-06-24 | 2006-01-12 | Nec Corp | 個人情報管理システム、方法、個人情報データ変換装置、漏洩検出装置、漏洩検出方法、プログラム |
JP2007102706A (ja) | 2005-10-07 | 2007-04-19 | Konica Minolta Business Technologies Inc | ワークフローの表示方法及びワークフロー表示装置 |
JP2010067094A (ja) | 2008-09-11 | 2010-03-25 | Ricoh Co Ltd | 電子ドキュメント管理システム、電子ドキュメント管理方法およびそのプログラム |
JP2019008666A (ja) | 2017-06-27 | 2019-01-17 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
US20200004604A1 (en) | 2018-06-29 | 2020-01-02 | Optum, Inc. | Automated systems and methods for generating executable workflows |
Also Published As
Publication number | Publication date |
---|---|
JP2021179857A (ja) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4574356B2 (ja) | 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム | |
US20100138428A1 (en) | Keyword output apparatus and method | |
US7890535B2 (en) | Management of processes based on reference information | |
JP4700462B2 (ja) | データベース利用システム | |
JP5424798B2 (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
JP2009003549A (ja) | データ管理装置およびデータ管理方法、データ管理プログラム、データ管理プログラム記憶媒体 | |
JP2012226777A (ja) | ワークフロー管理方法 | |
JP6586050B2 (ja) | 管理装置、管理方法および管理プログラム | |
JP2020013413A (ja) | 判断支援装置および判断支援方法 | |
KR20190109628A (ko) | 개인화된 기사 컨텐츠 제공 방법 및 장치 | |
JP2008197976A (ja) | 連結情報生成プログラム及び連結情報生成方法 | |
JP7431100B2 (ja) | データ生成支援装置、データ生成支援方法、及びデータ生成支援システム | |
JP2022012940A (ja) | 計算機システムおよび貢献度計算方法 | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
CN114443913A (zh) | 基于元数据多函数多条件的自定义查询方法、系统及介质 | |
JP4516007B2 (ja) | 連携型知財管理システムによる知財創出支援方法、サブライセンス管理機能付きの情報提供システムおよびコンピュータプログラム | |
JP5718630B2 (ja) | 情報処理装置、情報資産管理システム、情報資産管理方法、及びプログラム | |
Kumar et al. | Open Source Software Using Koha: A Case Study of LR Institute Of Engineering & Technology | |
JP2007249622A (ja) | 公開/非公開項目を含む情報の提供方法、情報提供システム、プログラム | |
JP2009223679A (ja) | 電子文書検索装置、及び電子文書検索プログラム | |
JP6455087B2 (ja) | 帳票情報処理プログラム、帳票情報処理装置、および帳票情報処理方法 | |
Gupta et al. | Provenance in context of Hadoop as a Service (HaaS)-State of the Art and Research Directions | |
JP2003044331A (ja) | 知識分析システム、クラスタデータベース表示方法および表示制御プログラム | |
KR20100088890A (ko) | 문서 분석 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7431100 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |