JP2021179857A - Data generation support device, data generation support method, and data generation support system - Google Patents

Data generation support device, data generation support method, and data generation support system Download PDF

Info

Publication number
JP2021179857A
JP2021179857A JP2020085428A JP2020085428A JP2021179857A JP 2021179857 A JP2021179857 A JP 2021179857A JP 2020085428 A JP2020085428 A JP 2020085428A JP 2020085428 A JP2020085428 A JP 2020085428A JP 2021179857 A JP2021179857 A JP 2021179857A
Authority
JP
Japan
Prior art keywords
data
workflow
input
data generation
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020085428A
Other languages
Japanese (ja)
Other versions
JP2021179857A5 (en
JP7431100B2 (en
Inventor
美都成 小林
Mitsunari Kobayashi
将幸 柿田
Masayuki Kakita
泰隆 河野
Yasutaka Kono
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020085428A priority Critical patent/JP7431100B2/en
Publication of JP2021179857A publication Critical patent/JP2021179857A/en
Publication of JP2021179857A5 publication Critical patent/JP2021179857A5/ja
Application granted granted Critical
Publication of JP7431100B2 publication Critical patent/JP7431100B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a data generation support device, a data generation support method, and a data generation support system which, even when information required for generating data is lacked, can generate the data.SOLUTION: A data generation support device 101 of a data generation support system 1 includes: a data generation request reception section for receiving request information for requesting generation of predetermined data; and a data generation management section for estimating features of contents of the predetermined data by a first model so as to identify processing capable of generating the predetermined data by other data having contents of the estimated features by a second model.SELECTED DRAWING: Figure 1

Description

本発明は、データ生成支援装置、データ生成支援方法、及びデータ生成支援システムに関する。 The present invention relates to a data generation support device, a data generation support method, and a data generation support system.

近年、DNAデータ及びオンラインサービスのユーザ情報など、個人情報に関連した高機
密なデータが急増している。これらの機密データは、企業や研究機関などの組織がデータ分析に用いることでその事業に有意な洞察を得られることから、利用価値が高い。
In recent years, the amount of highly confidential data related to personal information, such as DNA data and user information of online services, has increased rapidly. These confidential data are highly useful because they can be used by organizations such as companies and research institutes for data analysis to gain significant insights into their businesses.

機密データの利用方法としては、例えば、組織間での機密データの相互利用が挙げられる。多量の機密データを保有する組織(データ保有組織)は、機密データの相互利用に関するアライアンスを提携した相手組織(アライアンス組織)に対して、多様な機密データ、それらの機密データの分析などの処理を実行するワークフローを管理するレポジトリ、及び、ワークフローを利用するためのワークフロー実行環境を提供する(オンサイトデータ活用)。データ保有組織は、アライアンス組織の顧客(機密データの利用者)によるデータ利用に対して課金するなどにより収益を図る。 Examples of the method of using confidential data include mutual use of confidential data between organizations. An organization that holds a large amount of confidential data (data holding organization) processes various confidential data and analysis of those confidential data with the partner organization (alliance organization) that has an alliance for mutual use of confidential data. It provides a repository for managing the workflow to be executed and a workflow execution environment for using the workflow (utilization of on-site data). The data holding organization aims to make a profit by charging for the data usage by the customers (users of confidential data) of the alliance organization.

一方で、オンサイトデータ活用に関連した社会動向として、欧州におけるGDPR(General Data Protection Regulation)及び、日本における個人情報保護法の改正などの、機密データに対する法規制が強化されていることが挙げられる。このような法規制によって、機密データの管理に対する厳しい制約が課されている。そのため、データ保有組織は、特に機密性の高いデータ(一次データ)については利用者によるアクセスを禁止し、その代わり、一次データのうち機密性が特に高い部分(例えば、個人を特定する情報)を除くなどの処理を施すことにより得られる、比較的機密性の低い高次データ(二次データ、及び二次データをさらに加工して得られる三次データ等)についてのみ、利用者によるアクセスを許容するなどの対策を講じている。 On the other hand, as a social trend related to the utilization of on-site data, there is a strengthening of laws and regulations on confidential data such as GDPR (General Data Protection Regulation) in Europe and revision of the Personal Information Protection Law in Japan. .. These laws and regulations impose strict restrictions on the management of sensitive data. Therefore, the data holding organization prohibits users from accessing particularly sensitive data (primary data), and instead restricts the particularly sensitive part of the primary data (for example, personally identifiable information). Access by users is permitted only for high-order data with relatively low confidentiality (secondary data, tertiary data obtained by further processing the secondary data, etc.) obtained by performing processing such as removal. We are taking measures such as.

ここで、二次データの活用方法として、特許文献1には、利用者自らの判断により、目的とする二次データを得るためのデータ処理ワークフローまたは処理プログラムを選択できるようにするデータ管理システムが開示されている。 Here, as a method of utilizing the secondary data, Patent Document 1 includes a data management system that enables the user to select a data processing workflow or a processing program for obtaining the target secondary data at his / her own discretion. It has been disclosed.

特開2019−174983号広報Japanese Patent Application Laid-Open No. 2019-1974983

しかし、特許文献1のシステムは、データの利用者が一次データに対してアクセス可能である場合を前提としている。この場合、利用者が一次データへのアクセスができなくなるような対策が講じられた場合には、利用者は当システムを利用することができない。 However, the system of Patent Document 1 is premised on the case where the user of the data can access the primary data. In this case, if measures are taken to prevent the user from accessing the primary data, the user cannot use this system.

すなわち、利用者は、自身が利用したい二次データを得るために実行すべきワークフロー(処理プログラム)を、データ保有組織又はアライアンス組織に対して指示する必要がある。そのためには、その元となる一次データについての情報を知る必要があることが多い。例えば、ワークフローに入力する一次データを特定するためには、ワークフローへの入力データに関する情報として、ファイル拡張子などのデータ形式の他、データの性質(内容面)も知る必要がある。 That is, the user needs to instruct the data holding organization or the alliance organization on the workflow (processing program) to be executed in order to obtain the secondary data that he / she wants to use. For that purpose, it is often necessary to know information about the primary data from which the data is based. For example, in order to specify the primary data to be input to the workflow, it is necessary to know the nature (content aspect) of the data as well as the data format such as the file extension as the information regarding the input data to the workflow.

しかし、利用者が一次データへのアクセスがそもそもできない場合、利用者はそのような情報を知ることができないので、適切な一次データにアクセスすることができず、その結果、実行すべきワークフローも選択することができない。 However, if the user does not have access to the primary data in the first place, the user will not be able to know such information and will not be able to access the appropriate primary data and, as a result, select the workflow to be executed. Can not do it.

本発明はこのような背景に鑑みてなされたものであり、その目的は、データを生成するために必要な情報が欠けている場合であってもそのデータを生成することが可能な、データ生成支援装置、データ生成支援方法、及びデータ生成支援システムを提供することにある。 The present invention has been made in view of such a background, and an object thereof is data generation capable of generating data even if the information necessary for generating the data is lacking. The purpose is to provide a support device, a data generation support method, and a data generation support system.

上記課題を解決するための本発明の一つは、所定のデータの生成を要求する要求情報を受信するデータ生成要求受付処理と、前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、を実行する演算装置を備える、データ生成支援装置、とする。 One of the present inventions for solving the above-mentioned problems is a data generation request acceptance process for receiving request information requesting the generation of predetermined data, and an estimation of the characteristics of the contents of the predetermined data by a first model. A data generation support device including a calculation device for executing a data generation management process specified by a second model as a process in which the predetermined data can be generated by other data having the contents of the estimated features.

また、上記課題を解決するための本発明の他の一つは、情報処理装置が、所定のデータの生成を要求する要求情報を受信するデータ生成要求受付処理と、前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、を実行する、データ生成支援方法、とする。 Further, another one of the present invention for solving the above-mentioned problems is a data generation request acceptance process in which the information processing apparatus receives request information requesting the generation of predetermined data, and the content of the predetermined data. Data generation support that estimates features by the first model and executes a process that can generate the predetermined data by other data having the contents of the estimated features, and a data generation management process that specifies by the second model. The method.

また、上記課題を解決するための本発明の他の一つは、所定のデータの生成を要求する要求情報を送信する利用者端末と、前記要求情報を受信するデータ生成要求受付処理、及び、前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える、所定の情報処理装置が記憶している他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理を実行するデータ生成支援装置とを含んで構成され、前記所定の情報処理装置は、前記他のデータを記憶していると共に、前記利用者端末による前記他のデータへのアクセスを禁止している、データ生成支援システム、とする。 Another aspect of the present invention for solving the above problems is a user terminal for transmitting request information requesting the generation of predetermined data, a data generation request acceptance process for receiving the request information, and a data generation request acceptance process. A process in which the characteristic of the content of the predetermined data is estimated by the first model and the predetermined data can be generated by other data stored in the predetermined information processing apparatus having the content of the estimated characteristic is performed. The predetermined information processing apparatus is configured to include a data generation support device that executes data generation management processing specified by the two models, and the predetermined information processing apparatus stores the other data and the other by the user terminal. It is a data generation support system that prohibits access to data.

本発明によれば、データを生成するために必要な情報が欠けている場合であってもそのデータを生成することができる。 According to the present invention, even if the information necessary for generating the data is lacking, the data can be generated.

上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。 Issues, configurations and effects other than those described above will be clarified by the following description of the embodiments.

実施例1に係るデータ生成支援システムの構成の一例を示す図である。It is a figure which shows an example of the structure of the data generation support system which concerns on Example 1. FIG. データファイルの一例を示す図である。It is a figure which shows an example of a data file. データ生成管理部の詳細を説明する図である。It is a figure explaining the detail of the data generation management part. 物品検索支援システムが備える機能の一例を説明する図である。It is a figure explaining an example of the function which the article search support system has. ワークフローメタデータ管理テーブルの一例を示す図である。It is a figure which shows an example of a workflow metadata management table. ファイルメタデータ抽出規則の一例を示す図である。It is a figure which shows an example of the file metadata extraction rule. ワークフローメタデータ抽出規則の一例を示す図である。It is a figure which shows an example of a workflow metadata extraction rule. ワークフロー実行ログの一例を示す図である。It is a figure which shows an example of a workflow execution log. データ生成支援システムにおける各情報処理装置(利用者端末、データ生成支援装置、ワークフロー実行装置、ファイル管理サーバ、及び管理コンソール)が備えるハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware composition which each information processing apparatus (user terminal, a data generation support apparatus, a workflow execution apparatus, a file management server, and a management console) in a data generation support system has. データ生成支援処理の一例を説明するフロー図である。It is a flow diagram explaining an example of data generation support processing. データ生成要求の一例を示す図である。It is a figure which shows an example of a data generation request. ワークフロー特定画面の一例を示す図である。It is a figure which shows an example of a workflow specific screen. ファイルメタデータ管理テーブル生成処理の一例を説明するフロー図である。It is a flow diagram explaining an example of a file metadata management table generation process. ワークフローメタデータ管理テーブル生成処理の一例を説明するフロー図である。It is a flow diagram explaining an example of a workflow metadata management table generation process. 実施例2に係るデータ生成支援システムにおける構成例の一部を示す図である。It is a figure which shows a part of the configuration example in the data generation support system which concerns on Example 2. FIG. ワークフロー計画管理テーブルの一例を示す図である。It is a figure which shows an example of a workflow plan management table. ワークフロー計画管理テーブル生成処理の一例を説明するフロー図である。It is a flow diagram explaining an example of a workflow plan management table generation process.

本実施形態に係るデータ生成支援システムについて、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 The data generation support system according to this embodiment will be described with reference to the drawings. It should be noted that the embodiments described below do not limit the invention according to the claims, and all of the elements and combinations thereof described in the embodiments are indispensable for the means for solving the invention. Is not always.

[実施例1]
−システム構成−
図1は、実施例1に係るデータ生成支援システム1の構成の一例を示す図である。
[Example 1]
-System configuration-
FIG. 1 is a diagram showing an example of the configuration of the data generation support system 1 according to the first embodiment.

データ生成支援システム1は、利用者端末102、ファイル管理サーバ105、ワークフロー実行装置120、データ生成支援装置101、及び管理コンソール107を含んで構成されている。 The data generation support system 1 includes a user terminal 102, a file management server 105, a workflow execution device 120, a data generation support device 101, and a management console 107.

利用者端末102は、利用者(組織又は個人。例えば、医師。)が利用する情報処理装置である。 The user terminal 102 is an information processing device used by a user (organization or individual, for example, a doctor).

ファイル管理サーバ105は、所定の事業者により管理され、様々な機密データ(以下、一次データともいう)を記憶している。ファイル管理サーバ105は、例えば、所定のデータ保有組織又はそのアライアンス組織が管理する、多数人の遺伝情報のデータベース装置である。 The file management server 105 is managed by a predetermined business operator and stores various confidential data (hereinafter, also referred to as primary data). The file management server 105 is, for example, a database device for genetic information of a large number of people managed by a predetermined data holding organization or an alliance organization thereof.

なお、ファイル管理サーバ105は、データ生成支援装置101及びワークフロー実行装置120からのアクセスは許可しているが、利用者端末102からのアクセスは禁止している。 The file management server 105 permits access from the data generation support device 101 and the workflow execution device 120, but prohibits access from the user terminal 102.

ワークフロー実行装置120は、所定の事業者(例えば、データ保有組織又はそのアライアンス組織)が管理する情報処理装置である。ワークフロー実行装置120は、利用者端末102から受信したデータ生成要求108とファイル管理サーバ105の一次データとに基づき所定の処理プログラム(以下、ワークフローという)を実行することにより、一次データを加工して得られる機密性の低いデータ(二次データ)及びこの二次データをさらに加工して得られるデータ(以下、これらのデータを総称して成果データという。)を生成する。 The workflow execution device 120 is an information processing device managed by a predetermined business operator (for example, a data holding organization or an alliance organization thereof). The workflow execution device 120 processes the primary data by executing a predetermined processing program (hereinafter referred to as a workflow) based on the data generation request 108 received from the user terminal 102 and the primary data of the file management server 105. Data with low confidentiality (secondary data) obtained and data obtained by further processing this secondary data (hereinafter, these data are collectively referred to as result data) are generated.

二次データは、例えば、遺伝情報に基づき生成される変異情報である。成果データは、例えば、変異情報に基づき生成される疾病リスクの情報である。 The secondary data is, for example, mutation information generated based on genetic information. Outcome data is, for example, disease risk information generated based on mutation information.

データ生成支援装置101は、利用者端末102とワークフロー実行装置120とを仲介する情報処理装置である。データ生成支援装置101は、利用者端末102から受信したデータ生成要求108に基づき、成果データを生成するために必要な一次データを特定し、特定した一次データに基づき、ワークフロー実行装置120に成果データの生成を要求する(データ生成計画)。 The data generation support device 101 is an information processing device that mediates between the user terminal 102 and the workflow execution device 120. The data generation support device 101 identifies the primary data necessary for generating the result data based on the data generation request 108 received from the user terminal 102, and the result data is sent to the workflow execution device 120 based on the specified primary data. Requests the generation of (data generation plan).

管理コンソール107は、データ生成支援装置101の管理者106(組織又は個人)が使用する情報処理装置である。 The management console 107 is an information processing device used by the administrator 106 (organization or individual) of the data generation support device 101.

利用者端末102、データ生成支援装置101、ファイル管理サーバ105、管理コンソール107、及びワークフロー実行装置120の間は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、専用線等の有線又は無線のネットワ
ークによって通信可能に接続される。
Wired LAN (Local Area Network), WAN (Wide Area Network), Internet, dedicated line, etc. between the user terminal 102, data generation support device 101, file management server 105, management console 107, and workflow execution device 120. Alternatively, it is communicably connected by a wireless network.

ここで、利用者端末102の利用者は、データ生成要求108として自身が保有するデータ及び、成果データを生成するためのワークフローを指定することにより、所望の成果データを得ることを欲している。 Here, the user of the user terminal 102 wants to obtain desired result data by designating the data held by himself / herself as the data generation request 108 and the workflow for generating the result data.

しかし、ワークフローの実行には、使用する一次データを特定する必要があるところ、事業者はこの一次データについての情報を、利用者に提供することができない。そのため事業者は、通常であれば、提供を受けたデータから必要な一次データを特定するための煩雑な作業を行わなければならなかった。 However, in order to execute the workflow, it is necessary to specify the primary data to be used, and the business operator cannot provide the information about this primary data to the user. Therefore, the business operator would normally have to perform complicated work to identify the necessary primary data from the provided data.

そこで、本実施形態のデータ生成支援装置101は、利用者のデータ生成要求108に対する適切なワークフローを自動的に特定し、ワークフロー実行装置120に成果データを生成させるようにする。 Therefore, the data generation support device 101 of the present embodiment automatically identifies an appropriate workflow for the user's data generation request 108, and causes the workflow execution device 120 to generate result data.

以下、このようなデータ生成支援システム1の詳細を説明する。 Hereinafter, the details of such a data generation support system 1 will be described.

−−利用者端末−−
まず、利用者端末102は、利用者により入力された、成果データの生成を要求するデータ生成要求108を送信する。利用者端末102は、利用者が利用するインタフェースとして、GUI(Graphic User Interface)やCUI(Command User Interface)等を備える。
--User terminal ---
First, the user terminal 102 transmits a data generation request 108 input by the user, which requests the generation of result data. The user terminal 102 includes a GUI (Graphic User Interface), a CUI (Command User Interface), and the like as an interface used by the user.

−−管理コンソール−−
管理コンソール107は、管理者106からの入力により、データ生成支援装置101における後述するファイルメタデータ抽出規則115及びワークフローメタデータ抽出規則118を生成する。管理コンソール107は、管理者106が利用するインタフェースとして、GUI(Graphic User Interface)やCUI(Command User Interface)等を備える。
--Management console ---
The management console 107 generates the file metadata extraction rule 115 and the workflow metadata extraction rule 118 described later in the data generation support device 101 by input from the administrator 106. The management console 107 includes a GUI (Graphic User Interface), a CUI (Command User Interface), and the like as an interface used by the administrator 106.

−−ファイル管理サーバ−−
ファイル管理サーバ105は、ワークフローが利用する一次データのファイル(以下、データファイルともいう)を複数保持する。なお、ファイル管理サーバ105は、データ生成支援装置101に組み込まれていてもよいし、データ生成支援装置101の外部機能として提供されてもよい。すなわち、ファイル管理サーバ105が管理するデータファイルは、NAS(Network Attached Storage)やローカルファイルサーバ、クラウド上のオブ
ジェクトストレージなど、どのような形態で提供されていてもよい。
--File management server ---
The file management server 105 holds a plurality of primary data files (hereinafter, also referred to as data files) used by the workflow. The file management server 105 may be incorporated in the data generation support device 101, or may be provided as an external function of the data generation support device 101. That is, the data file managed by the file management server 105 may be provided in any form such as NAS (Network Attached Storage), a local file server, and object storage on the cloud.

(データファイル)
ここで、図2は、データファイルの一例を示す図である。データファイル150は、書
誌情報等が設定される部分であるデータヘッダ部R1001と、データボディ部R1021とを有する。データヘッダ部R1001は、データモデル、データボディ部R1021のサイズ、又は、データファイル150に対応づけられている外部のデータファイル150のID等の、サブ情報R1011〜R1016を含む。データボディ部R1021は、データ本体であり、機密情報が含まれる。なお、同図では、データファイル150がバイナリファイル形式である場合の例を示しているが、データファイル150はテキスト形式でもよい。
(data file)
Here, FIG. 2 is a diagram showing an example of a data file. The data file 150 has a data header unit R1001 and a data body unit R1021 which are portions in which bibliographic information and the like are set. The data header unit R1001 includes sub-information R1011 to R1016 such as a data model, a size of the data body unit R1021, or an ID of an external data file 150 associated with the data file 150. The data body unit R1021 is a data body and contains confidential information. Although the figure shows an example in which the data file 150 is in the binary file format, the data file 150 may be in the text format.

−−データ生成支援装置−−
次に、図1に示すように、データ生成支援装置101は、データ生成要求受付部111、データ生成管理部112、ファイルメタデータ抽出部113、及びワークフローメタデータ抽出部116の各機能部(プログラム)を備える。
--Data generation support device ---
Next, as shown in FIG. 1, the data generation support device 101 is a functional unit (program) of a data generation request receiving unit 111, a data generation management unit 112, a file metadata extraction unit 113, and a workflow metadata extraction unit 116. ).

また、データ生成支援装置101は、ファイルメタデータ管理テーブル114、ファイルメタデータ抽出規則115、ワークフローメタデータ管理テーブル117、及びワークフローメタデータ抽出規則118を記憶している。 Further, the data generation support device 101 stores a file metadata management table 114, a file metadata extraction rule 115, a workflow metadata management table 117, and a workflow metadata extraction rule 118.

まず、データ生成要求受付部111は、所定のデータ(成果データ)の生成を要求する要求情報を受信する。すなわち、データ生成要求受付部111は、利用者端末102から送信されてきたデータ生成要求108を受信する。 First, the data generation request receiving unit 111 receives the request information requesting the generation of predetermined data (result data). That is, the data generation request receiving unit 111 receives the data generation request 108 transmitted from the user terminal 102.

また、データ生成要求受付部111は、ワークフロー実行装置120が生成した成果データ又は当該成果データにアクセスするための情報を、利用者端末102に送信する。 Further, the data generation request receiving unit 111 transmits the result data generated by the workflow execution device 120 or the information for accessing the result data to the user terminal 102.

データ生成管理部112は、成果データの内容の特徴を第1モデル(ファイルメタデータ管理テーブル114)により推定し、推定した特徴の内容を備える他のデータ(一次データ)により成果データが生成可能な処理(ワークフロー)を、第2モデル(ワークフローメタデータ管理テーブル117)により特定する。 The data generation management unit 112 estimates the characteristics of the content of the result data by the first model (file metadata management table 114), and can generate the result data by other data (primary data) having the contents of the estimated characteristics. The process (workflow) is specified by the second model (workflow metadata management table 117).

すなわち、データ生成管理部112は、データ生成要求108と、ファイルメタデータ管理テーブル114及びワークフローメタデータ管理テーブル117とに基づき、データ生成要求108の要求内容に対応したワークフロー及びこれに使用されるデータファイル150の情報であるデータ生成計画を生成する。データ生成管理部112は、生成したデータ生成計画をワークフロー実行装置120に送信する。 That is, the data generation management unit 112 is based on the data generation request 108, the file metadata management table 114, and the workflow metadata management table 117, and the workflow corresponding to the request content of the data generation request 108 and the data used for the workflow. Generate a data generation plan that is information in file 150. The data generation management unit 112 transmits the generated data generation plan to the workflow execution device 120.

また、データ生成管理部112は、成果データ(二次データ等)が生成可能な処理(ワークフロー)を特定したことを示す情報、又は成果データが生成可能な処理に基づき成果データを生成中であることを示す情報を表示する。 Further, the data generation management unit 112 is generating the result data based on the information indicating that the process (workflow) in which the result data (secondary data or the like) can be generated is specified, or the process in which the result data can be generated. Display information indicating that.

ここで、データ生成管理部112の詳細を説明する。 Here, the details of the data generation management unit 112 will be described.

(データ生成管理部)
図3は、データ生成管理部112の詳細を説明する図である。データ生成管理部112は、データ生成計画部301、入力ファイル特定部302、実行ワークフロー特定部303、及び計画管理部304を含む。
(Data generation management department)
FIG. 3 is a diagram illustrating details of the data generation management unit 112. The data generation management unit 112 includes a data generation planning unit 301, an input file specifying unit 302, an execution workflow specifying unit 303, and a planning management unit 304.

データ生成計画部301は、データ生成要求受付部111から受信したデータ生成要求108に基づき、次述する実行ワークフロー特定部303と連携することで実行するワークフローを特定すると共に、次述する入力ファイル特定部302と連携することで、特定したワークフローに入力するファイルを特定する。データ生成計画部301は、特定した
これらのワークフロー及びファイルの情報を、データ生成計画として計画管理部304に入力する。
Based on the data generation request 108 received from the data generation request receiving unit 111, the data generation planning unit 301 specifies the workflow to be executed in cooperation with the execution workflow specifying unit 303 described below, and also specifies the input file described below. By linking with the unit 302, the file to be input to the specified workflow is specified. The data generation planning unit 301 inputs the information of these identified workflows and files to the planning management unit 304 as a data generation plan.

入力ファイル特定部302は、データ生成計画部301から入力されたファイルの情報に基づき、そのファイルを特徴付けるデータ(メタデータ)を、ファイルメタデータ管理テーブル114から取得する。 The input file specifying unit 302 acquires data (metadata) that characterizes the file from the file metadata management table 114 based on the information of the file input from the data generation planning unit 301.

実行ワークフロー特定部303は、データ生成計画部301から入力されたワークフローに基づき、そのワークフローを特徴付けるデータ(メタデータ)を、ワークフローメタデータ管理テーブル117から取得する。 The execution workflow specifying unit 303 acquires data (metadata) that characterizes the workflow from the workflow metadata management table 117 based on the workflow input from the data generation planning unit 301.

計画管理部304は、データ生成計画部301から入力されたデータ生成計画を取得し、当該データ生成計画におけるワークフローの実行要求をワークフロー実行装置120に送信する。また、計画管理部304は、計画管理部304からそのワークフローの実行完了の旨の通知及び、そのワークフローの実行結果又は当該実行結果のアクセスに必要な情報(実行結果情報)を、データ生成要求受付部111に入力する。 The plan management unit 304 acquires the data generation plan input from the data generation planning unit 301, and transmits the workflow execution request in the data generation plan to the workflow execution device 120. Further, the plan management unit 304 receives a data generation request notification from the plan management unit 304 to the effect that the execution of the workflow is completed, and the execution result of the workflow or the information necessary for accessing the execution result (execution result information). Input to unit 111.

ここで、ファイルメタデータ管理テーブル114及びワークフローメタデータ管理テーブル117について説明する。 Here, the file metadata management table 114 and the workflow metadata management table 117 will be described.

(ファイルメタデータ管理テーブル)
図4は、ファイルメタデータ管理テーブル114の一例を示す図である。
(File metadata management table)
FIG. 4 is a diagram showing an example of the file metadata management table 114.

ファイルメタデータ管理テーブル114は、データファイル150を特徴付ける情報(以下、特徴情報という)として、形式面からデータファイル150を特徴付ける情報であるデータ形式と、内容面からデータファイル150を特徴付ける情報であるメタデータとを記憶している。 File metadata The data management table 114 is a data format that characterizes the data file 150 in terms of format (hereinafter referred to as feature information) and a meta that is information that characterizes the data file 150 in terms of content. I remember the data.

すなわち、ファイルメタデータ管理テーブル114は、データファイル150のIDであるデータID501、データID501に係るデータファイル150の形式(例えば、ファイルの拡張子)の情報であるデータ形式502、及び、データID501に係るデータファイル150のデータの内容を特徴付ける情報であるメタデータ503の各項目を有する1以上のレコードR521〜R526で構成される。 That is, the file metadata management table 114 includes the data ID 501 which is the ID of the data file 150, the data format 502 which is the information of the format (for example, the extension of the file) of the data file 150 related to the data ID 501, and the data ID 501. It is composed of one or more records R521 to R526 having each item of metadata 503, which is information characterizing the contents of the data of the data file 150.

メタデータ503は、データファイル150の内容の種別であるデータ種別511と、データファイル150の内容を所定の規則により分類した場合の分類512とを有する。メタデータ503の内容は、データ形式502に係る情報では特定できない、データファイル150の特徴情報である。例えば、メタデータ503は、データファイル150がバイナリ形式の場合は、データファイルのヘッダ部R1001又はボディ部R1021を解析して得られる情報である。 The metadata 503 has a data type 511, which is a type of the contents of the data file 150, and a classification 512 when the contents of the data file 150 are classified according to a predetermined rule. The content of the metadata 503 is characteristic information of the data file 150 that cannot be specified by the information related to the data format 502. For example, the metadata 503 is information obtained by analyzing the header portion R1001 or the body portion R1021 of the data file when the data file 150 is in a binary format.

(ワークフローメタデータ管理テーブル)
図5は、ワークフローメタデータ管理テーブル117の一例を示す図である。ワークフローメタデータ管理テーブル117は、過去に実行された又はユーザにより予め設定された各ワークフローと各ワークフローの特徴情報とを蓄積している。
(Workflow metadata management table)
FIG. 5 is a diagram showing an example of the workflow metadata management table 117. The workflow metadata management table 117 stores each workflow executed in the past or preset by the user and the feature information of each workflow.

ワークフローメタデータ管理テーブル117は、ワークフローのIDが設定されるワークフローID601と、ワークフローID601に係るワークフローの実行の際に入力されるデータファイル150(以下、入力データという)の特徴情報が設定されるワークフロー入力602と、ワークフローID601に係るワークフローの実行により出力される
ファイル(以下、出力データという)の特徴情報が設定されるワークフロー出力603とを含む各項目を有する、1以上のレコードR(R631〜R636)を備える。
The workflow metadata management table 117 is a workflow in which the workflow ID 601 in which the workflow ID is set and the feature information of the data file 150 (hereinafter referred to as input data) input when the workflow related to the workflow ID 601 are executed are set. One or more records R (R631 to R636) having each item including the input 602 and the workflow output 603 in which the characteristic information of the file (hereinafter referred to as output data) output by the execution of the workflow related to the workflow ID 601 is set. ).

ワークフロー入力602は、入力データの形式(例えば、拡張子)が設定されるデータ形式611と、入力データのメタデータが設定されるメタデータ612とを有する。メタデータ612は、入力データのメタデータの種別が設定される種別621と、入力データのメタデータの分類が設定される分類622とを有する。 The workflow input 602 has a data format 611 in which the format of the input data (for example, an extension) is set, and metadata 612 in which the metadata of the input data is set. The metadata 612 has a type 621 in which the type of metadata of the input data is set, and a classification 622 in which the classification of the metadata of the input data is set.

また、ワークフロー出力603は、出力データの形式(例えば、拡張子)が設定されるデータ形式613と、出力データのメタデータが設定されるメタデータ614を有する。メタデータ614は、出力データのメタデータの種別が設定される種別623と、出力データのメタデータの分類が設定される分類624とを有する。 Further, the workflow output 603 has a data format 613 in which the format of the output data (for example, an extension) is set, and the metadata 614 in which the metadata of the output data is set. The metadata 614 has a type 623 in which the type of metadata of the output data is set, and a classification 624 in which the classification of the metadata of the output data is set.

なお、ワークフロー入力602及びワークフロー出力603には、それぞれ0個以上のデータが設定される。 In addition, 0 or more data are set in each of the workflow input 602 and the workflow output 603.

次に、図1に示すように、ファイルメタデータ抽出部113は、複数のデータ(データファイル150)の入力を受け付け、入力されたデータの内容に基づき入力されたデータファイル150の内容の各特徴を推定し、推定した各内容の特徴と、入力された各データファイル150とを対応づけて記憶したファイルメタデータ管理テーブル114を第1モデルとして生成する。具体的には、ファイルメタデータ抽出部113は、入力されたデータファイル150の内容から所定の規則に従って前記特徴を抽出することにより、入力されたデータファイル150の内容の特徴を推定する
すなわち、ファイルメタデータ抽出部113は、ファイル管理サーバ105が記憶している各データファイル150から、後述するファイルメタデータ抽出規則115に従って各データファイル150中のメタデータを抽出し、抽出したメタデータ(以下、ファイルメタデータという)をファイルメタデータ管理テーブル114に格納する。
Next, as shown in FIG. 1, the file metadata extraction unit 113 accepts the input of a plurality of data (data file 150), and each feature of the content of the data file 150 input based on the content of the input data. Is estimated, and a file metadata management table 114 that stores the characteristics of each estimated content in association with each input data file 150 is generated as the first model. Specifically, the file metadata extraction unit 113 estimates the characteristics of the contents of the input data file 150 by extracting the characteristics from the contents of the input data file 150 according to a predetermined rule, that is, a file. The metadata extraction unit 113 extracts the metadata in each data file 150 from each data file 150 stored in the file management server 105 according to the file metadata extraction rule 115 described later, and the extracted metadata (hereinafter referred to as “)”. The file metadata) is stored in the file metadata management table 114.

ワークフローメタデータ抽出部116は、入力されたデータファイル150の内容の各特徴について、当該特徴と、当該内容の特徴を備えるデータを用いて成果データを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブル117を第2モデルとして生成する。具体的には、ワークフローメタデータ抽出部116は、処理の情報(ワークフロー)の入力を受け付け、入力された処理が取り扱うデータ(一次データ)の特徴を所定の規則に従って抽出することにより、成果データを生成する処理を特定する。 The workflow metadata extraction unit 116 stores each feature of the content of the input data file 150 in association with the feature and the process of generating result data using the data having the feature of the content. The data management table 117 is generated as the second model. Specifically, the workflow metadata extraction unit 116 accepts input of processing information (workflow) and extracts the characteristics of the data (primary data) handled by the input processing according to a predetermined rule to obtain the result data. Specify the process to generate.

すなわち、ワークフローメタデータ抽出部116は、ファイルメタデータ管理テーブル114と、後述するワークフロー実行ログ104が示すワークフローとに基づき、後述するワークフローメタデータ抽出規則118に従って、各ワークフローにおけるメタデータ(以下、ワークフローメタデータという)を抽出し、抽出したワークフローメタデータを、ワークフローメタデータ管理テーブル117に格納する。 That is, the workflow metadata extraction unit 116 is based on the file metadata management table 114 and the workflow shown by the workflow execution log 104 described later, and according to the workflow metadata extraction rule 118 described later, the metadata in each workflow (hereinafter, workflow). (Metadata) is extracted, and the extracted workflow metadata is stored in the workflow metadata management table 117.

ここで、ファイルメタデータ抽出規則115及びワークフローメタデータ抽出規則118について説明する。 Here, the file metadata extraction rule 115 and the workflow metadata extraction rule 118 will be described.

(ファイルメタデータ抽出規則)
図6は、ファイルメタデータ抽出規則115の一例を示す図である。ファイルメタデータ抽出規則115は、ファイル管理サーバ105に記録されている各データファイル150から、データファイル150の特徴情報(ファイルメタデータ管理テーブル114)を生成するための、1又は複数の規則を記憶している。
(File metadata extraction rule)
FIG. 6 is a diagram showing an example of the file metadata extraction rule 115. The file metadata extraction rule 115 stores one or more rules for generating feature information (file metadata management table 114) of the data file 150 from each data file 150 recorded in the file management server 105. doing.

ファイルメタデータ抽出規則115は、規則の識別子である規則ID801と、規則ID801に係る規則を適用可能なデータファイル150のデータ形式802と、規則ID801に係る規則を適用してファイルメタデータを生成するためのコマンド(スクリプトやプログラム等)である抽出コマンド803(以下、ファイルメタデータ抽出コマンドともいう)と、抽出コマンド803に係るコマンドが生成するファイルメタデータの属性を定義した情報であるメタデータ定義804とを含む各項目を有する、1以上のレコードR821〜R824を備える。 The file metadata extraction rule 115 applies the rule ID 801 which is the identifier of the rule, the data format 802 of the data file 150 to which the rule according to the rule ID 801 can be applied, and the rule according to the rule ID 801 to generate the file metadata. Extraction command 803 (hereinafter also referred to as file metadata extraction command), which is a command (script, program, etc.) for this purpose, and metadata definition, which is information that defines the attributes of the file metadata generated by the command related to the extraction command 803. It comprises one or more records R821-R824 having each item including 804.

メタデータ定義804は、ファイルメタデータの属性(種別及び分類)の情報であるキー811と、ファイルメタデータを格納する変数であるバリュー812とを含む組み合わせを、1以上有する。 The metadata definition 804 has one or more combinations including a key 811 which is information on attributes (types and classifications) of file metadata and a value 812 which is a variable for storing file metadata.

例えば、レコードR821には、「CRAM」というデータ形式(拡張子)を有するデータファイル150に対して実行するファイルメタデータ抽出コマンドが抽出コマンド803として設定されている。そして、この抽出コマンド803はその実行により、ファイルメタデータにおける種別の情報(例えば、「Seq.」)を変数「v1」に設定し、ファイルメタデータにおける分類の情報(例えば、「Whole」「mtDNA」)を変数「v2」に設定する。 For example, in the record R821, a file metadata extraction command to be executed for a data file 150 having a data format (extension) of "CRAM" is set as an extraction command 803. Then, by executing this extraction command 803, the type information (for example, "Seq.") In the file metadata is set in the variable "v1", and the classification information in the file metadata (for example, "Whole" "mtDNA" is set. ") Is set to the variable" v2 ".

なお、ファイルメタデータ抽出コマンドは、ファイルメタデータを、データファイル150のデータヘッダ部R1001から抽出してもよいし、データボディ部R1021から抽出してもよいし、これらを組み合わせてもよい。また、ファイルメタデータ抽出コマンドは、データボディ部R1021を加工したデータをファイルメタデータとしてもよい。例えば、ファイルメタデータは、データボディ部R1021のデータに対して所定の統計分析(例えば、データモデルの記述方式の違いの分析)又は構文分析(例えば、語句の統計的な偏りの分析)を行ったデータでもよい。 The file metadata extraction command may extract the file metadata from the data header unit R1001 of the data file 150, may be extracted from the data body unit R1021, or may be combined. Further, the file metadata extraction command may use the data obtained by processing the data body portion R1021 as the file metadata. For example, the file metadata performs a predetermined statistical analysis (for example, analysis of differences in the description method of the data model) or syntactic analysis (for example, analysis of statistical bias of words) on the data of the data body unit R1021. Data may be used.

(ワークフローメタデータ抽出規則)
図7は、ワークフローメタデータ抽出規則118の一例を示す図である。ワークフローメタデータ抽出規則118は、ワークフロー実行ログ104に記録されている各ワークフローから、ワークフローのメタデータ(ワークフローメタデータ管理テーブル117)を生成するための、1又は複数の規則を記憶している。なお、ワークフロー実行ログ104における1つのワークフローに対して、ワークフローメタデータ抽出規則118に係る複数の規則が適用される場合がある。
(Workflow metadata extraction rule)
FIG. 7 is a diagram showing an example of the workflow metadata extraction rule 118. The workflow metadata extraction rule 118 stores one or a plurality of rules for generating workflow metadata (workflow metadata management table 117) from each workflow recorded in the workflow execution log 104. In addition, a plurality of rules related to the workflow metadata extraction rule 118 may be applied to one workflow in the workflow execution log 104.

ワークフローメタデータ抽出規則118は、規則の識別子である規則ID901と、規則ID801に係る規則に対する説明の情報であるステップ任意記述902と、規則ID801に係る規則を適用してワークフローメタデータを生成するコマンド(スクリプト等)である処理コマンド903(以下、ワークフローメタデータ抽出コマンドともいう)と、処理コマンド903に係るコマンドを実行後に適用される規則の規則IDである次ステップ判定904とを含む各情報を各レコードに有する。 The workflow metadata extraction rule 118 is a command for generating workflow metadata by applying the rule ID 901 which is an identifier of the rule, the step optional description 902 which is the information of the explanation for the rule related to the rule ID 801 and the rule related to the rule ID 801. Each information including the processing command 903 (hereinafter, also referred to as the workflow metadata extraction command) which is (script etc.) and the next step determination 904 which is the rule ID of the rule applied after the command related to the processing command 903 is executed. Have in each record.

例えば、レコードR911(規則「WR01」)には、ワークフローの入力データから当該入力データのメタデータを抽出するための規則が設定されている。すなわち、ワークフローにおける「入力データのDataID置換」を行うワークフローメタデータ抽出コマンドが設定されている。また、レコードR912(規則「WR02」)には、ワークフローの出力データのメタデータを抽出するための規則が設定されている。レコードR913(規則「WR03」)には、ワークフローの特徴情報の一つとして、ワークフローのIDを抽出するための規則が設定されている。 For example, the record R911 (rule "WR01") is set with a rule for extracting the metadata of the input data from the input data of the workflow. That is, a workflow metadata extraction command that performs "DataID replacement of input data" in the workflow is set. Further, in the record R912 (rule "WR02"), a rule for extracting the metadata of the output data of the workflow is set. In the record R913 (rule "WR03"), a rule for extracting a workflow ID is set as one of the workflow feature information.

なお、このワークフローメタデータ抽出コマンドは、ワークフロー実行ログ104におけるワークフローの入力データ703に含まれるデータIDを、ファイルメタデータ管理テーブル114が有するデータ形式及びメタデータに置換する処理を実行する。 The workflow metadata extraction command executes a process of replacing the data ID included in the workflow input data 703 in the workflow execution log 104 with the data format and metadata of the file metadata management table 114.

なお、処理コマンド903は、ワークフロー実行ログ104におけるワークフロー毎に異なる場合がある。また、次ステップ判定904には、単に規則IDが設定されてもよいし、処理コマンド903の実行結果に応じてその後に適用する規則を異ならせるための条件式が設定されてもよい。 The processing command 903 may be different for each workflow in the workflow execution log 104. Further, in the next step determination 904, a rule ID may be simply set, or a conditional expression for differentiating the rules to be applied thereafter may be set according to the execution result of the processing command 903.

−−ワークフロー実行装置−−
次に、図1に示すように、ワークフロー実行装置120は、ワークフロー実行部103、ワークフロー管理部109、及びワークフロー実行ログ104を備える。
--Workflow execution device ---
Next, as shown in FIG. 1, the workflow execution device 120 includes a workflow execution unit 103, a workflow management unit 109, and a workflow execution log 104.

ワークフロー実行部103は、データ生成計画を、後述するワークフロー管理部109が記憶しているワークフロー、及びファイル管理サーバ105が管理するデータファイル150を利用しつつ実行する。なお、ワークフロー実行部103は、ワークフロー実行装置120に組み込まれていてもよいし、データ生成支援装置101に組み込まれていてもよいし、その他の外部の情報処理装置に設けられていてもよい。 The workflow execution unit 103 executes the data generation plan while using the workflow stored in the workflow management unit 109, which will be described later, and the data file 150 managed by the file management server 105. The workflow execution unit 103 may be incorporated in the workflow execution device 120, may be incorporated in the data generation support device 101, or may be provided in another external information processing device.

ワークフロー実行ログ104は、ワークフロー実行部103が実行した処理の履歴を蓄積している。なお、ワークフロー実行ログ104は、ワークフロー実行装置120に組み込まれていてもよいし、データ生成支援装置101に組み込まれていてもよいし、その他の外部の情報処理装置に設けられていてもよい。 The workflow execution log 104 stores a history of processes executed by the workflow execution unit 103. The workflow execution log 104 may be incorporated in the workflow execution device 120, may be incorporated in the data generation support device 101, or may be provided in another external information processing device.

(ワークフロー実行ログ)
図8は、ワークフロー実行ログ104の一例を示す図である。ワークフロー実行ログ104は、過去に実行されたワークフローの情報である。ワークフロー実行ログ104は、ワークフローが実行された日時又は時刻が設定されるタイムスタンプ701と、実行されたワークフローのIDが設定されるワークフローID702と、ワークフローID702に係るワークフローの実行の際に入力されたデータ(データファイル150)が設定される入力データ703と、ワークフローID702に係るワークフローの実行により出力されたデータが設定される出力データ704とを含む各項目を有する、1以上のレコードR711〜R714を備える。
(Workflow execution log)
FIG. 8 is a diagram showing an example of the workflow execution log 104. The workflow execution log 104 is information on workflows executed in the past. The workflow execution log 104 is input when the time stamp 701 in which the date and time or time when the workflow is executed is set, the workflow ID 702 in which the ID of the executed workflow is set, and the workflow related to the workflow ID 702 are executed. One or more records R711 to R714 having each item including input data 703 in which data (data file 150) is set and output data 704 in which data output by executing a workflow related to workflow ID 702 are set. Be prepared.

入力データ703及び出力データ704には、それぞれ0個以上の情報が設定される。 Zero or more pieces of information are set in the input data 703 and the output data 704, respectively.

次に、図9は、データ生成支援システム1における各情報処理装置(利用者端末102、データ生成支援装置101、ワークフロー実行装置120、ファイル管理サーバ105、及び管理コンソール107)が備えるハードウェア構成の一例を示す図である。各情報処理装置は、CPU等の演算装置201と、プログラム及びデータ等が展開される、RAM(Random Access Memory)又はROM(Read Only Memory)等のメインメモリ202と、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等の補助記憶装置203と、他の情報処理装置と通信する、ネットワークインタフェースカード等の通信インタフェース204と、外部記憶媒体207が接続されるメディアインタフェース205と、キーボード若しくはタッチパネル等の入力装置及びモニタ若しくはディスプレイ等の出力装置を含む入出力装置206とを備え、これらはバス等で互いに接続されている。なお、外部記憶媒体207は、例えば、通信媒体(すなわち有線、無線、光などのネットワーク、または当該ネットワークを伝搬する搬送波やディジタル信号)、又はメディアインタフェース205に着脱可能な物である。なお、データ生成支援装置101は、入出力装置206を介して管理コンソール107に接続している。 Next, FIG. 9 shows the hardware configuration of each information processing device (user terminal 102, data generation support device 101, workflow execution device 120, file management server 105, and management console 107) in the data generation support system 1. It is a figure which shows an example. Each information processing device includes a calculation device 201 such as a CPU, a main memory 202 such as a RAM (Random Access Memory) or a ROM (Read Only Memory) in which programs and data are developed, and an HDD (Hard Disk Drive). An auxiliary storage device 203 such as an SSD (Solid State Drive) or a flash memory, a communication interface 204 such as a network interface card that communicates with another information processing device, and a media interface 205 to which an external storage medium 207 is connected. It includes an input device such as a keyboard or a touch panel and an input / output device 206 including an output device such as a monitor or a display, and these are connected to each other by a bus or the like. The external storage medium 207 is, for example, a communication medium (that is, a network such as wired, wireless, optical, etc., or a carrier wave or digital signal propagating in the network), or a medium that can be attached to and detached from the media interface 205. The data generation support device 101 is connected to the management console 107 via the input / output device 206.

これまでに説明した、各情報処理装置の各機能は、専用ハードウェアにより、又は、演算装置201がメインメモリ202又は補助記憶装置203に記憶されているプログラムを読み出して実行することにより実現される。また、各プログラムは、外部記憶媒体207にあらかじめ記録されていてもよいし、所定の通信ネットワークを介して、必要なときに導入されてもよい。 Each function of each information processing device described so far is realized by dedicated hardware or by reading and executing a program stored in the main memory 202 or the auxiliary storage device 203 by the arithmetic unit 201. .. Further, each program may be recorded in advance on the external storage medium 207, or may be introduced when necessary via a predetermined communication network.

−処理−
次に、データ生成支援システム1において行われる処理を説明する。
-Processing-
Next, the processing performed in the data generation support system 1 will be described.

データ生成支援システム1では、(1)利用者の要求に応じて成果データを生成するデータ生成支援処理と、(2)データ生成支援処理の実行に必要なファイルメタデータ管理テーブル114を生成するファイルメタデータ管理テーブル生成処理と、(3)データ生成支援処理の実行に必要なワークフローメタデータ管理テーブル117を生成するワークフローメタデータ管理テーブル生成処理とが実行される。 In the data generation support system 1, (1) a data generation support process that generates result data in response to a user's request, and (2) a file that generates a file metadata management table 114 necessary for executing the data generation support process. The metadata management table generation process and (3) the workflow metadata management table generation process for generating the workflow metadata management table 117 necessary for executing the data generation support process are executed.

なお、典型的には、(1)を実行する前に、(2)及び(3)が実行される必要がある。また、ワークフローメタデータ管理テーブル117を生成するためにはファイルメタデータ管理テーブル114が必要であるため、(3)を実行する前に(2)が実行される。 It should be noted that, typically, (2) and (3) need to be executed before executing (1). Further, since the file metadata management table 114 is required to generate the workflow metadata management table 117, (2) is executed before the execution of (3).

以下、これらの各処理について説明する。 Hereinafter, each of these processes will be described.

−−データ生成支援処理−−
図10は、データ生成支援処理の一例を説明するフロー図である。データ生成支援処理は、例えば、データ生成支援装置101が起動した際に実行される。
--Data generation support processing ---
FIG. 10 is a flow chart illustrating an example of data generation support processing. The data generation support process is executed, for example, when the data generation support device 101 is activated.

まず、データ生成支援装置101のデータ生成要求受付部111は、利用者端末102からのデータ生成要求108の受信を待機する(S1101)。データ生成要求受付部111は、データ生成要求108を受信すると、受信したデータ生成要求108を、データ生成管理部112のデータ生成計画部301に入力する(S1101)。 First, the data generation request receiving unit 111 of the data generation support device 101 waits for the reception of the data generation request 108 from the user terminal 102 (S1101). When the data generation request receiving unit 111 receives the data generation request 108, the data generation request receiving unit 111 inputs the received data generation request 108 to the data generation planning unit 301 of the data generation management unit 112 (S1101).

ここで、データ生成要求108について説明する。 Here, the data generation request 108 will be described.

(データ生成要求)
図11は、データ生成要求108の一例を示す図である。データ生成要求108は、二次データ(成果データ)を特定する情報である要求データ指定情報401と、成果データを生成するためのワークフロー(以下、指定WFという)のIDである利用ワークフローID402とを有する。
(Data generation request)
FIG. 11 is a diagram showing an example of the data generation request 108. The data generation request 108 includes request data designation information 401 which is information for specifying secondary data (result data) and usage workflow ID 402 which is an ID of a workflow for generating result data (hereinafter referred to as designated WF). Have.

要求データ指定情報401は、一次データの属性情報から推定される情報である。要求データ指定情報401は、例えば、一次データの存在有無の情報のみを提供している(一次データの詳細は不明である)カタログサイトに登録されている識別子である。一次データの属性情報は、一次データがゲノムデータの場合であれば、例えば、ゲノムデータから推定される人の性別、疾病状況、又は人種若しくは民族的な背景情報である。このような属性情報は、医療機関の電子カルテなどの外部情報によって生成されたものであってもよい。なお、属性情報を用いる場合は、その属性情報から複数の要求データ指定情報401が特定されてもよい。そのような場合には、要求データ指定情報401には、複数の情報が設定される。 The request data designation information 401 is information estimated from the attribute information of the primary data. The request data designation information 401 is, for example, an identifier registered in a catalog site that provides only information on the presence / absence of primary data (details of the primary data are unknown). If the primary data is genomic data, the attribute information of the primary data is, for example, the gender, disease status, or racial or ethnic background information of a person estimated from the genomic data. Such attribute information may be generated by external information such as an electronic medical record of a medical institution. When attribute information is used, a plurality of request data designation information 401 may be specified from the attribute information. In such a case, a plurality of pieces of information are set in the request data designation information 401.

次に、図10に示すように、データ生成計画部301は、S1101で受信したデータ
生成要求108におけるデータ指定情報(以下、指定データという)を入力ファイル特定部302に入力する(S1111)。
Next, as shown in FIG. 10, the data generation planning unit 301 inputs the data designation information (hereinafter referred to as designated data) in the data generation request 108 received in S1101 to the input file identification unit 302 (S1111).

具体的には、データ生成計画部301は、入力されたデータ生成要求108のうち要求データ指定情報401を、入力ファイル特定部302に入力する。 Specifically, the data generation planning unit 301 inputs the request data designation information 401 out of the input data generation request 108 to the input file identification unit 302.

そして、入力ファイル特定部302は、指定データの特徴情報(データ形式及びメタデータを取得する(S1112)。 Then, the input file specifying unit 302 acquires the feature information (data format and metadata (S1112) of the designated data.

具体的には、入力ファイル特定部302は、ファイルメタデータ管理テーブル114から、要求データ指定情報401は、要求データ指定情報401と同内容が要求データ指定情報401に設定されているレコードを特定し、特定したレコードのデータ形式502及びメタデータ503の内容を取得する。 Specifically, the input file specifying unit 302 identifies from the file metadata management table 114 a record in which the request data specification information 401 has the same contents as the request data specification information 401 set in the request data specification information 401. , Acquire the contents of the data format 502 and the metadata 503 of the specified record.

データ生成計画部301は、指定データの特徴情報と共に、指定WFを、実行ワークフロー特定部303に入力する(S1121)。 The data generation planning unit 301 inputs the designated WF together with the feature information of the designated data to the execution workflow specifying unit 303 (S1121).

具体的には、データ生成計画部301は、S1112で取得したデータ形式502及びメタデータ503と、S1101で受信したデータ生成要求108における利用ワークフローID402とを、実行ワークフロー特定部303に入力する。 Specifically, the data generation planning unit 301 inputs the data format 502 and the metadata 503 acquired in S1112 and the usage workflow ID 402 in the data generation request 108 received in S1101 to the execution workflow specifying unit 303.

実行ワークフロー特定部303は、指定WFが示すワークフローを、ワークフローメタデータ管理テーブル117から取得する(S1122)。 The execution workflow specifying unit 303 acquires the workflow indicated by the designated WF from the workflow metadata management table 117 (S1122).

具体的には、実行ワークフロー特定部303は、ワークフローメタデータ管理テーブル117から、S1121で入力された利用ワークフローID402と同内容のIDがワークフローID601に設定されているレコードを特定し、特定したレコードを取得する。 Specifically, the execution workflow specifying unit 303 identifies a record in which the ID having the same content as the usage workflow ID 402 input in S1121 is set in the workflow ID 601 from the workflow metadata management table 117, and identifies the specified record. get.

さらに、実行ワークフロー特定部303は、指定WFが示すワークフローの入力データの特徴情報を取得する(S1123)。 Further, the execution workflow specifying unit 303 acquires the feature information of the input data of the workflow indicated by the designated WF (S1123).

具体的には、実行ワークフロー特定部303は、S1122で取得したレコードのワークフロー入力602(データ形式611及びメタデータ612)を取得する。 Specifically, the execution workflow specifying unit 303 acquires the workflow input 602 (data format 611 and metadata 612) of the record acquired in S1122.

実行ワークフロー特定部303は、指定データと同じ特徴情報を有するデータを入力データとし、指定WFが示すワークフローの入力データと同じ特徴情報を有するデータを出力データとしているWF(以下、実行WFという)を特定する(S1124)。 The execution workflow specifying unit 303 uses data having the same characteristic information as the designated data as input data, and data having the same characteristic information as the input data of the workflow indicated by the designated data as output data (hereinafter referred to as execution WF). Specify (S1124).

具体的には、実行ワークフロー特定部303は、ワークフローメタデータ管理テーブル117から、S1112で取得したデータ形式502及びメタデータ503がワークフロー入力602に設定され、S1123で取得したワークフロー入力602(データ形式611及びメタデータ612)がワークフロー出力603に設定されているレコードを取得し、取得したレコードのワークフローID601を特定する。 Specifically, in the execution workflow specifying unit 303, the data format 502 and the metadata 503 acquired in S1112 are set in the workflow input 602 from the workflow metadata management table 117, and the workflow input 602 acquired in S1123 (data format 611). And the metadata 612) acquires the record set in the workflow output 603, and specifies the workflow ID 601 of the acquired record.

データ生成計画部301は、指定データと共に、実行WFを特定する情報を、計画管理部304に入力する(S1131)。 The data generation planning unit 301 inputs information for specifying the execution WF to the planning management unit 304 together with the designated data (S1131).

具体的には、データ生成計画部301は、S1101で受信したデータ生成要求108の要求データ指定情報401と、S1124で特定したワークフローID601とを、計画管理部304に入力する。 Specifically, the data generation planning unit 301 inputs the request data designation information 401 of the data generation request 108 received in S1101 and the workflow ID 601 specified in S1124 to the planning management unit 304.

計画管理部304は、入力された指定データ及び実行WFを特定する情報を含む情報をデータ生成計画として、ワークフロー実行装置120に送信し、ワークフロー実行装置120による実行WFの実行終了を待機する。そして、計画管理部304は、実行WFの実行が完了した旨の完了通知をワークフロー実行装置120から受信するまで待機する(S1141)。 The plan management unit 304 transmits the input designated data and information including information specifying the execution WF to the workflow execution device 120 as a data generation plan, and waits for the execution WF to be completed by the workflow execution device 120. Then, the plan management unit 304 waits until the completion notification to the effect that the execution of the execution WF is completed is received from the workflow execution device 120 (S1141).

計画管理部304は、ワークフロー実行装置120から完了通知と共に、実行WFが出力した成果データ又は当該成果データにアクセスするための情報(実行結果情報)を受信する。計画管理部304は、受信した実行結果情報を、データ生成要求受付部111に送信する。 The plan management unit 304 receives the result data output by the execution WF or information for accessing the result data (execution result information) together with the completion notification from the workflow execution device 120. The plan management unit 304 transmits the received execution result information to the data generation request reception unit 111.

その後、データ生成要求受付部111は、受信した実行結果情報を利用者端末102に送信し、利用者端末102が、受信した実行結果情報に基づき、成果データの内容を画面に表示する。 After that, the data generation request receiving unit 111 transmits the received execution result information to the user terminal 102, and the user terminal 102 displays the content of the result data on the screen based on the received execution result information.

以上でデータ生成支援処理は終了する。 This completes the data generation support process.

(ワークフロー特定画面)
ここで、図12は、S1124で実行WFを発見した場合にデータ生成支援装置101が表示する画面(ワークフロー特定画面)の一例を示す図である。ワークフロー特定画面160は、実行WFを特定したことを示す情報161が表示される。なお、実行WFの名称やIDの情報、実行WFが用いる一次データの具体的な内容の情報が表示されてもよい。
(Workflow specific screen)
Here, FIG. 12 is a diagram showing an example of a screen (workflow specific screen) displayed by the data generation support device 101 when the execution WF is discovered in S1124. The workflow specification screen 160 displays information 161 indicating that the execution WF has been specified. Information on the name and ID of the execution WF, and information on the specific contents of the primary data used by the execution WF may be displayed.

また、ワークフロー特定画面160には、特定した実行WFによりワークフロー実行装置120が二次データ又は成果データを生成中であることを示す情報162が表示されてもよい。 Further, the workflow specifying screen 160 may display information 162 indicating that the workflow execution device 120 is generating secondary data or result data by the specified execution WF.

次に、ファイルメタデータ管理テーブル生成処理について説明する。 Next, the file metadata management table generation process will be described.

−−ファイルメタデータ管理テーブル生成処理−−
図13は、ファイルメタデータ管理テーブル生成処理の一例を説明するフロー図である。ファイルメタデータ管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ファイル管理サーバ105に新たなデータファイル150が登録された場合等に実行される。
--File metadata management table generation process ---
FIG. 13 is a flow chart illustrating an example of a file metadata management table generation process. The file metadata management table generation process can be executed independently of the data generation support process. For example, when a predetermined input is received from the management console 107, a predetermined timing (for example, a predetermined date and time or a predetermined time interval) Is executed, or when a new data file 150 is registered in the file management server 105.

まず、データ生成支援装置101のファイルメタデータ抽出部113は、ファイル管理サーバ105を参照し、ファイルメタデータ管理テーブル114における各データファイル150のリストを取得する(S1201)。 First, the file metadata extraction unit 113 of the data generation support device 101 refers to the file management server 105 and acquires a list of each data file 150 in the file metadata management table 114 (S1201).

ファイルメタデータ抽出部113は、S1201で取得したデータファイル150のリストのうち一つのデータファイル150を選択し(以下、選択ファイルという)(S1211)、選択したデータファイル150の格納場所(パス又はURL)を特定する(S1212)。 The file metadata extraction unit 113 selects one data file 150 from the list of data files 150 acquired in S1201 (hereinafter referred to as a selection file) (S1211), and stores the selected data file 150 (path or URL). ) Is specified (S1212).

そして、ファイルメタデータ抽出部113は、特定した格納場所にある選択ファイルの拡張子を取得する(S1212)。 Then, the file metadata extraction unit 113 acquires the extension of the selected file in the specified storage location (S1212).

ファイルメタデータ抽出部113は、S1212で取得した選択ファイルの拡張子に対して適用可能な規則を、ファイルメタデータ抽出規則115から全て特定する(S1213)。 The file metadata extraction unit 113 specifies all the rules applicable to the extension of the selected file acquired in S1212 from the file metadata extraction rule 115 (S1213).

具体的には、ファイルメタデータ抽出部113は、ファイルメタデータ抽出規則115から、S1212で取得した拡張子がデータ形式802に設定されているレコードを全て抽出する。 Specifically, the file metadata extraction unit 113 extracts all the records whose extension is set to the data format 802 acquired in S1212 from the file metadata extraction rule 115.

ファイルメタデータ抽出部113は、S1213で抽出した規則のうち一つ(以下、選択規則という)を選択する(S1221)。具体的には、ファイルメタデータ抽出部113は、S1213で抽出したレコードの一つを取得する。 The file metadata extraction unit 113 selects one of the rules extracted in S1213 (hereinafter referred to as a selection rule) (S1221). Specifically, the file metadata extraction unit 113 acquires one of the records extracted in S1213.

ファイルメタデータ抽出部113は、選択規則を適用するためのファイルメタデータ抽出コマンドを実行することにより、選択ファイルの出力データの特徴情報を取得する。 The file metadata extraction unit 113 acquires the feature information of the output data of the selection file by executing the file metadata extraction command for applying the selection rule.

具体的には、ファイルメタデータ抽出部113は、S1221で取得したレコードの抽出コマンド803を取得し、取得したコマンドを実行する。そして、ファイルメタデータ抽出部113は、その出力データとして、同レコードのメタデータ定義804が示す構成を有するデータ(キー811及びバリュー812が示す構成及び内容のデータ)を取得する。 Specifically, the file metadata extraction unit 113 acquires the record extraction command 803 acquired in S1221 and executes the acquired command. Then, the file metadata extraction unit 113 acquires data having the configuration indicated by the metadata definition 804 of the same record (data having the configuration and contents indicated by the key 811 and the value 812) as the output data.

ファイルメタデータ抽出部113は、ファイルメタデータ抽出コマンドが出力データの特徴情報を取得できたか否かを判定する(S1223)。 The file metadata extraction unit 113 determines whether or not the file metadata extraction command has acquired the feature information of the output data (S1223).

ファイルメタデータ抽出コマンドが出力データの特徴情報を取得できた場合は(S1223:YES)、ファイルメタデータ抽出部113は、次述するS1214の処理を実行し、ファイルメタデータ抽出コマンドが出力データの特徴情報を取得できなかった場合は(S1223:NO)、ファイルメタデータ抽出部113は、後述するS1224の処理を実行する。 If the file metadata extraction command can acquire the feature information of the output data (S1223: YES), the file metadata extraction unit 113 executes the process of S1214 described below, and the file metadata extraction command is the output data. If the feature information could not be acquired (S1223: NO), the file metadata extraction unit 113 executes the process of S1224 described later.

S1214においてファイルメタデータ抽出部113は、ファイルメタデータ抽出コマンドが取得した特徴情報を、ファイルメタデータ管理テーブル114に登録する。 In S1214, the file metadata extraction unit 113 registers the feature information acquired by the file metadata extraction command in the file metadata management table 114.

具体的には、ファイルメタデータ抽出部113は、ファイルメタデータ管理テーブル114に新たなレコードを生成し、そのレコードのデータ形式502に、S1212で取得した拡張子を設定し、そのレコードのメタデータ503に、S1222で取得したデータ(メタデータ)を設定する。 Specifically, the file metadata extraction unit 113 creates a new record in the file metadata management table 114, sets the extension acquired in S1212 to the data format 502 of the record, and the metadata of the record. The data (metadata) acquired in S1222 is set in 503.

ファイルメタデータ抽出部113は、新たな選択ファイルを選択すべく、S1201で取得したリストにおける全データファイル150が選択されるまで、S1211以降の処理を繰り返す(S1215)。ファイルメタデータ抽出部113は、全てのデータファイル150が選択されたら、ファイルメタデータ管理テーブル生成処理を終了する。 The file metadata extraction unit 113 repeats the processing after S1211 until all the data files 150 in the list acquired in S1201 are selected in order to select a new selection file (S1215). When all the data files 150 are selected, the file metadata extraction unit 113 ends the file metadata management table generation process.

S1224においてファイルメタデータ抽出部113は、新たな選択規則を選択すべく、S1213で特定した規則が全て選択されるまで、S1221以降の処理を繰り返す。 In S1224, the file metadata extraction unit 113 repeats the processing after S1221 until all the rules specified in S1213 are selected in order to select a new selection rule.

次に、ワークフローメタデータ管理テーブル生成処理について説明する。 Next, the workflow metadata management table generation process will be described.

−−ワークフローメタデータ管理テーブル生成処理−−
図14は、ワークフローメタデータ管理テーブル生成処理の一例を説明するフロー図で
ある。ワークフローメタデータ管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ワークフロー実行ログ104に新たにワークフローのデータが登録された場合等に実行される。
--Workflow metadata management table generation process ---
FIG. 14 is a flow chart illustrating an example of the workflow metadata management table generation process. The workflow metadata management table generation process can be executed independently of the data generation support process. For example, when a predetermined input is received from the management console 107, a predetermined timing (for example, a predetermined date and time or a predetermined time interval). Is executed, or when workflow data is newly registered in the workflow execution log 104.

なお、ここでは、ワークフローメタデータ管理テーブル生成処理が、図7に示すワークフローメタデータ抽出規則118の3つの規則(WR01、WR02、WR03)に基づき、ワークフローの入出力ファイルの特徴情報を抽出するものとする。 Here, the workflow metadata management table generation process extracts the characteristic information of the workflow input / output file based on the three rules (WR01, WR02, WR03) of the workflow metadata extraction rule 118 shown in FIG. And.

まず、ワークフローメタデータ抽出部116は、ワークフロー実行ログ104を読み込んだ上で(S1301)、それらのワークフローのうち1つ(以下、選択WFという)を選択する(S1311)。具体的には、ワークフローメタデータ抽出部116は、ワークフロー実行ログ104のうち一つのレコードを選択する。 First, the workflow metadata extraction unit 116 reads the workflow execution log 104 (S1301) and selects one of those workflows (hereinafter referred to as selection WF) (S1311). Specifically, the workflow metadata extraction unit 116 selects one record from the workflow execution log 104.

ワークフローメタデータ抽出部116は、選択WFに対する最初の規則であり入力データの特徴情報を抽出するための規則(WR01)を適用するワークフローメタデータ抽出コマンドを実行する。(S1312)。具体的には、ワークフローメタデータ抽出部116は、ワークフローメタデータ抽出規則118における冒頭のレコードR911の処理コマンド903を取得し、取得した処理コマンド903を実行する。 The workflow metadata extraction unit 116 executes a workflow metadata extraction command that is the first rule for the selection WF and applies a rule (WR01) for extracting the feature information of the input data. (S1312). Specifically, the workflow metadata extraction unit 116 acquires the processing command 903 of the record R911 at the beginning of the workflow metadata extraction rule 118, and executes the acquired processing command 903.

ワークフローメタデータ抽出部116は、S1312でのワークフローメタデータ抽出コマンドの実行により、入力データの特徴情報を推定する(S1321)。 The workflow metadata extraction unit 116 estimates the feature information of the input data by executing the workflow metadata extraction command in S1312 (S1321).

具体的には、ワークフローメタデータ抽出部116は、ワークフロー実行ログ104における選択WFに係るレコードの入力データ703を取得し、取得した入力データ703の内容と同じ内容がデータID501に設定されている、ファイルメタデータ管理テーブル114のレコードR911を特定し、特定したレコードR911のデータ形式502及びメタデータ503の内容を取得する。 Specifically, the workflow metadata extraction unit 116 acquires the input data 703 of the record related to the selection WF in the workflow execution log 104, and the same content as the content of the acquired input data 703 is set in the data ID 501. The record R911 of the file metadata management table 114 is specified, and the contents of the data format 502 and the metadata 503 of the specified record R911 are acquired.

ワークフローメタデータ抽出部116は、選択WFに対する次の規則であり出力データの特徴情報を抽出するための規則(WR02)を適用するワークフローメタデータ抽出コマンドを実行する(S1313)。 The workflow metadata extraction unit 116 executes a workflow metadata extraction command to which the next rule for the selected WF and the rule (WR02) for extracting the feature information of the output data is applied (S1313).

具体的には、ワークフローメタデータ抽出部116は、S1311で選択したレコードR911の次ステップ判定904の内容が規則ID901に設定されているレコードR912を特定し、特定したレコードR912の処理コマンド903を取得し、取得した処理コマンド903を実行する。 Specifically, the workflow metadata extraction unit 116 identifies the record R912 in which the content of the next step determination 904 of the record R911 selected in S1311 is set in the rule ID 901, and acquires the processing command 903 of the specified record R912. Then, the acquired processing command 903 is executed.

ワークフローメタデータ抽出部116は、S1313でのワークフローメタデータ抽出コマンドの実行により、出力データの特徴情報を推定する(S1331)。 The workflow metadata extraction unit 116 estimates the feature information of the output data by executing the workflow metadata extraction command in S1313 (S1331).

具体的には、ワークフローメタデータ抽出部116は、ワークフロー実行ログ104における選択WFに係るレコードの出力データ704を取得し、取得した出力データ704の内容と同じ内容がデータID501に設定されている、ファイルメタデータ管理テーブル114のレコードR912を特定し、特定したレコードR912のデータ形式502及びメタデータ503を取得する。 Specifically, the workflow metadata extraction unit 116 acquires the output data 704 of the record related to the selected WF in the workflow execution log 104, and the same content as the content of the acquired output data 704 is set in the data ID 501. The record R912 of the file metadata management table 114 is specified, and the data format 502 and the metadata 503 of the specified record R912 are acquired.

ワークフローメタデータ抽出部116は、選択WFに対するさらに次の規則でありワークフローの種類の特徴情報を抽出するための規則(WR03)を適用するワークフローメタデータ抽出コマンドを実行する(S1314)。 The workflow metadata extraction unit 116 executes a workflow metadata extraction command to which the next rule for the selected WF and the rule (WR03) for extracting the characteristic information of the workflow type is applied (S1314).

具体的には、ワークフローメタデータ抽出部116は、ワークフロー実行ログ104における選択WFに係るレコードR912の次ステップ判定904の内容が規則ID901に設定されているレコードR913を特定し、特定したレコードR913の処理コマンド903を取得し、取得した処理コマンド903を実行する。 Specifically, the workflow metadata extraction unit 116 identifies the record R913 in which the content of the next step determination 904 of the record R912 related to the selection WF in the workflow execution log 104 is set in the rule ID 901, and the specified record R913. The processing command 903 is acquired, and the acquired processing command 903 is executed.

ワークフローメタデータ抽出部116は、S1314でのワークフローメタデータ抽出コマンドの実行により、ワークフローの種類の特徴情報を推定する(S1341)。 The workflow metadata extraction unit 116 estimates the characteristic information of the workflow type by executing the workflow metadata extraction command in S1314 (S1341).

具体的には、ワークフローメタデータ抽出部116は、S1312で選択したワークフロー実行ログ104のレコードR913のワークフローID702を取得する。 Specifically, the workflow metadata extraction unit 116 acquires the workflow ID 702 of the record R913 of the workflow execution log 104 selected in S1312.

ここで、ワークフローメタデータ抽出部116は、ワークフローメタデータ抽出規則118のレコードR913における次ステップ判定904に情報が設定されていないため、選択WFにおけるさらに次の処理コマンドがないことを確認する。 Here, the workflow metadata extraction unit 116 confirms that there is no further next processing command in the selection WF because the information is not set in the next step determination 904 in the record R913 of the workflow metadata extraction rule 118.

すると、ワークフローメタデータ抽出部116は、選択WFと、選択WFに対する各特徴情報とを、ワークフローメタデータ管理テーブル117に登録する(S1315)。 Then, the workflow metadata extraction unit 116 registers the selected WF and each feature information for the selected WF in the workflow metadata management table 117 (S1315).

具体的には、ワークフローメタデータ抽出部116は、S1341で取得したワークフローID702の内容を、ワークフローメタデータ管理テーブル117のワークフローID601に設定し、S1321で取得したデータ形式502の内容を、ワークフローメタデータ管理テーブル117のワークフロー入力602におけるデータ形式611に設定し、S1321で取得したメタデータ503の内容を、ワークフローメタデータ管理テーブル117のワークフロー入力602におけるメタデータ612(種別621及び分類622)に設定し、S1331で取得したデータ形式502の内容を、ワークフローメタデータ管理テーブル117のワークフロー出力603におけるデータ形式613に設定し、S1331で取得したメタデータ503の内容を、ワークフローメタデータ管理テーブル117のワークフロー出力603におけるメタデータ614(種別623及び分類624)に設定する。 Specifically, the workflow metadata extraction unit 116 sets the contents of the workflow ID 702 acquired in S1341 in the workflow ID 601 of the workflow metadata management table 117, and sets the contents of the data format 502 acquired in S1321 to the workflow metadata. The data format 611 in the workflow input 602 of the management table 117 is set, and the content of the metadata 503 acquired in S1321 is set in the metadata 612 (type 621 and classification 622) in the workflow input 602 of the workflow metadata management table 117. , The content of the data format 502 acquired in S1331 is set in the data format 613 in the workflow output 603 of the workflow metadata management table 117, and the content of the metadata 503 acquired in S1331 is set to the workflow output of the workflow metadata management table 117. It is set in the metadata 614 (type 623 and classification 624) in 603.

ワークフローメタデータ抽出部116は、ワークフロー実行ログ104におけるワークフローのうちこれまでに選択WFとして選択されていないワークフローを新たな選択WFとして選択し、S1312以降の処理を繰り返す(S1316)。ワークフローメタデータ抽出部116は、ワークフローを全て選択した場合に、ワークフローメタデータ管理テーブル生成処理を終了する。 The workflow metadata extraction unit 116 selects a workflow that has not been selected as the selection WF in the workflow execution log 104 as the new selection WF, and repeats the processing after S1312 (S1316). The workflow metadata extraction unit 116 ends the workflow metadata management table generation process when all workflows are selected.

このように、ワークフローメタデータ管理テーブル生成処理は、処理対象のワークフローに対する全規則(ワークフローメタデータ抽出規則118が規定する全規則)を当該ワークフローに適用することにより、当該ワークフローの特徴情報(データ形式、メタデータ、ワークフローID)を推定し、推定した特徴情報をワークフローメタデータ管理テーブル117に登録する。 In this way, the workflow metadata management table generation process applies all the rules for the workflow to be processed (all rules specified by the workflow metadata extraction rule 118) to the workflow, so that the characteristic information (data format) of the workflow is applied. , Metadata, workflow ID), and the estimated feature information is registered in the workflow metadata management table 117.

以上に説明したように、本実施形態のデータ生成支援システム1は、成果データの生成を要求するためのデータ生成要求108を受信し、二次データの特徴情報(種別及び分類といったメタデータ)をファイルメタデータ管理テーブル114により推定し、推定した特徴情報を備えるデータ(一次データ)により成果データが生成可能なワークフローを、ワークフローメタデータ管理テーブル117により特定する。これにより、成果データを生成するために必要なデータ(二次データに対応した、機密情報を含む一次データ)が特定できなくても、メタデータを使用することで、データ生成要求108が要求する成果デ
ータを生成するためのワークフローをオンデマンドに特定することができる。
As described above, the data generation support system 1 of the present embodiment receives the data generation request 108 for requesting the generation of the result data, and receives the characteristic information (metadata such as type and classification) of the secondary data. A workflow that is estimated by the file metadata management table 114 and can generate result data from data (primary data) having the estimated feature information is specified by the workflow metadata management table 117. As a result, even if the data required to generate the result data (primary data including sensitive information corresponding to the secondary data) cannot be specified, the data generation request 108 requests by using the metadata. The workflow for generating outcome data can be specified on demand.

特に、メタデータを使用することで、予め必要なデータを網羅的に準備することなく、利用者のデータ要求に対してオンデマンドに所望のデータを生成できる。すなわち、予めデータを網羅的に生成しなければならないとすれば、データそのものによるリソース消費のみならず、データ間の関連付けにもリソースを消費することになるため、データも膨大になりうるが、本実施形態のデータ生成支援システム1は、そのようなリソースを必要とせず、データの管理コストを削減することができる。 In particular, by using metadata, it is possible to generate desired data on demand in response to a user's data request without comprehensively preparing necessary data in advance. That is, if the data must be comprehensively generated in advance, not only the resource consumption by the data itself but also the resource consumption for the association between the data will be consumed, so that the data can be enormous. The data generation support system 1 of the embodiment does not require such resources and can reduce the data management cost.

このように、本実施形態のデータ生成支援システム1によれば、データを生成するために必要な情報が欠けている場合であってもそのデータを生成することができる。 As described above, according to the data generation support system 1 of the present embodiment, even when the information necessary for generating the data is lacking, the data can be generated.

[実施例2]
実施例2のデータ生成支援システムは、一次データから成果データ(二次データ等)を生成するために複数のワークフローによる処理が必要な場合に適用されるシステムである。
[Example 2]
The data generation support system of the second embodiment is a system applied when processing by a plurality of workflows is required in order to generate result data (secondary data, etc.) from the primary data.

−システム構成−
図15は、実施例2に係るデータ生成支援システム2における構成例の一部を示す図である。なお、実施例1と同様の符号が付されている部分は、実施例1と同様の構成及び機能を備える。また、同図に示されていない部分は、実施例1と同様の構成及び機能が備わっているものとする。
-System configuration-
FIG. 15 is a diagram showing a part of a configuration example in the data generation support system 2 according to the second embodiment. The parts with the same reference numerals as those in the first embodiment have the same configurations and functions as those in the first embodiment. Further, the part not shown in the figure is assumed to have the same configuration and function as in the first embodiment.

すなわち、本実施例のデータ生成支援システム2は、実施例1のデータ生成支援システム1の構成に加えて、連結ワークフロー算出部1401及びワークフロー計画管理テーブル1402を備える。 That is, the data generation support system 2 of this embodiment includes a consolidated workflow calculation unit 1401 and a workflow plan management table 1402 in addition to the configuration of the data generation support system 1 of the first embodiment.

連結ワークフロー算出部1401は、ワークフローメタデータ抽出部116が生成した第2モデル(ワークフローメタデータ管理テーブル117)における各ワークフローに入力されるデータの内容の特徴(メタデータ)と当該各ワークフローが出力するデータの内容の特徴(メタデータ)とを比較することにより、一次データにより成果データ(二次データ等)を生成する複数からなる成果データの実行順序を特定し、特定した複数の成果データの実行順序を第3モデル(ワークフロー計画管理テーブル1402)として生成する。 The concatenated workflow calculation unit 1401 outputs the characteristics (metadata) of the contents of the data input to each workflow in the second model (workflow metadata management table 117) generated by the workflow metadata extraction unit 116 and each workflow. By comparing with the characteristics (metadata) of the data contents, the execution order of the multiple outcome data that generates the outcome data (secondary data, etc.) from the primary data is specified, and the execution of the specified multiple outcome data. The order is generated as a third model (workflow plan management table 1402).

すなわち、連結ワークフロー算出部1401は、ワークフローメタデータ管理テーブル117を用いて、複数のワークフローを連結して生成可能な一次データと二次データとの組み合わせと、当該複数のワークフローの構成とを含む情報(以下、ワークフロー計画という)を生成し、生成した計画をワークフロー計画管理テーブル1402に格納する。 That is, the consolidated workflow calculation unit 1401 uses the workflow metadata management table 117 to provide information including a combination of primary data and secondary data that can be generated by concatenating a plurality of workflows and a configuration of the plurality of workflows. (Hereinafter referred to as workflow plan) is generated, and the generated plan is stored in the workflow plan management table 1402.

そして、この場合、データ生成管理部112は、第3モデル(ワークフロー計画管理テーブル1402)に基づき、一次データにより成果データが生成可能な複数のワークフローの実行順序を特定する
ワークフロー計画管理テーブル1402は、連結ワークフロー算出部1401が生成したワークフロー計画を管理するテーブルである。ワークフロー計画管理テーブル1402には、複数のワークフローの実行を備えるワークフロー計画と、実施例1におけるワークフローメタデータ管理テーブル117と同様の、1つのワークフローの実行の構成とをそれぞれ記憶している。
In this case, the data generation management unit 112 uses the workflow plan management table 1402 to specify the execution order of a plurality of workflows from which result data can be generated from the primary data, based on the third model (workflow plan management table 1402). It is a table which manages the workflow plan generated by the consolidated workflow calculation unit 1401. The workflow plan management table 1402 stores a workflow plan including execution of a plurality of workflows and a configuration for executing one workflow similar to the workflow metadata management table 117 in the first embodiment.

実施例1では、ワークフローメタデータ管理テーブル117が、実行ワークフロー特定
部303からの入出力データの特徴情報(メタデータ)の取得をクエリとして受け付け、クエリに対する特徴情報を実行ワークフロー特定部303に返す仕組みとなっていたが、実施例2では、ワークフロー計画管理テーブル1402が、実行ワークフロー特定部303からのクエリを受け付けるようになっている。
In the first embodiment, the workflow metadata management table 117 accepts the acquisition of the characteristic information (metadata) of the input / output data from the execution workflow specific unit 303 as a query, and returns the characteristic information for the query to the execution workflow specific unit 303. However, in the second embodiment, the workflow plan management table 1402 accepts a query from the execution workflow specifying unit 303.

(ワークフロー計画管理テーブル)
図16は、ワークフロー計画管理テーブル1402の一例を示す図である。
(Workflow plan management table)
FIG. 16 is a diagram showing an example of the workflow plan management table 1402.

ワークフロー計画管理テーブル1402は、ワークフロー計画のIDである計画ID1501と、計画ID1501に係るワークフロー計画において最初に実行されるワークフローのIDである開始ワークフローID1502と、開始ワークフローID1502に係るワークフローの入力データの特徴情報であるワークフロー入力1503と、2番目以降に実行されるワークフローのIDのリストである連結ワークフローIDリスト1504と、最後に実行されるワークフローの出力データの特徴情報であるワークフロー出力1505とを各項目として有する、1以上のレコードR(R1531〜R1533)を備える。 The workflow plan management table 1402 is characterized by a plan ID 1501 which is an ID of the workflow plan, a start workflow ID 1502 which is an ID of the workflow to be executed first in the workflow plan related to the plan ID 1501, and input data of the workflow related to the start workflow ID 1502. Each item includes a workflow input 1503 which is information, a consolidated workflow ID list 1504 which is a list of IDs of workflows executed after the second, and a workflow output 1505 which is characteristic information of output data of the workflow executed last. It is provided with one or more records R (R1531 to R1533) having a workflow.

ワークフロー入力1503は、ワークフローの入力データの形式であるデータ形式1511(拡張子等)、及び、ワークフローの入力データのメタデータであるメタデータ1512の各項目を備え、このメタデータ1512はさらに、入力データの種別1521及び分類1522の各項目を有する。 The workflow input 1503 includes items of a data format 1511 (extension, etc.) which is a format of input data of the workflow, and a metadata 1512 which is a metadata of the input data of the workflow, and the metadata 1512 is further input. It has each item of data type 1521 and classification 1522.

ワークフロー出力1505は、ワークフローの出力データの形式であるデータ形式1513(拡張子等)、及び、ワークフローの出力データのメタデータであるメタデータ1514の各項目を備え、このメタデータ1514はさらに、出力データの種別1523及び分類1524の各項目を有する。 The workflow output 1505 includes items of a data format 1513 (extension, etc.) which is a format of the output data of the workflow, and a metadata 1514 which is a metadata of the output data of the workflow, and the metadata 1514 is further output. It has each item of data type 1523 and classification 1524.

なお、開始ワークフローID1502、ワークフロー入力1503、及びワークフロー出力1505はそれぞれ、ワークフローメタデータ管理テーブル117のワークフローID601、ワークフロー入力602、及びワークフロー出力603と同種の情報が設定される項目である。 The start workflow ID 1502, the workflow input 1503, and the workflow output 1505 are items in which the same types of information as the workflow ID 601, the workflow input 602, and the workflow output 603 of the workflow metadata management table 117 are set, respectively.

−−ワークフロー計画管理テーブル生成処理−−
図17は、ワークフロー計画管理テーブル生成処理の一例を説明するフロー図である。ワークフロー計画管理テーブル生成処理は、データ生成支援処理と独立に実行可能であり、例えば、管理コンソール107から所定の入力があった場合、所定のタイミング(例えば、所定の日時又は所定の時間間隔)が到来した場合、又は、ワークフロー実行ログ104に新たにワークフローのデータが登録された場合等に実行される。
--Workflow plan management table generation process ---
FIG. 17 is a flow chart illustrating an example of the workflow plan management table generation process. The workflow plan management table generation process can be executed independently of the data generation support process. For example, when a predetermined input is received from the management console 107, a predetermined timing (for example, a predetermined date and time or a predetermined time interval) is set. It is executed when it arrives or when the workflow data is newly registered in the workflow execution log 104.

まず、データ生成支援装置101の連結ワークフロー算出部1401は、ワークフローメタデータ管理テーブル117の各ワークフローの内容を全て取得する(S1601)。具体的には、連結ワークフロー算出部1401は、ワークフローメタデータ管理テーブル117の全レコードを取得する。 First, the connection workflow calculation unit 1401 of the data generation support device 101 acquires all the contents of each workflow in the workflow metadata management table 117 (S1601). Specifically, the consolidated workflow calculation unit 1401 acquires all the records of the workflow metadata management table 117.

連結ワークフロー算出部1401は、S1601で取得した各ワークフローのうちこれまで選択されていないワークフローのうち最初に登録されたワークフロー(以下、選択フローという)を選択する(S1611)。具体的には、例えば、連結ワークフロー算出部1401は、S1601で取得したレコードから、これまでに選択されていないレコードのうち先頭のレコードを取得する。そして、連結ワークフロー算出部1401は、ワークフロー計画管理テーブル1402に生成した新たなレコードの開始ワークフローID1502に、前記取得したレコードのワークフローID601を設定する。 The consolidated workflow calculation unit 1401 selects the workflow (hereinafter referred to as a selection flow) registered first among the workflows that have not been selected so far among the workflows acquired in S1601 (S1611). Specifically, for example, the concatenation workflow calculation unit 1401 acquires the first record among the records that have not been selected so far from the records acquired in S1601. Then, the consolidated workflow calculation unit 1401 sets the workflow ID 601 of the acquired record in the start workflow ID 1502 of the new record generated in the workflow plan management table 1402.

連結ワークフロー算出部1401は、選択フローに出力データがあるか否かを判定する(S1621)。具体的には、連結ワークフロー算出部1401は、S1611で取得したレコードのワークフロー出力603にデータが登録されているか否かを判定する。 The concatenated workflow calculation unit 1401 determines whether or not there is output data in the selection flow (S1621). Specifically, the consolidated workflow calculation unit 1401 determines whether or not data is registered in the workflow output 603 of the record acquired in S1611.

選択フローに出力データがある場合は(S1621:YES)、連結ワークフロー算出部1401は、次述するS1622を実行し、選択フローに出力データがない場合は(S1621:NO)、連結ワークフロー算出部1401は、その選択フローについてのデータはワークフロー計画管理テーブル1402に設定しない。その後、連結ワークフロー算出部1401は、後述するS1646の処理を繰り返す。 If there is output data in the selection flow (S1621: YES), the concatenation workflow calculation unit 1401 executes S1622 described below, and if there is no output data in the selection flow (S1621: NO), the concatenation workflow calculation unit 1401 Does not set the data about the selection flow in the workflow plan management table 1402. After that, the connection workflow calculation unit 1401 repeats the process of S1646 described later.

S1622において連結ワークフロー算出部1401は、あるワークフローの出力データの特徴情報と他のワークフローの入力データの特徴情報とが一致する場合に、前者を親ノード(ワークフロー)とし、後者をその子ノード(ワークフロー)とするノード探索を、選択フローを起点に繰り返し行うことで、一連の各ノード(ワークフロー)の流れをパスとして記憶する。 In S1622, when the characteristic information of the output data of a certain workflow and the characteristic information of the input data of another workflow match, the consolidated workflow calculation unit 1401 sets the former as a parent node (workflow) and the latter as its child node (workflow). By repeating the node search to be performed starting from the selection flow, the flow of each node (workflow) in a series is stored as a path.

具体的には、例えば、連結ワークフロー算出部1401は、S1611で取得したレコードのワークフロー出力603をキーにワークフローメタデータ管理テーブル117を検索し、そのキーの内容がワークフロー入力1503に設定されているレコードを取得する。以下、連結ワークフロー算出部1401は同内容の処理を繰り返す。 Specifically, for example, the consolidated workflow calculation unit 1401 searches the workflow metadata management table 117 using the workflow output 603 of the record acquired in S1611 as a key, and the record whose key content is set in the workflow input 1503. To get. Hereinafter, the connection workflow calculation unit 1401 repeats the same processing.

なお、連結ワークフロー算出部1401は、最初のワークフローの入力ノード及び最後のワークフローの出力ノードの特徴情報が互いに同じワークフロー(処理がループするワークフロー。例えば、入出力データの違いが大文字と小文字の違いであり、入出力間のデータ内容に実質的に差異が無い一連のワークフロー。)は、ノード探索から除外する。 In the consolidated workflow calculation unit 1401, the characteristic information of the input node of the first workflow and the output node of the last workflow is the same workflow (workflow in which processing loops. For example, the difference in input / output data is the difference between upper and lower case). A series of workflows that exist and there is virtually no difference in the data content between input and output.) Are excluded from the node search.

連結ワークフロー算出部1401は、S1622で特定した各パスの一つ(以下、選択パスという)を選択する(S1631)。 The concatenated workflow calculation unit 1401 selects one of the paths specified in S1622 (hereinafter referred to as a selection path) (S1631).

連結ワークフロー算出部1401は、選択パスにおける各ノードに対して、親ノードに対する子ノード、及びその子ノードに対する子ノード、・・・とそれぞれ順序づけし、子ノードが存在しなくなるまで(S1643:NO)、順序づけした各ノードの情報を、ワークフロー計画管理テーブル1402に設定する(S1641〜S1645)。 The concatenated workflow calculation unit 1401 orders each node in the selection path as a child node for the parent node, a child node for the child node, and so on, until the child node no longer exists (S1643: NO). The information of each ordered node is set in the workflow plan management table 1402 (S1641 to S1645).

具体的には、例えば、連結ワークフロー算出部1401は、順序づけした各ノード(ワークフローメタデータ管理テーブル117のいずれかのレコード)に係るレコードのワークフローID601を、ワークフロー計画管理テーブル1402の連結ワークフローIDリスト1504にそれぞれ格納する。 Specifically, for example, the consolidated workflow calculation unit 1401 sets the workflow ID 601 of the record related to each ordered node (any record of the workflow metadata management table 117) to the consolidated workflow ID list 1504 of the workflow plan management table 1402. Store in each.

連結ワークフロー算出部1401は、以上の各ノードに対する処理を、全パスについて実行する(S1646)。さらに、連結ワークフロー算出部1401は、以上の各パスに対する処理を、ワークフローメタデータ管理テーブルの全レコード(全ワークフロー)について実行する(S1647)。 The concatenated workflow calculation unit 1401 executes the processing for each of the above nodes for all paths (S1646). Further, the consolidated workflow calculation unit 1401 executes the processing for each of the above paths for all the records (all workflows) in the workflow metadata management table (S1647).

以上のように、本実施例のデータ生成支援システム2によれば、一次データから二次データを生成するために複数のワークフローによる処理が必要な場合に、ワークフロー計画管理テーブル1402を用いることによりその複数のワークフローを実行するパスを生成し、このパスにより二次データ及び成果データを生成することができる。 As described above, according to the data generation support system 2 of this embodiment, when processing by a plurality of workflows is required to generate secondary data from the primary data, the workflow plan management table 1402 is used. A path for executing multiple workflows can be generated, and secondary data and result data can be generated by this path.

以上に説明した本発明の内容は上記した実施例に限定されるものではなく、様々な変形例が含まれる。上記した実施例は本発明のより良い理解のために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されものではない。 The content of the present invention described above is not limited to the above-described embodiment, and includes various modifications. The above-mentioned examples have been described in detail for a better understanding of the present invention, and are not necessarily limited to those having all the configurations of the description.

例えば、本実施形態では、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。 For example, in the present embodiment, the control line and the information line show what is considered necessary for explanation, and do not necessarily show all the control line and the information line in the product. In practice, it can be considered that almost all configurations are interconnected.

また、ある情報処理装置に設けられている機能の一部又は全部を他の情報処理装置に設けてもよい。 Further, a part or all of the functions provided in one information processing device may be provided in another information processing device.

また、本実施形態で利用されるデータ形式は、ファイルの拡張子だけでなく、ファイルの生成日付又は時刻、ファイルのサイズ、ファイルの作成者等の他の形式的な情報でもよい。 Further, the data format used in this embodiment may be not only the file extension but also other formal information such as the file generation date or time, the file size, and the file creator.

また、本実施形態では機密データとして遺伝情報を取り上げたが、所定の個人又は組織が秘匿すべきデータであればその他の任意のデータでもよい。 In addition, although genetic information is taken up as confidential data in this embodiment, any other data may be used as long as it is data that should be kept secret by a predetermined individual or organization.

また、本実施形態では、あるデータの内容を特徴付けるメタデータの例としてデータの種類及び分類を取り上げたが、それ以外の種類のデータであってもよい。メタデータは、一次データ(機密データ)と一次データから生成される成果データ(二次データ等)とが共通して備える属性の情報であればよい。 Further, in the present embodiment, the type and classification of data are taken up as an example of the metadata that characterizes the content of a certain data, but other types of data may be used. The metadata may be information of attributes that the primary data (confidential data) and the result data (secondary data, etc.) generated from the primary data have in common.

また、本実施形態では、ファイルメタデータ及びワークフローメタデータを生成するために、それぞれファイルメタデータ抽出規則115及びワークフローメタデータ抽出規則118を用いたが、その他の情報を用いてもよい。例えば、データファイルの内容とファイルメタデータとの関係、及び、ワークフローの入出力データとワークフローメタデータとの関係をそれぞれ、データファイル及びワークフローに関する特徴量を用いた機械学習(例えば、決定木又はディープラーニングによる学習)により生成した学習済みモデルを生成することで決定してもよい。 Further, in the present embodiment, the file metadata extraction rule 115 and the workflow metadata extraction rule 118 are used to generate the file metadata and the workflow metadata, respectively, but other information may be used. For example, machine learning (eg, decision tree or deep) using data files and features related to the workflow, respectively, regarding the relationship between the contents of the data file and the file metadata, and the relationship between the input / output data of the workflow and the workflow metadata, respectively. It may be determined by generating a trained model generated by (learning by learning).

以上の本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態のデータ生成支援装置101においては、前記演算装置は、複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを前記第1モデルとして生成する第1モデル生成処理を実行する、としてもよい。 The above description of the present specification clarifies at least the following. That is, in the data generation support device 101 of the present embodiment, the arithmetic device receives input of a plurality of data, estimates each feature of the content of the input data based on the input data, and estimates each. The first model generation process for generating the file metadata management table stored in association with the characteristics of the contents and the input data may be executed as the first model.

このように、複数のデータの内容の各特徴を推定し、その各内容の特徴と上記各データとを対応づけて記憶したファイルメタデータ管理テーブル114を生成することで、対象データの内容的な特徴(メタデータ)を正確に特定することができる。 In this way, by estimating each feature of the contents of the plurality of data and generating the file metadata management table 114 that stores the features of each content in association with each of the above data, the contents of the target data are included. Features (metadata) can be identified accurately.

また、本実施形態のデータ生成支援装置101においては、前記演算装置は、前記第1モデル生成処理において、前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、としてもよい。 Further, in the data generation support device 101 of the present embodiment, the arithmetic unit is input by extracting the features of the contents from the input data according to a predetermined rule in the first model generation process. It may be possible to estimate the characteristics of the contents of the collected data.

このように、入力されたデータから所定の規則(ファイルメタデータ抽出規則115)に従ってデータの内容の特徴を抽出することにより、データ内容の特徴(メタデータ)を統一的に抽出することができる。 In this way, by extracting the characteristics of the data contents from the input data according to a predetermined rule (file metadata extraction rule 115), the characteristics (metadata) of the data contents can be uniformly extracted.

また、本実施形態のデータ生成支援装置101においては、前記演算装置は、前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、としてもよい。 Further, in the data generation support device 101 of the present embodiment, the arithmetic unit uses the characteristics of the contents and the data having the characteristics of the contents to determine the characteristics of each content of the input data. The second model generation process of generating the workflow metadata management table stored in association with the process of generating data as the second model may be executed.

このように、データの各内容の特徴と、その内容の特徴を備える一次データを用いて成果データを生成するワークフローとを対応づけたワークフローメタデータ管理テーブル117を生成することで、ワークフローの内容的な特徴(メタデータ)を正確に特定することができる。 In this way, by generating the workflow metadata management table 117 that associates the characteristics of each content of the data with the workflow that generates the result data using the primary data having the characteristics of the contents, the content of the workflow Features (metadata) can be accurately identified.

また、本実施形態のデータ生成支援装置101においては、前記演算装置は、前記第2モデル生成処理において、処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する複数の処理を特定する、としてもよい。 Further, in the data generation support device 101 of the present embodiment, the arithmetic unit accepts input of processing information in the second model generation process, and determines the characteristics of the content of the data handled by the input process as a predetermined rule. By extracting according to the above, a plurality of processes for generating the predetermined data may be specified.

このように、入力されたワークフローが取り扱うデータの内容の特徴(ファイルメタデータ)を所定の規則(ワークフローメタデータ抽出規則118)に従って抽出することにより、ワークフローの内容の特徴(ワークフローメタデータ)を統一的に抽出することができる。 In this way, by extracting the characteristics (file metadata) of the data contents handled by the input workflow according to a predetermined rule (workflow metadata extraction rule 118), the characteristics of the workflow contents (workflow metadata) are unified. Can be extracted as a workflow.

また、本実施形態のデータ生成支援装置101においては、前記演算装置は、前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、としてもよい。 Further, in the data generation support device 101 of the present embodiment, the arithmetic device has the characteristics of the content of the data input to each of the processes in the generated second model and the characteristics of the content of the data output by each process. By comparing with and, the execution order of the plurality of processes that generate the second data from the first data is specified, and the execution order of the specified plurality of processes is generated as the third model. In the data generation management process, the execution order of a plurality of processes in which the predetermined data can be generated may be specified by the other data based on the third model.

このように、第2モデル(ワークフローメタデータ管理テーブル117)における各ワークフローに入力されるデータの内容の特徴(メタデータ)とそのワークフローが出力するデータの内容の特徴(メタデータ)とを比較することにより、一次データにより成果データ(例えば、二次データ)を生成する複数からなる処理の実行順序を特定し、その実行順序を第3モデル(ワークフロー計画管理テーブル1402)として生成することで、成果データを生成する複数のワークフローを特定することができる。これにより、一次データから成果データ(二次データ等)を生成するワークフローが複雑な場合であっても、確実に二次データ又は成果データを生成することができる。 In this way, the characteristics (metadata) of the content of the data input to each workflow in the second model (workflow metadata management table 117) are compared with the characteristics (metadata) of the content of the data output by the workflow. By specifying the execution order of the plurality of processes for generating the result data (for example, secondary data) from the primary data, and generating the execution order as the third model (workflow plan management table 1402), the result is obtained. You can identify multiple workflows that generate data. This makes it possible to reliably generate secondary data or result data even when the workflow for generating result data (secondary data or the like) from the primary data is complicated.

また、本実施形態のデータ生成支援装置101においては、前記演算装置は、前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、としてもよい。 Further, in the data generation support device 101 of the present embodiment, the arithmetic unit generates information indicating that the process in which the predetermined data can be generated is specified in the data generation management process, or the predetermined data is generated. Information indicating that the predetermined data is being generated may be displayed based on possible processing.

このように、成果データ(二次データ)が生成可能なワークフローを特定したことを示す情報や、そのワークフローに基づき成果データ(二次データ)を生成中であることを示す情報を表示することで、ユーザは、一次データから成果データ(二次データ等)を生成できることを確認することができる。 In this way, by displaying the information indicating that the workflow in which the result data (secondary data) can be generated is specified and the information indicating that the result data (secondary data) is being generated based on the workflow. , The user can confirm that the result data (secondary data, etc.) can be generated from the primary data.

さらに、本実施形態では、情報処理装置が、所定のデータの生成を要求する要求情報を受信するデータ生成要求受付処理と、前記所定のデータの内容の特徴を第1モデルにより
推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、を実行する、としてもよい。
Further, in the present embodiment, the information processing apparatus estimates and estimates the data generation request acceptance process for receiving the request information requesting the generation of predetermined data and the characteristics of the content of the predetermined data by the first model. The process in which the predetermined data can be generated by other data having the content of the feature may be executed with the data generation management process specified by the second model.

また、本実施形態では、前記情報処理装置が、複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを前記第1モデルとして生成する第1モデル生成処理を実行する、としてもよい。 Further, in the present embodiment, the information processing apparatus receives input of a plurality of data, estimates each feature of the content of the input data based on the input data, and the feature of each estimated content and the said. The first model generation process for generating the file metadata management table stored in association with each input data as the first model may be executed.

また、本実施形態では、前記情報処理装置が、前記第1モデル生成処理において、前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、としてもよい。 Further, in the present embodiment, the information processing apparatus extracts the features of the contents from the input data according to a predetermined rule in the first model generation process, so that the features of the contents of the input data are characterized. May be estimated.

また、本実施形態では、前記情報処理装置が、前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、としてもよい。 Further, in the present embodiment, the information processing apparatus generates the predetermined data for the characteristics of each content of the input data by using the characteristics of the contents and the data having the characteristics of the contents. The second model generation process for generating the workflow metadata management table stored in association with the second model may be executed.

また、本実施形態では、前記情報処理装置が、前記第2モデル生成処理において、処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する処理を特定する、としてもよい。 Further, in the present embodiment, the information processing apparatus receives input of processing information in the second model generation processing, and extracts the characteristics of the contents of the data handled by the input processing according to a predetermined rule. The process of generating the predetermined data may be specified.

また、本実施形態では、前記情報処理装置が、前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、としてもよい。 Further, in the present embodiment, the information processing apparatus compares the characteristics of the content of the data input to each of the processes in the generated second model with the characteristics of the content of the data output by each process. , The execution order of the plurality of processes for generating the second data is specified from the first data, and the consolidated workflow calculation process for generating the execution order of the specified plurality of processes as the third model is executed, and the data generation is performed. In the management process, the execution order of a plurality of processes in which the predetermined data can be generated may be specified by the other data based on the third model.

また、本実施形態では、前記情報処理装置が、前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、としてもよい。 Further, in the present embodiment, the information processing apparatus identifies the process in which the predetermined data can be generated in the data generation management process, or the process based on the process in which the predetermined data can be generated. Information indicating that predetermined data is being generated may be displayed.

さらに、本実施形態では、所定のデータの生成を要求する要求情報を送信する利用者端末と、前記要求情報を受信するデータ生成要求受付処理、及び、前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える、所定の情報処理装置が記憶している他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理を実行するデータ生成支援装置とを含んで構成され、前記所定の情報処理装置は、前記他のデータを記憶していると共に、前記利用者端末による前記他のデータへのアクセスを禁止している、データ生成支援システム、としてもよい。 Further, in the present embodiment, the characteristics of the user terminal for transmitting the request information requesting the generation of predetermined data, the data generation request acceptance process for receiving the request information, and the content of the predetermined data are first. A data generation management process is executed to specify the process in which the predetermined data can be generated by other data stored in the predetermined information processing apparatus, which is estimated by the model and has the contents of the estimated features, by the second model. The predetermined information processing device is configured to include the data generation support device, and the predetermined information processing device stores the other data and prohibits the user terminal from accessing the other data. It may be a generation support system.

このように、所定の情報処理装置(ファイル管理サーバ105)が、一次データを記憶していると共に、利用者端末102による一次データへのアクセスを禁止していることで、ファイル管理サーバ105に個人情報等の機密情報を記憶していても、これを成果データの生成を欲する利用者に知られることなく、成果データを生成することができる。 In this way, the predetermined information processing device (file management server 105) stores the primary data and prohibits the user terminal 102 from accessing the primary data, so that the file management server 105 is an individual. Even if confidential information such as information is stored, the result data can be generated without being known to the user who wants to generate the result data.

1 データ生成支援システム、101 データ生成支援装置、102 利用者端末、12
0 ワークフロー実行装置、105 ファイル管理サーバ、108 データ生成要求、2
データ生成支援システム
1 data generation support system, 101 data generation support device, 102 user terminal, 12
0 Workflow executor, 105 file management server, 108 data generation request, 2
Data generation support system

Claims (15)

所定のデータの生成を要求する要求情報を受信するデータ生成要求受付処理と、
前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、
を実行する演算装置を備える、
データ生成支援装置。
Data generation request acceptance processing to receive request information requesting the generation of predetermined data,
A data generation management process for estimating the characteristics of the contents of the predetermined data by the first model and specifying a process in which the predetermined data can be generated by other data having the contents of the estimated features by the second model.
Equipped with an arithmetic unit to execute
Data generation support device.
前記演算装置は、
複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを前記第1モデルとして生成する第1モデル生成処理を実行する、
請求項1に記載のデータ生成支援装置。
The arithmetic unit is
A file that accepts input of multiple data, estimates each feature of the content of the input data based on the input data, and stores the feature of each estimated content in association with each input data. Execute the first model generation process for generating the metadata management table as the first model.
The data generation support device according to claim 1.
前記演算装置は、前記第1モデル生成処理において、
前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、
請求項2に記載のデータ生成支援装置。
The arithmetic unit is used in the first model generation process.
By extracting the characteristics of the contents from the input data according to a predetermined rule, the characteristics of the contents of the input data are estimated.
The data generation support device according to claim 2.
前記演算装置は、
前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、
請求項1に記載のデータ生成支援装置。
The arithmetic unit is
The workflow metadata management table is stored in which the characteristics of each content of the input data are stored in association with the characteristics of the content and the process of generating the predetermined data using the data having the characteristics of the content. Execute the second model generation process to be generated as the second model,
The data generation support device according to claim 1.
前記演算装置は、前記第2モデル生成処理において、
処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する複数の処理を特定する、
請求項4に記載のデータ生成支援装置。
The arithmetic unit is used in the second model generation process.
By accepting the input of processing information and extracting the characteristics of the content of the data handled by the input processing according to a predetermined rule, a plurality of processes that generate the predetermined data are specified.
The data generation support device according to claim 4.
前記演算装置は、
前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、
前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、
請求項4に記載のデータ生成支援装置。
The arithmetic unit is
The second data is generated from the first data by comparing the characteristics of the contents of the data input to each of the processes in the generated second model with the characteristics of the contents of the data output by each of the processes. Specify the execution order of multiple processes and execute the consolidated workflow calculation process to generate the execution order of the specified multiple processes as the third model.
In the data generation management process, based on the third model, the execution order of a plurality of processes in which the predetermined data can be generated by the other data is specified.
The data generation support device according to claim 4.
前記演算装置は、
前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、
請求項2に記載のデータ生成支援装置。
The arithmetic unit is
In the data generation management process, information indicating that the process in which the predetermined data can be generated is specified, or information indicating that the predetermined data is being generated based on the process in which the predetermined data can be generated. indicate,
The data generation support device according to claim 2.
情報処理装置が、
所定のデータの生成を要求する要求情報を受信するデータ生成要求受付処理と、
前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理と、
を実行する、データ生成支援方法。
Information processing equipment
Data generation request acceptance processing to receive request information requesting the generation of predetermined data,
A data generation management process for estimating the characteristics of the contents of the predetermined data by the first model and specifying a process in which the predetermined data can be generated by other data having the contents of the estimated features by the second model.
Data generation support method to execute.
前記情報処理装置が、
複数のデータの入力を受け付け、入力されたデータに基づき前記入力されたデータの内容の各特徴を推定し、推定した各内容の特徴と、前記入力された各データとを対応づけて記憶したファイルメタデータ管理テーブルを前記第1モデルとして生成する第1モデル生成処理を実行する、
請求項8に記載のデータ生成支援方法。
The information processing device
A file that accepts input of multiple data, estimates each feature of the content of the input data based on the input data, and stores the feature of each estimated content in association with each input data. Execute the first model generation process for generating the metadata management table as the first model.
The data generation support method according to claim 8.
前記情報処理装置が、前記第1モデル生成処理において、
前記入力されたデータから所定の規則に従って前記内容の特徴を抽出することにより、前記入力されたデータの内容の特徴を推定する、
請求項8に記載のデータ生成支援方法。
In the first model generation process, the information processing apparatus
By extracting the characteristics of the contents from the input data according to a predetermined rule, the characteristics of the contents of the input data are estimated.
The data generation support method according to claim 8.
前記情報処理装置が、
前記入力されたデータの各内容の特徴について、当該内容の特徴と、当該内容の特徴を備えるデータを用いて前記所定のデータを生成する処理とを対応づけて記憶したワークフローメタデータ管理テーブルを前記第2モデルとして生成する第2モデル生成処理を実行する、
請求項10に記載のデータ生成支援方法。
The information processing device
The workflow metadata management table is stored in which the characteristics of each content of the input data are stored in association with the characteristics of the content and the process of generating the predetermined data using the data having the characteristics of the content. Execute the second model generation process to be generated as the second model,
The data generation support method according to claim 10.
前記情報処理装置が、前記第2モデル生成処理において、
処理の情報の入力を受け付け、入力された処理が取り扱うデータの内容の特徴を所定の規則に従って抽出することにより、前記所定のデータを生成する処理を特定する、
請求項8に記載のデータ生成支援方法。
In the second model generation process, the information processing apparatus
By accepting the input of processing information and extracting the characteristics of the content of the data handled by the input processing according to a predetermined rule, the processing for generating the predetermined data is specified.
The data generation support method according to claim 8.
前記情報処理装置が、
前記生成した第2モデルにおける各前記処理に入力されるデータの内容の特徴と当該各処理が出力するデータの内容の特徴とを比較することにより、第1のデータにより第2のデータを生成する複数からなる処理の実行順序を特定し、特定した複数の処理の実行順序を第3モデルとして生成する連結ワークフロー算出処理を実行し、
前記データ生成管理処理において、前記第3モデルに基づき、前記他のデータにより前記所定のデータが生成可能な複数の処理の実行順序を特定する、
請求項12に記載のデータ生成支援方法。
The information processing device
The second data is generated from the first data by comparing the characteristics of the contents of the data input to each of the processes in the generated second model with the characteristics of the contents of the data output by each of the processes. Specify the execution order of multiple processes and execute the consolidated workflow calculation process to generate the execution order of the specified multiple processes as the third model.
In the data generation management process, based on the third model, the execution order of a plurality of processes in which the predetermined data can be generated by the other data is specified.
The data generation support method according to claim 12.
前記情報処理装置が、
前記データ生成管理処理において、前記所定のデータが生成可能な処理を特定したことを示す情報、又は前記所定のデータが生成可能な処理に基づき前記所定のデータを生成中であることを示す情報を表示する、
請求項8に記載のデータ生成支援方法。
The information processing device
In the data generation management process, information indicating that the process in which the predetermined data can be generated is specified, or information indicating that the predetermined data is being generated based on the process in which the predetermined data can be generated. indicate,
The data generation support method according to claim 8.
所定のデータの生成を要求する要求情報を送信する利用者端末と、
前記要求情報を受信するデータ生成要求受付処理、及び、
前記所定のデータの内容の特徴を第1モデルにより推定し、推定した特徴の内容を備える、所定の情報処理装置が記憶している他のデータにより前記所定のデータが生成可能な処理を、第2モデルにより特定するデータ生成管理処理を実行するデータ生成支援装置とを含んで構成され、
前記所定の情報処理装置は、前記他のデータを記憶していると共に、前記利用者端末による前記他のデータへのアクセスを禁止している、
データ生成支援システム。
A user terminal that sends request information requesting the generation of predetermined data, and
Data generation request acceptance processing to receive the request information, and
A process in which the characteristics of the contents of the predetermined data are estimated by the first model and the predetermined data can be generated by other data stored in the predetermined information processing apparatus, which has the contents of the estimated characteristics, is the first. It is configured to include a data generation support device that executes data generation management processing specified by two models.
The predetermined information processing device stores the other data and prohibits the user terminal from accessing the other data.
Data generation support system.
JP2020085428A 2020-05-14 2020-05-14 Data generation support device, data generation support method, and data generation support system Active JP7431100B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020085428A JP7431100B2 (en) 2020-05-14 2020-05-14 Data generation support device, data generation support method, and data generation support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020085428A JP7431100B2 (en) 2020-05-14 2020-05-14 Data generation support device, data generation support method, and data generation support system

Publications (3)

Publication Number Publication Date
JP2021179857A true JP2021179857A (en) 2021-11-18
JP2021179857A5 JP2021179857A5 (en) 2023-02-24
JP7431100B2 JP7431100B2 (en) 2024-02-14

Family

ID=78511566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020085428A Active JP7431100B2 (en) 2020-05-14 2020-05-14 Data generation support device, data generation support method, and data generation support system

Country Status (1)

Country Link
JP (1) JP7431100B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022428A1 (en) * 2003-08-28 2005-03-10 Ibm Japan, Ltd. Attribute information providing server, attribute information providing method, and program
JP2006011738A (en) * 2004-06-24 2006-01-12 Nec Corp Personal information management system, personal information management method, personal information data convertion device, leakage detection device, leakage detection method and program
JP2007102706A (en) * 2005-10-07 2007-04-19 Konica Minolta Business Technologies Inc Workflow display method and workflow display device
JP2010067094A (en) * 2008-09-11 2010-03-25 Ricoh Co Ltd Electronic document management system, electronic document management method, and program for the same
JP2019008666A (en) * 2017-06-27 2019-01-17 キヤノン株式会社 Information processing apparatus, control method, and program
US20200004604A1 (en) * 2018-06-29 2020-01-02 Optum, Inc. Automated systems and methods for generating executable workflows

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022428A1 (en) * 2003-08-28 2005-03-10 Ibm Japan, Ltd. Attribute information providing server, attribute information providing method, and program
JP2006011738A (en) * 2004-06-24 2006-01-12 Nec Corp Personal information management system, personal information management method, personal information data convertion device, leakage detection device, leakage detection method and program
JP2007102706A (en) * 2005-10-07 2007-04-19 Konica Minolta Business Technologies Inc Workflow display method and workflow display device
JP2010067094A (en) * 2008-09-11 2010-03-25 Ricoh Co Ltd Electronic document management system, electronic document management method, and program for the same
JP2019008666A (en) * 2017-06-27 2019-01-17 キヤノン株式会社 Information processing apparatus, control method, and program
US20200004604A1 (en) * 2018-06-29 2020-01-02 Optum, Inc. Automated systems and methods for generating executable workflows

Also Published As

Publication number Publication date
JP7431100B2 (en) 2024-02-14

Similar Documents

Publication Publication Date Title
JP4936028B2 (en) Information providing support device and information providing support method
KR20130018641A (en) Forensic system, method and program
JP4700462B2 (en) Database usage system
Helm et al. First steps towards process mining in distributed health information systems
JP2022159518A (en) Intellectual property evaluation support system, intellectual property evaluation support program, intellectual property evaluation support method, server and intellectual property support device
JP6586050B2 (en) Management device, management method, and management program
JP2020013413A (en) Judgment support device and judgment support method
JP2008197976A (en) Connection information generation program and connection information generation method
JP7431100B2 (en) Data generation support device, data generation support method, and data generation support system
JP3781375B2 (en) Intellectual property creation support method by cooperative intellectual property management system, information providing system with sublicense management function, and computer program
Rhee A new lifecycle model enabling optimal digital curation
KR102463120B1 (en) Patent document searching server providing user customized flle name generating function when dowloading document and patent document searching method using thereof
JP6675868B2 (en) Information processing apparatus, information processing method, and program
CN114443913A (en) Metadata multi-function multi-condition based user-defined query method, system and medium
JP4516007B2 (en) Intellectual property creation support method by cooperative intellectual property management system, information providing system with sublicense management function, and computer program
Kumar et al. Open Source Software Using Koha: A Case Study of LR Institute Of Engineering & Technology
JP2012043258A (en) Retrieval system, retrieval device, retrieval program, recording medium and retrieval method
US20160019231A1 (en) Reporting tool and method therefor
JP2009223679A (en) Electronic document search device and electronic document search program
JP2010170438A (en) Document management system
JP6828287B2 (en) Information processing equipment and information processing programs
Qureshi et al. Capturing users requirements using a data mining approach
US10614105B2 (en) System and method of designating documents to associate with a search record
JP6455087B2 (en) Form information processing program, form information processing apparatus, and form information processing method
CN108897873A (en) A kind of method, apparatus, storage medium and processor generating job file

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240201

R150 Certificate of patent or registration of utility model

Ref document number: 7431100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150