JP2015014847A - Design assist system, design assist method, and program - Google Patents
Design assist system, design assist method, and program Download PDFInfo
- Publication number
- JP2015014847A JP2015014847A JP2013140035A JP2013140035A JP2015014847A JP 2015014847 A JP2015014847 A JP 2015014847A JP 2013140035 A JP2013140035 A JP 2013140035A JP 2013140035 A JP2013140035 A JP 2013140035A JP 2015014847 A JP2015014847 A JP 2015014847A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- data
- sample
- processing method
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Stored Programmes (AREA)
Abstract
Description
本発明は、設計支援システム、設計支援方法、およびプログラムに関し、特に、並列分散処理技術を活用する際における設計支援技術に関する。 The present invention relates to a design support system, a design support method, and a program, and more particularly, to a design support technology when utilizing a parallel distributed processing technology.
近年、現実的な時間で処理することが不可能であった大量データに対するデータ加工処理が、並列分散処理技術により可能になってきている。この並列分散処理技術によるデータ加工は、大量データに対する処理の高速化という点で非常に効果的であり、統計処理やマイニング処理、あるいは大量バッチ処理などに適用されている。適用にあたっては、並列分散処理が可能かを判断した上で、実装などを行う。 In recent years, data processing for large amounts of data that could not be processed in a realistic time has become possible with parallel distributed processing technology. Data processing by this parallel distributed processing technique is very effective in terms of speeding up processing for a large amount of data, and is applied to statistical processing, mining processing, or large-scale batch processing. In application, it is implemented after judging whether parallel distributed processing is possible.
この種の並列分散処理技術においては、例えば並列分散処理が苦手な系列データを対象に、効率的に並列分散処理するもの(例えば特許文献1参照)やCOBOL(COmmon Business Oriented Language)バッチ処理を並列分散処理可能にして高速化するもの(例えば非特許文献1参照)などが知られている。 In this type of parallel distributed processing technology, for example, parallel distributed processing (for example, refer to Patent Document 1) or COBOL (COmmon Business Oriented Language) batch processing is performed in parallel for series data that is not good at parallel distributed processing. A device that can be distributed and speeded up (for example, see Non-Patent Document 1) is known.
並列分散処理技術は、大量のデータを高速に扱えるという点において非常に有効である。しかし、データ分析などのデータ抽出/加工処理を実装する上で、処理をどのように分散し、どのような手順で処理するかを適切に設計することは技術的に難易度が高い。 The parallel distributed processing technology is very effective in that a large amount of data can be handled at high speed. However, in implementing data extraction / processing such as data analysis, it is technically difficult to appropriately design how to distribute the processing and in what procedure.
これは、データ抽出処理に指定可能な条件の制限や、出力データが大量になりすぎてI/O(Input/Output)性能が劣化する、といったケースがあるためである。 This is because there are cases where there are restrictions on conditions that can be specified for the data extraction process, and there are cases where output data becomes too large and I / O (Input / Output) performance deteriorates.
そのような課題を解決するための特殊な手法や、データ加工をコンサルティングするようなサービスも市場には存在するが、「大量データ処理」であるが故に、試行そのものが困難となる場合がある。 Although there are special methods for solving such problems and services for consulting data processing, there are cases where trials themselves are difficult due to the "mass data processing".
前述したように、非特許文献1では、既存のバッチ処理を並列分散化することが可能であることが記載されており、特許文献1では、並列分散化を行う技術が記載されているが、実際にこれから扱うデータに当該手法が適用できるか否かの判断は明確にされておらず、適用にはこれら高度な手法に精通した技術者を要する。
As described above, Non-Patent
例えば性能検証という視点では、設計を確認するためにプロトタイプなどを開発し、大量データで試行する必要がある。適切な設計ができていない場合、処理時間は、当然長くなり、試行回数が減少し、相対的に品質が劣化する。 For example, from the viewpoint of performance verification, it is necessary to develop a prototype or the like in order to confirm the design and to experiment with a large amount of data. If an appropriate design is not made, the processing time naturally becomes longer, the number of trials decreases, and the quality deteriorates relatively.
このことは、分析などのデータ加工サービスを顧客に提供する上において、価値提供におけるボトルネックとなりかねないため、検証の度にコンサルティングや高度技術者を適用する必要がある。 This may become a bottleneck in providing value when providing data processing services such as analysis to customers, and it is necessary to apply consulting and advanced engineers for each verification.
本発明の目的は、並列分散処理技術を活用するシステム設計において、特に大量のデータを取り扱うケースの設計を支援することで、並列分散処理技術の適用を容易とすることのできる技術を提供することにある。 An object of the present invention is to provide a technology that can facilitate the application of a parallel distributed processing technique by supporting a design of a case that handles a large amount of data in a system design that utilizes a parallel distributed processing technique. It is in.
本発明の前記ならびにその他の目的と新規な特徴については、本明細書の記述および添付図面から明らかになるであろう。 The above and other objects and novel features of the present invention will be apparent from the description of this specification and the accompanying drawings.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。 Of the inventions disclosed in the present application, the outline of typical ones will be briefly described as follows.
すなわち、代表的なものの概要は、設計支援システムに適用され、以下のような特徴を有するものである。 That is, a typical outline is applied to a design support system and has the following characteristics.
設計支援システムは、並列分散処理技術を活用するシステム設計において、特に大量のデータを取り扱うケースの設計を支援することによって、データ加工技術に加えて並列分散アルゴリズムを習熟するような高度技術者でなくても、並列分散処理技術の適用を容易とするものである。 The design support system is not an advanced engineer who is proficient in parallel distributed algorithms in addition to data processing technology by supporting the design of cases that handle large amounts of data in system design that utilizes parallel distributed processing technology. However, this facilitates the application of the parallel distributed processing technology.
この設計支援システムは、方式評価部、サンプル実行処理部、およびデータ管理部を有する。方式評価部は、入力された処理方式データから特徴量を抽出し、抽出した特徴量と処理方式メタデータとからデータの処理方式を評価する。 This design support system includes a method evaluation unit, a sample execution processing unit, and a data management unit. The method evaluation unit extracts a feature amount from the input processing method data, and evaluates a data processing method from the extracted feature amount and processing method metadata.
サンプル実行処理部は、処理方式データから、分散処理としての候補をサンプルデータとして抽出し、方式評価部による評価結果を加えたサンプルデータに対して処理方式データに基づく処理を実行した際に要した時間であるサンプルデータ処理時間から、処理対象データの処理時間を予測する。 The sample execution processing unit needed to extract a candidate for distributed processing as sample data from the processing method data, and to execute processing based on the processing method data on the sample data to which the evaluation result by the method evaluation unit was added. The processing time of the processing target data is predicted from the sample data processing time which is time.
データ管理部は、方式評価部が抽出した特徴量に基づいて処理方式特徴量を生成し、処理方式特徴量およびサンプル実行処理部が予測した処理対象データの処理時間を出力する。 The data management unit generates a processing method feature value based on the feature value extracted by the method evaluation unit, and outputs the processing method feature value and the processing time of the processing target data predicted by the sample execution processing unit.
また、本発明は、多様な形式のデータを入力として、適切な並列分散処理選択候補と選択処理方式の検証方法を提供するシステムによる方法や、前記システムとしてコンピュータシステムを機能させるプログラムにも適用することができる。 The present invention is also applicable to a method by a system that provides appropriate parallel distributed processing selection candidates and a selection processing method verification method using various types of data as input, and a program that causes a computer system to function as the system. be able to.
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。 Among the inventions disclosed in the present application, effects obtained by typical ones will be briefly described as follows.
並列分散処理設計を高効率化することができる。 Parallel distributed processing design can be made highly efficient.
以下の実施の形態においては便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらはお互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。 In the following embodiments, when it is necessary for the sake of convenience, the description will be divided into a plurality of sections or embodiments. However, unless otherwise specified, they are not irrelevant to each other. There are some or all of the modifications, details, supplementary explanations, and the like.
また、以下の実施の形態において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。 Further, in the following embodiments, when referring to the number of elements (including the number, numerical value, quantity, range, etc.), especially when clearly indicated and when clearly limited to a specific number in principle, etc. Except, it is not limited to the specific number, and may be more or less than the specific number.
さらに、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。 Further, in the following embodiments, the constituent elements (including element steps and the like) are not necessarily indispensable unless otherwise specified and apparently essential in principle. Needless to say.
同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは特に明示した場合および原理的に明らかにそうではないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。 Similarly, in the following embodiments, when referring to the shape, positional relationship, etc. of components, etc., the shape of the component is substantially the case unless it is clearly specified and the case where it is clearly not apparent in principle. And the like are included. The same applies to the above numerical values and ranges.
また、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。なお、図面をわかりやすくするために平面図であってもハッチングを付す場合がある。 In all the drawings for explaining the embodiments, the same members are denoted by the same reference symbols in principle, and the repeated explanation thereof is omitted. In order to make the drawings easy to understand, even a plan view may be hatched.
以下、上記した概要に基づいて、実施の形態を詳細に説明する。 Hereinafter, the embodiment will be described in detail based on the above-described outline.
〈データ抽出・加工設計支援システムの概要〉
図1は、本実施の形態におけるデータ抽出・加工設計支援システム100の構成の一例を示す説明図である。
<Outline of data extraction / processing design support system>
FIG. 1 is an explanatory diagram illustrating an example of a configuration of a data extraction / processing
データ抽出・加工設計支援システム100は、中央演算処理装置などの計算能力を有する1つ以上の計算機およびネットワークで構成される設計支援システムであり、大量の系列データを並列に処理する。
The data extraction / processing
並列分散処理データ抽出・加工設計支援システム100は、図1に示すように、設計制御サブシステム200、方式評価サブシステム300、サンプル実行サブシステム400、データ管理サブシステム500、処理対象データ群601、および処理方式メタデータ群602を有する。
As shown in FIG. 1, the parallel distributed processing data extraction / processing
設計制御サブシステム200は、方式評価サブシステム300およびサンプル実行サブシステム400にそれぞれ接続されており、方式評価部である方式評価サブシステム300は、サンプル実行処理部となるサンプル実行サブシステム400に接続されている。
The
また、データ管理部であるデータ管理サブシステム500は、方式評価サブシステム300、サンプル実行サブシステム400、処理対象データ群601、および処理方式メタデータ群602にそれぞれ接続されている。
The
設計制御サブシステム200は、キーボードなどの入力部201とディスプレイなどの表示部202とを有し、該入力部201を介して得た利用者からの処理方式定義や処理対象データを含む様々な要求を用いて、方式評価サブシステム300やサンプル実行サブシステム400に様々な要求を送信し、表示部202に結果を表示する。
The
方式評価サブシステム300は、データ評価部301および処理方式特徴量抽出部302を有する。方式評価サブシステム300は、設計制御サブシステム200の入力部201から入力された、処理方式定義と処理対象データとからなる処理方式データの特徴量を抽出し、データ管理サブシステム500からの処理方式メタデータと合わせて、データの処理方式を評価する。処理方式定義は、処理の入出力定義だけでもよいし、処理フローを明示するなどの処理の経過ログを含んでもよい。
The method evaluation subsystem 300 includes a
サンプル実行サブシステム400は、サンプル実行部401および候補処理抽出部402を有する。このサンプル実行サブシステム400は、入力部201から入力された処理方式定義と処理対象データに対し、方式評価サブシステム300にて実行した処理の評価に加え、処理対象データから実行用のサンプルデータを抽出し、そのサンプルデータを用いて処理方式定義に基づく処理を実行する。実行した試行結果は、データ管理サブシステム500を通じて格納される。
The
データ管理サブシステム500は、形式特徴抽出部501およびデータ閲覧部502を有する。データ管理サブシステム500は、方式評価サブシステム300やサンプル実行サブシステム400からのデータ格納要求に応じて、データ形式に基づいた特徴を抽出し、その結果やメタデータなどを、データベースである処理対象データ群601や処理方式メタデータ群602に格納し、また様々な要求に応じて格納データを送付するサブシステムである。
The
なお、以下に説明する方式評価サブシステム300、サンプル実行サブシステム400、およびデータ管理サブシステム500の処理機能は、たとえば、データ抽出・加工設計支援システム100に設けられたプログラム格納メモリ(図示せず)などに記憶されているプログラム形式のソフトウェアを、該データ抽出・加工設計支援システム100の図示しないCPU(Central Processing Unit)などが実行することにより実現する。
The processing functions of the method evaluation subsystem 300, the
〈方式評価サブシステムの処理例〉
続いて、図2を用いて方式評価サブシステム300の処理を説明する。
<Example of system evaluation subsystem processing>
Next, processing of the system evaluation subsystem 300 will be described using FIG.
図2は、図1のデータ抽出・加工設計支援システム100が有する方式評価サブシステム300の処理の一例を示すフローチャートである。
FIG. 2 is a flowchart showing an example of processing of the method evaluation subsystem 300 included in the data extraction / processing
ここで、図2のステップS101,S102,S106,S107の処理は、データ評価部301が実行する処理であり、図2のステップS103,S104,S105の処理は、処理方式特徴量抽出部302が実行する処理である。
Here, the processes of steps S101, S102, S106, and S107 in FIG. 2 are processes executed by the
まず、入力部201を介し入力された処理方式定義のうち、処理ログを解析し、処理名称、処理時間やデータ利用の詳細履歴を抽出する(ステップS101)。続いて、入力部201を介し入力された処理方式定義とステップS101の処理の出力であるデータ利用の詳細履歴から、処理に対する入出力定義を取得する(ステップS102)。入出力定義からは、入出力データの種別や組、利用の順序、入力値同士の操作種別、処理時間が抽出される。
First, among the processing method definitions input via the
このとき、類似の処理方式がある場合には、データ管理サブシステム500のデータ閲覧部502を通じて、処理方式メタデータ群602に既に格納されている、類似の処理方式メタデータを取得する(ステップS103)。また、類似の処理方式がない場合には、ステップS106の処理を行う。
At this time, if there is a similar processing method, the similar processing method metadata already stored in the processing
ステップS103の処理おいて、類似の処理方式メタデータを取得すると、ステップS101,S102の処理において抽出した処理方式定義の解析結果と突き合わせて特徴量を抽出する(ステップS104)。この際、特徴量の突き合わせは、数値の平均でもよいし、文字列の結合でもよい。 When similar processing method metadata is acquired in the processing of step S103, the feature amount is extracted by matching with the analysis result of the processing method definition extracted in the processing of steps S101 and S102 (step S104). At this time, the matching of the feature amounts may be an average of numerical values or a combination of character strings.
その後、データ管理サブシステム500を通じて、算出した処理方式特徴量を処理対象データ群601に格納し(ステップS105)、入出力定義から入出力の管理単位や操作単位を抽出する(ステップS106)。管理単位は、ファイル名から取得した名称でもよいし、拡張子から判断される用途でもよい。続いて、データ管理サブシステム500を通じて、処理対象データとともに、算出したデータ特徴量を格納する(ステップS107)。
Thereafter, the calculated processing method feature quantity is stored in the processing
〈処理方式特徴量のデータ形式例〉
図3は、図1のデータ抽出・加工設計支援システム100が有する処理対象データ群601に格納される処理方式特徴量のデータ形式の一例を示した説明図であり、処理方式特徴量は、図示するように、「方式ID」、「詳細ID」、「処理名」、「入力種別」、「出力種別」、「試行履歴」、「処理時間/データ量」、および「組操作」を有する形式となっている。
<Data format example of processing method feature value>
FIG. 3 is an explanatory diagram showing an example of the data format of the processing method feature amount stored in the processing
〈データ特徴量のデータ形式例〉
図4は、処理対象データ群601に格納されるデータ特徴量のデータ形式の一例を示した説明であり、図示するように、「処理ID」、「引数ID」、「管理単位」、「共有単位」、「操作単位」、および「データ」を有する形式となっている。
<Data format example of data feature value>
FIG. 4 is an explanation showing an example of the data format of the data feature quantity stored in the processing
データ特徴量の格納時には、データ管理サブシステム500の形式特徴抽出部501を通じて、自動的にデータ型や値の分布といった特徴量が処理方式特徴量として算出され、処理対象データ群601に格納される。この際、算出される特徴量は、文字列型、整数型といったデータ型でもよいし、最大値、最小値や分布形式といった集計、統計的処理結果でもよい。
When storing data feature amounts, feature amounts such as data type and value distribution are automatically calculated as processing method feature amounts through the format
〈抽出された処理方式特徴量のデータ形式例〉
図5は、図1のデータ抽出・加工設計支援システム100が有する形式特徴抽出部501によって抽出された処理方式特徴量におけるデータ形式の一例を示す説明図であり、図示するように、「データ」、「属性」、「属性型」、および「レコード数」を有する形式となっている。
<Data format example of extracted processing method features>
FIG. 5 is an explanatory diagram showing an example of a data format in the processing method feature amount extracted by the format
〈候補処理抽出部の処理例〉
次に、候補処理抽出部402の処理について、図6を用いて説明する。
<Example of candidate process extraction unit>
Next, the process of the candidate
図6は、図1のサンプル実行サブシステム400が有する候補処理抽出部402の処理の一例を示すフローチャートである。
FIG. 6 is a flowchart showing an example of processing of the candidate
候補処理抽出部402は、入力部201に入力された処理対象データに基づいて、分散処理としての候補を算出する処理を実行し、表示部202に選択可能な入力項目として出力される。
The candidate
まず、入力部201から、処理対象データが入力されると、候補処理抽出部402は、データ管理サブシステム500から、図3に示す形式の処理方式特徴量群を取得する(ステップS201)。
First, when processing target data is input from the
続いて、方式評価サブシステム300に対してデータ評価要求を実施し、結果として図4に示す形式にてデータ特徴量を得る(ステップS202)。また、データ管理サブシステム500に対して形式評価要求を実施し、結果として図5に示す形式でデータ特徴量を得る。
Subsequently, a data evaluation request is made to the method evaluation subsystem 300, and as a result, a data feature amount is obtained in the format shown in FIG. 4 (step S202). Further, a format evaluation request is made to the
ステップS201の処理にて得た処理方式特徴量群とステップS202の処理にて得たデータ特徴量から実施可能な値の組を抽出し(ステップS203)、抽出した組に含まれる値それぞれのデータ特徴量から、最小数のサンプルを取得する。 A set of feasible values is extracted from the processing method feature amount group obtained in the process of step S201 and the data feature amount obtained in the process of step S202 (step S203), and data of each value included in the extracted set is extracted. The minimum number of samples is acquired from the feature quantity.
抽出したサンプルを用いて、各処理方式毎にサンプル実行部401に対して、サンプルデータに対する処理実行を要求する(ステップS204)。サンプル実行部401の処理が終了すると処理実行時のログを解析し、処理時間や日時などが抽出され、図7に示す形式のデータとして保持する(ステップS205)。
Using the extracted sample, the
サンプル実行時間があらかじめ設定された時間であるしきい値を超えたか否かを判断し(ステップS206)、サンプル実行時間がしきい値を超えた場合、または既定の回数実行された場合に処理を終了する。サンプル実行時間がしきい値を超えていない場合には、ステップS203の処理に戻り、再度サンプル数を増加してサンプル実行を要求する。 It is determined whether or not the sample execution time exceeds a threshold value that is a preset time (step S206), and processing is performed when the sample execution time exceeds the threshold value or when a predetermined number of times have been executed. finish. If the sample execution time does not exceed the threshold value, the process returns to step S203 to request the sample execution by increasing the number of samples again.
〈サンプル実行部の処理例〉
続いて、サンプル実行部401の処理について説明する。
<Sample execution unit processing example>
Next, processing of the
図8は、サンプル実行サブシステム400が有するサンプル実行部401の処理の一例を示すフローチャートである。
FIG. 8 is a flowchart illustrating an example of processing of the
サンプル実行部401は、入力部201から実行を要求されるか、あるいは候補処理抽出部402の要求により処理を開始する。サンプル実行部401は、実行すべき処理対象サンプルデータと処理方式定義を入力として開始する。
The
まず、サンプル実行部401は、データ管理サブシステム500に対し、形式特徴の抽出要求を行い、結果として図5に示すデータ形式特徴を取得する(ステップS301)。そして、方式評価サブシステム300に対して、処理対象サンプルデータの特徴量抽出を要求し、結果として図4に示すデータ特徴量を取得する(ステップS302)。
First, the
データ特徴量を取得すると、処理方式定義に基づいた処理を、処理対象サンプルデータを入力として実行し(ステップS303)、実行履歴情報を出力する(ステップS304)。 When the data feature amount is acquired, processing based on the processing method definition is executed with the processing target sample data as input (step S303), and execution history information is output (step S304).
〈表示部の表示例〉
図9は、設計制御サブシステム200が有する表示部202における表示の一例を示す説明図である。
<Display examples on the display>
FIG. 9 is an explanatory diagram illustrating an example of display on the
表示部202には、図9の左上方にデータ特徴表示ウィンドウ2022が表示されており、該データ特徴表示ウィンドウ2022の左下方には、処理方式表示ウィンドウ2023が表示されている。
On the
また、処理方式表示ウィンドウ2023の右側には、処理入力方式表示ウィンドウ2024が表示されている。処理入力方式表示ウィンドウ2024の下方には、実行ボタン2025が表示されている。
A processing input
データ特徴表示ウィンドウ2022の右側には、出力サンプル表示ウィンドウ2026が表示されており、該出力サンプル表示ウィンドウ2026の下方には、処理時間推定表示ウィンドウ2027が表示されている。
An output
データ特徴表示ウィンドウ2022は、図4および図5に示した形式で保存されている、データ特徴量、データ形式特徴量をリスト形式にて表示する。処理方式表示ウィンドウ2023および処理入力方式表示ウィンドウ2024には、図3に示した形式にて保存されている処理方式リストと、処理方式に対する入力組(タプル)とが表示されおり、処理方式に対する入力組は、データ形式特徴量で組み合わせ可能な組のみが明示される。
The data feature
処理方式表示ウィンドウ2023や処理入力方式表示ウィンドウ2024にて選択された処理方式定義は、実行ボタン2025を押下することによってサンプル実行部401によって実行される。このサンプル実行部401での実行結果は、出力サンプル表示ウィンドウ2026と処理時間推定表示ウィンドウ2027にそれぞれ表示される。
The processing method definition selected in the processing
出力サンプル表示ウィンドウ2026は、選択した処理方式の出力が表示される。表示形式は、テキストでもよいしグラフでもよい。処理時間推定表示ウィンドウ2027は、実行結果として得られる、図7に示すサンプル実行監視結果の形式のデータを表示し、近似曲線を表示する。少量サンプルによる処理時間を用いて、大量データ時の処理時間を推定することで、実現可能性の判断の支援となる。
The output
以上によれば、技術者の手により、並列分散処理方式定義をあらかじめ蓄積しておけば、大量データを取り扱うケースであっても、並列分散処理技術の設計において、分析手法の抽出と性能評価の実施を容易とすることができる。 According to the above, if the parallel distributed processing method definition is accumulated in advance by an engineer, analysis method extraction and performance evaluation can be performed in parallel distributed processing technology design, even in cases where large amounts of data are handled. Implementation can be facilitated.
また、画面提供により、分散並列処理の効果を概念的に把握することができるため、高度分析者が直接指導することなく、分散技術やデータ分析技術を効果的な活用検証に専念することができる。 In addition, since the provision of screens enables conceptual understanding of the effects of distributed parallel processing, it is possible to concentrate on effective use verification of distributed technology and data analysis technology without direct instruction from advanced analysts. .
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
なお、本発明は上記した実施の形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。 In addition, this invention is not limited to above-described embodiment, Various modifications are included. For example, the above-described embodiment has been described in detail for easy understanding of the present invention, and is not necessarily limited to one having all the configurations described.
また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることが可能である。 Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. . In addition, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.
100 データ抽出・加工設計支援システム
200 設計制御サブシステム
201 入力部
202 表示部
2022 データ特徴表示ウィンドウ
2023 処理方式表示ウィンドウ
2024 処理入力方式表示ウィンドウ
2025 実行ボタン
2026 出力サンプル表示ウィンドウ
2027 処理時間推定表示ウィンドウ
300 方式評価サブシステム
301 データ評価部
302 処理方式特徴量抽出部
400 サンプル実行サブシステム
401 サンプル実行部
402 候補処理抽出部
500 データ管理サブシステム
501 形式特徴抽出部
502 データ閲覧部
601 処理対象データ群
602 処理方式メタデータ群
100 Data Extraction / Processing
Claims (12)
前記処理方式データから、分散処理としての候補をサンプルデータとして抽出し、前記方式評価部による評価結果を加えた前記サンプルデータに対して前記処理方式データに基づく処理を実行した際に要した時間であるサンプルデータ処理時間から、処理対象データの処理時間を予測するサンプル実行処理部と、
前記方式評価部が抽出した特徴量に基づいて処理方式特徴量を生成し、前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間を出力するデータ管理部と、
を有する設計支援システム。 A method evaluation unit that extracts feature values from the input processing method data and evaluates a data processing method from the extracted feature values and processing method metadata;
The time required when processing based on the processing method data is performed on the sample data obtained by extracting candidates for distributed processing as sample data from the processing method data and adding the evaluation result by the method evaluation unit. A sample execution processing unit for predicting the processing time of processing target data from a certain sample data processing time;
A data management unit that generates a processing method feature value based on the feature value extracted by the method evaluation unit, and outputs a processing time of the processing target data predicted by the processing method feature value and the sample execution processing unit;
Design support system with
さらに、前記データ管理部が出力する前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間を格納するデータベースを有する、設計支援システム。 The design support system according to claim 1,
The design support system further includes a database that stores the processing method feature amount output by the data management unit and a processing time of the processing target data predicted by the sample execution processing unit.
前記処理方式データは、データ処理の入出力を定義する処理方式定義を有し、
前記方式評価部は、前記処理方式定義と前記処理方式定義に類似する処理方式メタデータとを比較して前記特徴量を抽出する、設計支援システム。 The design support system according to claim 1,
The processing method data has a processing method definition that defines input / output of data processing,
The system evaluation unit is a design support system that extracts the feature amount by comparing the processing method definition and processing method metadata similar to the processing method definition.
前記サンプル実行処理部は、前記サンプルデータ処理時間に基づいて近似曲線を生成し、前記近似曲線から前記処理対象データの処理時間を予測する、設計支援システム。 The design support system according to claim 1,
The sample execution processing unit generates an approximate curve based on the sample data processing time, and predicts the processing time of the processing target data from the approximate curve.
前記方式評価部において、入力された処理方式データから特徴量を抽出するステップと、
抽出した前記特徴量と処理方式メタデータとに基づいて処理方式を評価するステップと、
前記サンプル実行処理部において、前記処理方式データから、分散処理としての候補をサンプルデータとして抽出し、前記方式評価部による評価結果を加えた前記サンプルデータに対して前記処理方式データに基づく処理を実行した際に要する時間であるサンプルデータ処理時間を算出するステップと、
算出した前記サンプルデータ処理時間から、処理対象データの処理時間を予測するステップと、
前記データ管理部において、前記方式評価部が抽出した特徴量に基づいて処理方式特徴量を生成するステップと、
前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間を出力するステップと、
を有する設計支援方法。 A method evaluation unit that evaluates a data processing method, a sample execution processing unit that predicts a processing time of processing target data, a processing method feature amount, and a processing time of the processing target data predicted by the sample execution processing unit are output. A design support method by a computer system comprising a data management unit,
Extracting a feature amount from the input processing method data in the method evaluation unit;
Evaluating a processing method based on the extracted feature quantity and processing method metadata;
In the sample execution processing unit, candidates for distributed processing are extracted as sample data from the processing method data, and processing based on the processing method data is executed on the sample data to which the evaluation result by the method evaluation unit is added. Calculating sample data processing time, which is the time required for
Predicting the processing time of the data to be processed from the calculated sample data processing time;
In the data management unit, generating a processing method feature amount based on the feature amount extracted by the method evaluation unit;
Outputting the processing method feature and the processing time of the processing target data predicted by the sample execution processing unit;
A design support method.
さらに、前記データ管理部が出力する前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間をデータベースに格納するステップを有する、設計支援方法。 The design support method according to claim 5,
The design support method further includes a step of storing the processing method feature amount output by the data management unit and a processing time of the processing target data predicted by the sample execution processing unit in a database.
前記処理方式データは、データ処理の入出力を定義する処理方式定義を有し、
前記特徴量を抽出するステップは、前記処理方式定義と前記処理方式定義に類似する処理方式メタデータとを比較して前記特徴量を抽出する、設計支援方法。 The design support method according to claim 5,
The processing method data has a processing method definition that defines input / output of data processing,
The step of extracting the feature amount is a design support method for extracting the feature amount by comparing the processing method definition and processing method metadata similar to the processing method definition.
前記処理対象データの処理時間を予測するステップは、前記サンプル実行処理部が、前記サンプルデータ処理時間に基づいて近似曲線を生成し、前記近似曲線から前記処理対象データの処理時間を予測する、設計支援方法。 The design support method according to claim 5,
The step of predicting the processing time of the processing target data is a design in which the sample execution processing unit generates an approximate curve based on the sample data processing time and predicts the processing time of the processing target data from the approximate curve. Support method.
前記方式評価部において、入力された処理方式データから特徴量を抽出するステップと、
抽出した前記特徴量と処理方式メタデータとに基づいて処理方式を評価するステップと、
前記サンプル実行処理部において、前記処理方式データから、分散処理としての候補をサンプルデータとして抽出し、前記方式評価部による評価結果を加えた前記サンプルデータに対して前記処理方式データに基づく処理を実行した際に要する時間であるサンプルデータ処理時間を算出するステップと、
算出した前記サンプルデータ処理時間から、処理対象データの処理時間を予測するステップと、
前記データ管理部において、前記方式評価部が抽出した特徴量に基づいて処理方式特徴量を生成するステップと、
前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間を出力するステップと、
を有するプログラム。 A method evaluation unit that evaluates a data processing method, a sample execution processing unit that predicts a processing time of processing target data, a processing method feature amount, and a processing time of the processing target data predicted by the sample execution processing unit are output. A program to be executed by a computer system comprising a data management unit,
Extracting a feature amount from the input processing method data in the method evaluation unit;
Evaluating a processing method based on the extracted feature quantity and processing method metadata;
In the sample execution processing unit, candidates for distributed processing are extracted as sample data from the processing method data, and processing based on the processing method data is executed on the sample data to which the evaluation result by the method evaluation unit is added. Calculating sample data processing time, which is the time required for
Predicting the processing time of the data to be processed from the calculated sample data processing time;
In the data management unit, generating a processing method feature amount based on the feature amount extracted by the method evaluation unit;
Outputting the processing method feature and the processing time of the processing target data predicted by the sample execution processing unit;
A program with
さらに、前記データ管理部が、前記データ管理部が出力する前記処理方式特徴量および前記サンプル実行処理部が予測した前記処理対象データの処理時間をデータベースに格納するステップを有する、プログラム。 The program according to claim 9, wherein
The program further includes a step in which the data management unit stores in the database the processing method feature amount output by the data management unit and the processing time of the processing target data predicted by the sample execution processing unit.
前記特徴量を抽出するステップは、前記処理方式データが有するデータ処理の入出力を定義する処理方式定義と前記処理方式定義に類似する処理方式メタデータとを比較して前記特徴量を抽出する、プログラム。 The program according to claim 9, wherein
The step of extracting the feature amount extracts the feature amount by comparing a processing method definition that defines input / output of data processing included in the processing method data and processing method metadata similar to the processing method definition, program.
前記処理対象データの処理時間を予測するステップは、前記サンプル実行処理部が、前記サンプルデータ処理時間に基づいて近似曲線を生成し、前記近似曲線から前記処理対象データの処理時間を予測する、プログラム。 The program according to claim 9, wherein
The step of predicting the processing time of the processing target data is a program in which the sample execution processing unit generates an approximate curve based on the sample data processing time and predicts the processing time of the processing target data from the approximate curve. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013140035A JP2015014847A (en) | 2013-07-03 | 2013-07-03 | Design assist system, design assist method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013140035A JP2015014847A (en) | 2013-07-03 | 2013-07-03 | Design assist system, design assist method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015014847A true JP2015014847A (en) | 2015-01-22 |
Family
ID=52436557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013140035A Pending JP2015014847A (en) | 2013-07-03 | 2013-07-03 | Design assist system, design assist method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015014847A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018041168A (en) * | 2016-09-05 | 2018-03-15 | ヤフー株式会社 | Information processing device, information processing system, information processing program, and information processing method |
WO2019059135A1 (en) * | 2017-09-20 | 2019-03-28 | 日本電気株式会社 | Information processing device, information processing system, information processing method and recording medium |
-
2013
- 2013-07-03 JP JP2013140035A patent/JP2015014847A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018041168A (en) * | 2016-09-05 | 2018-03-15 | ヤフー株式会社 | Information processing device, information processing system, information processing program, and information processing method |
WO2019059135A1 (en) * | 2017-09-20 | 2019-03-28 | 日本電気株式会社 | Information processing device, information processing system, information processing method and recording medium |
JPWO2019059135A1 (en) * | 2017-09-20 | 2020-04-16 | 日本電気株式会社 | Information processing apparatus, information processing system, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11295262B2 (en) | System for fully integrated predictive decision-making and simulation | |
US20170124497A1 (en) | System for automated capture and analysis of business information for reliable business venture outcome prediction | |
US9350747B2 (en) | Methods and systems for malware analysis | |
US20180204123A1 (en) | Application Recommending Method and Apparatus | |
US20200042659A1 (en) | Autonomous surrogate model creation platform | |
US20180247321A1 (en) | Platform for management of marketing campaigns across multiple distribution mediums | |
US20240195843A1 (en) | System for automated capture and analysis of business information for reliable business venture outcome prediction | |
JP7069029B2 (en) | Automatic prediction system, automatic prediction method and automatic prediction program | |
JP7098327B2 (en) | Information processing system, function creation method and function creation program | |
CN113811854B (en) | Micro-application function suggestions with cross-application activity relevance | |
WO2019179030A1 (en) | Product purchasing prediction method, server and storage medium | |
KR20150103509A (en) | Method for analyzing patent documents using a latent dirichlet allocation | |
US20170193541A1 (en) | Agricultural products processing center adaptive analysis system and processing method thereof | |
US11574237B2 (en) | Quick path to train, score, and operationalize a machine learning project | |
US10114636B2 (en) | Production telemetry insights inline to developer experience | |
CN111950600A (en) | Method and device for predicting overdue user resource return performance and electronic equipment | |
WO2017219044A1 (en) | Accurate and detailed modeling of systems using a distributed simulation engine | |
KR101700832B1 (en) | Apparatus and method for predicting computer simulation necessary resource | |
JP2015014847A (en) | Design assist system, design assist method, and program | |
US10885441B2 (en) | Selecting attributes by progressive sampling to generate digital predictive models | |
Madarshahian et al. | Reducing MCMC computational cost with a two layered Bayesian approach | |
JP5555238B2 (en) | Information processing apparatus and program for Bayesian network structure learning | |
WO2016178312A1 (en) | Information processing device, information processing method, and recording medium | |
KR102185359B1 (en) | Service restoration device linked with the change in service usage by menu chage | |
Sammaneh | Requirements Elicitation with the Existence of Similar Applications: A Conceptual Framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180703 |