JP2019035996A - 分散処理システム、分散処理方法、及び分散処理プログラム - Google Patents
分散処理システム、分散処理方法、及び分散処理プログラム Download PDFInfo
- Publication number
- JP2019035996A JP2019035996A JP2017155083A JP2017155083A JP2019035996A JP 2019035996 A JP2019035996 A JP 2019035996A JP 2017155083 A JP2017155083 A JP 2017155083A JP 2017155083 A JP2017155083 A JP 2017155083A JP 2019035996 A JP2019035996 A JP 2019035996A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- unit
- data
- flow
- parallel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
図1は、本実施形態に係る分散処理システム100の構成の一例を示す図である。分散処理システム100は、所定のデータ(以下、対象データという)の変化を分析する処理(以下、分析処理という)を行う情報処理システムである。
、いわゆるビッグデータ(Big Data)である。この対象データは複数のデータ区画からなり、例えば、所定の時間帯ごとに区切られたデータからなる。
ーク108により通信可能に接続されている。
Drive)、SSD(Solid State Drive)等の補助記憶装置53と、キーボード、マウス
、タッチパネル等からなる入力装置54と、モニタ(ディスプレイ)等からなる出力装置55とを備える。
<機能>
図3は、各情報処理装置が備える機能の一例を説明する図である。
まず、仮想マシン管理サーバ101は、フローテーブル記憶部211、処理状態管理テーブル記憶部212、処理負荷算出部201、フロー管理部202、マシン管理テーブル記憶部213、及びマシン制御部203を備える。
フローテーブル300の詳細は後述する。
図4は、分析フローテーブル300の一例を示す図である。同図に示すように、分析フローテーブル300は、分析フローの識別情報(以下、フロー名という)が格納されるフロー名611、フロー名611が示す分析フローに入力されるデータ(又はその種類)を特定する情報が格納される入力612、フロー名611が示す分析フローが実行する処理の種類を示す情報(例えば、統計解析や機械学習の種類に関する情報)が格納される処理方法613、及び、フロー名611が示す分析フローから出力されるデータ(又はその種類)を特定する情報が格納される出力614の各項目を有する、少なくとも1つ以上のレコードで構成されている。
図5は、処理状態管理テーブル400の一例を示す図である。処理状態管理テーブル400は、分析フローテーブル300が規定する分析フローの処理順序を前提に、その分析フローにおける区間フローの実行状態について記憶している。
図6は、VM管理テーブル500の一例を示す図である。同図に示すように、VM管理テーブル500は、仮想マシン実行サーバ102の識別情報(以下、実行サーバ名という)が格納される実行サーバ名711、実行サーバ名711が示す仮想マシン実行サーバ102における仮想マシン103に対して分析フロー(における区間フロー)を割り当てることが可能な仮想マシン103の最大の台数(以下、最大数という)を示す情報が格納される最大VM割当可能数712、及び、実行サーバ名711が示す仮想マシン実行サーバ102に現在割り当てられている仮想マシン103の台数(以下、現在台数という)を示す情報が格納される割当VM数713の各項目を有する、少なくとも1つ以上のレコードで構成される。
<分析処理>
図7は、分散処理システム100が行う分析処理の一例を示すシーケンス図である。この処理は、例えば、ユーザ操作端末105から仮想マシン管理サーバ101に、実行する分析処理を指定する情報が入力された際に開始される。
図8は、フロー実行対象判定処理の詳細を説明するフローチャートである。同図に示すように、フロー管理部202は、まず、現在実行可能な分析フローが1つだけであるか否
かを判断する(S401)。具体的には、例えば、フロー管理部202は、処理状態管理テーブル400の各レコードの実行状態623のうちで、「実行可能」が格納されているレコードの数を確認する。これにより、同時に実行可能なフローの数を、各分析フローの実行順序の制約を崩さずに判定できる。
図9は、仮想マシン割当判定処理の詳細を示すフローチャートである。まず、マシン制御部203は、フロー実行対象判定処理で決定した各対象区間フローを割り当て可能な仮想マシン103が存在するか否かを判定する(S501)。具体的には、例えば、マシン制御部203は、VM管理テーブル500の各レコードの割当VM数713及び最大VM割当可能数712を参照して判断する。
図10は、ユーザ操作端末105が表示する、分析処理の経過又は結果を示す画面の一例である。同図に示すように、この表示画面1000には、分析処理の実行状態又は実行結果を示すテーブル1010が表示される。このテーブル1010には、仮想マシン実行サーバ102における各仮想マシン103ごとに、各分析フローにおける各区間フローの現在の処理状況1011(又はその処理結果)が時系列に沿って表示される。そして、この処理状況1011には、その処理により発生したI/O量も表示される。また、分析処理によって発生したI/O量の合計1012が、各時間帯ごとに(各データ区画ごとに)表示される。
の処理の分散による安定化が実現される。
ある仮想マシン103の稼動実績が少なく分析フローの処理時間が不明又は不正確である場合であっても、合理的に分散処理を行うことができる。
Claims (12)
- 複数の情報処理装置を含んで構成され、複数の区画からなる所定のデータを前記区画ごとに処理する処理部を複数備える所定の処理について、前記処理部の処理を前記複数の情報処理装置のうち少なくともいずれかに割り当てることにより前記処理部を並列的に実行可能な、プロセッサ及びメモリを備える分散処理システムであって、
前記区画のデータに対する前記複数の処理部の処理順序を記憶するフローテーブル記憶部と、
前記処理部が行う前記区画のデータの処理による前記情報処理装置に対する負荷を、前記区画ごとに算出する処理負荷算出部と、
各前記処理部の現在の実行状態、各前記処理部の処理順序、及び各前記処理部について算出した前記負荷に基づき、並列的に実行される前記処理部、及び当該処理部を実行する前記情報処理装置の組み合わせを決定するフロー管理部と、
前記決定した組み合わせが示す並列的な処理を各前記情報処理装置に実行させるマシン制御部と、
を備える分散処理システム。 - 前記情報処理装置による前記処理部の並列的な実行に関する制約条件を記憶するマシン管理テーブル記憶部を備え、
前記フロー管理部は、前記制約条件を満たす前記情報処理装置を、前記処理部を並列的に実行する前記情報処理装置として決定する、
請求項1に記載の分散処理システム。 - 前記マシン管理テーブル記憶部は、前記制約条件として、並列的に前記処理部を実行可能な前記情報処理装置の最大数を記憶する、請求項2に記載の分散処理システム。
- 前記処理負荷算出部は、前記負荷として、前記処理部の処理の実行に係る予測時間を各前記処理部について算出し、
前記フロー管理部は、並列的に実行される前記処理部が複数ある場合、前記算出した予測時間に基づき、前記複数の処理部のそれぞれに対して割り当てる前記情報処理装置又はその割り当てに関する優先度を決定する、
請求項1に記載の分散処理システム。 - 前記フロー管理部は、前記並列的に実行される複数の処理部のうち前記予測時間を算出していない前記処理部がある場合には、前記複数の処理部のそれぞれを実行する前記情報処理装置の台数を互いに均等とする、請求項4に記載の分散処理システム。
- 前記フロー管理部は、並列的に実行される前記処理部を決定する際に、当該処理部が処理可能な前記データの区画が複数ある場合には、予め定められた、最初に処理される前記データの区画のみを前記処理部が処理することを決定する、請求項1に記載の分散処理システム。
- 各前記情報処理装置が実行した前記処理部の処理の結果、又は前記処理部の処理により発生したデータの入出力量に関する情報を出力する出力部を備える、請求項1に記載の分散処理システム。
- 前記情報処理装置による前記処理部の並列的な実行に関する制約条件を記憶するマシン管理テーブル記憶部と、
各前記情報処理装置が実行した前記処理部の処理の結果、又は前記処理部の処理により発生したデータの入出力量に関する情報を出力する出力部とをさらに備え、
前記マシン管理テーブル記憶部は、前記制約条件として、並列的に前記処理部を実行可能な前記情報処理装置の最大数を記憶し、
前記処理負荷算出部は、前記負荷として、前記処理部の処理の実行に係る予測時間を各前記処理部について算出し、
前記フロー管理部は、
前記制約条件を満たす前記情報処理装置を、前記処理部を並列的に実行する前記情報処理装置として決定し、
並列的に実行される前記処理部が複数ある場合、前記算出した予測時間に基づき、前記複数の処理部のそれぞれに対して割り当てる前記情報処理装置又はその割り当てに関する優先度を決定し、
前記並列的に実行される複数の処理部のうち前記予測時間を算出していない前記処理部がある場合には、前記複数の処理部のそれぞれを実行する前記情報処理装置の台数を互いに均等とし、
並列的に実行される前記処理部を決定する際に、当該処理部が処理可能な前記データの区画が複数ある場合には、予め定められた、最初に処理される前記データの区画のみを前記処理部が処理することを決定する、
請求項1に記載の分散処理システム。 - 複数の情報処理装置を含んで構成され、複数の区画からなる所定のデータを前記区画ごとに処理する処理部を複数備える所定の処理について、前記処理部の処理を前記複数の情報処理装置のうち少なくともいずれかに割り当てることにより前記処理部を並列的に実行可能な分散処理システムにおける分散処理方法であって、
プロセッサ及びメモリを備えるマシン管理サーバが、
前記区画のデータに対する前記複数の処理部の処理順序を記憶するフローテーブル記憶処理と、
前記処理部が行う前記区画のデータの処理による前記情報処理装置に対する負荷を、前記区画ごとに算出する処理負荷算出処理と、
各前記処理部の現在の実行状態、各前記処理部の処理順序、及び各前記処理部について算出した前記負荷に基づき、並列的に実行される前記処理部、及び当該処理部を実行する前記情報処理装置の組み合わせを決定するフロー管理処理と、
前記決定した組み合わせが示す並列的な処理を各前記情報処理装置に実行させるマシン制御処理と、
を実行する、分散処理方法。 - 前記マシン管理サーバは、前記情報処理装置による前記処理部の並列的な実行に関する制約条件を記憶するマシン管理テーブル記憶処理をさらに実行し、
前記フロー管理処理は、前記制約条件を満たす前記情報処理装置を、前記処理部を並列的に実行する前記情報処理装置として決定する、
請求項9に記載の分散処理方法。 - 複数の情報処理装置を含んで構成され、複数の区画からなる所定のデータを前記区画ごとに処理する処理部を複数備える所定の処理について、前記処理部の処理を前記複数の情報処理装置のうち少なくともいずれかに割り当てることにより前記処理部を並列的に実行可能な、プロセッサ及びメモリを備える分散処理システムに、
前記区画のデータに対する前記複数の処理部の処理順序を記憶するフローテーブル記憶処理と、
前記処理部が行う前記区画のデータの処理による前記情報処理装置に対する負荷を、前記区画ごとに算出する処理負荷算出処理と、
各前記処理部の現在の実行状態、各前記処理部の処理順序、及び各前記処理部について算出した前記負荷に基づき、並列的に実行される前記処理部、及び当該処理部を実行する
前記情報処理装置の組み合わせを決定するフロー管理処理と、
前記決定した組み合わせが示す並列的な処理を各前記情報処理装置に実行させるマシン制御処理と、
を実行させる、分散処理プログラム。 - 前記情報処理装置による前記処理部の並列的な実行に関する制約条件を記憶するマシン管理テーブル記憶処理をさらに実行させ、
前記フロー管理処理は、前記制約条件を満たす前記情報処理装置を、前記処理部を並列的に実行する前記情報処理装置として決定する、
請求項11に記載の分散処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017155083A JP6940325B2 (ja) | 2017-08-10 | 2017-08-10 | 分散処理システム、分散処理方法、及び分散処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017155083A JP6940325B2 (ja) | 2017-08-10 | 2017-08-10 | 分散処理システム、分散処理方法、及び分散処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019035996A true JP2019035996A (ja) | 2019-03-07 |
JP6940325B2 JP6940325B2 (ja) | 2021-09-29 |
Family
ID=65637518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017155083A Active JP6940325B2 (ja) | 2017-08-10 | 2017-08-10 | 分散処理システム、分散処理方法、及び分散処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6940325B2 (ja) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0965023A (ja) * | 1995-08-25 | 1997-03-07 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2003208323A (ja) * | 2002-01-11 | 2003-07-25 | Hitachi Ltd | バッチジョブの実行方法、システムおよびプログラム |
JP2011053995A (ja) * | 2009-09-03 | 2011-03-17 | Hitachi Ltd | データ処理制御方法および計算機システム |
WO2012105056A1 (ja) * | 2011-02-04 | 2012-08-09 | 株式会社日立製作所 | 並列分散処理システムのデータ転送制御方法、並列分散処理システム及び記憶媒体 |
WO2012164689A1 (ja) * | 2011-05-31 | 2012-12-06 | 株式会社日立製作所 | ジョブ管理サーバ及びジョブ管理方法 |
US20130290976A1 (en) * | 2012-04-30 | 2013-10-31 | Ludmila Cherkasova | Scheduling mapreduce job sets |
WO2015001596A1 (ja) * | 2013-07-01 | 2015-01-08 | 株式会社日立製作所 | 系列データ並列分析基盤およびその並列分散処理方法 |
JP2015090688A (ja) * | 2013-11-07 | 2015-05-11 | 株式会社日立製作所 | MapReduceジョブ管理システム、MapReduceジョブ管理方法 |
WO2015125225A1 (ja) * | 2014-02-19 | 2015-08-27 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
JP2017016494A (ja) * | 2015-07-03 | 2017-01-19 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
-
2017
- 2017-08-10 JP JP2017155083A patent/JP6940325B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0965023A (ja) * | 1995-08-25 | 1997-03-07 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2003208323A (ja) * | 2002-01-11 | 2003-07-25 | Hitachi Ltd | バッチジョブの実行方法、システムおよびプログラム |
JP2011053995A (ja) * | 2009-09-03 | 2011-03-17 | Hitachi Ltd | データ処理制御方法および計算機システム |
WO2012105056A1 (ja) * | 2011-02-04 | 2012-08-09 | 株式会社日立製作所 | 並列分散処理システムのデータ転送制御方法、並列分散処理システム及び記憶媒体 |
WO2012164689A1 (ja) * | 2011-05-31 | 2012-12-06 | 株式会社日立製作所 | ジョブ管理サーバ及びジョブ管理方法 |
US20130290976A1 (en) * | 2012-04-30 | 2013-10-31 | Ludmila Cherkasova | Scheduling mapreduce job sets |
WO2015001596A1 (ja) * | 2013-07-01 | 2015-01-08 | 株式会社日立製作所 | 系列データ並列分析基盤およびその並列分散処理方法 |
JP2015090688A (ja) * | 2013-11-07 | 2015-05-11 | 株式会社日立製作所 | MapReduceジョブ管理システム、MapReduceジョブ管理方法 |
WO2015125225A1 (ja) * | 2014-02-19 | 2015-08-27 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
JP2017016494A (ja) * | 2015-07-03 | 2017-01-19 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Non-Patent Citations (1)
Title |
---|
"特集:Pentaho「データから価値を創る」 〜攻めのビジネスを支えるデータ統合・分析基盤〜", はいたっく, vol. 通巻595号, JPN6021022417, 1 December 2016 (2016-12-01), JP, pages 2 - 4, ISSN: 0004526146 * |
Also Published As
Publication number | Publication date |
---|---|
JP6940325B2 (ja) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6241300B2 (ja) | ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム | |
US9483288B2 (en) | Method and system for running a virtual appliance | |
JP6172649B2 (ja) | 情報処理装置、プログラム、及び、情報処理方法 | |
JP6191691B2 (ja) | 異常検出装置、制御方法、及びプログラム | |
WO2015001850A1 (ja) | タスク割り当て判定装置、制御方法、及びプログラム | |
EP3255553A1 (en) | Transmission control method and device for direct memory access | |
JP2015517147A5 (ja) | ||
JP6519111B2 (ja) | データ処理制御方法、データ処理制御プログラムおよびデータ処理制御装置 | |
CN113641457A (zh) | 容器创建方法、装置、设备、介质及程序产品 | |
JP2017041191A (ja) | リソース管理装置、リソース管理プログラム、及びリソース管理方法 | |
JP6885193B2 (ja) | 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム | |
Xue et al. | Managing data center tickets: Prediction and active sizing | |
JP2019079334A (ja) | 情報処理装置、情報処理システムおよび情報処理方法 | |
JP5471822B2 (ja) | 入出力制御プログラム、情報処理装置および入出力制御方法 | |
US10754547B2 (en) | Apparatus for managing disaggregated memory and method thereof | |
JP6666553B2 (ja) | 情報処理装置、ジョブ管理方法およびジョブ管理プログラム | |
JP6940325B2 (ja) | 分散処理システム、分散処理方法、及び分散処理プログラム | |
US11093281B2 (en) | Information processing apparatus, control method, and program to control allocation of computer resources for different types of tasks | |
JP5867499B2 (ja) | 仮想サーバシステム、管理サーバ装置及びシステム管理方法 | |
JP6374059B2 (ja) | コンピュータ資源配分決定方法、コンピュータ資源配分決定方法プログラムおよび制御用コンピュータ | |
JP6059259B2 (ja) | 計算機システム及び計算機リソースの割当方法 | |
JP6724631B2 (ja) | 情報処理装置及びプログラム | |
US20170147408A1 (en) | Common resource updating apparatus and common resource updating method | |
WO2018173300A1 (ja) | I/o制御方法およびi/o制御システム | |
JP4999932B2 (ja) | 仮想計算機システム及び仮想計算機重み付け設定処理方法及び仮想計算機重み付け設定処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6940325 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |