JP6679445B2 - 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 - Google Patents
情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 Download PDFInfo
- Publication number
- JP6679445B2 JP6679445B2 JP2016169876A JP2016169876A JP6679445B2 JP 6679445 B2 JP6679445 B2 JP 6679445B2 JP 2016169876 A JP2016169876 A JP 2016169876A JP 2016169876 A JP2016169876 A JP 2016169876A JP 6679445 B2 JP6679445 B2 JP 6679445B2
- Authority
- JP
- Japan
- Prior art keywords
- job
- information
- output
- data
- distributed processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 65
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000012545 processing Methods 0.000 claims description 250
- 238000000034 method Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 description 43
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 20
- 238000009826 distribution Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000013523 data management Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 101150083648 Sav1 gene Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1を用いて、実施形態に係る分散処理システムにおける情報処理について説明する。図1は、実施形態に係る情報処理の説明図であり、かかる情報処理は、分散処理システム1によって実行される処理である。
次に、分散処理システム1を含む情報処理システム100について説明する。図2は実施形態に係る情報処理システム100の一例を示す図である。
分散処理システム1は、上述したように、マスタサーバ2と、複数のスレーブサーバ3とを備える。図3は、マスタサーバ2およびスレーブサーバ3の構成例を示す図である。
サービス提供サーバ7は、ネットワーク5を介して各種のサービスをユーザ端末6のユーザへ提供する。図4は、サービス提供サーバ7の構成例を示す図である。
ジョブ要求装置8は、分散処理システム1に対してジョブを要求する。かかるジョブ要求装置8は、例えば、複数の種類のジョブを分散処理システム1に対して要求することができ、複数の種類のジョブ毎に、所定周期(例えば、1日毎)で同一ジョブを繰り返し要求することができる。
ジョブ要求部53は、設定情報記憶部55に記憶された設定情報と出力制御部54によって設定される分割数情報とに基づいて、ジョブ定義情報を生成し、かかるジョブ定義情報を含むジョブ要求をマスタサーバ2へ送信する。
Pf=(St×Pav)/Sav ・・・(1)
Pt=So/St ・・・(2)
まず、図7を用いて、情報処理システム100における情報処理の手順について説明する。図7は、情報処理システム100における情報処理の流れを示すフローチャートであり、かかる処理は同一のジョブ(例えば、図6に示すジョブNo.3のジョブ)に関して繰り返し実行される。
上述した分散処理システム1では、キー・バリュー形式の処理を行う分散処理を行う例を説明したが、分散処理の内容はキー・バリュー形式の処理に限定されるものでなく、分散処理システム1は、種々の分散処理を行うことができる。
上述した実施形態におけるマスタサーバ2、スレーブサーバ3、サービス提供サーバ7およびジョブ要求装置8は、それぞれ例えば図8に示すような構成のコンピュータ200がプログラムを実行することによって実現される。
実施形態に係るジョブ要求装置8(情報処理装置の一例)は、ジョブ要求部53と、出力制御部54とを備える。ジョブ要求部53は、入力データを分散処理する分散処理システム1にジョブを実行させる。出力制御部54は、同一ジョブに対する分散処理システム1における過去の処理結果に応じた分割数で今回の分散処理の処理結果を分割した複数の出力ファイルを、今回のジョブに対する出力データとして分散処理システム1に生成させる。
2 マスタサーバ
3 スレーブサーバ
6 ユーザ端末
7 サービス提供サーバ
8 ジョブ要求装置(情報処理装置の一例)
51 制御部
52 記憶部
53 ジョブ要求部
54 出力制御部
55 設定情報記憶部
56 過去情報記憶部
61 情報取得部
62 決定部
63 出力設定部
100 情報処理システム
Claims (10)
- 入力データを分散処理する分散処理システムにジョブを実行させるジョブ要求部と、
前記ジョブに対する前記分散処理システムにおける過去の処理結果に応じた分割数で前記分散処理の処理結果を分割した複数の出力ファイルを前記ジョブに対する出力データとして前記分散処理システムに生成させる出力制御部と、を備える
ことを特徴とする情報処理装置。 - 前記出力制御部は、
前記ジョブに対する前記分散処理システムの過去の処理結果を取得する情報取得部と、
前記情報取得部によって取得された前記過去の処理結果に応じた分割数に関する情報を決定する決定部と、
前記決定部によって決定した情報に基づく分割数で前記分散処理の処理結果を分割した複数の出力ファイルを前記ジョブに対する出力データとして前記分散処理システムに生成させる出力設定部と、を備える
ことを特徴とする請求項1に記載の情報処理装置。 - 前記出力データは、複数のレコードを含み、
前記決定部は、
前記出力ファイルのファイルサイズを目標サイズにする前記出力ファイルのレコード数を前記分割数に関する情報として決定し、
前記出力設定部は、
前記決定部によって決定されたレコード数と今回の前記分散処理の処理結果に含まれるレコードの総数とに応じた分割数で分割した出力ファイルを前記分散処理システムに生成させる
ことを特徴とする請求項2に記載の情報処理装置。 - 前記決定部は、
過去の前記出力データに含まれる出力ファイルの平均ファイルサイズと平均レコード数とに基づいて、前記出力ファイルのレコード数を決定する
ことを特徴とする請求項3に記載の情報処理装置。 - 前記出力制御部は、
前記複数の出力ファイルをそれぞれ圧縮形式のデータとして前記分散処理システムに生成させる
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。 - 前記ジョブ要求部は、
前記分散処理システムで分割されて生成される出力データの複数の分割データを前記入力データとして前記分散処理システムにジョブを実行させる
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。 - 前記入力データには、
ネットワーク上の異なるサービスのログデータまたは当該ログデータの前記分散処理システムにおける処理結果が含まれる
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。 - 請求項1〜7のいずれか一つに記載の情報処理装置と、
前記分散処理システムと、を備える
ことを特徴とする情報処理システム。 - 分配された入力データをジョブに応じて分散処理する手順と、
前記ジョブに対する過去の前記分散処理の処理結果に応じた分割数で前記分散処理の処理結果を分割した複数の出力ファイルを前記ジョブに対する出力データとして生成する手順と、
をコンピュータシステムに実行させることを特徴とする情報処理プログラム。 - コンピュータシステムが実行する情報処理方法であって、
入力データが分配された複数のサーバのそれぞれによって前記分配された入力データをジョブに応じて分散処理する工程と、
前記ジョブに対する過去の前記分散処理の処理結果に応じた分割数で前記分散処理の処理結果を分割した複数の出力ファイルを前記ジョブに対する出力データとして生成する工程と、を含む
ことを特徴とする情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016169876A JP6679445B2 (ja) | 2016-08-31 | 2016-08-31 | 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016169876A JP6679445B2 (ja) | 2016-08-31 | 2016-08-31 | 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036885A JP2018036885A (ja) | 2018-03-08 |
JP6679445B2 true JP6679445B2 (ja) | 2020-04-15 |
Family
ID=61567542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016169876A Active JP6679445B2 (ja) | 2016-08-31 | 2016-08-31 | 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6679445B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7174245B2 (ja) * | 2018-12-27 | 2022-11-17 | 富士通株式会社 | 情報処理プログラム、情報処理装置及び情報処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148451A (ja) * | 1998-11-18 | 2000-05-30 | Nec Corp | バッチジョブ負荷分散方法および負荷分散システム |
WO2012131927A1 (ja) * | 2011-03-30 | 2012-10-04 | 株式会社日立製作所 | 計算機システム及びデータ管理方法 |
WO2012137347A1 (ja) * | 2011-04-08 | 2012-10-11 | 株式会社日立製作所 | 計算機システム及び並列分散処理方法 |
JP2015084152A (ja) * | 2013-10-25 | 2015-04-30 | 株式会社日立ソリューションズ | データ割当制御プログラム、MapReduceシステム、データ割当制御装置、データ割当制御方法 |
JP6183198B2 (ja) * | 2013-12-13 | 2017-08-23 | 富士通株式会社 | 分散配備装置、分散配備方法及び分散配備プログラム |
-
2016
- 2016-08-31 JP JP2016169876A patent/JP6679445B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018036885A (ja) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230126005A1 (en) | Consistent filtering of machine learning data | |
US10366053B1 (en) | Consistent randomized record-level splitting of machine learning data | |
US10372723B2 (en) | Efficient query processing using histograms in a columnar database | |
US10713589B1 (en) | Consistent sort-based record-level shuffling of machine learning data | |
US9063992B2 (en) | Column based data transfer in extract, transform and load (ETL) systems | |
US11100420B2 (en) | Input processing for machine learning | |
US11182691B1 (en) | Category-based sampling of machine learning data | |
JP6697392B2 (ja) | 半構造データスキーマのトランスペアレントディスカバリ | |
TW201820165A (zh) | 用於雲端巨量資料運算架構之伺服器及其雲端運算資源最佳化方法 | |
JP7038740B2 (ja) | キャッシュ最適化及び効率的な処理のためのデータ集約の方法 | |
US10261767B2 (en) | Data integration job conversion | |
EP3182298B1 (en) | Smart elastic scaling based on application scenarios | |
Heilig et al. | Managing cloud-based big data platforms: a reference architecture and cost perspective | |
US10334028B2 (en) | Apparatus and method for processing data | |
US20210216657A1 (en) | Distributing data amongst storage components using data sensitivity classifications | |
US10691653B1 (en) | Intelligent data backfill and migration operations utilizing event processing architecture | |
JP6679445B2 (ja) | 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 | |
US10083121B2 (en) | Storage system and storage method | |
US9904536B1 (en) | Systems and methods for administering web widgets | |
CN111226201B (zh) | 管理计算机中的存储器的方法和计算机系统 | |
CN110659296A (zh) | 存储方法、装置、设备以及计算机可读介质 | |
Dawelbeit et al. | A novel cloud based elastic framework for big data preprocessing | |
US11023226B2 (en) | Dynamic data ingestion | |
JP6865003B2 (ja) | 情報処理装置、情報処理システム、情報処理プログラムおよび情報処理方法 | |
JP2016184213A (ja) | 数値データを匿名化する方法及び数値データ匿名化サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6679445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |