JP5946068B2 - 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム - Google Patents
演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム Download PDFInfo
- Publication number
- JP5946068B2 JP5946068B2 JP2013259975A JP2013259975A JP5946068B2 JP 5946068 B2 JP5946068 B2 JP 5946068B2 JP 2013259975 A JP2013259975 A JP 2013259975A JP 2013259975 A JP2013259975 A JP 2013259975A JP 5946068 B2 JP5946068 B2 JP 5946068B2
- Authority
- JP
- Japan
- Prior art keywords
- computer system
- arithmetic processing
- core
- processing units
- arithmetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 75
- 230000004044 response Effects 0.000 title claims description 75
- 238000000034 method Methods 0.000 title claims description 35
- 238000004364 calculation method Methods 0.000 claims description 54
- 238000012821 model calculation Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 11
- 230000007704 transition Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
- G06F9/5088—Techniques for rebalancing the load in a distributed system involving task migration
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
クロック数3.55GHzのPOWER7(登録商標)プロセッサを2機、128GBメモリを用いて、コンピュータ・システム10を構成した。OSとしては、ReadHat(登録商標)Enterprise Linux(登録商標)6.4(Kernel 2.6.32−358.2.1.el6)を用いた。各プロセッサは、8コアを有し、4−wayのSMT機能を有する。したがって、プロセッサ・コア数は、合計16個であり、SMTスレッド数(論理CPU数)は、最大で64である。動的周波数スケーリング機能は、再現性を高めるため無効とした。
Claims (18)
- 演算コア各々上で複数の演算処理単位が内部ハードウェア資源を共有しながら並列に稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法であって、コンピュータが、
前記コンピュータ・システムの利用状況を、演算処理単位の並列状態で正規化して評価するステップと、
正規化された前記利用状況から、求めようとする演算処理単位の並列状態での応答性能の期待値を、並列稼働状況に応じた前記演算処理単位の平均的な単一性能の変化を考慮した待ち行列理論に基づいて計算するステップと
を含む、計算方法。 - 前記平均的な単一性能の変化を考慮するとは、ある瞬間の演算コア内での演算処理単位の同時稼働数に応じた平均的な単一性能の変化を平均サービス率の変動として取り込んで待ち行列における待ち時間を計算することである、請求項1に記載の計算方法。
- 前記コンピュータ・システムは、複数の演算コアを含み、前記応答性能の期待値を計算するステップは、前記コンピュータが、
演算コア毎の演算処理単位数を窓口数とした待ち行列での待ち時間を計算するステップと、
前記複数の演算コアにわたる窓口数の待ち行列で、他の演算コアからタスクを受け入れ可能な少なくとも1つ演算コアが存在する移行可能な確率を計算するステップと、
前記待ち時間および前記移行可能な確率に基づき、前記応答性能として平均応答時間の期待値を計算するステップと
を含む、請求項1または2に記載の計算方法。 - 前記待ち時間を計算するステップは、前記コンピュータが、演算コア上で同時稼働可能な演算処理単位の2以上の並列度に関して、
前記演算処理単位の平均的な単一性能の初期値を与えるステップと、
前記演算処理単位の平均的な単一性能が平均サービス率であるとして、演算コア毎の演算処理単位数を窓口数とした待ち行列で、各演算コア内に存在するタスク数の確率の分布を計算するステップと、
前記各演算コア内に存在するタスク数の確率の分布に基づき、前記演算処理単位の平均的な単一性能を更新するステップと、
前記確率の分布を計算するステップおよび前記更新するステップの繰り返しの終了条件を判定するステップと
を含む、請求項3に記載の計算方法。 - 前記移行可能な確率を計算するステップは、前記コンピュータが、
前記演算処理単位の平均的な単一性能が平均サービス率であるとして、前記複数の演算コアにわたる演算処理単位の総数を窓口数とした待ち行列で、前記複数の演算コア内に存在するタスク数の確率の分布を計算するステップと、
前記複数の演算コア内に存在するタスク数の確率の分布に基づき、前記複数の演算コアのうちの少なくとも1つの演算コアで閾値以下のタスク数である確率を前記移行可能な確率として計算するステップと
を含む、請求項3または4に記載の計算方法。 - 前記応答性能の期待値を計算するステップは、演算コアの並列度または複数の演算コアでの並列度の組み合わせの各々について、応答性能の期待値を計算するステップであり、前記計算方法は、前記コンピュータが、
算出された前記応答性能の期待値が最適化される並列度または並列度の組み合わせを、前記利用状況下で使用する演算処理単位の並列状態として決定するステップ
をさらに含む、請求項1〜5のいずれか1項に記載の計算方法。 - 前記評価するステップは、各並列度での演算処理単位の単一性能と、各演算処理単位の利用率とに基づいて、前記コンピュータ・システムの正規化されたCPU利用率を計算するステップである、請求項1〜6のいずれか1項に記載の計算方法。
- 前記コンピュータが前記コンピュータ・システムに含まれ、
前記評価するステップは、当該コンピュータ・システムで取得される現在のCPU利用情報に基づき、正規化された現在の利用状況を評価するステップであり、前記計算方法は、前記コンピュータが、
計算された並列状態での応答性能の期待値の結果に基づき、使用する演算処理単位の並列状態の設定を更新するステップ
をさらに含む、請求項1〜7のいずれか1項に記載の計算方法。 - 前記コンピュータが、評価対象のコンピュータ・システムから分離されたものであり、
前記評価するステップは、前記コンピュータ・システムの複数の利用状況を仮定するステップであり、前記計算方法は、前記コンピュータが、
仮定された前記複数の利用状況各々に対応付けて、決定された使用する演算処理単位の並列状態の設定を記録するステップ
をさらに含む、請求項1〜7のいずれか1項に記載の計算方法。 - 前記コンピュータ・システムは、同時マルチスレッディング環境を提供するものであり、前記演算処理単位は、ハードウェア・スレッドである、請求項1〜9のいずれか1項に記載の計算方法。
- 演算コア各々上で複数の演算処理単位が内部ハードウェア資源を共有しながら並列に稼働可能なコンピュータ・システムにおける応答性能を評価する計算装置であって、
前記コンピュータ・システムの利用状況を、演算処理単位の並列状態で正規化して評価する利用状況評価部と、
正規化された前記利用状況から、求めようとする並列状態での応答性能の期待値を、並列稼働状況に応じた前記演算処理単位の平均的な単一性能の変化を考慮した待ち行列理論に基づいて計算する応答性能計算部と
を含む、計算装置。 - 前記コンピュータ・システムは、複数の演算コアを含み、前記応答性能計算部は、
演算コア毎の演算処理単位数を窓口数とした待ち行列での待ち時間を計算するコア内モデル計算部と、
前記複数の演算コアにわたる窓口数の待ち行列で、他の演算コアからタスクを受け入れ可能な少なくとも1つ演算コアが存在する移行可能な確率を計算し、前記待ち時間および前記移行可能な確率に基づき前記応答性能として平均応答時間の期待値を計算するコア間モデル計算部と
を含む、請求項11に記載の計算装置。 - 前記コア内モデル計算部は、演算コア上で同時稼働可能な演算処理単位の2以上の並列度に関して、
前記演算処理単位の平均的な単一性能の初期値を与える初期値設定部と、
前記演算処理単位の平均的な単一性能がサービス率であるとして、演算コア毎の演算処理単位数を窓口数とした待ち行列で、各演算コア内に存在するタスク数の確率の分布を計算するコア内タスク分布計算部と、
前記各演算コア内に存在するタスク数の確率の分布に基づき、前記演算処理単位の平均的な単一性能を更新する単一性能更新部と、
前記確率の分布の計算および前記更新を繰り返す終了条件を判定する終了条件判定部と
を含む、請求項12に記載の計算装置。 - 前記コア間モデル計算部は、
前記演算処理単位の平均的な単一性能が平均サービス率であるとして、前記複数の演算コアの演算処理単位総数を窓口数とした待ち行列で、前記複数の演算コア内に存在するタスク数の確率の分布を計算するシステム内タスク分布計算部と、
前記複数の演算コア内に存在するタスク数の確率の分布に基づき、前記複数の演算コアのうちの少なくとも1つの演算コアで閾値以下のタスク数である確率を前記移行可能な確率として計算する移行可能確率計算部と
を含む、請求項12または13に記載の計算装置。 - 前記計算装置は、前記コンピュータ・システムであり、
前記利用状況評価部は、当該コンピュータ・システムで取得される現在の演算装置利用情報に基づき、正規化された現在の利用状況を評価することを特徴とし、前記計算装置は、
計算された並列状態での応答性能の期待値の結果に基づき、使用する演算処理単位の並列状態の設定を更新する設定更新部
をさらに含む、請求項11〜14のいずれか1項に記載の計算装置。 - 前記計算装置は、評価対象の前記コンピュータ・システムから分離されたものであり、
前記利用状況評価部は、前記コンピュータ・システムの複数の利用状況を仮定するものであり、前記計算装置は、
仮定された前記複数の利用状況各々に対応付けて、決定された使用する演算処理単位の並列状態の設定を記録する記録部
をさらに含む、請求項11〜14のいずれか1項に記載の計算装置。 - 演算コア各々上で複数の演算処理単位が内部ハードウェア資源を共有しながら並列に稼働可能なコンピュータ・システムであって、
前記コンピュータ・システムの現在の利用状況を、演算処理単位の並列状態で正規化して評価する利用状況評価部と、
正規化された前記現在の利用状況から、前記利用状況に対し使用する演算処理単位の並列状態を対応付ける対応付け情報に基づき、使用する演算処理単位の並列状態の設定を更新する設定更新部と
を含み、前記対応付け情報は、並列稼働状況に応じた前記演算処理単位の平均的な単一性能の変化を考慮した待ち行列理論に基づき計算される応答性能の期待値が最適化される並列状態を、前記利用状況各々に対応付ける情報である、コンピュータ・システム。 - 演算コア各々上で複数の演算処理単位が内部ハードウェア資源を共有しながら並列に稼働可能なコンピュータ・システムにおける応答性能を評価するコンピュータを実現するためのプログラムであって、コンピュータに、
前記コンピュータ・システムの利用状況を、演算処理単位の並列状態で正規化して評価するステップ、および
正規化された前記利用状況から、求めようとする演算処理単位の並列状態での応答性能の期待値を、並列稼働状況に応じた前記演算処理単位の平均的な単一性能の変化を考慮した待ち行列理論に基づいて計算するステップ
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013259975A JP5946068B2 (ja) | 2013-12-17 | 2013-12-17 | 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム |
US14/570,203 US9600290B2 (en) | 2013-12-17 | 2014-12-15 | Calculation method and apparatus for evaluating response time of computer system in which plurality of units of execution can be run on each processor core |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013259975A JP5946068B2 (ja) | 2013-12-17 | 2013-12-17 | 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118434A JP2015118434A (ja) | 2015-06-25 |
JP5946068B2 true JP5946068B2 (ja) | 2016-07-05 |
Family
ID=53368556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013259975A Expired - Fee Related JP5946068B2 (ja) | 2013-12-17 | 2013-12-17 | 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9600290B2 (ja) |
JP (1) | JP5946068B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9921870B2 (en) * | 2014-09-25 | 2018-03-20 | Oracle International Corporation | System and method for supporting a scalable thread pool in a distributed data grid |
US20170031724A1 (en) * | 2015-07-31 | 2017-02-02 | Futurewei Technologies, Inc. | Apparatus, method, and computer program for utilizing secondary threads to assist primary threads in performing application tasks |
US11218322B2 (en) * | 2017-09-28 | 2022-01-04 | Intel Corporation | System and method for reconfiguring and deploying soft stock-keeping units |
JP6897524B2 (ja) | 2017-11-29 | 2021-06-30 | トヨタ自動車株式会社 | ソフトウェア品質判定装置、ソフトウェア品質判定方法、及びソフトウェア品質判定プログラム |
JP6891780B2 (ja) * | 2017-11-29 | 2021-06-18 | トヨタ自動車株式会社 | ソフトウェア品質判定装置、ソフトウェア品質判定方法、及びソフトウェア品質判定プログラム |
US10572748B2 (en) * | 2017-12-06 | 2020-02-25 | GM Global Technology Operations LLC | Autonomous vehicle adaptive parallel image processing system |
US10509671B2 (en) * | 2017-12-11 | 2019-12-17 | Afiniti Europe Technologies Limited | Techniques for behavioral pairing in a task assignment system |
US10491668B1 (en) * | 2018-07-03 | 2019-11-26 | EMC IP Holding Company LLC | Intelligent service distributor and controller with real time service calibration |
CN109597680B (zh) * | 2018-10-22 | 2023-07-07 | 创新先进技术有限公司 | 任务排队响应参数估算方法及装置 |
CN109918195B (zh) * | 2019-01-18 | 2023-06-20 | 华南理工大学 | 基于热感知动态任务迁移的众核系统处理器资源调度方法 |
CN110119311B (zh) * | 2019-04-12 | 2022-01-04 | 华中科技大学 | 一种基于fpga的分布式流计算系统加速方法 |
CN110362457B (zh) * | 2019-05-08 | 2023-03-28 | 阜阳师范学院 | 一种基于休假排队的三值光学计算机性能评价方法及系统 |
US11892924B2 (en) * | 2020-03-20 | 2024-02-06 | UncommonX Inc. | Generation of an issue detection evaluation regarding a system aspect of a system |
CN112749070B (zh) * | 2020-12-28 | 2024-01-23 | 中国人寿保险股份有限公司上海数据中心 | 一种jvm负载状态的评估方法、设备及存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3663968B2 (ja) | 1999-04-14 | 2005-06-22 | 日本電気株式会社 | マルチタスクシステムの性能予測システム及び予測方法並びにその方法プログラムを記録した記録媒体 |
US7237242B2 (en) | 2002-12-31 | 2007-06-26 | International Business Machines Corporation | Dynamic thread pool tuning techniques |
US8230426B2 (en) * | 2004-10-06 | 2012-07-24 | Digipede Technologies, Llc | Multicore distributed processing system using selection of available workunits based on the comparison of concurrency attributes with the parallel processing characteristics |
US8788986B2 (en) * | 2010-11-22 | 2014-07-22 | Ca, Inc. | System and method for capacity planning for systems with multithreaded multicore multiprocessor resources |
US8010822B2 (en) * | 2008-03-28 | 2011-08-30 | Microsoft Corporation | Power-aware thread scheduling and dynamic use of processors |
US20100070730A1 (en) * | 2008-09-17 | 2010-03-18 | Sebastian Pop | Minimizing memory access conflicts of process communication channels |
US20100077403A1 (en) * | 2008-09-23 | 2010-03-25 | Chaowei Yang | Middleware for Fine-Grained Near Real-Time Applications |
US8131843B2 (en) * | 2009-03-31 | 2012-03-06 | International Business Machines Corporation | Adaptive computing using probabilistic measurements |
US8289975B2 (en) * | 2009-06-22 | 2012-10-16 | Citrix Systems, Inc. | Systems and methods for handling a multi-connection protocol between a client and server traversing a multi-core system |
US8285950B2 (en) * | 2010-06-03 | 2012-10-09 | International Business Machines Corporation | SMT/ECO mode based on cache miss rate |
JP2012128771A (ja) | 2010-12-17 | 2012-07-05 | Mitsubishi Electric Corp | 情報処理装置及びプログラム |
US8812825B2 (en) * | 2011-01-10 | 2014-08-19 | Dell Products L.P. | Methods and systems for managing performance and power utilization of a processor employing a fully multithreaded load threshold |
US8683468B2 (en) * | 2011-05-16 | 2014-03-25 | Advanced Micro Devices, Inc. | Automatic kernel migration for heterogeneous cores |
US9602426B2 (en) * | 2013-06-21 | 2017-03-21 | Microsoft Technology Licensing, Llc | Dynamic allocation of resources while considering resource reservations |
-
2013
- 2013-12-17 JP JP2013259975A patent/JP5946068B2/ja not_active Expired - Fee Related
-
2014
- 2014-12-15 US US14/570,203 patent/US9600290B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015118434A (ja) | 2015-06-25 |
US20150169380A1 (en) | 2015-06-18 |
US9600290B2 (en) | 2017-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5946068B2 (ja) | 演算コア上で複数の演算処理単位が稼働可能なコンピュータ・システムにおける応答性能を評価する計算方法、計算装置、コンピュータ・システムおよびプログラム | |
US10089140B2 (en) | Dynamically adaptive, resource aware system and method for scheduling | |
CN107003887B (zh) | Cpu超载设置和云计算工作负荷调度机构 | |
US20190303200A1 (en) | Dynamic Storage-Aware Job Scheduling | |
US7711821B2 (en) | Multiple resource control-advisor for management of distributed or web-based systems | |
Li et al. | Work stealing for interactive services to meet target latency | |
US9910892B2 (en) | Managing execution of database queries | |
US8424007B1 (en) | Prioritizing tasks from virtual machines | |
Jeon et al. | Adaptive parallelism for web search | |
Zhang et al. | An effective data locality aware task scheduling method for MapReduce framework in heterogeneous environments | |
US9934071B2 (en) | Job scheduler for distributed systems using pervasive state estimation with modeling of capabilities of compute nodes | |
US9870269B1 (en) | Job allocation in a clustered environment | |
Jeon et al. | TPC: Target-driven parallelism combining prediction and correction to reduce tail latency in interactive services | |
US20120297216A1 (en) | Dynamically selecting active polling or timed waits | |
US10089155B2 (en) | Power aware work stealing | |
JP2016042284A (ja) | 並列計算機システム、管理装置、並列計算機システムの制御方法及び管理装置の制御プログラム | |
US20220195434A1 (en) | Oversubscription scheduling | |
US20170116030A1 (en) | Low latency scheduling on simultaneous multi-threading cores | |
Sfakianakis et al. | Quman: Profile-based improvement of cluster utilization | |
Varga et al. | Deadline scheduling algorithm for sustainable computing in Hadoop environment | |
JP5987987B2 (ja) | リソース管理システム、リソース管理方法、およびプログラム | |
US10817401B1 (en) | System and method for job-to-queue performance ranking and resource matching | |
Anselmi et al. | Stability and optimization of speculative queueing networks | |
HoseinyFarahabady et al. | Data-intensive workload consolidation in serverless (Lambda/FaaS) platforms | |
Ogden et al. | Layercake: Efficient Inference Serving with Cloud and Mobile Resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160502 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20160506 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5946068 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |