JP4945410B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP4945410B2 JP4945410B2 JP2007304273A JP2007304273A JP4945410B2 JP 4945410 B2 JP4945410 B2 JP 4945410B2 JP 2007304273 A JP2007304273 A JP 2007304273A JP 2007304273 A JP2007304273 A JP 2007304273A JP 4945410 B2 JP4945410 B2 JP 4945410B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- processing
- information
- control unit
- accelerator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
(第1の実施の形態)
まず図1に基づき、本発明の第1の実施の形態に係わる情報処理装置の構成を説明する。図1は、本実施の形態に係わる情報処理装置の構成を示す構成図である。
情報処理装置1は、PCアーキテクチャを有するコンピュータであるPC2を含んで構成されている。PC2には、アクセラレータ3が付加可能に、すなわち接続可能になっている。PC2は、CPU(Central Processing Unit)11と、MCH(Memory Controller Hub)12と、ICH(I/O Controller Hub)13と、GPU(Graphics Processing Unit)14と、主メモリ15と、画像メモリとしてのVRAM(Video RAM)16とを含んで構成される情報処理装置である。よって、このようなPCアーキテクチャを有するPC2にアクセラレータ3が接続されて情報処理装置1が構成されている。なお、本実施の形態では、PCアーキテクチャとして、CPU11と、MCH12と、ICH13と、GPU14からなるPCアーキテクチャの例を示すが、PCアーキテクチャは、このような構成に限られるものではない。
CPU11は、各種のアプリケーションプログラムを実行可能であり、各種アプリケーションプログラムの中には、負荷量の高いプログラムもあれば、負荷量の低いプログラムもある。従って、CPU11は、負荷量の高いアプリケーションプログラム、例えば、画像認識のアプリケーションプログラム、動画の再生等のアプリケーションプログラムの実行を、AC3に依頼して、行わせることができる。具体的には、情報処理装置1において、あるアプリケーションプログラムをAC3を用いて実行する場合には、CPU11がAC3に対して所定のコマンドを出力し、AC3は、そのコマンドを受信してCPU11により指定されたプログラムの処理を行う。その場合、例えば、AC3は、指定された処理、例えば画像の認識処理、を行う場合、SATA等からのストリーム信号をDMAにより読み込んで、その認識処理を行い、その認識処理した結果データを、DMAにより、GPU14等に転送して出力する。
演算部22aは、ここでは、データ幅が128ビットのデータに対してSIMD演算が可能な演算部である。さらに、演算部22aは、32ビットの単精度及び64ビットの倍精度のフローティング演算が可能である。
CPU11が各種処理を実行している途中で、ある処理、ここでは画像の認識処理、をAC3に分担させる場合の例で説明する。CPU11は、AC3との間で、その処理を依頼する前に、所定の前処理を実行した後に、CPU11は、その画像認識プログラムをAC3に送信する(ステップS1)。CPE21の演算部21aは、CPU11からの画像認識プログラムをRAM4にストアする。
その処理Y,Zが終了すると、状態104からスタンバイ状態101へ戻る。
次に、本発明の第2の実施の形態を説明する。第2の実施の形態に係る情報処理装置用のACは、複数の汎用の処理部(PE)を有するだけでなく、さらに、複数のハード・マクロを有し、その複数のハード・マクロの動作についても、処理分担を決定して、かつ最適な消費電力で処理を実行するように制御する。
図9に示すように、AC3Aは、ハード・マクロとして、複数(ここでは2つ)のエンコーダ26A、26Bと、複数(ここでは2つ)のデコーダ26C、26Dとを有し、それぞれが、内部バス25を介して、CPE21と接続されている。以下、エンコーダ26A、26Bと、デコーダ26C、26Dとを、纏めて指すときは、あるいはその中の1つを指すときは、ハード・マクロ26という。
なお、本実施の形態においても、各F/V制御部26cは、対応するハード・マクロ26の動作及び処理能力の両方を制御するが、動作及び処理能力の少なくとも一方でもよい。
その場合におけるCPU11の処理の流れは、図3及び図4と同様である。すなわち、CPU11は、画像認識プログラムをAC3Aに送信し、CPE21の演算部21aは、CPU11からの画像認識プログラムをRAM4にストアする。そして、CPU11は、画像認識処理の対象である対象データのアドレスと、認識処理の結果データのアドレスと、画像認識プログラムについての負荷情報と、画像認識プログラムについての並列度情報とを、AC3Aへ送信する。AC3Aは、受信した負荷情報と並列度情報をRAM4に蓄積する。
一方、CPU11が、画像データのデコード処理を、AC3Aに依頼して行わせる場合、CPU11がAC3Aに対して、上述した画像認識処理のためのコマンドとは異なる、所定のコマンドを出力する。なお、CPU11は、画像データのデコード処理の依頼を、上述した画像認識の処理の依頼と同時に行ってもよいし、別々に行ってもよい。AC3Aは、そのコマンドを受信してCPU11により指定されたデコード処理を、ハード・マクロ26を用いて行う。
デコード処理について、図12を用いて説明する。図12は、CPE21におけるデコード処理の例を示すフローチャートである。
CPE21は、CPU11から上述したデコード処理を依頼されると、受信した負荷情報と並列度情報を参照し、その負荷情報と並列度情報をRAM4にストアする(ステップS11)。
よって、本実施の形態によれば、AC3Aは、自律的に、内部の複数のPE22と複数のハード・マクロ26における処理分担を決定し、かつ消費電力を考慮して動作及び処理能力を決定して、CPU11から依頼された処理を実行するようにしたので、AC3Aは、最適な消費電力で依頼された処理を行うことができる。
Claims (5)
- アクセラレータと、前記アクセラレータと接続されプロセッサとを有する情報処理装置であって、
前記アクセラレータは、プログラムを実行可能なアクセラレータであって、
前記プログラムを並列処理により実行可能な複数の演算部と、
前記複数の演算部のそれぞれの動作及び処理能力の少なくとも一方を制御する動作制御部と、
実行する前記プログラムについての負荷情報と並列度情報に基づいて、前記プログラムの実行のための、前記複数の演算部のそれぞれの前記動作及び処理能力の少なくとも一方を決定して、その決定に応じて前記動作制御部を制御する制御部と、
を有し、
前記アクセラレータは、前記プロセッサから、前記プログラムの実行前に、前記プログラムと前記プログラムについての前記負荷情報及び前記並列度情報とを受信することを特徴とする情報処理装置。 - 前記プロセッサと接続され、前記プロセッサへの信号の入出力を制御する第1の入出力制御部と、
前記プロセッサと前記第1の入出力制御部を介して接続され、前記プロセッサへの信号の入出力を制御する第2の入出力制御部と、を含み、
前記アクセラレータは、前記第2の入出力制御部に接続されていることを特徴とする請求項1に記載の情報処理装置。 - アクセラレータと、前記アクセラレータと接続されプロセッサとを有する情報処理装置であって、
前記アクセラレータは、プログラムを実行可能なアクセラレータであって、
前記プログラムを並列処理により実行可能な複数の演算部と、
対象データに対する所定の処理を並列に実行可能な複数のハードウエアエンジン部と、
前記複数の演算部および前記複数のハードウエアエンジン部のそれぞれの動作及び処理能力の少なくとも一方を制御する動作制御部と、
実行する前記プログラムについての第1の負荷情報と第1の並列度情報に基づいて、前記複数の演算部のそれぞれの前記動作及び処理能力の少なくとも一方を決定して、かつ前記対象データについての第2の負荷情報と第2の並列度情報に基づいて、前記複数のハードウエアエンジン部のそれぞれの前記動作及び処理能力の少なくとも一方を決定して、その決定に応じて前記動作制御部を制御する制御部と、
を有し、
前記アクセラレータは、前記プロセッサから、前記プログラムの実行前に、前記プログラムと、前記対象データと、前記プログラムについての前記第1の負荷情報及び前記第1の並列度情報と、前記対象データに関する前記第2の負荷情報及び前記第2の並列度情報とを受信することを特徴とする情報処理装置。 - 前記プロセッサと接続され、前記プロセッサへの信号の入出力を制御する第1の入出力制御部と、
前記プロセッサと前記第1の入出力制御部を介して接続され、前記プロセッサへの信号の入出力を制御する第2の入出力制御部と、を含み、
前記アクセラレータは、前記第2の入出力制御部に接続されることを特徴とする請求項3に記載の情報処理装置。 - プログラムを並列処理により実行可能な複数の演算部、前記複数の演算部のそれぞれの動作及び処理能力の少なくとも一方を制御する動作制御部、及び前記動作制御部を制御する制御部を有するアクセラレータと、前記アクセラレータと接続されたプロセッサとを含む情報処理装置を用いる情報処理方法であって、
前記アクセラレータは、前記プロセッサから、前記プログラムの実行前に、前記プログラムと前記プログラムについての負荷情報及び並列度情報とを受信し、
前記制御部は、実行する前記プログラムについての前記負荷情報と前記並列度情報に基づいて、前記プログラムの実行のための、前記複数の演算部のそれぞれの前記動作及び処理能力の少なくとも一方を決定して、その決定に応じて前記動作制御部を制御することを特徴とする情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007304273A JP4945410B2 (ja) | 2006-12-06 | 2007-11-26 | 情報処理装置及び情報処理方法 |
US11/950,901 US8046565B2 (en) | 2006-12-06 | 2007-12-05 | Accelerator load balancing with dynamic frequency and voltage reduction |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006329868 | 2006-12-06 | ||
JP2006329868 | 2006-12-06 | ||
JP2007304273A JP4945410B2 (ja) | 2006-12-06 | 2007-11-26 | 情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008165746A JP2008165746A (ja) | 2008-07-17 |
JP4945410B2 true JP4945410B2 (ja) | 2012-06-06 |
Family
ID=39547223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007304273A Expired - Fee Related JP4945410B2 (ja) | 2006-12-06 | 2007-11-26 | 情報処理装置及び情報処理方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4945410B2 (ja) |
CN (1) | CN101196776B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012008019A1 (ja) * | 2010-07-13 | 2012-01-19 | 富士通株式会社 | 情報処理装置、情報処理装置の制御方法及びプログラム |
WO2012135019A2 (en) * | 2011-03-29 | 2012-10-04 | Lyrical Labs LLC | Video encoding system and method |
JP2013143652A (ja) * | 2012-01-10 | 2013-07-22 | Canon Inc | 情報処理装置、情報処理方法 |
JP2013143653A (ja) * | 2012-01-10 | 2013-07-22 | Canon Inc | 情報処理装置、情報処理方法 |
JP5950811B2 (ja) * | 2012-12-13 | 2016-07-13 | Kddi株式会社 | 条件テーブルからクエリエントリに一致する条件エントリを検索する検索装置、フロースイッチ装置、プログラム及び方法 |
US9747185B2 (en) | 2013-03-26 | 2017-08-29 | Empire Technology Development Llc | Acceleration benefit estimator |
CN110688169B (zh) * | 2019-09-16 | 2021-10-08 | 腾讯科技(深圳)有限公司 | 应用程序加速方法及装置、存储介质、电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3946393B2 (ja) * | 1999-10-19 | 2007-07-18 | 株式会社東芝 | 階層構造をもつ並列計算機 |
KR20020028814A (ko) * | 2000-10-10 | 2002-04-17 | 나조미 커뮤니케이션즈, 인코포레이티드 | 마이크로코드 엔진을 이용한 자바 하드웨어 가속기 |
US7174194B2 (en) * | 2000-10-24 | 2007-02-06 | Texas Instruments Incorporated | Temperature field controlled scheduling for processing systems |
US20040039940A1 (en) * | 2002-08-23 | 2004-02-26 | Koninklijke Philips Electronics N.V. | Hardware-based packet filtering accelerator |
CN100430896C (zh) * | 2002-10-29 | 2008-11-05 | 洛克希德马丁公司 | 硬件解析器加速器 |
JP4057989B2 (ja) * | 2003-09-26 | 2008-03-05 | 株式会社東芝 | スケジューリング方法および情報処理システム |
US20050228967A1 (en) * | 2004-03-16 | 2005-10-13 | Sony Computer Entertainment Inc. | Methods and apparatus for reducing power dissipation in a multi-processor system |
EP2207103A1 (en) * | 2004-04-01 | 2010-07-14 | Panasonic Corporation | Integrated circuit for video/audio processing |
JP4082706B2 (ja) * | 2005-04-12 | 2008-04-30 | 学校法人早稲田大学 | マルチプロセッサシステム及びマルチグレイン並列化コンパイラ |
-
2007
- 2007-11-26 JP JP2007304273A patent/JP4945410B2/ja not_active Expired - Fee Related
- 2007-12-06 CN CN200710196783.5A patent/CN101196776B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101196776B (zh) | 2014-06-25 |
JP2008165746A (ja) | 2008-07-17 |
CN101196776A (zh) | 2008-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240028094A1 (en) | Techniques To Enable Communication Between A Processor And Voltage Regulator | |
JP4945410B2 (ja) | 情報処理装置及び情報処理方法 | |
CN110109527B (zh) | 动态电压裕度恢复 | |
JP2024024042A (ja) | プロセッサの最適スロットルのためのシステム、機器、及び方法 | |
US8046565B2 (en) | Accelerator load balancing with dynamic frequency and voltage reduction | |
KR101529016B1 (ko) | 멀티-코어 시스템 에너지 소비 최적화 | |
US20080271035A1 (en) | Control Device and Method for Multiprocessor | |
KR101930183B1 (ko) | 명령어 세트 아키텍처의 상이한 부분들을 구현하는 다수의 비유사 프로세서 코어들을 포함하는 프로세서 | |
KR20180048886A (ko) | 커맨드 스트림 힌팅을 사용한 gpu 작업부하 특성화 및 전력 관리 | |
KR20170019444A (ko) | 시스템 메모리의 온도 제어 | |
KR20130024155A (ko) | 이종의 가속기들 사이에서 스위칭할 수 있는 데이터 처리 시스템과 그 방법 | |
JP5776688B2 (ja) | 情報処理装置及びタスク切り替え方法 | |
JP2011118871A (ja) | イベント処理のためのターボ性能を向上させる方法および装置 | |
KR101930659B1 (ko) | 다수의 비유사 프로세서 코어들을 포함하는 프로세서 | |
US20140025930A1 (en) | Multi-core processor sharing li cache and method of operating same | |
US10409350B2 (en) | Instruction optimization using voltage-based functional performance variation | |
CN113748397A (zh) | 用于动态控制处理器的处理电路的电流消耗的系统、装置和方法 | |
KR20130020420A (ko) | 반도체 장치의 태스크 스케쥴링 방법 | |
TWI432953B (zh) | 具電源管理之超長指令處理器以及其電源管理裝置與方法 | |
EP3881181B1 (en) | System, apparatus and method for configurable control of asymmetric multi-threading (smt) on a per core basis | |
US20170068575A1 (en) | Hardware Migration between Dissimilar Cores | |
CN109791427B (zh) | 使用滑动平均值的处理器电压控制 | |
KR20210091048A (ko) | Soc의 동적 열 분배를 위한 시스템, 장치 및 방법 | |
EP3857336A1 (en) | System, apparatus and method for collective power control of multiple intellectual property agents and a shared power rail | |
US11921564B2 (en) | Saving and restoring configuration and status information with reduced latency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120305 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |