JP2013210738A - ベクトル処理装置、ベクトル演算処理装置の制御方法 - Google Patents
ベクトル処理装置、ベクトル演算処理装置の制御方法 Download PDFInfo
- Publication number
- JP2013210738A JP2013210738A JP2012079361A JP2012079361A JP2013210738A JP 2013210738 A JP2013210738 A JP 2013210738A JP 2012079361 A JP2012079361 A JP 2012079361A JP 2012079361 A JP2012079361 A JP 2012079361A JP 2013210738 A JP2013210738 A JP 2013210738A
- Authority
- JP
- Japan
- Prior art keywords
- mask
- vector
- instruction
- register
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】ベクトル命令発行手段102は、命令保持手段101から命令を読み出して発行するとともに、マスクデータ生成命令を実行しているかを示すマスクデータ生成命令実行中フラグ114を保持する。マスクレジスタ107は、複数のマスクデータを保持する。1ビットマスク演算器113は、マスクレジスタ107から1ビット毎に読み出されたマスクデータを用いてマスク演算処理を行う。マスク演算器109は、マスクレジスタ107から一括して読み出された全マスクデータを用いてマスク演算処理を行う。n+1ビットマスクレジスタ選択手段108は、マスクデータ生成命令実行中フラグ114の値に基づいて、1ビットマスク演算器113の出力、またはマスク演算器109の出力の一方をマスクレジスタ107に書き込む。
【選択図】図6
Description
命令を保持する命令保持手段と、
前記命令保持手段から命令を読み出して発行するとともに、マスクデータの生成を指示するマスクデータ生成命令を実行しているか否かを示すフラグ情報を保持するベクトル命令発行手段と、
複数のマスクデータを保持するマスクレジスタと、
前記マスクレジスタから1ビット毎に読み出されたマスクデータを用いてマスク演算処理を行う分割マスク演算器と、
前記マスクレジスタから一括して読み出された全マスクデータを用いてマスク演算処理を行う一括マスク演算器と、
前記フラグ情報が前記マスクデータ生成命令の実行を示す値である場合に前記分割マスク演算器からの出力を前記マスクレジスタに書き込むように制御し、前記フラグ情報が前記マスクデータ生成命令の実行を示す値ではない場合に前記一括マスク演算器からの出力を前記マスクレジスタに書き込むように制御するマスクデータ選択手段と、
を備える、ものである。
マスクデータを保持するマスクレジスタと、1ビット単位でのマスク演算処理を行う分割マスク演算器と、前記マスクレジスタのデータサイズのマスク演算処理を行う一括マスク演算器を有するベクトル処理装置の制御方法であって、
マスクデータの生成を指示するマスクデータ生成命令の処理中には、後続するマスク演算命令を、前記マスクレジスタからビット単位でマスクデータを読み出し、読み出したマスクデータを前記分割マスク演算器によって演算して演算結果を前記マスクレジスタに書き込み、
マスクデータの生成を指示するマスクデータ生成命令の処理中ではない場合には、後続するマスク演算命令を、前記マスクレジスタから前記マスクデータを一括して読み出し、読み出したマスクデータを前記一括マスク演算器によって演算して演算結果を前記マスクレジスタに書き込む、ものである。
以下、図面を参照して本発明の実施の形態について説明する。本実施の形態にかかるベクトル処理装置の構成、及び動作の説明に先立ち、当該ベクトル処理装置が処理する命令について説明する。なお、後述するマスクレジスタ107は、マスクレジスタの更新指示がない限り、常に同じ値を保持する。
図3は、本実施の形態にかかるベクトル処理装置の構成を示すブロック図である。本実施の形態にかかるベクトル処理装置は、命令記憶手段101、ベクトル命令発行手段102、ベクトルレジスタ103−1、103−2、ベクトルレジスタ選択手段104、ベクトル演算器105、演算結果選択手段106、マスクレジスタ107−1〜3、n+1ビットマスクレジスタ選択手段(マスクデータ選択手段)108、マスク演算器(一括マスク演算器)109、1/n選択手段110−1〜3、ビットシフタ111−1〜3、1ビットマスク演算器(分割マスク演算器)113を具備する。
続いて、図4及び図5を参照して、本実施の形態にかかるベクトル処理装置の動作について説明する。図4は、本実施の形態にかかるベクトル処理装置と図1に示すベクトル処理装置(マスク演算の一括処理を行う構成)の動作を比較するタイムチャートである。以下の例では、両ベクトル処理装置の命令記憶手段101には、マスクデータ生成命令、マスク演算命令、マスク付きベクトル命令が格納されている。
以上、本実施の形態にかかるベクトル処理装置は、マスクデータ生成命令実行中フラグ114の状態(点灯、消灯)に応じて、後続の命令の実行を制御している。詳細には、本実施の形態にかかるベクトル処理装置は、マスクデータ生成命令実行中フラグ114の状態(点灯、消灯)に応じて、使用する演算器(マスク演算器109、1ビットマスク演算器113)を切り替えている。これにより、本実施の形態にかかるベクトル処理装置は、先行するマスクデータ生成命令の実行の如何に関わらず、後続のマスク演算命令を速やかに処理することができる。
以下、図6を参照して、本発明の本質的な構成、及び動作について改めて説明する。図6は、本発明にかかるベクトル処理装置の本質的な処理を行う処理部を示すブロック図である。なお、当該ベクトル処理装置は、図示しないもののベクトルレジスタ、ベクトル演算器等といったベクトル処理装置が備えるべき各種処理部を適宜備えることは勿論である。
102 ベクトル命令発行手段
103 ベクトルレジスタ
104 ベクトルレジスタ選択手段
105 ベクトル演算器
106 演算結果選択手段
107 マスクレジスタ
108 n+1ビットマスクレジスタ選択手段
109 マスク演算器
110 1/n選択手段
111 ビットシフタ
112 1ビットマスクレジスタ選択手段
113 1ビットマスク演算器
114 マスクデータ生成命令実行中フラグ
Claims (6)
- 命令を保持する命令保持手段と、
前記命令保持手段から命令を読み出して発行するとともに、マスクデータの生成を指示するマスクデータ生成命令を実行しているか否かを示すフラグ情報を保持するベクトル命令発行手段と、
複数のマスクデータを保持するマスクレジスタと、
前記マスクレジスタから1ビット毎に読み出されたマスクデータを用いてマスク演算処理を行う分割マスク演算器と、
前記マスクレジスタから一括して読み出された全マスクデータを用いてマスク演算処理を行う一括マスク演算器と、
前記フラグ情報が前記マスクデータ生成命令の実行を示す値である場合に前記分割マスク演算器からの出力を前記マスクレジスタに書き込むように制御し、前記フラグ情報が前記マスクデータ生成命令の実行を示す値ではない場合に前記一括マスク演算器からの出力を前記マスクレジスタに書き込むように制御するマスクデータ選択手段と、
を備えるベクトル処理装置。 - 前記ベクトル命令発行手段は、
1クロックサイクル毎に前記命令保持手段から命令を読み出して発行することを特徴とする請求項1に記載のベクトル処理装置。 - 前記マスクレジスタに格納された各マスクデータと対応するベクトルデータを保持するベクトルレジスタと、
前記ベクトル命令発行手段が発行した命令に応じて、前記ベクトルレジスタからベクトルデータを読み出すベクトルレジスタ選択手段と、
前記ベクトルレジスタ選択手段が読み出したベクトルデータを用いてベクトル演算を行うベクトル演算器と、
をさらに備えていることを特徴とする請求項1または請求項2に記載のベクトル処理装置。 - 前記命令の種別として、前記マスクデータ生成命令、マスク演算命令、マスク付きベクトル命令を含むことを特徴とする請求項1乃至請求項3のいずれか1項に記載のベクトル処理装置。
- 前記マスクレジスタの各要素に保持されたマスクデータと、前記ベクトルレジスタの各要素に保持されたベクトルデータと、が要素番号によって対応付けられていることを特徴とする請求項3に記載のベクトル処理装置。
- マスクデータを保持するマスクレジスタと、
1ビット単位でのマスク演算処理を行う分割マスク演算器と、
前記マスクレジスタのデータサイズのマスク演算処理を行う一括マスク演算器と、
を有するベクトル処理装置の制御方法であって、
マスクデータの生成を指示するマスクデータ生成命令の処理中には、後続するマスク演算命令を、前記マスクレジスタからビット単位でマスクデータを読み出し、読み出したマスクデータを前記分割マスク演算器によって演算して演算結果を前記マスクレジスタに書き込み、
マスクデータの生成を指示するマスクデータ生成命令の処理中ではない場合には、後続するマスク演算命令を、前記マスクレジスタから前記マスクデータを一括して読み出し、読み出したマスクデータを前記一括マスク演算器によって演算して演算結果を前記マスクレジスタに書き込む、
ベクトル処理装置の制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012079361A JP5881163B2 (ja) | 2012-03-30 | 2012-03-30 | ベクトル処理装置、ベクトル演算処理装置の制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012079361A JP5881163B2 (ja) | 2012-03-30 | 2012-03-30 | ベクトル処理装置、ベクトル演算処理装置の制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013210738A true JP2013210738A (ja) | 2013-10-10 |
JP5881163B2 JP5881163B2 (ja) | 2016-03-09 |
Family
ID=49528536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012079361A Active JP5881163B2 (ja) | 2012-03-30 | 2012-03-30 | ベクトル処理装置、ベクトル演算処理装置の制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5881163B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6059469A (ja) * | 1983-09-09 | 1985-04-05 | Nec Corp | ベクトル処理装置 |
JPH04116770A (ja) * | 1990-09-07 | 1992-04-17 | Koufu Nippon Denki Kk | ベクトルデータ処理装置 |
JPH0991272A (ja) * | 1995-09-27 | 1997-04-04 | Kofu Nippon Denki Kk | ベクトルデータ処理装置 |
-
2012
- 2012-03-30 JP JP2012079361A patent/JP5881163B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6059469A (ja) * | 1983-09-09 | 1985-04-05 | Nec Corp | ベクトル処理装置 |
JPH04116770A (ja) * | 1990-09-07 | 1992-04-17 | Koufu Nippon Denki Kk | ベクトルデータ処理装置 |
JPH0991272A (ja) * | 1995-09-27 | 1997-04-04 | Kofu Nippon Denki Kk | ベクトルデータ処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5881163B2 (ja) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414197B (zh) | 数据处理系统、编译器、处理器的方法和机器可读介质 | |
US10831490B2 (en) | Device and method for scheduling multiple thread groups on SIMD lanes upon divergence in a single thread group | |
KR101766183B1 (ko) | 벡터 소팅 알고리즘 및 다른 알고리즘들을 지원하기 위한 트리 구조를 갖춘 기능 유닛 | |
US10437593B2 (en) | Techniques for comprehensively synchronizing execution threads | |
JP2007519052A (ja) | 命令制御式データ処理装置 | |
WO2015114305A1 (en) | A data processing apparatus and method for executing a vector scan instruction | |
KR102495792B1 (ko) | 가변 파면 크기 | |
JP2021166053A (ja) | 非同期パイプラインのステージの動作速度の制御 | |
JP6551751B2 (ja) | マルチプロセッサ装置 | |
Hall et al. | Sparser, better, faster GPU parsing | |
WO2010044242A1 (ja) | データ処理装置 | |
WO2015017129A4 (en) | Multi-threaded gpu pipeline | |
JP5881163B2 (ja) | ベクトル処理装置、ベクトル演算処理装置の制御方法 | |
CN108228242B (zh) | 一种可配置且具弹性的指令调度器 | |
JP5630798B1 (ja) | プロセッサーおよび方法 | |
JP2020527797A (ja) | データ処理装置におけるベクトル・インタリーブ | |
JP5413473B2 (ja) | ベクトル処理装置およびベクトル処理方法 | |
JP5871298B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
US10073773B2 (en) | Instruction paging in reconfigurable fabric | |
JP5491113B2 (ja) | ベクトル処理装置、ベクトル処理方法、およびプログラム | |
JP7157457B2 (ja) | データ処理装置 | |
JP6381019B2 (ja) | 情報処理装置及び制御方法 | |
JP2009086870A (ja) | ベクトル処理装置 | |
US20130061000A1 (en) | Software compiler generated threaded environment | |
JP2013077216A (ja) | プロセッサ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20140807 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5881163 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |