JP2006195563A - 演算処理装置 - Google Patents
演算処理装置 Download PDFInfo
- Publication number
- JP2006195563A JP2006195563A JP2005004223A JP2005004223A JP2006195563A JP 2006195563 A JP2006195563 A JP 2006195563A JP 2005004223 A JP2005004223 A JP 2005004223A JP 2005004223 A JP2005004223 A JP 2005004223A JP 2006195563 A JP2006195563 A JP 2006195563A
- Authority
- JP
- Japan
- Prior art keywords
- data
- arithmetic
- conversion
- data format
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Executing Machine-Instructions (AREA)
Abstract
【解決手段】ALU1はプロセッサから入力された通常の2進数のデータを格納している複数のレジスタ31−1〜31−mのデータを用いて論理演算処理および算術演算処理を実行して演算結果をレジスタ31−1〜31−mに格納し、ALU2はレジスタ31−1〜31−mに対応付けられて符号変換部5によって符号変換が施された剰余数系のデータを格納している複数の変換レジスタ41−1〜41−mのデータを用いて論理演算処理および算術演算処理を実行して演算結果を変換レジスタ41−1〜41−mに格納し、変換レジスタ41−1〜41−mに格納されているデータをプロセッサに出力する際には、剰余数系のデータに逆符号変換を施して通常の2進数に変換した後に出力する。
【選択図】 図1
Description
図1〜図4を用いてこの発明の実施の形態1を説明する。この発明にかかる演算処理装置は、CPU(Central Processing Unit)やDSP(Digital Signal Processor)などのプロセッサに適用され、プロセッサが実行するプログラムの命令によって制御されて、算術論理演算処理を実行する。
「0101_1110_0010_0000_0110_1011_0101_1010_1101」
で表され、剰余数系では「8」は、
「1001_1001_1000_1000_0100_0010_0001_0000_1000」
で表され、「13」と「8」の積「104」は剰余数系では、
「1010_0110_0101_0000_0100_1011_0010_0010_1011」
で表され、剰余数系の特性から剰余同士で演算を行なえばよい。したがって、数値Nを3の剰余(2ビット)、5の剰余(3ビット)、7の剰余(3ビット)、11の剰余(4ビット)、13の剰余(4ビット)、19の剰余(5ビット)、23の剰余(5ビット)、29の剰余(5ビット)、31の剰余(5ビット)の36ビットを用いて通常の2進数の32ビットを表す場合、3の剰余の2ビット、5の剰余の3ビット、7の剰余の3ビット、11の剰余の4ビット、13の剰余の4ビット、19の剰余の5ビット、23の剰余の5ビット、29の剰余の5ビット、および31の剰余の5ビットの演算を行なう回路構成となる。すなわち、ALU1が通常の2進数の32ビットでの演算を行なうのに対して、ALU2は、剰余数系を用いることで最大5ビットの演算を行なえばよく、32ビットの全てのビットに影響をおよぼすキャリーの伝播遅延が、最大5ビットのキャリーの伝播遅延となり、演算時間を高速にすることができる回路構成となっている。
図5を用いてこの発明の実施の形態2を説明する。図5は、この発明にかかる演算処理装置の実施の形態2の構成を示すブロック図である。図5に示した演算処理装置は、図1に示した実施の形態1の演算処理装置と構成部分は全て同じであるが、プロセッサとの接続が異なっている。図1に示した実施の形態1の演算処理装置は、ALU1およびレジスタファイル3がプロセッサの入力用内部バス7aに接続され、プロセッサからの入力データはALU1によってレジスタ31−1〜31−mに格納された。しかし、図5に示したこの実施の形態2の演算処理装置は、符号変換部5が入力用内部バス7aに接続されている。
図6を用いてこの発明の実施の形態3を説明する。図6は、この発明にかかる実施の形態3の演算処理装置の構成を示すブロック図である。図6に示した実施の形態3の演算処理装置は、図1に示した実施の形態1の演算処理装置のALU1の代わりにLU10(特許請求の範囲でいうところの論理演算処理部)を備え、ALU2の代わりにAU20(特許請求の範囲でいうところの算術演算処理部)を備えている。図1に示した実施の形態1の演算処理装置と同じ機能を持つ構成部分には同一符号を付し、重複する説明は省略する。
図8を用いてこの発明にかかる実施の形態4を説明する。図8は、この発明にかかる実施の形態4の演算処理装置の構成を示すブロック図である。図8に示した演算処理装置は、先の図1に示した実施の形態1の演算処理装置の変換レジスタファイル4の代わりに、変換レジスタファイル4aを備えている。図1に示した実施の形態1の演算処理装置と同じ機能を持つ構成部分には同一符号を付し、重複する説明は省略する。
「0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0001_1001」
となり、第2のデータ形式が冗長2進数系の場合、
「0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0000_0101_0001」
となる。
3 レジスタファイル
4 変換レジスタファイル
5 符号変換部
7a 入力用内部バス
7b 出力用内部バス
8 制御バス
10 LU
20 AU
31−1,31−2,31−3,31−m レジスタ
32−1,32−2,32−3,32−m,42−1,42−2,42−3,42−m,42a−1,42a−2,42a−3 フラグ
41−1,41−2,41−3,41−m,41a−1,41a−2,41a−3 変換レジスタ
Claims (10)
- プロセッサから入力された命令に基づいて、前記プロセッサから入力されたデータに論理演算処理または算術演算処理を施して演算処理結果を出力する演算処理装置において、
前記データおよび前記演算処理結果を前記プロセッサが認識する第1のデータ形式で格納するレジスタと、
前記複数のレジスタに対応付けられて、前記データおよび前記演算処理結果を前記第1のデータ形式とは異なる符合の第2のデータ形式で格納する変換レジスタと、
前記第1のデータ形式のデータに符号変換を施して前記第2のデータ形式のデータに変換して前記変換レジスタに格納するとともに、前記第2のデータ形式のデータに逆符号変換を施して前記第1のデータ形式に変換して前記レジスタに格納する符号変換部と、
前記命令に基づいて前記レジスタに格納されている前記第1のデータ形式のデータを用いて論理演算処理および算術演算処理を実行する算術論理演算処理部と、
前記命令に基づいて前記変換レジスタに格納されている前記第2のデータ形式のデータを用いて論理演算処理および算術演算処理を実行する変換算術論理演算処理部と、
を備え、
前記第2のデータ形式のデータを前記第1のデータ形式のデータに変換した後に、前記プロセッサに算術演算処理の演算結果を出力すること、
を特徴とする演算処理装置。 - 前記算術論理演算処理部は、
前記プロセッサから入力された第1のデータ形式のデータを前記命令によって指定されたレジスタに格納し、
前記符号変換部は、
前記命令が算術演算処理を示す場合に前記レジスタに格納されている第1のデータ形式のデータに符号変換を施して第2のデータ形式のデータに変換し、変換したデータを前記レジスタに対応する変換レジスタに格納し、
前記変換算術論理演算処理部は、
前記変換レジスタに格納された第2のデータ形式のデータを用いて算術演算処理を実行し、実行した算術演算処理の演算結果を前記変換レジスタに格納すること、
を特徴とする請求項1に記載の演算処理装置。 - 前記符号変換部は、
前記プロセッサから入力された第1のデータ形式のデータを前記命令によって指定されたレジスタに格納するとともに、前記第1のデータ形式のデータに符号変換を施して前記第2のデータ形式のデータに変換し、変換したデータを前記命令によって指定されたレジスタに対応する前記変換レジスタに格納すること、
を特徴とする請求項1に記載の演算処理装置。 - 前記複数のレジスタの一部に対応する数だけ前記変換レジスタを備えることを特徴とする請求項1〜3の何れか一つに記載の演算処理装置。
- 前記第1のデータ形式を通常の2進数とし、前記第2のデータ形式を剰余数系、SD数系、冗長2進系、またはBoothのアルゴリズムに基づく係数とすることを特徴とする請求項1〜4の何れか一つに記載の演算処理装置。
- プロセッサから入力された命令に基づいて、前記プロセッサから入力されたデータに論理演算処理または算術演算処理を施して演算処理結果を出力する演算処理装置において、
前記データおよび前記演算処理結果を前記プロセッサが認識する第1のデータ形式で格納する複数のレジスタと、
前記データおよび前記演算処理結果を前記第1のデータ形式とは異なる符合の第2のデータ形式で格納する前記複数のレジスタに対応する複数の変換レジスタと、
前記第1のデータ形式のデータに符号変換を施して前記第2のデータ形式のデータに変換して前記変換レジスタに格納するとともに、前記第2のデータ形式のデータに逆符号変換を施して前記第1のデータ形式に変換して前記レジスタに格納する符号変換部と、
前記命令に基づいて前記レジスタに格納されている前記第1のデータ形式のデータを用いて論理演算処理を実行する論理演算処理部と、
前記命令に基づいて前記変換レジスタに格納されている前記第2のデータ形式のデータを用いて算術演算処理を実行する変換算術演算処理部と、
を備え、
前記第2のデータ形式のデータを前記第1のデータ形式のデータに変換した後に、前記プロセッサに算術演算処理の演算結果を出力すること、
を特徴とする演算処理装置。 - 前記論理演算処理部は、
前記プロセッサから入力された第1のデータ形式のデータを前記命令によって指定されたレジスタに格納し、
前記符号変換部は、
前記命令が算術演算処理を示す場合に前記レジスタに格納されている第1のデータ形式のデータに符号変換を施して第2のデータ形式のデータに変換し、変換したデータを前記レジスタに対応する変換レジスタに格納し、
前記変換算術演算処理部は、
前記変換レジスタに格納された第2のデータ形式のデータを用いて算術演算処理を実行し、実行した算術演算処理の演算結果を前記変換レジスタに格納すること、
を特徴とする請求項6に記載の演算処理装置。 - 前記符号変換部は、
前記プロセッサから入力された第1のデータ形式のデータを前記命令によって指定されたレジスタに格納するとともに、前記第1のデータ形式のデータに符号変換を施して前記第2のデータ形式のデータに変換し、変換したデータを前記命令によって指定されたレジスタに対応する前記変換レジスタに格納すること、
を特徴とする請求項6に記載の演算処理装置。 - 前記複数のレジスタの一部に対応する数だけ前記変換レジスタを備えることを特徴とする請求項6〜8の何れか一つに記載の演算処理装置。
- 前記第1のデータ形式を通常の2進数とし、前記第2のデータ形式を剰余数系、SD数系、冗長2進系、またはBoothのアルゴリズムに基づく係数とすることを特徴とする請求項6〜9の何れか一つに記載の演算処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005004223A JP2006195563A (ja) | 2005-01-11 | 2005-01-11 | 演算処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005004223A JP2006195563A (ja) | 2005-01-11 | 2005-01-11 | 演算処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006195563A true JP2006195563A (ja) | 2006-07-27 |
Family
ID=36801625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005004223A Pending JP2006195563A (ja) | 2005-01-11 | 2005-01-11 | 演算処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006195563A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6284334A (ja) * | 1985-10-08 | 1987-04-17 | Nec Corp | 情報処理方式 |
JPH02282821A (ja) * | 1989-04-25 | 1990-11-20 | Seiko Epson Corp | 数値演算装置 |
JP2001520775A (ja) * | 1997-04-18 | 2001-10-30 | サーティカム コーポレイション | 算術プロセッサ |
JP2004514960A (ja) * | 2000-05-12 | 2004-05-20 | ジ アテナ グループ インコーポレーティッド | 剰余演算を用いて計算を行う方法および装置 |
-
2005
- 2005-01-11 JP JP2005004223A patent/JP2006195563A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6284334A (ja) * | 1985-10-08 | 1987-04-17 | Nec Corp | 情報処理方式 |
JPH02282821A (ja) * | 1989-04-25 | 1990-11-20 | Seiko Epson Corp | 数値演算装置 |
JP2001520775A (ja) * | 1997-04-18 | 2001-10-30 | サーティカム コーポレイション | 算術プロセッサ |
JP2004514960A (ja) * | 2000-05-12 | 2004-05-20 | ジ アテナ グループ インコーポレーティッド | 剰余演算を用いて計算を行う方法および装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6371855B2 (ja) | プロセッサ、方法、システム、プログラム、及び非一時的機械可読記憶媒体 | |
US10209989B2 (en) | Accelerated interlane vector reduction instructions | |
JP6456867B2 (ja) | 密結合ヘテロジニアスコンピューティングのためのハードウェアプロセッサ及び方法 | |
JP6162203B2 (ja) | 命令に応じた丸め処理の実行 | |
CN108647044B (zh) | 浮点缩放处理器、方法、系统和指令 | |
CN110879724A (zh) | 用于深度学习和其它算法的fp16-s7e8混合精度 | |
EP2435906B1 (en) | Dsp engine with implicit mixed operands | |
TWI474258B (zh) | 用於執行浮點捨入量決定指令之方法、裝置、系統及機器可讀取儲存媒體 | |
TW201104569A (en) | Microprocessors and methods for executing instruction | |
JPWO2006112045A1 (ja) | 演算処理装置 | |
TW201118725A (en) | Microprocessor and method for enhanced precision sum-of-products calculation on a microprocessor | |
US10564932B2 (en) | Methods for calculating floating-point operands and apparatuses using the same | |
JP2018506094A (ja) | 多倍長整数(big integer)の算術演算を実行するための方法および装置 | |
US20030037085A1 (en) | Field processing unit | |
Boersma et al. | The POWER7 binary floating-point unit | |
EP3671432B1 (en) | Arithmetic processing device and method of controlling arithmetic processing device | |
US8117422B2 (en) | Fast address translation for linear and circular modes | |
CN111752533A (zh) | 用于矩阵运算的加速器系统和方法 | |
US11656870B2 (en) | Systems, apparatuses, and methods for dual complex multiply add of signed words | |
JP2006195563A (ja) | 演算処理装置 | |
TW201716990A (zh) | 執行模式選擇的方法與裝置 | |
CN112988230A (zh) | 用于将大约为一的浮点值相乘的指令的装置、方法和系统 | |
JP6497250B2 (ja) | 演算処理装置および演算処理装置の制御方法 | |
JP2001216136A (ja) | 加算回路およびプロセッサ | |
US11669586B2 (en) | Systems and methods for combining low-mantissa units to achieve and exceed FP64 emulation of matrix multiplication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100511 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100519 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100914 |