JP5607832B2 - 汎用論理演算の方法および装置 - Google Patents
汎用論理演算の方法および装置 Download PDFInfo
- Publication number
- JP5607832B2 JP5607832B2 JP2013530347A JP2013530347A JP5607832B2 JP 5607832 B2 JP5607832 B2 JP 5607832B2 JP 2013530347 A JP2013530347 A JP 2013530347A JP 2013530347 A JP2013530347 A JP 2013530347A JP 5607832 B2 JP5607832 B2 JP 5607832B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- bit
- bits
- immediate
- index value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000012545 processing Methods 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 23
- 101100534231 Xenopus laevis src-b gene Proteins 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 101100058681 Drosophila melanogaster Btk29A gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30145—Instruction analysis, e.g. decoding, instruction word fields
- G06F9/3016—Decoding the operand specifier, e.g. specifier format
- G06F9/30167—Decoding the operand specifier, e.g. specifier format of immediate specifier, e.g. constants
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30029—Logical and Boolean instructions, e.g. XOR, NOT
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
- G06F9/30038—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations using a mask
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/34—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Executing Machine-Instructions (AREA)
- Advance Control (AREA)
Description
即値=11111111
本例において、即値から読み込んだ全てのビットが、宛先レジスタにおいてバイナリ値1となる。
即値=01010101
(例えば、現在のx86命令セット内で実行される)現在のNOT命令が、オリジナルのデータを分解し、位置的に反転される。対照的に、上記の即値を用いる上述した技術は、異なるレジスタへのコピーを行う。この命令は、dest=NOT src1となる。
即値=10001000
この即値によって、ソースレジスタ1およびソースレジスタ2内の値のAND演算となり、つまりdest=src1 AND src2となる。ビット0−3およびビット7−4は同じなので、宛先レジスタ内の値(dest)は結果に影響を与えない。よって、一実施形態において、宛先レジスタは読み込まれず、電力消費量が減少する。
即値=01111000
この即値は、ソースレジスタ1およびソースレジスタ2のAND演算となり、宛先レジスタ内の値のXORされた結果が得られる。命令は、dest=(src1 AND src2)XOR destとなる。上述したように、従来の技術ではこの演算を実行するには、複数の異なる命令を実行するしかなく、多大な時間および処理リソースを要した。対照的に、上記で特定した即値を用いることにより、本明細書で説明する他の演算と同じ時間内で結果を得ることが可能となる。
即値=10101100
この演算の目的は、宛先レジスタ内の対応するビットが設定される場合にソースレジスタ1を選択し、そうでなければソースレジスタ2を設定することにある。従来、この処理には多大な数の命令を要するdest=(src1 AND dest)OR(src2 AND(NOT dest))などの論理が必要であった。対照的に、上記で特定した即値を用いることにより、本明細書で説明する他の即値演算と同程度の効率性で、結果を得ることが出来る。
即値=11101000
この演算を用い、3つの入力値のうち、最もポピュラーなものを選択する。例えば、宛先レジスタ内のビットが0であり、ソースレジスタ1内のビットが1であり、ソースレジスタ2内のビットが0であった場合、0が最もポピュラーな出力となる。よって、0が選択され、宛先レジスタ内に格納される。
for (i = 0; i < 64; i++) {
index = (dest[i]<<2) | (src2[i]<<1) | (src1[i]);
dest[i] = imm8[index];
}
for (n = 0; n < 16; n++) {
if(mask[n] != 0) {
for (j = 0; j < 32; j++) {
i = 32*n + j;
index = (dest[i]<<2) | (src2[i]<<1) | (src1[i]);
dest[i] = imm8[index];
}
}
}
for (n = 0; n < 16; n++) {
for (j = 0; j < 32; j++) {
i = 32*n + j;
index = (dest[i]<<3) | (src3[i]<<2)
| (src2[i]<<1) | (src1[i]);
dest[i] = imm16[index];
}
}
図3は、例示的な処理コア300を示し、本願発明の実施形態は、処理コア300上で実施することが出来る。汎用処理コア300は、Complex Instruction Set(CISC)、Reduced Instruction Set(RISC)およびVery Long Instruction Word (VLIW)などの異なる多くのタイプの処理コアアーキテクチャを表し得る。図3の汎用処理コア300は、1)(例えばキャッシュおよび/またはメモリから)命令をフェッチするフェッチユニット303、2)命令を復号化する復号ユニット304、3)実行ユニット306への命令の発行のタイミングおよび/または順序を決定する(任意選択的に含まれる)スケジューリングユニット305、4)命令を実行する実行ユニット306(典型的な命令実行ユニットは、分岐実行ユニット、(例えばALUなどの)整数演算実行ユニット、(例えばFPUなどの)浮動小数点演算実行ユニット、メモリアクセス実行ユニットを含む)、および5)命令の実行成功を示すリタイヤユニット307を含む。なお、処理コア300は、マイクロコード308を用いても、用いなくてもよい。マスクレジスタ302は、上述した本願発明の実施形態に従い用いてもよい。
以下に示すのは、本明細書で説明する命令を実行するのに適したシステムの例である。ラップトップ、デスクトップ、ハンドヘルドPC、携帯情報端末、エンジニアリングワークステーション、サーバ、ネットワークデバイス、ネットワークハブ、スイッチ、組み込みプロセッサ、デジタル信号プロセッサ(DSP)、グラフィックデバイス、ビデオゲームデバイス、セットトップボックス、マイクロコントローラ、携帯電話、ポータブルメディアプレーヤ、ハンドヘルドデバイス、およびその他様々な電子デバイスなどの、当技術分野で公知の他のシステム設計および構成も適している。一般的に、本明細書で開示するプロセッサおよび/または他の実行論理を組み込むことの出来る、多様なシステムまたは電子デバイスが適している。
[項目1]
コンピュータプロセッサ上で論理演算を実行する方法であり、
2以上のソースオペランドのそれぞれからデータを読み込む段階と、
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成する段階と、
即値から、指標値により識別されるビットのサブセットを読み込む段階と、
即値から読み込まれたビットを宛先レジスタ内に格納し、命令の結果を生成する段階と
を備える、方法。
[項目2]
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成する段階は、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、指標値を生成する段階を有し、
指標値は、即値内のビット位置を識別する対応するビット位置からの連結されたビットの各セットからなる、項目1に記載の方法。
[項目3]
即値の識別されたビット位置からビットを読み込む段階と、
各ソースオペランドから読み込んだビットのビット位置に対応する宛先レジスタ内のビット位置に結果を格納する段階と
をさらに備える、項目2に記載の方法。
[項目4]
ソースオペランドはNビットのソースレジスタに格納されており、
宛先レジスタはNビットの宛先レジスタであり、
ビットを連結し、指標値を生成する段階は、
ソースオペランドから並行してN個のビットの全てを読み込み、即値のN個の指標を形成する段階と、
N個の指標を用い、即値内のN個のビット位置を識別する段階と、
即値から宛先レジスタへN個のインデックス付きのビットの全てを並行してコピーし、論理演算の結果を生成する段階と
をさらに有する、項目1から3のいずれか1項に記載の方法。
[項目5]
Nは64に等しい、項目4に記載の方法。
[項目6]
ソースオペランドは3つあり、
即値は8ビットであり、
3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、指標値を生成する段階をさらに備え、
指標値は、8ビットの即値内のビット位置を識別する対応するビット位置からの3つの連結されたビットの各セットからなる、項目1から5のいずれか1項に記載の方法。
[項目7]
即値は、命令と共に送信された8ビットの値である、項目1から6のいずれか1項に記載の方法。
[項目8]
8ビットの値はimm8値である、項目7に記載の方法。
[項目9]
即値は、命令と共に送信された16ビットの値である、項目1から8のいずれか1項に記載の方法。
[項目10]
命令を処理する装置であり、
命令をデコードし、命令によって実行される論理演算を識別するデコーダユニットと、
動作を実行することにより、論理演算を実行する実行ユニットと
を備え、
動作は、
2以上のソースオペランドのそれぞれからデータを読み込むことと、
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することと、
指標値により識別される即値からビットのサブセットを読み込むことと、
即値から読み込まれたビットを宛先レジスタ内に格納し、命令の結果を生成することと
を含む、装置。
[項目11]
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することは、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、指標値を生成することを含み、
指標値は、即値内のビット位置を識別する対応するビット位置からの連結されたビットの各セットからなる、項目10に記載の装置。
[項目12]
実行ユニットが実行する動作は、
即値の識別されたビット位置からビットを読み込むことと、
各ソースオペランドから読み込んだビットのビット位置に対応する宛先レジスタ内のビット位置に結果を格納することと
をさらに含む、項目11に記載の装置。
[項目13]
ソースオペランドはNビットのソースレジスタに格納されており、
宛先レジスタはNビットの宛先レジスタであり、
ビットを連結し、指標値を生成することは、
ソースオペランドから並行してN個のビットの全てを読み込み、即値のN個の指標を形成することと、
N個の指標を用い、即値内のN個のビット位置を識別することと、
即値から宛先レジスタへN個のインデックス付きのビットの全てを並行してコピーし、論理演算の結果を生成することと
をさらに含む、項目10から12のいずれか1項に記載の装置。
[項目14]
Nは64に等しい、項目13に記載の装置。
[項目15]
ソースオペランドは3つあり、
即値は8ビットであり、
実行ユニットが実行する動作は、3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、指標値を生成することをさらに含み、
指標値は、8ビットの即値内のビット位置を識別する対応するビット位置からの3つの連結されたビットの各セットからなる、項目10から14のいずれか1項に記載の装置。
[項目16]
即値は、命令と共に送信された8ビットの値である、項目10から15のいずれか1項に記載の装置。
[項目17]
8ビットの値はimm8値である、項目16に記載の装置。
[項目18]
即値は、命令と共に送信された16ビットの値である、項目10から17のいずれか1項に記載の装置。
[項目19]
コンピュータシステムであり、
ディスプレイと、
命令を格納するメモリと、
命令を処理するプロセッサと
を備え、
プロセッサは、
命令をデコードし、命令によって実行される論理演算を識別するデコーダユニットと、
動作を実行することにより、論理演算を実行する実行ユニットと
を有し、
動作は、
2以上のソースオペランドのそれぞれからデータを読み込むことと、
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することと、
指標値により識別される即値からビットのサブセットを読み込むことと、
即値から読み込まれたビットを宛先レジスタ内に格納し、命令の結果を生成することと、を含むコンピュータシステム。
[項目20]
ソースオペランドから読み込んだデータを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することは、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、指標値を生成することを含み、
指標値は、即値内のビット位置を識別する対応するビット位置からの連結されたビットの各セットからなる、項目19に記載のコンピュータシステム。
[項目21]
実行ユニットが実行する動作は、
即値の識別されたビット位置からビットを読み込むことと、
各ソースオペランドから読み込んだビットのビット位置に対応する宛先レジスタ内のビット位置に結果を格納することと
をさらに含む、項目20に記載のコンピュータシステム。
[項目22]
ソースオペランドはNビットのソースレジスタに格納されており、
宛先レジスタはNビットの宛先レジスタであり、
ビットを連結し、指標値を生成することは、
ソースオペランドから並行してN個のビットの全てを読み込み、即値のN個の指標を形成することと、
N個の指標を用い、即値内のN個のビット位置を識別することと、
即値から宛先レジスタへN個のインデックス付きのビットの全てを並行してコピーし、論理演算の結果を生成することと
をさらに含む、項目19から21のいずれか1項に記載のコンピュータシステム。
[項目23]
Nは64に等しい、項目22に記載のコンピュータシステム。
[項目24]
ソースオペランドは3つあり、
即値は8ビットであり、
実行ユニットが実行する動作は、3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、指標値を生成することをさらに含み、
指標値は、8ビットの即値内のビット位置を識別する対応するビット位置からの3つの連結されたビットの各セットからなる、項目19から23のいずれか1項に記載のコンピュータシステム。
[項目25]
即値は、命令と共に送信された8ビットの値である、項目19から24のいずれか1項に記載のコンピュータシステム。
[項目26]
8ビットの値はimm8値である、項目25に記載のコンピュータシステム。
[項目27]
即値は、命令と共に送信された16ビットの値である、項目19から26のいずれか1項に記載のコンピュータシステム。
Claims (27)
- コンピュータプロセッサ上で論理演算を実行する方法であり、
2以上のソースオペランドのそれぞれからデータを読み込む段階と、
前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成する段階と、
前記即値から、前記指標値により識別される前記ビットのサブセットを読み込む段階と、
前記即値から読み込まれた前記ビットを宛先レジスタ内に格納し、前記命令の結果を生成する段階と
を備える、方法。 - 前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成する段階は、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、前記指標値を生成する段階を有し、
前記指標値は、前記即値内のビット位置を識別するためのものである、請求項1に記載の方法。 - 前記指標値により識別された前記即値内の前記ビット位置からビットを読み込む段階と、
前記即値内から読み込まれたビットを宛先レジスタ内の所定のビット位置に格納する段階とをさらに備え、
前記所定のビット位置は、前記指標値を生成するために連結されたビットが存在した、各ソースオペランド内でのビット位置に対応するものである、
請求項2に記載の方法。 - 前記ソースオペランドはNビットのソースレジスタに格納されており、
前記宛先レジスタはNビットの宛先レジスタであり、
前記ビットを連結し、前記指標値を生成する段階は、
それぞれの前記ソースオペランドからN個のビットの全てを読み込み、前記即値内のビット位置を識別する指標値をN個生成する段階を有し、
さらに、前記方法は、
前記N個の指標値を用い、前記即値内のN個のビット位置を識別して、識別したN個のビット位置からN個のビットを読み込む段階と、
前記即値から読み込んだN個のビットの全てを宛先レジスタに格納することにより、前記論理演算の前記結果を生成する段階と
をさらに有する、請求項2又は3に記載の方法。 - Nは64に等しい、請求項4に記載の方法。
- 前記ソースオペランドは3つあり、
前記即値は8ビットであり、
前記3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、前記指標値を生成する段階をさらに備え、
前記指標値は、8ビットの前記即値内のビット位置を識別するためのものである、請求項1から5のいずれか1項に記載の方法。 - 前記即値は、前記命令と共に送信された8ビットの値である、請求項1から6のいずれか1項に記載の方法。
- 前記8ビットの値はimm8値である、請求項7に記載の方法。
- 前記即値は、前記命令と共に送信された16ビットの値である、請求項1から5のいずれか1項に記載の方法。
- 命令を処理する装置であり、
命令をデコードし、前記命令によって実行される論理演算を識別するデコーダユニットと、
動作を実行することにより、前記論理演算を実行する実行ユニットと
を備え、
前記動作は、
2以上のソースオペランドのそれぞれからデータを読み込むことと、
前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することと、
前記即値から、前記指標値により識別される前記ビットのサブセットを読み込むことと、
前記即値から読み込まれた前記ビットを宛先レジスタ内に格納し、前記命令の結果を生成することと
を含む、装置。 - 前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することは、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、前記指標値を生成することを含み、
前記指標値は、前記即値内のビット位置を識別するためのものである、請求項10に記載の装置。 - 前記実行ユニットが実行する前記動作は、
前記指標値により識別された前記即値内の前記ビット位置から前記ビットを読み込むことと、
前記即値内から読み込まれたビットを前記宛先レジスタ内の所定のビット位置に格納することとをさらに含み、
前記所定のビット位置は、前記指標値を生成するために連結されたビットが存在した、各ソースオペランド内でのビット位置に対応するものである、
請求項11に記載の装置。 - 前記ソースオペランドはNビットのソースレジスタに格納されており、
前記宛先レジスタはNビットの宛先レジスタであり、
前記ビットを連結し、前記指標値を生成することは、
それぞれの前記ソースオペランドからN個のビットの全てを読み込み、前記即値内のビット位置を識別する指標値をN個生成することを含み、
さらに、前記実行ユニットが実行する前記動作は、
前記N個の指標値を用い、前記即値内のN個のビット位置を識別して、識別したN個のビット位置からN個のビットを読み込むことと、
前記即値から読み込んだN個のビットの全てを宛先レジスタに格納することにより、前記論理演算の前記結果を生成することと
をさらに含む、請求項11又は12に記載の装置。 - Nは64に等しい、請求項13に記載の装置。
- 前記ソースオペランドは3つあり、
前記即値は8ビットであり、
前記実行ユニットが実行する前記動作は、前記3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、前記指標値を生成することをさらに含み、
前記指標値は、8ビットの前記即値内のビット位置を識別するためのものである、請求項10から14のいずれか1項に記載の装置。 - 前記即値は、前記命令と共に送信された8ビットの値である、請求項10から15のいずれか1項に記載の装置。
- 前記8ビットの値はimm8値である、請求項16に記載の装置。
- 前記即値は、前記命令と共に送信された16ビットの値である、請求項10から14のいずれか1項に記載の装置。
- コンピュータシステムであり、
ディスプレイと、
命令を格納するメモリと、
前記命令を処理するプロセッサと
を備え、
前記プロセッサは、
命令をデコードし、前記命令によって実行される論理演算を識別するデコーダユニットと、
動作を実行することにより、前記論理演算を実行する実行ユニットと
を有し、
前記動作は、
2以上のソースオペランドのそれぞれからデータを読み込むことと、
前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することと、
前記即値から、前記指標値により識別される前記ビットのサブセットを読み込むことと、
前記即値から読み込まれた前記ビットを宛先レジスタ内に格納し、前記命令の結果を生成することと、を含むコンピュータシステム。 - 前記ソースオペランドから読み込んだ前記データを組み合わせ、命令と関連付けられた即値内のビットのサブセットを特定する指標値を生成することは、各ソースオペランドの対応するビット位置から読み込んだビットを連結し、前記指標値を生成することを含み、
前記指標値は、前記即値内のビット位置を識別するためのものである、請求項19に記載のコンピュータシステム。 - 前記実行ユニットが実行する前記動作は、
前記指標値により識別された前記即値内の前記ビット位置から前記ビットを読み込むことと、
前記即値内から読み込まれたビットを前記宛先レジスタ内の所定のビット位置に格納することとをさらに含み、
前記所定のビット位置は、前記指標値を生成するために連結されたビットが存在した、各ソースオペランド内でのビット位置に対応するものである、
請求項20に記載のコンピュータシステム。 - 前記ソースオペランドはNビットのソースレジスタに格納されており、
前記宛先レジスタはNビットの宛先レジスタであり、
前記ビットを連結し、前記指標値を生成することは、
それぞれの前記ソースオペランドからN個のビットの全てを読み込み、前記即値内のビット位置を識別する指標値をN個生成することを含み、
さらに、前記実行ユニットが実行する前記動作は、
前記N個の指標値を用い、前記即値内のN個のビット位置を識別して、識別したN個のビット位置からN個のビットを読み込むことと、
前記即値から読み込んだN個のビットの全てを宛先レジスタに格納することにより、前記論理演算の前記結果を生成することと
をさらに含む、請求項20又は21に記載のコンピュータシステム。 - Nは64に等しい、請求項22に記載のコンピュータシステム。
- 前記ソースオペランドは3つあり、
前記即値は8ビットであり、
前記実行ユニットが実行する前記動作は、前記3つのソースオペランドのうちそれぞれの対応するビット位置から読み込んだビットを連結し、前記指標値を生成することをさらに含み、
前記指標値は、8ビットの前記即値内のビット位置を識別するためのものである、請求項19から23のいずれか1項に記載のコンピュータシステム。 - 前記即値は、前記命令と共に送信された8ビットの値である、請求項19から24のいずれか1項に記載のコンピュータシステム。
- 前記8ビットの値はimm8値である、請求項25に記載のコンピュータシステム。
- 前記即値は、前記命令と共に送信された16ビットの値である、請求項19から23のいずれか1項に記載のコンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/890,571 | 2010-09-24 | ||
US12/890,571 US8539206B2 (en) | 2010-09-24 | 2010-09-24 | Method and apparatus for universal logical operations utilizing value indexing |
PCT/US2011/052913 WO2012040552A2 (en) | 2010-09-24 | 2011-09-23 | Method and apparatus for universal logical operations |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013543175A JP2013543175A (ja) | 2013-11-28 |
JP2013543175A5 JP2013543175A5 (ja) | 2014-07-31 |
JP5607832B2 true JP5607832B2 (ja) | 2014-10-15 |
Family
ID=45871870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013530347A Active JP5607832B2 (ja) | 2010-09-24 | 2011-09-23 | 汎用論理演算の方法および装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8539206B2 (ja) |
JP (1) | JP5607832B2 (ja) |
KR (1) | KR101524450B1 (ja) |
CN (1) | CN103109261B (ja) |
BR (1) | BR112013006661A2 (ja) |
DE (1) | DE112011103197T5 (ja) |
GB (1) | GB2499532B (ja) |
TW (2) | TWI435266B (ja) |
WO (1) | WO2012040552A2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120124341A1 (en) * | 2010-11-17 | 2012-05-17 | Goodrich Allen B | Methods and Apparatus for Performing Multiple Operand Logical Operations in a Single Instruction |
US20140095845A1 (en) * | 2012-09-28 | 2014-04-03 | Vinodh Gopal | Apparatus and method for efficiently executing boolean functions |
US9128698B2 (en) * | 2012-09-28 | 2015-09-08 | Intel Corporation | Systems, apparatuses, and methods for performing rotate and XOR in response to a single instruction |
US9471310B2 (en) * | 2012-11-26 | 2016-10-18 | Nvidia Corporation | Method, computer program product, and system for a multi-input bitwise logical operation |
GB2523823B (en) * | 2014-03-07 | 2021-06-16 | Advanced Risc Mach Ltd | Data processing apparatus and method for processing vector operands |
US20160179521A1 (en) * | 2014-12-23 | 2016-06-23 | Intel Corporation | Method and apparatus for expanding a mask to a vector of mask values |
US20160283242A1 (en) * | 2014-12-23 | 2016-09-29 | Intel Corporation | Apparatus and method for vector horizontal logical instruction |
US10296334B2 (en) * | 2014-12-27 | 2019-05-21 | Intel Corporation | Method and apparatus for performing a vector bit gather |
US10296489B2 (en) * | 2014-12-27 | 2019-05-21 | Intel Corporation | Method and apparatus for performing a vector bit shuffle |
EP3782088B1 (en) * | 2018-04-20 | 2024-06-05 | Google LLC | Performing unitary iteration and indexed operations |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4237532A (en) * | 1977-09-02 | 1980-12-02 | Sperry Corporation | Table driven decision and control logic for digital computers |
EP0349124B1 (en) * | 1988-06-27 | 1996-10-09 | Digital Equipment Corporation | Operand specifier processing |
US5493687A (en) * | 1991-07-08 | 1996-02-20 | Seiko Epson Corporation | RISC microprocessor architecture implementing multiple typed register sets |
US5881307A (en) | 1997-02-24 | 1999-03-09 | Samsung Electronics Co., Ltd. | Deferred store data read with simple anti-dependency pipeline inter-lock control in superscalar processor |
JPH1185507A (ja) * | 1997-09-05 | 1999-03-30 | Mitsubishi Electric Corp | 中央処理装置およびマイクロコンピュータシステム |
TW498275B (en) * | 1999-05-24 | 2002-08-11 | Toshiba Corp | Processor unit |
US6892373B2 (en) * | 2001-06-15 | 2005-05-10 | Science & Technology Corporation At Unm | Integrated circuit cell library |
US6721866B2 (en) | 2001-12-21 | 2004-04-13 | Intel Corporation | Unaligned memory operands |
US7014122B2 (en) * | 2003-12-24 | 2006-03-21 | International Business Machines Corporation | Method and apparatus for performing bit-aligned permute |
US7464255B1 (en) | 2005-07-28 | 2008-12-09 | Advanced Micro Devices, Inc. | Using a shuffle unit to implement shift operations in a processor |
US8732686B2 (en) * | 2006-06-30 | 2014-05-20 | Intel Corporation | Generating optimal instruction sequences for bitwise logical expressions |
US20080021942A1 (en) * | 2006-07-20 | 2008-01-24 | On Demand Microelectronics | Arrangements for evaluating boolean functions |
US20080100628A1 (en) * | 2006-10-31 | 2008-05-01 | International Business Machines Corporation | Single Precision Vector Permute Immediate with "Word" Vector Write Mask |
CN101178644B (zh) * | 2006-11-10 | 2012-01-25 | 上海海尔集成电路有限公司 | 一种基于复杂指令集计算机结构的微处理器架构 |
US7941641B1 (en) | 2007-10-01 | 2011-05-10 | Yong-Kyu Jung | Retargetable instruction decoder for a computer processor |
-
2010
- 2010-09-24 US US12/890,571 patent/US8539206B2/en active Active
-
2011
- 2011-09-23 JP JP2013530347A patent/JP5607832B2/ja active Active
- 2011-09-23 BR BR112013006661A patent/BR112013006661A2/pt not_active IP Right Cessation
- 2011-09-23 GB GB1306690.7A patent/GB2499532B/en active Active
- 2011-09-23 CN CN201180046100.2A patent/CN103109261B/zh active Active
- 2011-09-23 KR KR1020137008232A patent/KR101524450B1/ko active IP Right Grant
- 2011-09-23 TW TW100134372A patent/TWI435266B/zh not_active IP Right Cessation
- 2011-09-23 WO PCT/US2011/052913 patent/WO2012040552A2/en active Application Filing
- 2011-09-23 TW TW103104892A patent/TWI512618B/zh not_active IP Right Cessation
- 2011-09-23 DE DE112011103197T patent/DE112011103197T5/de not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
GB2499532A (en) | 2013-08-21 |
CN103109261B (zh) | 2016-03-09 |
KR101524450B1 (ko) | 2015-06-02 |
TW201432564A (zh) | 2014-08-16 |
DE112011103197T5 (de) | 2013-07-04 |
WO2012040552A2 (en) | 2012-03-29 |
TWI512618B (zh) | 2015-12-11 |
BR112013006661A2 (pt) | 2016-06-07 |
JP2013543175A (ja) | 2013-11-28 |
US8539206B2 (en) | 2013-09-17 |
WO2012040552A3 (en) | 2012-05-18 |
GB201306690D0 (en) | 2013-05-29 |
GB2499532B (en) | 2020-04-01 |
KR20130064797A (ko) | 2013-06-18 |
US20120079244A1 (en) | 2012-03-29 |
CN103109261A (zh) | 2013-05-15 |
TW201232392A (en) | 2012-08-01 |
TWI435266B (zh) | 2014-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5607832B2 (ja) | 汎用論理演算の方法および装置 | |
JP6351682B2 (ja) | 装置および方法 | |
US9766897B2 (en) | Method and apparatus for integral image computation instructions | |
CN109716290B (zh) | 用于经融合的乘加的系统、装置和方法 | |
CN107918546B (zh) | 利用经掩码的全寄存器访问实现部分寄存器访问的处理器、方法和系统 | |
US20120166511A1 (en) | System, apparatus, and method for improved efficiency of execution in signal processing algorithms | |
TWI502490B (zh) | 用以處理加法指令之方法、及用以執行加法指令之裝置與系統 | |
JP2018506094A (ja) | 多倍長整数(big integer)の算術演算を実行するための方法および装置 | |
KR101927858B1 (ko) | Rsa 알고리즘 가속 프로세서들, 방법들, 시스템들 및 명령어들 | |
TW201721409A (zh) | 向量運算指令 | |
JP2018500659A (ja) | 高速ベクトルによる動的なメモリ競合検出 | |
US9904548B2 (en) | Instruction and logic to perform a centrifuge operation | |
JP2014182796A (ja) | 書き込みマスク・レジスタの末尾の最下位マスキング・ビットを判定するためのシステム、装置、および方法 | |
JP6773378B2 (ja) | 3d座標から3dのz曲線インデックスを計算するための機械レベル命令 | |
CN109643235B (zh) | 用于多源混合操作的装置、方法和系统 | |
JP5798650B2 (ja) | 短整数の乗算の数を減らすためのシステム、装置、および方法 | |
CN111814093A (zh) | 一种乘累加指令的处理方法和处理装置 | |
KR20170097012A (ko) | 역 원심 연산을 수행하는 명령어 및 로직 | |
JP5753603B2 (ja) | データ要素内のビットをゼロ化するためのシステム、装置、および方法 | |
CN116339826A (zh) | 用于四字特定部分的向量紧缩串接和移位的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20140610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140730 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5607832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |