JP6108362B2 - 不連続命令指定子の連続命令指定子への変換 - Google Patents

不連続命令指定子の連続命令指定子への変換 Download PDF

Info

Publication number
JP6108362B2
JP6108362B2 JP2014561527A JP2014561527A JP6108362B2 JP 6108362 B2 JP6108362 B2 JP 6108362B2 JP 2014561527 A JP2014561527 A JP 2014561527A JP 2014561527 A JP2014561527 A JP 2014561527A JP 6108362 B2 JP6108362 B2 JP 6108362B2
Authority
JP
Japan
Prior art keywords
field
instruction
specifier
bits
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014561527A
Other languages
English (en)
Other versions
JP2015514242A (ja
Inventor
グシュビント、マイケル、カール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2015514242A publication Critical patent/JP2015514242A/ja
Application granted granted Critical
Publication of JP6108362B2 publication Critical patent/JP6108362B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30181Instruction operation extension or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/52Binary to binary
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
    • G06F9/30038Instructions to perform operations on packed data, e.g. vector, tile or matrix operations using a mask
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30098Register arrangements
    • G06F9/3012Organisation of register space, e.g. banked or distributed register file
    • G06F9/30138Extension of register space, e.g. register cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30145Instruction analysis, e.g. decoding, instruction word fields
    • G06F9/3016Decoding the operand specifier, e.g. specifier format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/3017Runtime instruction translation, e.g. macros
    • G06F9/30174Runtime instruction translation, e.g. macros for non-native instruction set, e.g. Javabyte, legacy code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/34Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
    • G06F9/342Extension of operand address space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
    • G06F9/45516Runtime code conversion or optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Executing Machine-Instructions (AREA)
  • Advance Control (AREA)

Description

本発明は、一般にコンピューティング環境内のエミュレーションに関し、より具体的には命令内部の指定子のエミュレーションに関する。
エミュレーションは、ターゲット・アーキテクチャと呼ばれるコンピュータ・アーキテクチャ上の機能を模倣するものである。ターゲット・アーキテクチャは、機能が定義されたソース・アークテクチャと呼ばれるコンピュータ・アーキテクチャとは異なる。例えば、ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ・コーポレーションによって提供されるz/Architectureに対して書かれた命令を、異なるアークテクチャ、例えば、同じくインターナショナル・ビジネス・マシーンズ・コーポレーションによって提供されるPowerPC、又はインターナショナル・ビジネス・マシーンズ・コーポレーション若しくは他社によって提供される別のアーキテクチャの1以上の命令に翻訳して表すことができる。これらの翻訳された命令は、被翻訳命令と同じ又は類似の機能を実行する。
インタプリテーション(解釈)及びトランスレーション(翻訳)を含む種々のタイプのエミュレーションが存在する。インタプリテーションでは、ある命令を表すデータが読み込まれ、各命令がデコードされて実行される。各命令は、参照されるたびに実行される。しかし、バイナリ・トランスレーション又はリコンパイルとも呼ばれるトランスレーションでは、一連の命令が1つのコンピュータ・アークテクチャの命令セットから別のコンピュータ・アークテクチャの命令セットに翻訳される。
静的トランスレーション及び動的トランスレーションを含む複数のタイプのトランスレーションが存在する。静的トランスレーションにおいては、1つのアーキテクチャの命令のコードは、予めコードを実行することなく、他のアーキテクチャ上で実行されるコードに変換される。対照的に、動的トランスレーションにおいては、コードの少なくとも一セクションが実行及び翻訳され、その結果が、ターゲット・コンピュータ・アーキテクチャのプロセッサによる後続の実行のためにキャッシュ内に置かれる。
米国特許第5,551,013号明細書 米国特許第6,009,261号明細書 米国特許第5,574,873号明細書 米国特許第6,308,255号明細書 米国特許第6,463,582号明細書 米国特許第5,790,825号明細書
「z/Architecture Principles of Operation」、IBM(登録商標)出版番号SA22−7832−08、第9版、2010年8月 「Power ISA(商標) Version 2.06 Revision B」、インターナショナル・ビジネス・マシーンズ・コーポレーション、2010年7月23日 「Intel(登録商標) 64 and IA−32 Architectures Developer’s Manual: Vol. 2B, Instructions@ Set Reference, A−L」、注文番号253666−041US、2011年12月 「Intel(登録商標) 64 and IA−32 Architectures Developer’s Manual: Vol. 2B, Instruction Set Reference, M−Z」、注文番号253667−041US、2011年12月
不連続命令指定子を連続命令指定子に変換するためのコンピュータ・プログラム製品、コンピュータ・システム及び方法を提供すること。
コンピューティング環境の命令指定子を変換するためのコンピュータ・プログラム製品を提供することにより、従来技術の弱点に対処し、利点がもたらされる。このコンピュータ・プログラム製品は、処理回路により読み出し可能であり、且つ、方法を実施するための、処理回路による実行のための命令を格納するコンピュータ可読記憶媒体を含み、その方法は、プロセッサにより、第1のコンピュータ・アーキテクチャに対して定義された第1の命令から不連続指定子を取得するステップであって、この不連続指定子は、第1の部分及び第2の部分を有し、不連続指定子を取得するステップは、第1の部分を命令の第1のフィールドから取得するステップ、及び、第2の部分を命令の第2のフィールドから取得するステップを含み、前記第1のフィールドは、前記第2のフィールドから分離している、不連続指定子を取得するステップと、第1の部分及び第2の部分を使用して連続指定子を生成するステップであって、連続指定子を生成するステップは、第1の命令のオペコードに基づく1以上の規則を用いる、連続指定子を生成するステップと、第2の命令の実行に用いられるリソースを示すために連続指定子を使用するステップであって、第2の命令は、第1のコンピュータ・アーキテクチャとは異なる第2のコンピュータ・アーキテクチャに対して定義され、且つ、第1の命令の機能をエミュレートする、連続指定子を使用するステップと、を含む。
本発明の1以上の態様に関連する方法及びシステムもまた、本明細書で説明され、特許請求される。さらに、本発明の1以上の態様に関連するサービスもまた、本明細書で説明され、特許請求され得る。
本発明の技術を通じて、付加的な特徴及び利点が実現される。本発明の他の実施形態及び態様は、本明細書で詳細に説明され、特許請求される本発明の一部であると見なされる。
次に、本発明の実施形態について添付の図面を参照しながら、例示のみを目的として説明する。
本発明の1以上の態様を組み込み、用いるためのコンピューティング環境の一例を示す。 本発明の一態様による、図1のメモリの詳細を示す。 1以上のインタプリテーション及びトランスレーションを使用するエミュレーション・プロセスの概要の一実施形態を示す。 図3で参照されるインタプリテーション・ブロックに関連付けられる論理の一例を示す。 図3で参照されるトランスレーション・ブロックに関連付けられる論理の一例を示す。 本発明の一態様による、修正された1以上のインタプリテーション及びトランスレーションを使用するエミュレーション・プロセスの概要の別の実施形態を示す。 本発明の一態様による、図6において参照されるインタプリテーション・ブロックに関連付けられる論理の一例を示す。 本発明の一態様による、不連続指定子を連続指定子に変換するための論理の一実施形態を示す。 本発明の一態様による、図6において参照されるトランスレーション・ブロックに関連付けられる論理の一例を示す。 本発明の一態様による、1つのコンピュータ・アーキテクチャのVector Load(ベクトル・ロード)命令内の不連続指定子を、別のコンピュータ・アーキテクチャのLoad Vector Indexed(ロード・インデックス付きベクトル)命令内の連続指定子に変換することの一実施形態を示す。 本発明の一態様による、連続指定子に対する特定のレジスタの割当てを含む、図9Aの変換の別の例を示す。 本発明の一態様による、レジスタ・ファイルの例を示す。 本発明の一態様による、エミュレーション中のメモリの割当てにおいて不連続指定子を連続指定子に変換するステップの一例を示す。 本発明の1以上の態様を組み込むコンピュータ・プログラム製品の一実施形態を示す。 本発明の1以上の態様を組み込み、用いるためのホスト・コンピュータ・システムの一実施形態を示す。 本発明の1以上の態様を組み込み、用いるためのコンピュータ・システムの更に別の例を示す。 本発明の1以上の態様を組み込み、用いるためのコンピュータ・ネットワークを含むコンピュータ・システムの別の例を示す。 本発明の1以上の態様を組み込み、用いるためのコンピュータ・システムの種々の要素の一実施形態を示す。 本発明の1以上の態様を組み込み、用いるための、図16のコンピュータ・システムの実行ユニットの一実施形態を示す。 本発明の1以上の態様を組み込み、用いるための、図16のコンピュータ・システムの分岐ユニットの一実施形態を示す。 本発明の1以上の態様を組み込み、用いるための、図16のコンピュータ・システムのロード/ストア・ユニットの一実施形態を示す。 本発明の1以上の態様を組み込み、用いるためのエミュレートされたホスト・コンピュータ・システムの一実施形態を示す。
本発明の一態様により、不連続指定子を含む命令のエミュレーションを容易にするための技法が提供される。不連続指定子は、命令の複数のフィールドを用いて、レジスタなどの、命令のリソースを指定する。例えば、命令の複数のフィールド(例えば、2つのフィールド)が、その命令によって使用される特定のレジスタを一緒に指示するビットを含む。
本発明の特定の態様において、1つのコンピュータ・システム・アーキテクチャ(例えば、インターナショナル・ビジネス・マシーンズ・コーポレーションによって提供されるz/Architecture)において定義された命令の不連続指定子を、別のコンピュータ・システム・アーキテクチャ(例えば、インターナショナル・ビジネス・マシーンズ・コーポレーションによって提供されるPowerPCアーキテクチャ)において定義される命令によって使用可能な連続指定子に変換するための技法が提供される。別のコンピュータ・システム・アーキテクチャにおいて定義された命令は、1つのコンピュータ・システム・アーキテクチャに対して定義された命令をエミュレートする。
エミュレーションを提供するコンピューティング環境の一実施形態について図1を参照しながら説明する。一例において、コンピューティング環境100は、例えば1以上のバス108及び/又は他の接続を介して互いに結合された、例えば、ネイティブ中央演算処理ユニット102、メモリ104、並びに、1以上の入力/出力デバイス及び/又はインターフェース106を含む。例として、コンピューティング環境100は、ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ・コーポレーションによって提供されるPowerPCプロセッサ、pSeriesサーバ又はxSeriesサーバ、カリフォルニア州パロアルト所在のHewlett Packard Co.によって提供されるIntel Itanium IIプロセッサ、及び/又は、インターナショナル・ビジネス・マシーンズ・コーポレーション、Hewlett Packard、Intel、Oracleなどによって提供されるアーキテクチャに基づく他のマシンを含むことができる。
ネイティブ中央演算処理ユニット102は、環境内での処理の際に用いられる、1以上の汎用レジスタ及び/又は1以上の専用レジスタのような1以上のネイティブ・レジスタ110を含む。これらのレジスタは、任意の特定の時点における環境の状態を表す情報を含む。
さらに、ネイティブ中央演算処理ユニット102は、メモリ104内に格納された命令及びコードを実行する。1つの特定の例において、中央演算処理ユニットは、メモリ104内に格納されたエミュレータ・コード112を実行する。このコードにより、1つのアーキテクチャにおいて構成された処理環境が、別のアーキテクチャをエミュレートすることが可能になる。例えば、エミュレータ・コード112により、z/Architecture以外のアーキテクチャ、例えば、PowerPCプロセッサ、pSeriesサーバ又はxSeriesサーバ、HP Superdomeサーバなどに基づいたマシンが、z/Architectureをエミュレートし、z/Architectureに基づいて開発されたソフトウェア及び命令を実行することが可能になる。
エミュレータ・コード112に関するさらなる詳細について図2を参照しながら説明する。ゲスト命令200は、ネイティブCPU102のアーキテクチャとは異なるアーキテクチャにおいて実行されるように開発されたソフトウェア命令(例えば、マシン命令)を含む。例えば、ゲスト命令200は、z/Architecture上で実行されるように設計されていてもよいが、代わりに、例えばPowerPCプロセッサ又は他のタイプのプロセッサとすることができるネイティブCPU102上でエミュレートされる。一例において、エミュレータ・コード112は、1以上のゲスト命令200をメモリ104から取得し、取得された命令に対してローカル・バッファリングを任意に提供するための命令フェッチ・ユニット202を含む。エミュレータ・コード112はまた、取得されたゲスト命令のタイプを判断し、ゲスト命令を1以上の対応するネイティブ命令206に翻訳するための命令翻訳ルーチン204を含む。この翻訳は、例えば、ゲスト命令によって実行される機能を識別する(例えば、オペコードにより)ステップと、その機能を実行するためのネイティブ命令を選択するステップとを含む。
さらに、エミュレータ112は、ネイティブ命令を実行させるためのエミュレーション制御ルーチン210を含む。エミュレーション制御ルーチン210は、ネイティブCPU102に、予め取得された1以上のゲスト命令をエミュレートするネイティブ命令のルーチンを実行させ、こうした実行の最後に、次のゲスト命令又はゲスト命令のグループの取得をエミュレートするために、制御を命令フェッチ・ルーチンに戻させることができる。ネイティブ命令206の実行は、メモリ104からデータをレジスタにロードするステップ、データをレジスタから再びメモリに格納するステップ、又は、翻訳ルーチンによって決定される何らかのタイプの算術演算又は論理演算を実施するステップを含むことができる。
各ルーチンは、例えば、メモリ内に格納され、ネイティブ中央演算処理ユニット102によって実行される、ソフトウェアで実装される。他の例においては、1以上のルーチン又は演算は、ファームウェア、ハードウェア、ソフトウェア、又はこれらの幾つかの組合せで実装される。エミュレートされるプロセッサのレジスタは、ネイティブCPUのレジスタ110を使用して、又は、メモリ104内の位置を使用して、エミュレートすることができる。実施形態において、ゲスト命令200、ネイティブ命令206及びエミュレータ・コード112は、同じメモリ内に存在してもよく、又は、異なるメモリ・デバイスの間に分散されてもよい。
本明細書で用いられるファームウェアとは、例えば、プロセッサのマイクロコード、ミリコード、及び/又はマクロコードを含む。ファームウェアは、例えば、より高水準のマシン・コードの実装に用いられるハードウェア・レベルの命令及び/又はデータ構造体を含む。一実施形態において、ファームウェアは、例えば、典型的には、信頼できるソフトウェアを含むマイクロコードとして供給される専用コード、又は基礎となるハードウェアに特有のマイクロコードを含み、システム・ハードウェアへのオペレーティング・システムのアクセスを制御する。
一例において、取得され、翻訳され、実行されるゲスト命令200は、本明細書で説明される1以上の命令である。1つのアーキテクチャ(例えば、z/Architecture)の命令であるこの命令は、メモリからフェッチされ、翻訳され、別のアーキテクチャ(例えば、PowerPC、pSeries、xSeries、Intelなど)のネイティブ命令206のシーケンスとして表される。次に、これらのネイティブ命令が実行される。
エミュレーションに関するさらなる詳細について図3−図5を参照しながら説明する。具体的には、図3は、1以上のインタプリテーション及びトランスレーションを使用するエミュレーション・プロセスの概要の一実施形態を示し、図4は、図3で参照されるインタプリテーションに関連付けられる論理(技法2000)の一実施形態を示し、図5は、図3で参照されるバイナリ・トランスレーションに関連付けられる論理(技法3000)の一実施形態を示す。この具体的な例においては、z/Architecture用に書かれた命令がPowerPC命令に翻訳される。しかし、同じ技法を、z/Architectureから他のターゲット・アーキテクチャへのエミュレーション、他のソース・アーキテクチャからPowerPCアーキテクチャへのエミュレーション、及び/又は他のソース・アーキテクチャから他のターゲット・アーキテクチャへのエミュレーションに適用することができる。
図3を参照すると、エミュレーション中に、命令Xと呼ばれる命令が、図4を参照してさらに詳しく説明するように、取得され、解釈される(ステップ300)。解釈された命令に関する種々の統計量が更新され(ステップ302)、そして処理は、論理内の命令Xとなる次の命令に進む(ステップ304)。当該次の命令が、先行して翻訳されたエントリ・ポイントを有するか否かについて判断がなされる(照会306)。当該次の命令がエントリ・ポイントを有しない場合には、当該次の命令がN(例えば15)回参照されたか否かについて判断がなされる(照会308)。即ち、この命令が、例えば後続の使用のためのエントリ・ポイントを与えるコードのジャスト・イン・タイム(JIT)コンパイルを行うことにより、実行を最適化するために十分頻繁に参照されるか否かについて判断がなされる。この命令がN回、例えば15回参照されていない場合、処理は、ステップ300を続ける。そうでない場合には、処理は、命令グループを形成し、この命令グループを1つのアーキテクチャから別のアーキテクチャに翻訳するステップを続ける(ステップ310)。この翻訳を行うステップの一例は、図5を参照して説明する。命令グループを形成して翻訳するステップに続いて、このグループが実行され(ステップ312)、処理はステップ304に続く。
照会306に戻り、この命令について既に翻訳されたエントリ・ポイントが存在する場合、処理はそのエントリ・ポイントにおいて、このグループの実行を続ける(ステップ312)。
命令を解釈するステップ(技法2000)に関するさらなる詳細を、図4を参照しながら説明する。初めに、次のプログラム・カウンタ(PC)アドレスにおける命令が読み込まれる(ステップ400)。この命令が分析され、オペコード、レジスタ及び即値フィールドが抽出される(ステップ402)。次に、抽出されたオペコードに対応する動作をエミュレートするコードへの分岐が実行される(ステップ404)。次いでエミュレートされたコードが実行される(ステップ406)。
グループ内の命令を翻訳するステップ(技法3000)に関するさらなる詳細を、図5を参照しながら説明する。初めに、事前に定義されたグループ内の命令が読み込まれる(ステップ500)。一例において、このグループは、様々な方法を用いて形成することができる。一実施形態によれば、命令グループは、最も可能性の高いパスに沿った実行の単一パスを包含するように形成される。別の実施形態において、命令グループは、エミュレートされたアーキテクチャの状態に基づいて、直近の実行パスのうちの1つ、又は現在の実行パスを包含するように形成される。別の実施形態において、全ての分岐が行われないものと仮定される。さらに別の実施形態において、複数のパス、例えばそのグループの開始点から始まる全てのパスがグループ内に含められる。別の実施形態において、第1の分岐に至る及び第1の分岐を含む全ての命令がグループに加えられる(即ち、グループは、一般に「基本ブロック」としても知られる、コードの直線部分に対応する)。各々の実施形態において、いつどこでグループが終るかについての判断がなされなければならない。一実施形態において、グループは一定数の命令の後で終了する。別の実施形態において、グループは、ある命令に達する累積確率が所与の閾値より低くなった後で終了する。幾つかの実施形態において、グループは、終了条件に達すると直ちに終了する。別の実施形態のセットにおいて、命令グループは、明確な「終了点」、例えば、定められた命令、特定のグループ開始アライメント(specific group start alignment)、又は他の条件においてのみ終了する。
その後、命令が分析され、オペコード、レジスタ及び即値フィールドが命令から抽出される(ステップ502)。次に、抽出された情報の内部表現が提供される(ステップ504)。この内部表現は、抽出された情報の形式であり、プロセッサ(例えば、コンパイラ又はトランスレータ)は、これを用いて命令の翻訳に伴うデコーディング、レジスタ割当て、及び/又は他のタスクを最適化する。
さらに、グループ内に翻訳すべき別の命令が存在するか否かの判断がなされる(照会506)。存在する場合、処理は、ステップ500を続ける。そうでない場合、処理は、内部表現の最適化を続け(ステップ508)、1以上のレジスタを命令グループに割当て(ステップ510)、グループ内の命令をエミュレートするコードを生成する(ステップ512)。
上記のインタプリテーション及びトランスレーション手続きは、1つのアーキテクチャにおいて定義された命令を、別のアーキテクチャにおいて定義された1以上の命令にエミュレーションすることを規定するが、不連続指定子を使用する命令のエミュレーションにおいて発展させることができる。例えば、本発明の一態様により、命令のレジスタ・オペランドが命令の複数のフィールドによって指示されている状況に対処するエミュレーション技法が改善される。
不連続指定子を用いる1つのタイプの命令は、本発明の一態様により提供されるベクトル・ファシリティの一部分であるベクトル命令である。多くのベクトル命令において、レジスタ・フィールドは、命令によって使用されるレジスタを指示するのに必要なビットの全てを含むのではなく、レジスタを指示するのにレジスタ・フィールドと共に別のフィールドが使用される。この別のフィールドを、本明細書ではRXBフィールドと呼ぶ。
RXBフィールドは、レジスタ拡張ビットとも呼ばれ、例えば、あるベクトル命令のベクトル・レジスタ指示オペランドの各々についての最上位ビットを含む4ビットフィールド(ビット0−3)である。その命令によって指定されていないレジスタを指示するためのビットは、予約され、ゼロに設定される。
一例において、RXBビットは、以下のように定義される。
0−命令の第1のベクトル・レジスタ指示のための最上位ビット。
1−命令の第2のベクトル・レジスタ指示のための最上位ビット。
2−命令の第3のベクトル・レジスタ指示のための最上位ビット。
3−命令の第4のベクトル・レジスタ指示のための最上位ビット。
各ビットは、例えば、アセンブラによりレジスタ番号に応じてゼロ又は1に設定される。例えば、レジスタ0−15に対してビットは0に設定され、レジスタ16−31に対してビットは1に設定される、などである。
一実施形態において、各々のRXBビットは、1以上のベクトル・レジスタを含む命令における特定の位置に対する拡張ビットである。例えば、1以上のベクトル命令において、RXBのビット0は、位置8−11の拡張ビットであり、これが例えばVに割り当てられ、RXBのビット1は、位置12−15の拡張ビットであり、これが例えばVに割り当てられ、以下同様である。
さらに別の実施形態において、RXBフィールドは付加的なビットを含み、複数のビットが、各ベクトル又は位置のための拡張として用いられる。
本発明の一態様により、不連続オペランド指定子を連続指定子に変換する技法が提供される。ひとたび変換されると、不連続指定子を顧慮せずに連続指定子が用いられる。
不連続指定子を用いる命令をエミュレートする論理の一実施形態を、図6〜図8を参照しながら説明する。具体的には、図6は、不連続指定子を含む命令の1以上のインタプリテーション及びトランスレーションを含むエミュレーション・プロセスの概要を示し、図7Aは、不連続指定子のインタプリテーションを含む、インタプリテーションの一実施形態(技法6000)を示し、図7Bは、不連続指定子を連続指定子に変換するステップの一実施形態を示し、図8は、不連続指定子のトランスレーションを含む、トランスレーションの一実施形態(技法7000)を示す。
初めに図6を参照すると、エミュレーション・プロセスの概要が提示される。この概要はステップ600が、ステップ300において参照された技法2000の代りに、図7Aを参照して説明する技法6000を使用し、ステップ610が、ステップ310において参照された技法3000の代りに、図8を参照して説明する技法7000を使用する点を除き、図3に示す概要と同様である。概要については、図3を参照して上述したため、ここでは繰返さず、議論を図7Aの論理に進める。
図7Aを参照すると、ステップ700、702、704及び706は、それぞれ、図4のステップ400、402、404及び406と同様であるので、再度説明することはしないが、ステップ703及び705について説明する。ステップ703で、本発明の一態様によれば、連続指定子(本明細書では連続インデックスとも呼ぶ)が不連続指定子から生成される。不連続指定子からの連続指定子の生成に関するさらなる詳細について、図7Bを参照しながら説明する。
図7Bを参照すると、一実施形態において、初めに不連続指定子が取得される(ステップ750)。これは、例えば、その命令が不連続指定子を有することをオペコードから判断するステップと、その命令のどのフィールドが不連続指定子の指示に使用されているかを判断するステップとを含む。例えば、オペコードの一部分が、命令の形式を指定し、この形式が、当該命令が少なくとも1つの不連続指定子を有することをプロセッサに対して示し、且つ、この形式はさらに、不連続指定子の指示に使用されるフィールドを指定する。これらのフィールドは次に、これらのフィールド内のデータ(例えば、ビット)を取得するために読み込まれる。例えば、多くのベクトル命令において、命令の位置8−11(例えば、V)は、ベクトル・レジスタを指示するのに用いられる複数のビット(例えば4)を指定し、この命令のRXBフィールドは、特定のベクトル・レジスタを指示するのに用いられる1以上の付加的ビットを含む。これらのビットが、このステップにおいて取得される。
不連続指定子(例えば、レジスタ・フィールドVからのビット及びRXBからのビット)を取得するステップに続いて、1以上の規則を用いて、不連続指定子の部分を組み合せて連続指定子を生成する(ステップ752)。1以上の規則は、例えば、命令のオペコードによって指定される命令の形式に依存する。オペコードがRXBフィールドを示す特定の例において、1以上の規則は、レジスタ・オペランドに関連付けられたRXBビットを、レジスタ・フィールド内で指定されるビットの最上位ビットとして使用することを含む。例えば、RXBフィールドは、一実施形態において、4ビットを有し、各ビットがレジスタ・オペランドに対応する。例えば、ビット0が第1のレジスタ・オペランドに対応し、ビット1が第2のレジスタ・オペランドに対応し、以下同様である。従って、レジスタ・オペランドに対応するビットが抽出され、連続指定子を形成するのに使用される。例えば、2進数の0010が第1のオペランド・レジスタ・フィールド内で指定され、2進数の1000がRXBフィールド内で指定される場合、この例においてはビット0である第1のオペランドに関連付けられたビットの値が、0010に連結される。従って、連続指定子は、この例においては10010(レジスタ18)となる。
次に、生成された連続指定子が、あたかもその命令内に与えられた指定子であるかのように用いられる(ステップ754)。
その後、図7Aに戻ると、オペコードに対応する動作をエミュレートするコードへの分岐が実行される(ステップ704)。さらに、均質化された(homogenized)アーキテクチャ・リソースを管理するために、不連続指定子を顧慮せずに連続インデックスが使用される(ステップ705)。即ち、連続レジスタ指定子が、あたかも不連続指定子が存在しないかのように用いられる。各連続指定子は、エミュレーション・コードによって使用されるレジスタを示す。その後、エミュレーション・コードが実行される(ステップ706)。
不連続指定子を連続指定子に変換するステップ(技法7000)を含む、トランスレーションに関するさらなる詳細を、図8を参照しながら説明する。一実施形態において、ステップ800、802、804、806、808、810、及び812は、それぞれ、図5のステップ500、502、504、506、508、510、及び512と同様であるので、ここで図8を参照しながら説明することはしない。しかし、本発明の一態様により、さらに別のステップが、ソース・アーキテクチャの命令の不連続指定子をターゲット・アーキテクチャの命令の連続指定子に変換するために実行される。ターゲット・アーキテクチャの命令は、ソース・アーキテクチャの命令の機能をエミュレートする。
例えば、ステップ803において、連続指定子が不連続指定子から生成される。図7Bを参照しながら前述したように、このステップは、エミュレートされる命令から不連続指定子を取得するステップと、1以上の規則を用いて不連続指定子から連続指定子を作成するステップとを含む。一実施形態において、不連続指定子を有する命令のオペコードは、少なくとも暗黙的にその形式により、その命令が不連続指定子を含むことを示す。例えば、命令の形式は、オペコードの1以上のビット(例えば、初めの2ビット)によって示され、その形式に基づいて、プロセッサ(例えば、プロセッサのコンパイラ、トランスレータ、エミュレータ)は、この命令が不連続指定子を含み、その中で、レジスタなどのリソースの指定子の一部が命令の1つのフィールド内に含まれ、指定子の1以上のその他の部分が命令の1以上のその他のフィールド内に配置されていることを理解する。
オペコードはまた、一例として、不連続指定子から連続指定子を生成するのに使用される1以上の規則をプロセッサに示す指標(indication)を提供する。例えば、オペコードは、特定の命令がベクトル・レジスタ命令であり、従ってRXBフィールドを有することを示すことができる。従って、プロセッサは、RXBフィールドを伴う命令について示す情報(例えば、メモリ又は外部記憶装置内に格納された規則)にアクセスし、RXBフィールドは、その対応するレジスタ・フィールドについての最上位ビットを提供する。この規則は、例えば、連続フィールドを生成するために、レジスタ・フィールドのビットが、特定のレジスタ・オペランドに関連付けられたRXBフィールドの1以上のビットと組み合わされることを規定する。
連続指定子の生成の後、その連続指定子は、不連続指定子を顧慮せずに用いられる。例えば、ステップ808において、連続指定子を不連続指定子に顧慮せずに用いて、コードが最適化される。同様に、連続指定子を用いて、不連続指定子を顧慮せずに、1以上のレジスタが割り当てられる(ステップ810)。さらに、ステップ812において、エミュレートされたコードが、不連続指定子を顧慮せずに、ステップ810で実行された割当てを用いて生成される。即ち、これらのステップにおいて、連続指定子が不連続指定子から生成されたことを示す指標は何ら存在しない。不連続指定子は、無視される。
不連続指定子を連続指定子に翻訳するステップに関するさらなる詳細を、図9A、図9B、及び図11を参照しながら説明する。初めに図9Aを参照すると、Vector Load(VL)命令900が示される。一例において、Vector Load命令は、ベクトル・ロード動作を示すオペコード・フィールド902a(例えば、ビット0−7)、902b(例えば、ビット40−47)、ベクトル・レジスタを指定するのに用いられるベクトル・レジスタ・フィールド904(例えば、ビット8−11)(V)、インデックス・フィールド(X)906(例えば、ビット12−15)、ベース・フィールド(B)908(例えば、ビット16−19)、変位フィールド(D)910(例えば、ビット20−31)、及びRXBフィールド912(例えば、ビット36−39)を含む。フィールド904−912の各々は、一例において、オペコード・フィールドから分離し独立している。さらに、一実施形態において、それらは互いに分離し独立している。しかし、他の実施形態においては、複数のフィールドが組み合わされていてもよい。これらのフィールドに使用に関するさらなる情報は後述する。
一例において、選択されたビット(例えば、オペコード・フィールド902aにより指示されるオペコードの初めの2ビット)は、命令の長さ及び形式を指定する。この特定の例において、長さは、3ハーフワードであり、形式は、拡張オペコード・フィールドを伴うベクトル・レジスタ・アンド・インデックス・ストレージオペレーション(vector register-and-index storage operation)である。ベクトル(V)フィールドは、RXBによって指定された、当該ベクトルフィールドに対応する拡張ビットと共に、ベクトル・レジスタを指示する(即ち、不連続指定子)。具体的には、ベクトル・レジスタに関して、オペランドを含むレジスタは、例えば、そのレジスタ拡張ビット(RXB)を最上位ビットとして付け加えたレジスタ・フィールドの4ビット・フィールドを用いて指定される。例えば、V内の4ビット・フィールドが2進数の0010であり、このオペランドに対する拡張ビットが2進数の1である場合、5ビット・フィールドは、2進数の10010となり、レジスタ番号18(10進数)を示す。
命令のフィールドに付随する下付き数字は、そのフィールドが適用されるオペランドを示す。例えば、Vに付随する下付き数字1は、第1のオペランドを示し、以下同様である。これは、RXBフィールドのいずれのビットがそのレジスタ・フィールドと組み合わされるかを決定するのに用いられる。レジスタ・オペランドは、長さが一レジスタであり、例えば128バイトである。一例において、ベクトル・レジスタ・アンド・インデックス・ストレージオペレーション命令において、X及びBフィールドによって指示される汎用レジスタのコンテンツがDフィールドのコンテンツに付け加えられて、第2のオペランド・アドレスが形成される。Vector Load命令に関する変位Dは、一例において、12ビットの符号なし整数として取り扱われる。
この例において、Vは、第1のオペランドであるので、RXBの左端位置(例えば、ビット0)がこのオペランドに関連付けられる。従って、その左端位置にある値がVレジスタ・フィールド内の値と組み合わされて、本明細書で説明するように連続指定子が生成される。
本発明の一態様により、例えばz/Architectureで定義されたVector Load命令900が、例えばPowerPCアーキテクチャで定義されるLoad Vector Indexed命令950にエミュレートされる。この例においては、z/Architectureがソース・アーキテクチャであり、PowerPCアーキテクチャがターゲット・アーキテクチャであるが、これは一例に過ぎない。その他の多くのアーキテクチャを、ソース・アーキテクチャ及びターゲット・アーキテクチャの一方又は両方に用いることができる。
各アーキテクチャは、そのアーキテクチャが使用することができる特定のレジスタに関連付けられている。例えば、z/Architectureにおいては、32個のベクトル・レジスタが存在し、他のタイプのレジスタはベクトル・レジスタの一象限にマップすることができる。例えば、図10に示すように、32個のベクトル・レジスタ1002を含むレジスタ・ファイル1000が存在し、各レジスタが128ビット長である場合、64ビット長の16個の浮動小数点レジスタ1004をベクトル・レジスタに被せることができる。従って、例えば、浮動小数点レジスタ2が変更されたとき、ベクトル・レジスタ2もまた変更される。他のタイプのレジスタの他のマッピングもまた可能である。
同様に、PowerPC又は他のターゲット・アーキテクチャは、それに割り当てられたレジスタのセットを有する。このレジスタのセットは、ソース・アーキテクチャに割り当てられたレジスタのセットと異なっても同じでもよい。ターゲット・レジスタは、特定のタイプの命令に関して使用可能なより多くのレジスタ又はより少ないレジスタを有することができる。例えば、図9Aに示す例において、Vector Load命令及びLoad Vector Indexed命令は、その命令が使用可能な32個のベクトル・レジスタを有する。この場合もやはり、他の例が可能である。
オペコードによって示されるように、Vector Load命令は不連続指定子を含み、それは、この例においてはV及びRXBフィールド内で表される。これらの不連続フィールドが組み合わされてLoad Vector Indexed命令950における連続インデックスが作成される。この連続指定子は、命令950のVRTフィールド954内に示される。この特定の例において、コードVL v18,0(0,gr5)において示されるように、指定されているベクトル・レジスタは、レジスタ18である。このレジスタは、Vフィールド及びRXBフィールドによって与えられる不連続指定子によって命令内で指定される。この例において、Vフィールドは、値2(2進数の0010)を含み、RXBフィールドは、値8(2進数の1000)を含む。予め定義された規則に基づいて、Vが第1のオペランドであるので、1000の左端ビット(1)がVフィールド内のビット(0010)と連結されて、連続指定子10010が生成され、これは10進数では値18である。
参照数字956で示されるように、18という表現は、Vector Load命令のレジスタ・フィールド(V)に対応するLoad Vector Indexed命令のVRTフィールド内に配置される。完全性のために、命令950のRA及びRBフィールドは、それぞれ命令900のX及びBに対応する。命令900のDフィールドは、命令950内に対応するフィールドを有さない。命令900のオペコード・フィールドは、命令950のオペコード・フィールドに対応する。
さらに別の例を図9Bに示す。この例において、図9Aに示す例と同様に、命令900の不連続指定子(V、RXB)が命令950の連続指定子(VRT)に変換される。しかし、この例においては、命令950に割り当てられるレジスタは変換された連続指定子と同じ番号を有さず、代りに、連続指定子は、異なるレジスタにマップされる。例えば、図9Aの例において、不連続指定子は、連続指定子が行うのと同様にレジスタ18を参照する。即ち、1対1マッピングが存在する。しかし、図9Bにおいては、18の不連続指定子は、18の連続指定子に変換されるが、次に連続指定子の18は、異なるレジスタ、例えばレジスタ7にマップされる(参照数字980を参照されたい)。即ち、ソース・アーキテクチャ内のレジスタ18は、この特定の例ではターゲット・アーキテクチャ内のレジスタ7にマップする。そのようなマッピングは、予め定義されており、プロセッサにとってアクセス可能である。
さらに別の例を図11に示す。この例においては、エミュレーション中に、図9A及び図9Bにおけるようにレジスタに割り当てる代りに、割当てはメモリに対して行われる。この例において、命令VLRを用いて、1つのベクトル・レジスタVR18のコンテンツが別のベクトル・レジスタVR24に移動される。しかし、この例においては、レジスタ・ファイルが、これらのベクトル・レジスタを含むのに十分に大きくないと想定され、それゆえ、代りにメモリが使用される。即ち、複数のベクトルを配列として格納するメモリの連続部分が存在する。配列は、例えばレジスタ0である第1のレジスタが格納されるアドレスrvbaseで始まり、次いで、次のレジスタは、rvbaseから例えば16バイトのオフセット位置に格納され、第3のレジスタは、第2のレジスタからのオフセット位置に格納され、以下同様である。従って、この例において、レジスタ18は、rvbaseからオフセット288の位置にあり、レジスタ24は、rvbaseからオフセット384の位置にある。
この例においては、2つの不連続指定子(V、RXB;及びV、RXB)が存在する。従って、2つの連続指定子が生成される。例えば、Vが第1のオペランドであるので、第1の連続指定子は、V内のビットとRXBのビット0との連結によって生成される。Vが2進数の1000(10進数の8)を含み、RXBが2進数の1100(10進数の12)を含むので、第1の連続指定子は、1(RXBのビット0に由来)と1000(Vに由来)を連結して11000(10進数の24)を与えることによって形成される。同様に、第2の連続指定子は、0010(Vに関して、10進数の2))と1(RXBのビット1に由来)を連結して10010(10進数の18)を与えることによって形成される。これらのレジスタはメモリ内にあるので、ベクトル・レジスタ24は、rvbaseからオフセット384の位置にあり、ベクトル・レジスタ18は、rvbaseからオフセット288の位置にある。これらの値は、それぞれ、図11において1102、1104で示される。
図11の右側の疑似コード及び左側の命令は、18のベクトル・オフセット(288のバイト・オフセットに相当)位置にあるベクトル・レジスタの、24のベクトル・オフセット(384のバイト・オフセットに相当)位置への移動に対応する連続バイト数の移動を示す。具体的には、load immediate(ロード・イミディエート)(LI)が、値288をrtemp1にロードし、次にrvbaseにrtemp1内のオフセットを加えて得られるアドレスにおいてvector load(ベクトル・ロード)が実行され、その値が一時ベクトル・レジスタvtemp2に格納される。次いで、次のload immediateが384をrtemp1にロードし、アドレスにベクトル・レジスタ24内のオフセット(例えば、オフセット288)を加えたアドレスに対応する位置において、メモリに対するstore back out(ストア・バック・アウト)が実行される。
種々の例を上記で説明したが、多くの他の例及びバリエーションが可能である。ベクトル命令及びRXBフィールドの使用に関する付加的な情報は、同時出願されたJonathan D. Bradbury他による「Instruction to Load Data Up to A Specified Memory Boundary Indicated by the Instruction」と題する米国特許出願(出願番号13/421456)に記載されている。
さらに、種々のアーキテクチャについてここで言及する。z/Architectureの一実施形態は、IBM(登録商標)の刊行物である非特許文献1に記載されている。IBM(登録商標)及びZ/ARCHITECTURE(登録商標)は、米国ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ・コーポレーションの登録商標である。本明細書で用いられる他の名称は、インターナショナル・ビジネス・マシーンズ・コーポレーション又は他社の登録商標、商標、又は製品名の場合がある。さらに、Power Architectureの一実施形態は、非特許文献2に記載されている。POWER ARCHITECTURE(登録商標)はインターナショナル・ビジネス・マシーンズ・コーポレーションの登録商標である。さらに、Intelアーキテクチャの一実施形態が、非特許文献3及び非特許文献4に記載されている。Intel(登録商標)は、カリフォルニア州サンタクララ所在のIntel Corporationの登録商標である。
ここでは、1つのシステム・アーキテクチャに対して定義された命令の不連続指定子を別のシステム・アーキテクチャに対して定義された命令の連続指定子に変換する技法について詳細に説明する。従来のアーキテクチャ・エミュレーションは、固定幅又は可変幅の命令セットのいずれにおいても、不連続指定子、特に不連続レジスタ指定子を伴うシステムのエミュレーションにうまく対応していなかった。しかし、本発明の一態様により、従来のエミュレータを、不連続指定子を取り扱うように拡張する技法が提供される。この技法は、例えば、不連続指定子を読み込むステップと、不連続指定子から連続インデックスを生成するステップと、連続インデックスを用いて均質リソース(homogeneous resource)にアクセスするか又は均質リソースを表すステップとを含む。
さらに別の実施形態において、JIT実装により、連続インデックスを用いて割当ての決定が行われ、不連続指定子によってアクセスされるリソースを、任意で不連続/不均質リソースにより表すが、不連続指定子境界によるのではなく、最適化決定によって分割を反映する。即ち、一実施形態において、1つのアーキテクチャに対して定義された命令は、少なくとも1つのリソースに関する少なくとも1つの不連続指定子を有し、その少なくとも1つの不連続指定子は、少なくとも1つの連続指定子に変換される。その少なくとも1つの連続指定子を用いて、別のアーキテクチャの命令が使用する少なくとも1つのリソースが選択される。しかし、その別のアーキテクチャの命令は、不連続指定子を使用する。従って、この少なくとも1つの選択されたリソースに関する少なくとも1つの連続指定子は次に、その第2のアーキテクチャの命令で使用する少なくとも1つの不連続指定子に変換される。一実施形態において、これはエミュレータによって実行される。
一実施形態において、第1のコンピュータ・アーキテクチャ命令セットの命令実行を第2のコンピュータ・アーキテクチャのために設計されたプロセッサ上でエミュレートするエミュレータが提供される。このエミュレータは、例えば、エミュレーション・プログラムによりアプリケーションの命令をフェッチするステップと、命令をエミュレートするためのエミュレーション・モジュールを選択するために命令のオペコードを解釈するステップと、命令が不連続レジスタ・フィールドを使用することをオペコードから判断するステップと、命令の不連続レジスタ・フィールドを組み合せて結合レジスタ・フィールド(combined register field)を形成するステップと、命令をエミュレートするために、結合レジスタ・フィールドをエミュレーション・モジュールの命令によって用いるステップとを含む。
さらに、一実施形態において、レジスタ・スペースは、サブセクションを含み、第1のコンピュータ・アーキテクチャ命令セットは、サブセクションにアクセスするためだけのレジスタ・フィールドを有する第1の命令と、全レジスタ・スペースにアクセスするための不連続レジスタ・フィールドを有する第2の命令とを含む。
一実施形態において、RXBフィールドは、RXBフィールドを使用する全ての命令に対して同じ位置にある。RXBビットは、例えば、RXBフィールドのビット36が命令のビット8−11を拡張するために用いられ、RXBのビット37がビット12−15を拡張するために用いられ、RXBのビット38がビット16−19を拡張するために用いられ、RXBのビット39がビット32−35を拡張するために用いられる点で重要なビットである。さらに、RXBのビットを拡張ビットとして用いる決定はオペコードに依存する(例えば、R対V)。さらに、不連続指定子は、RXBフィールド以外のフィールドを使用することができる。
本明細書において、メモリ、メインメモリ、記憶装置及び主記憶装置は、明示的に又は文脈によって示されない限り、互換的に使用される。
命令の例を含むベクトル・ファシリティに関する付加的な詳細は、さらに以下で、この詳細な説明の部分として提示される。
当業者により認識されるように、本発明の1以上の態様は、システム、方法、又はコンピュータ・プログラム製品として具体化することができる。従って、本発明の1以上の態様は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)、又はソフトウェアの態様とハードウェアの態様とを組み合わせた実施形態の形を取ることができ、これらは全て、本明細書において、一般的に「回路」、「モジュール」又は「システム」と呼ぶことができる。さらに、本発明の1以上の態様は、コンピュータ可読プログラム・コードが組み込まれた、1以上のコンピュータ可読媒体内に具体化されたコンピュータ・プログラム製品の形を取ることができる。
1以上のコンピュータ可読媒体のいずれの組み合わせを用いることもできる。コンピュータ可読媒体は、コンピュータ可読ストレージ媒体とすることができる。コンピュータ可読ストレージ媒体は、これらに限定されるものではないが、例えば、電子、磁気、光学、電磁気、赤外線又は半導体のシステム、装置又はデバイス、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例(非網羅的なリスト)として、以下のもの、即ち、1以上の配線を有する電気的接続、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラム可能読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD−ROM)、光記憶装置、磁気記憶装置、又は上記のいずれかの適切な組み合わせが挙げられる。本明細書の文脈において、コンピュータ可読ストレージ媒体は、命令実行システム、装置若しくはデバイスによって用いるため、又はそれらと接続して用いるために、プログラムを収容又は格納できるいずれかの有形媒体とすることができる。
ここで図12を参照すると、一例において、コンピュータ・プログラム製品1200は、例えば、コンピュータ可読プログラム・コード手段又は論理1204を格納するための1以上の非一時的(non-transitory)なコンピュータ可読ストレージ媒体1202を含み、本発明の1以上の態様を提供し、容易にする。
コンピュータ可読媒体上に具体化されたプログラム・コードは、これらに限られるものではないが、無線、有線、光ファイバ・ケーブル、RF等、又は上記のいずれかの適切な組み合わせを含む、適切な媒体を用いて伝送することができる。
本発明の1以上の態様に関するオペレーションを実行するためのコンピュータ・プログラム・コードは、Java、SmallTalk、C++等のようなオブジェクト指向型プログラミング言語、及び、「C」プログラミング言語、アセンブラ、又は同様のプログラミング言語のような従来の手続き型プログラミング言語を含む、1以上のプログラミング言語のいずれかの組み合わせで書くことができる。プログラム・コードは、完全にユーザのコンピュータ上で実行される場合もあり、スタンドアロンのソフトウェア・パッケージとして、一部がユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部がリモートコンピュータ上で実行される場合もあり、又は完全にリモートコンピュータ若しくはサーバ上で実行される場合もある。最後のシナリオにおいては、リモートコンピュータは、ローカル・エリア・ネットワーク(LAN)若しくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータに(例えば、インターネット・サービス・プロバイダを用いたインターネットを通じて)接続される場合もある。
本発明の1以上の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図及び/又はブロック図を参照して、本明細書で説明される。フローチャート図及び/又はブロック図の各ブロック、並びにフローチャート図及び/又はブロック図内のブロックの組み合わせは、コンピュータ・プログラム命令によって実装できることが理解されるであろう。これらのコンピュータ・プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに提供してマシンを製造することができ、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャート及び/又はブロック図の1つ以上のブロックにおいて指定された機能/動作を実装する手段を作り出す。
これらのコンピュータ・プログラム命令はまた、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイスを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納することができ、それにより、そのコンピュータ可読媒体内に格納された命令が、フローチャート及び/又はブロック図の1以上のブロックにおいて指定された機能/動作を実装する命令を含む製品を製造する。
コンピュータ・プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイス上で行わせて、コンピュータで実行されるプロセスを生成することができ、それにより、コンピュータ又は他のプログラム可能装置上で実行される命令が、フローチャート及び/又はブロック図の1以上のブロックにおいて指定された機能/動作を実行するプロセスを提供する。
図面内のフローチャート及びブロック図は、本発明の1以上の態様の種々の実施形態によるシステム、方法及びコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能及び動作を示す。この点に関して、フローチャート又はブロック図内の各ブロックは、指定された論理機能を実装するための1以上の実行可能命令を含むモジュール、セグメント、又はコードの部分を表すことができる。幾つかの代替的な実装において、ブロック内に記載された機能は、図面内に記載された順序とは異なる順序で行われ得ることにも留意すべきである。例えば、連続して示された2つのブロックが、関与する機能に応じて、実際には、ほぼ同時に実行されることもあり、ときにはブロックが逆順に実行されることもある。また、ブロック図及び/又はフローチャート図の各ブロック、並びにブロック図及び/又はフローチャート図内のブロックの組み合わせは、指定された機能又は動作を行う専用ハードウェア・ベースのシステムによって、又は専用ハードウェアとコンピュータ命令との組み合わせによって実装できることにも留意されたい。
上記に加えて、本発明の1以上の態様は、顧客環境の管理を提供するサービス・プロバイダにより、供与し、提供し、配置し、管理し、サービスを行うことなどができる。例えば、サービス・プロバイダは、1以上の顧客に対して本発明の1以上の態様を実施するコンピュータ・コード及び/又はコンピュータ・インフラストラクチャを作成し、保持し、サポートすることなどができる。見返りとして、サービス・プロバイダは、例として、予約申し込み及び/又は報酬契約の下で顧客から支払いを受けることができる。付加的に又は代替的に、サービス・プロバイダは、1以上の第三者に対する広告コンテンツの販売から支払いを受けることができる。
本発明の一態様において、本発明の1以上の態様を実施するために、アプリケーションを配置することができる。一例として、アプリケーションの配置は、本発明の1以上の態様を実施するように動作可能なコンピュータ・インフラストラクチャを提供することを含む。
本発明の更に別の態様として、コンピュータ可読コードをコンピュータ・システムに統合することを含む、コンピュータ・インフラストラクチャを配置することが可能であり、そこでは、コードは、コンピューティング・システムと協働して、本発明の1以上の態様を実施することができる。
本発明の更に別の態様として、コンピュータ可読コードをコンピュータ・システムに統合することを含む、コンピュータ・インフラストラクチャを統合するためのプロセスを提供することができる。コンピュータ・システムは、コンピュータ可読媒体を含み、ここで、コンピュータ媒体は本発明の1以上の態様を含む。コードは、コンピュータ・システムと協働して、本発明の1以上の態様を実施することができる。
種々の実施形態が上述されたが、これらは例にすぎない。例えば、他のアーキテクチャのコンピューティング環境が、本発明の1以上の態様を組み込み、用いることが可能である。さらに、他のサイズのベクトル又は他のレジスタを用いることができ、本発明の精神から逸脱することなく、命令に対する変更をなすことができる。加えて、処理中に他の命令を用いることができる。さらに、不連続指定子を連続指定子に変換することに関連する本発明の1以上の態様は、他の文脈において用いることができる。さらに、指定子は、レジスタのための指定子以外のものであってもよい。他の変更もまた可能である。
さらに、他のタイプのコンピューティング環境が、本発明の1以上の態様から利益を得ることができる。一例として、システム・バスを通してメモリ要素に直接的に又は間接的に結合された少なくとも2つのプロセッサを含む、プログラム・コードを格納及び/又は実行するのに適したデータ処理システムが使用可能である。メモリ要素は、例えば、プログラム・コードの実際の実行時に用いられるローカル・メモリと、大容量記憶装置と、実行時に大容量記憶装置からコードを取得しなければならない回数を減少させるために少なくとも幾つかのプログラム・コードの一時的なストレージを提供するキャッシュ・メモリとを含む。
入力/出力即ちI/O装置(キーボード、ディスプレイ、ポインティング装置、DASD、テープ、CD、DVD、親指ドライブ、及び他のメモリ媒体等を含むが、これらに限定されるものではない)は、直接的に、又は介在するI/Oコントローラを通して、システムに結合することができる。データ処理システムが、介在するプライベート・ネットワーク又は公衆ネットワークを通して、他のデータ処理システム又はリモートプリンタ若しくはストレージ装置に結合できるように、ネットワーク・アダプタをシステムに結合することもできる。モデム、ケーブル・モデム及びイーサネット・カードは、利用可能なタイプのネットワーク・アダプタのほんの数例にすぎない。
図13を参照すると、本発明の1以上の態様を実装するためのホスト・コンピュータ・システム5000の代表的なコンポーネントが描かれている。代表的なホスト・コンピュータ5000は、コンピュータ・メモリ(即ち、中央ストレージ)5002と通信状態にある1以上のCPU5001に加えて、ストレージ媒体デバイス5011及び他のコンピュータ又はSAN等と通信するためのネットワーク5010へのI/Oインターフェースを含む。CPU5001は、アーキテクチャ化された(architected)命令セット及びアーキテクチャ化された機能を有するアーキテクチャに準拠している。CPU5001は、プログラム・アドレス(仮想アドレス)をメモリの実アドレスに変換するための動的アドレス変換(Dynamic Address Translation、DAT)5003を有することができる。DATは、一般的に、変換をキャッシュに入れるためのトランスレーション・ルックアサイド・バッファ(TLB)5007を含むので、コンピュータ・メモリ5002のブロックへの後のアクセスは、アドレス変換の遅延を必要としない。一般的に、コンピュータ・メモリ5002とプロセッサ5001との間に、キャッシュ5009が用いられる。キャッシュ5009は、複数のCPUが利用可能な大容量のキャッシュと、大型のキャッシュと各CPUとの間のより小型でより高速な(下位レベルの)キャッシュとを有する階層とすることができる。幾つかの実装において、下位レベルのキャッシュは、命令のフェッチ及びデータ・アクセスのために別個の下位レベル・キャッシュを与えるように分割される。一実施形態においては、キャッシュ5009を介して、命令フェッチ・ユニット5004により、命令がメモリ5002からフェッチされる。命令は、命令デコード・ユニット5006でデコードされ、(幾つかの実施形態においては他の命令と共に)命令実行ユニット5008にディスパッチされる。一般的には、例えば、算術演算実行ユニット、浮動小数点実行ユニット、及び分岐命令実行ユニットなどの幾つかの実行ユニット5008が用いられる。命令は、実行ユニットにより実行され、必要に応じて命令が指定したレジスタ又はメモリからオペランドにアクセスする。メモリ5002からオペランドにアクセスする(ロード又はストアする)場合、典型的には、ロード/ストア・ユニット5005が、実行される命令の制御下でアクセスを処理する。命令は、ハードウェア回路又は内部のマイクロコード(ファームウェア)において、又はその両方の組み合わせによって実行することができる。
既述のように、コンピュータ・システムは、ローカル(又はメイン)ストレージ内の情報、並びに、アドレッシング、保護、参照、及び変更の記録を含む。アドレッシングの幾つかの態様は、アドレスの形式、アドレス空間の概念、種々のタイプのアドレス、及び1つのタイプのアドレスを別のタイプのアドレスに変換する方法を含む。メインストレージの一部は、永続的に割り当てられた記憶位置を含む。メインストレージは、システムに、データの直接アドレス指定可能な高速アクセス・ストレージを与える。データ及びプログラムを処理できるようになる前に、(入力装置から)データ及びプログラムの両方が、メインストレージにロードされる。
メインストレージは、キャッシュと呼ばれることもある、1以上のより小さくより高速アクセスのバッファ・ストレージを含むことができる。キャッシュは、典型的には、CPU又はI/Oプロセッサと物理的に関連付けられる。物理的な構成及び別個のストレージ媒体を使用することの影響は、性能に対するものを除き、通常、プログラムにより監視することはできない。
命令及びデータ・オペランドについて、別個のキャッシュを保持することができる。キャッシュ内の情報は、キャッシュ・ブロック又はキャッシュ・ライン(又は短縮してライン)と呼ばれる、整数境界(integral boundary)上にある連続したバイト内に保持される。モデルは、キャッシュ・ラインのサイズをバイトで返す、EXTRACT CACHE ATTRIBUTE命令を提供することができる。モデルはまた、データ若しくは命令キャッシュへのストレージのプリフェッチ、又は、キャッシュからのデータの解放に影響を与える、PREFETCH DATA及びPREFETCH DATA RELATIVE LONG命令を提供することができる。
ストレージは、長い水平方向のビットの文字列と考えられる。大部分のオペレーションにおいて、ストレージへのアクセスは、左から右への順序で進む。ビットの文字列は、8ビット単位で分割される。8ビットの単位は1バイトと呼ばれ、全ての情報の形式の基本的な構成要素(building block)である。ストレージ内の各々のバイト位置は、負でない一意の整数により識別され、この整数がそのバイト位置のアドレスであり、即ち、簡単にバイト・アドレスである。隣接するバイト位置は、連続するアドレスを有し、左の0で始まり、左から右への順序で進む。アドレスは、符号なしの2進整数であり、24ビット、31ビット、又は64ビットである。
情報は、ストレージとCPU又はチャネル・サブシステムとの間で、一度に1バイトずつ、又は1バイト・グループずつ伝送される。特に断りのない限り、例えばz/Architectureにおいては、ストレージ内のバイト・グループは、グループの左端のバイトによりアドレス指定される。グループ内のバイト数は、実行されるオペレーションにより暗黙に又は明示的に指定される。CPUのオペレーションに用いられる場合、バイト・グループはフィールドと呼ばれる。例えばz/Architectureにおいては、バイト・グループの中の各々において、ビットは、左から右の順序で番号が付けられる。z/Architectureにおいては、左端ビットは「上位(high-order)」ビットと呼ばれることがあり、右端ビットは「下位(low-order)」ビットと呼ばれることがある。しかしながら、ビット数は、ストレージ・アドレスではない。バイトだけを、アドレス指定することができる。ストレージ内の1つのバイトの個々のビットに対してオペレーションを行うためには、そのバイト全体にアクセスされる。(例えばz/Architectureにおいて)1バイトの中のビットには、左から右に0から7までの番号が付けられる。1つのアドレスの中のビットには、24ビット・アドレスの場合は8−31若しくは40−63の番号を付けることができ、又は、31ビット・アドレスの場合は1−31若しくは33−63の番号を付けることができ、64ビット・アドレスの場合は0−63の番号が付けられる。複数のバイトから成る他のいずれかの固定長形式の中では、その形式を構成するビットには、0から始まる連続番号が付けられる。エラー検出のため、また好ましくは訂正のために、1以上の検査ビットが、各バイト又はバイト・グループと共に伝送されることがある。このような検査ビットは、マシンにより自動的に生成されるものであり、プログラムが直接制御することはできない。記憶容量は、バイト数で表わされる。ストレージ・オペランド・フィールドの長さが命令のオペレーション・コードで暗黙的に指定される場合、そのフィールドは固定長を有し、固定長は、1バイト、2バイト、4バイト、8バイト、又は16バイトとすることができる。一部の命令では、より長いフィールドが暗黙的に指定されることもある。ストレージ・オペランド・フィールドの長さが暗黙的に指定されず、明示的に記述される場合は、そのフィールドは可変長を有する。可変長オペランドは、1バイト(又は、一部の命令では、2バイトの倍数若しくは他の倍数)のインクリメントにより変化し得る。情報がストレージ内に置かれるとき、ストレージへの物理パスの幅が、格納されるフィールドの長さを上回るとしても、指定されたフィールド内に含まれるバイト位置のコンテンツのみが置き換えられる。
特定の情報単位は、ストレージ内の整数境界上にあることになる。そのストレージ・アドレスがバイト単位の長さの倍数であるとき、境界は、情報単位に関して整数であるとみなされる。整数境界上にある2バイト、4バイト、8バイト、及び16バイトのフィールドには、特別な名称が与えられる。ハーフワードは、2バイトの境界上にある2個の連続したバイトのグループであり、これは、命令の基本的な構成要素である。ワードは、4バイトの境界上にある4個の連続したバイトのグループである。ダブルワード(doubleword)は、8バイトの境界上にある8個の連続したバイトのグループである。クワッドワード(quadword)は、16バイトの境界上にある16個の連続したバイトのグループである。ストレージ・アドレスが、ハーフワード、ワード、ダブルワード、及びクワッドワードを示す場合、そのアドレスを2進数で表現すると、それぞれ、右端の1個、2個、3個、又は4個のビットが0になる。命令は、2バイトの整数境界上にあることになる。大部分の命令のストレージ・オペランドは、境界合わせ(boundary alignment)要件をもたない。
命令及びデータ・オペランドに対して別個のキャッシュを実装するデバイスにおいては、後に命令がフェッチされるキャッシュ・ライン内にプログラムが格納される場合には、その格納によって、後にフェッチされる命令が変更されるかどうかに関係なく、著しい遅延が生じることがある。
一実施形態において、本発明は、ソフトウェア(ライセンス内部コード、ファームウェア、マイクロコード、ミリコード、ピココードなどと呼ばれる場合もあるが、そのいずれも本発明の1以上の態様と整合性がある)により実施することができる。図13を参照すると、本発明の1以上の態様を具体化するソフトウェア・プログラム・コードには、ホスト・システム5000のプロセッサ5001により、CD−ROMドライブ、テープドライブ、又はハードドライブといった長期ストレージ媒体デバイス5011からアクセスすることができる。ソフトウェア・プログラム・コードは、ディスケット、ハードドライブ、又はCD−ROMといった、データ処理システムと共に用いるための種々の周知の媒体のいずれかの上で具体化することができる。コードは、こうした媒体上に分散させても、又はコンピュータ・メモリ5002からユーザに分散させても、又は、こうした他のシステムのユーザが使用するために、ネットワーク5010上の1つのコンピュータ・システムのストレージから他のコンピュータ・システムに分散させてもよい。
ソフトウェア・プログラム・コードは、種々のコンピュータ・コンポーネント及び1以上のアプリケーション・プログラムの機能及び相互作用を制御するオペレーティング・システムを含む。プログラム・コードは、通常、ストレージ媒体デバイス5011から、比較的より高速のコンピュータ・ストレージ5002にページングされ、そこでプロセッサ5001による処理のために利用可能になる。ソフトウェア・プログラム・コードを物理的媒体上のメモリ内で具体化する技術及び方法、及び/又は、ネットワークを介してソフトウェア・コードを分散させる技術及び方法は周知であるため、ここではこれ以上論じない。プログラム・コードは、有形の媒体(これらに限定されるものではないが、電子メモリ・モジュール(RAM)、フラッシュメモリ、コンパクトディスク(CD)、DVD、磁気テープなどを含む)上に作成され、格納されたとき、「コンピュータ・プログラム製品」と呼ばれることが多い。コンピュータ・プログラム製品媒体は、典型的には、処理回路による実行のために、好ましくはコンピュータ・システム内の処理回路によって読み取り可能である。
図14は、本発明の1以上の態様を実施することができる代表的なワークステーション又はサーバ・ハードウェア・システムを示す。図14のシステム5020は、任意の周辺機器を含む、パーソナル・コンピュータ、ワークステーション、又はサーバなどの代表的なベース・コンピュータ・システム5021を含む。ベース・コンピュータ・システム5021は、1以上のプロセッサ5026と、周知の技術に従ってプロセッサ5026とシステム5021の他のコンポーネントを接続し、これらの間の通信を可能にするバスとを含む。バスは、プロセッサ5026を、ハードドライブ(例えば、磁気媒体、CD、DVD、及びフラッシュメモリのいずれかを含む)又はテープドライブを含むことができる、メモリ5025及び長期ストレージ5027に接続する。システム5021はまた、キーボード5024、マウス5023、プリンタ/スキャナ5030、及び/又は、タッチ・センシティブ・スクリーンやデジタル化された入力パッド等の任意のユーザ・インターフェース機器とすることができる他のインターフェース機器などの1以上のインターフェース機器に、バスを介してマイクロプロセッサ5026を接続するユーザ・インターフェース・アダプタを含むこともできる。バスはまた、ディスプレイ・アダプタを介して、LCDスクリーンやモニタなどのディスプレイ装置5022をマイクロプロセッサ5026にも接続する。
システム5021は、ネットワーク5029と通信する5028ことができるネットワーク・アダプタを介して、他のコンピュータ又はコンピュータ・ネットワークと通信することができる。例示的なネットワーク・アダプタは、通信チャネル、トークン・リング、イーサネット又はモデムである。或いは、システム5021は、CDPD(セルラー・デジタル・パケット・データ)カードのような無線インターフェースを用いて通信することもできる。システム5021は、ローカル・エリア・ネットワーク(LAN)若しくは広域ネットワーク(WAN)、又はシステム5021内のそのような他のコンピュータと関連付けることができ、又は、別のコンピュータ等とのクライアント/サーバ構成におけるクライアントとすることができる。これらの構成の全て、並びに、適切な通信ハードウェア及びソフトウェアは、当技術分野において周知である。
図15は、本発明の1以上の態様を実施することができるデータ処理ネットワーク5040を示す。データ処理ネットワーク5040は、各々が複数の個々のワークステーション5041、5042、5043、5044を含むことができる、無線ネットワーク及び有線ネットワークのような複数の個々のネットワークを含むことができる。さらに、当業者であれば理解するように、1以上のLANを含ませることができ、LANは、ホスト・プロセッサに結合された複数のインテリジェント・ワークステーションを含むことができる。
さらに図15を参照すると、ネットワークはまた、ゲートウェイ・コンピュータ(クライアント・サーバ5046)、又はアプリケーション・サーバ(データ・リポジトリにアクセスすることができ、且つ、ワークステーション5045から直接アクセスすることもできる遠隔サーバ5048)のような、メインフレーム・コンピュータ又はサーバを含むこともできる。ゲートウェイ・コンピュータ5046は、各々の個々のネットワークへの入口点として働く。ゲートウェイは、1つのネットワーク・プロトコルを別のものに接続するときに必要とされる。ゲートウェイ5046は、通信リンクによって別のネットワーク(例えば、インターネット5047)に接続できることが好ましい。ゲートウェイ5046はまた、通信リンクを用いて、1以上のワークステーション5041、5042、5043、5044に直接接続することもできる。ゲートウェイ・コンピュータは、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能なIBM eServer(商標)System zサーバを用いて実装することができる。
図14及び図15を同時に参照すると、本発明の1以上の態様を具体化することができるソフトウェア・プログラム・コードには、一般的に、CD−ROMドライブ又はハードドライブといった長期ストレージ媒体5027から、システム5020のプロセッサ5026によってアクセスすることができる。ソフトウェア・プログラム・コードは、ディスケット、ハードドライブ、又はCD−ROMといった、データ処理システムと共に用いるための種々の周知の媒体のいずれかの上で具体化することができる。コードは、そのような媒体上で分散させても、又はメモリからユーザ5050、5051に分散させても、或いは、こうした他のシステムのユーザが用いるために、ネットワーク上の1つのコンピュータ・システムのストレージから他のコンピュータ・システムに分散させてもよい。
或いは、プログラム・コードをメモリ5025内で具体化し、プロセッサ・バスを用いてプロセッサ5026によってプログラム・コードにアクセスすることができる。このようなプログラム・コードは、種々のコンピュータ・コンポーネント及び1以上のアプリケーション・プログラム5032の機能及び相互作用を制御するオペレーティング・システムを含む。プログラム・コードは、通常、ストレージ媒体5027から高速メモリ5025にページングされ、そこでプロセッサ5026による処理のために利用可能になる。ソフトウェア・プログラム・コードを物理的媒体上のメモリ内で具体化する技術及び方法、及び/又は、ネットワークを介してソフトウェア・コードを配布する技術及び方法は周知であるため、ここではこれ以上論じない。プログラム・コードは、作成され、有形の媒体(これらに限定されるものではないが、電子メモリ・モジュール(RAM)、フラッシュメモリ、コンパクトディスク(CD)、DVD、磁気テープなどを含む)に格納されたとき、「コンピュータ・プログラム製品」と呼ばれることが多い。コンピュータ・プログラム製品媒体は、典型的には、処理回路による実行のために、好ましくはコンピュータ・システム内の処理回路によって読み取り可能である。
プロセッサが最も容易に利用できるキャッシュ(通常、プロセッサの他のキャッシュよりも高速で小さい)は、最下位(L1又はレベル1)のキャッシュであり、メインストア(メインメモリ)は、最上位レベルのキャッシュ(3つのレベルがある場合にはL3)である。最下位レベルのキャッシュは、実行されるマシン命令を保持する命令キャッシュ(I−キャッシュ)と、データ・オペランドを保持するデータ・キャッシュ(D−キャッシュ)とに分割されることが多い。
図16を参照すると、プロセッサ5026についての例示的なプロセッサの実施形態が示される。典型的には、メモリ・ブロックをバッファに入れてプロセッサ性能を向上させるために、1以上のレベルのキャッシュ5053が用いられる。キャッシュ5053は、使用される可能性が高いメモリ・データのキャッシュ・ラインを保持する高速バッファである。典型的なキャッシュ・ラインは、64バイト、128バイト、又は256バイトのメモリ・データである。データをキャッシュに入れるのではなく、命令をキャッシュに入れるために、別個のキャッシュが用いられることが多い。キャッシュ・コヒーレンス(メモリ及びキャッシュ内のラインのコピーの同期)は、多くの場合、当技術分野において周知の種々の「スヌープ(snoop)」アルゴリズムによって与えられる。プロセッサ・システムのメインメモリ・ストレージ5025は、キャッシュと呼ばれることが多い。4つのレベルのキャッシュ5053を有するプロセッサ・システムにおいて、メインストレージ5025は、典型的にはより高速であり、且つ、コンピュータ・システムが利用できる不揮発性ストレージ(DASD、テープ等)の一部だけを保持するので、レベル5(L5)のキャッシュと呼ばれることがある。メインストレージ5025は、オペレーティング・システムによってメインストレージ5025との間でページングされるデータのページを「キャッシュに入れる」。
プログラム・カウンタ(命令カウンタ)5061は、実行される現行の命令のアドレスを常時監視している。z/Architectureプロセッサのプログラム・カウンタは64ビットであり、従来のアドレッシング制限をサポートするために、31ビット又は24ビットに切り捨てることができる。プログラム・カウンタは、典型的には、コンテキスト・スイッチの際に持続するように、コンピュータのPSW(プログラム状況ワード)内で具体化される。従って、例えば、オペレーティング・システムにより、プログラム・カウンタ値を有する進行中のプログラムに割り込みをかけることが可能である(プログラム環境からオペレーティング・システム環境へのコンテキスト・スイッチ)。プログラムのPSWは、プログラムがアクティブでない間、プログラム・カウンタ値を保持し、オペレーティング・システムが実行されている間、オペレーティング・システムの(PSW内の)プログラム・カウンタが用いられる。典型的には、プログラム・カウンタは、現行の命令のバイト数に等しい量だけインクリメントされる。RISC(Reduced Instruction Set Computing、縮小命令セット・コンピューティング)命令は、典型的には固定長であり、CISC(Complex Instruction Set Computing、複合命令セット・コンピューティング)命令は、典型的には可変長である。IBM z/Architectureの命令は、2バイト、4バイト、又は6バイトの長さを有するCISC命令である。例えば、コンテキスト・スイッチオペレーション又は分岐命令の分岐成立(Branch taken)オペレーションにより、プログラム・カウンタ5061が変更される。コンテキスト・スイッチオペレーションにおいて、現行のプログラム・カウンタ値は、実行されるプログラムについての他の状態情報(条件コードのような)と共にプログラム状況ワード内に保存され、実行される新しいプログラム・モジュールの命令を示す新しいプログラム・カウンタ値がロードされる。分岐成立オペレーションを行い、分岐命令の結果をプログラム・カウンタ5061にロードすることにより、プログラムが判断すること又はプログラム内でループすることが可能になる。
典型的には、プロセッサ5026の代わりに命令をフェッチするために、命令フェッチ・ユニット5055が用いられる。フェッチ・ユニットは、「次の順次命令(next sequential instruction)」、分岐成立命令のターゲット命令、又はコンテキスト・スイッチの後のプログラムの最初の命令のいずれかをフェッチする。最新の命令フェッチ・ユニットは、プリフェッチされた命令が使用される可能性に基づいて、命令を投機的にプリフェッチするプリフェッチ技術を用いることが多い。例えば、フェッチ・ユニットは、次の順次命令を含む16バイトの命令と、付加的なバイトの更なる順次命令とをフェッチすることができる。
次いで、フェッチされた命令が、プロセッサ5026によって実行される。一実施形態において、フェッチされた命令は、フェッチ・ユニットのディスパッチ・ユニット5056に渡される。ディスパッチ・ユニットは命令をデコードし、デコードされた命令についての情報を適切なユニット5057、5058、5060に転送する。実行ユニット5057は、典型的には、命令フェッチ・ユニット5055からデコードされた算術命令についての情報を受け取り、命令のオペコードに従ってオペランドに関する算術演算を行う。オペランドは、好ましくは、メモリ5025、アーキテクチャ化レジスタ5059、又は実行される命令の即値フィールドのいずれかから、実行ユニット5057に与えられる。実行の結果は、格納される際に、メモリ5025、レジスタ5059、又は他のマシン・ハードウェア(制御レジスタ、PSWレジスタなどのような)内に格納される。
プロセッサ5026は、典型的には、命令の機能を実行するための1以上の実行ユニット5057、5058、5060を有する。図17Aを参照すると、実行ユニット5057は、インターフェース論理5071を介して、アーキテクチャ化された汎用レジスタ5059、デコード/ディスパッチ・ユニット5056、ロード・ストア・ユニット5060、及び他のプロセッサ・ユニット5065と通信することができる。実行ユニット5057は、幾つかのレジスタ回路5067、5068、5069を用いて、算術論理演算ユニット(ALU)5066が動作する情報を保持することができる。ALUは、加算(add)、減算(subtract)、乗算(multiply)、及び除算(divide)などの算術演算、並びに、論理積(and)、論理和(or)、及び排他的論理和(XOR)、ローテート(rotate)及びシフト(shift)のような論理関数を実行する。ALUは、設計に依存する専用の演算をサポートすることが好ましい。他の回路は、例えば条件コード及び回復サポート論理を含む、他のアーキテクチャ化ファシリティ5072を提供することができる。典型的には、ALU演算の結果は、出力レジスタ回路5070に保持され、この出力レジスタ回路5070が、結果を種々の他の処理機能に転送することができる。多数のプロセッサ・ユニットの構成が存在し、本説明は、一実施形態の代表的な理解を与えることのみを意図している。
例えばADD命令は、算術及び論理機能を有する実行ユニット5057で実行され、一方、例えば浮動小数点命令は、特化された浮動小数点能力を有する浮動小数点実行部で実行される。実行ユニットは、オペランドに対してオペコードが定めた関数を行うことにより、命令が特定したオペランドに対して動作することが好ましい。例えば、ADD命令は、命令のレジスタ・フィールドによって特定された2つのレジスタ5059内に見出されるオペランドに対して、実行ユニット5057により実行することができる。
実行ユニット5057は、2つのオペランドに対して算術加算を実行し、結果を第3オペランドに格納する。第3オペランドは、第3のレジスタであっても又は2つのソース・レジスタのいずれかであってもよい。実行ユニットは、シフト、ローテート、論理積、論理和、及び排他的論理和のような種々の論理関数、並びに、加算、減算、乗算、除法のいずれかを含む、種々の代数関数を実行することができる算術論理演算ユニット(ALU)5066を用いることが好ましい。スカラー演算のために設計されたALU5066もあり、浮動小数点のために設計されたものALU5066もある。データは、アーキテクチャに応じて、ビッグエンディアン(Big Endian)(最下位のバイトが最も高いバイト・アドレスである)、又はリトルエンディアン(Little Endian)(最下位のバイトが最も低いバイト・アドレスである)とすることができる。IBM z/Architectureは、ビッグエンディアンである。符号付きフィールドは、アーキテクチャに応じて、符号及び大きさ、1の補数、又は2の補数とすることができる。2の補数における負の値又は正の値はALU内で加法しか必要としないため、ALUが減算能力を設計する必要がないという点で、2の補数は有利である。数値は、通常、省略表現で記述され、12ビット・フィールドは、4,096バイトブロックのアドレスを定め、通常、例えば4Kバイト(キロバイト)ブロックのように記述される。
図17Bを参照すると、分岐命令を実行するための分岐命令情報が、典型的には、分岐ユニット5058に送られ、この分岐ユニット5058は、多くの場合、分岐履歴テーブル5082のような分岐予測アルゴリズムを用いて、他の条件付き演算が完了する前に分岐の結果を予測する。条件付き演算が完了する前に、現行の分岐命令のターゲットがフェッチされ、投機的に実行される。条件付き演算が完了すると、投機的に実行された分岐命令は、条件付き演算の条件及び投機された結果に基づいて、完了されるか又は破棄される。典型的な分岐命令は、条件コードを試験し、条件コードが分岐命令の分岐要件を満たす場合、ターゲット・アドレスに分岐することができ、ターゲット・アドレスは、例えば、命令のレジスタ・フィールド又は即値フィールド内に見出されるものを含む幾つかの数に基づいて計算することができる。分岐ユニット5058は、複数の入力レジスタ回路5075、5076、5077と、出力レジスタ回路5080とを有するALU5074を用いることができる。分岐ユニット5058は、例えば、汎用レジスタ5059、デコード・ディスパッチ・ユニット5056、又は他の回路5073と通信することができる。
例えば、オペレーティング・システムによって開始されるコンテキスト・スイッチ、コンテキスト・スイッチを発生させるプログラム例外又はエラー、コンテキスト・スイッチを発生させるI/O割り込み信号、或いは、(マルチスレッド環境における)複数のプログラムのマルチスレッド活動を含む様々な理由により、命令のグループの実行に割り込みがかけられることがある。コンテキスト・スイッチ動作は、現在実行中のプログラムについての状態情報を保存し、次いで、起動される別のプログラムについての状態情報をロードすることが好ましい。状態情報は、例えば、ハードウェア・レジスタ又はメモリ内に保存することができる。状態情報は、実行される次の命令を指し示すプログラム・カウンタ値と、条件コードと、メモリ変換情報と、アーキテクチャ化されたレジスタのコンテンツとを含むことが好ましい。コンテキスト・スイッチの活動は、ハードウェア回路、アプリケーション・プログラム、オペレーティング・システム・プログラム、又はファームウェア・コード(マイクロコード、ピココード、又はライセンス内部コード(LIC))単独で又はその組み合わせで実施することができる。
プロセッサは、命令により定義された方法に従ってオペランドにアクセスする。命令は、命令の一部の値を用いて即値オペランドを与えることができ、汎用レジスタ又は専用レジスタ(例えば、浮動小数点レジスタ)のいずれかを明示的に示す1以上のレジスタ・フィールドを与えることができる。命令は、オペコード・フィールドによってオペランドとして識別されるインプライド・レジスタ(implied register)を用いることができる。命令は、オペランドのためのメモリ位置を用いることができる。z/Architectureの長変位ファシリティ(long displacement facility)により例示されるように、オペランドのメモリ位置を、レジスタ、即値フィールド、又はレジスタと即値フィールドの組み合わせによって与えることができ、命令は、基底レジスタ、指標レジスタ、及び即値フィールド(変位フィールド)を定め、これらが、例えば互いに加算されてメモリ内のオペランドのアドレスをもたらす。ここでの位置(location)は、典型的には、特に断りのない限り、メインメモリ(メインストレージ)内の記憶位置を意味する。
図17Cを参照すると、プロセッサは、ロード/ストア・ユニット5060を用いて、ストレージにアクセスする。ロード/ストア・ユニット5060は、メモリ5053内のターゲット・オペランドのアドレスを取得し、オペランドをレジスタ5059又は別のメモリ5053の記憶位置にロードすることによってロードオペレーションを行うことができ、或いは、メモリ5053内のターゲット・オペランドのアドレスを取得し、レジスタ5059又は別のメモリ5053の記憶位置から取得したデータをメモリ5053内のターゲット・オペランドの記憶位置に格納することによって、ストアオペレーションを行うことができる。ロード/ストア・ユニット5060は、投機的なものであってもよく、命令シーケンスに対してアウト・オブ・オーダー式の順序でメモリにアクセスすることができるが、プログラムに対して、命令がイン・オーダー式に実行されたという状態を維持することになる。ロード/ストア・ユニット5060は、汎用レジスタ5059、デコード/ディスパッチ・ユニット5056、キャッシュ/メモリ・インターフェース5053、又は他の要素5083と通信することができ、ストレージ・アドレスを計算し、且つ、パイプライン処理を順に行ってオペレーションをイン・オーダー式に保持するための、種々のレジスタ回路、ALU5085、及び制御論理5090を含む。一部の動作は、アウト・オブ・オーダー式とすることができるが、ロード/ストア・ユニットは、アウト・オブ・オーダー式動作が、プログラムに対して、当技術分野において周知のようなイン・オーダー式に実行されたように見せる機能を提供する。
好ましくは、アプリケーション・プログラムが「参照する」アドレスは、仮想アドレスと呼ばれることが多い。仮想アドレスは、「論理アドレス」及び「実効アドレス(effective address)」と呼ばれることもある。これらの仮想アドレスは、これらに限定されるものではないが、単に仮想アドレスをオフセット値にプリフィックス付加するステップと、1以上の変換テーブルを介して仮想アドレスを変換するステップとを含む種々の動的アドレス変換(DAT)技術の1つによって、物理的メモリ位置にリダイレクトされるという点で仮想のものであり、変換テーブルは、少なくともセグメント・テーブル及びページ・テーブルを単独で又は組み合わせて含むことが好ましく、セグメント・テーブルは、ページ・テーブルを示すエントリを有することが好ましい。z/Architectureでは、領域第1テーブル、領域第2テーブル、領域第3テーブル、セグメント・テーブル、及び随意的なページ・テーブルを含む、変換の階層が提供される。アドレス変換の性能は、仮想アドレスを関連した物理的メモリ位置にマッピングするエントリを含むトランスレーション・ルックアサイド・バッファ(TLB)を用いることにより改善されることが多い。DATが変換テーブルを用いて仮想アドレスを変換したときに、エントリが作成される。次いで、後に仮想アドレスを用いることで、低速の順次変換テーブル・アクセスではなく、高速のTLBのエントリを用いることが可能になる。TLBの内容は、LRU(Least Recently Used)を含む種々の置換アルゴリズムによって管理することができる。
プロセッサがマルチプロセッサ・システムのプロセッサである場合には、各プロセッサは、コヒーレンシのために、I/O、キャッシュ、TLB、及びメモリといった共有リソースをインターロック状態に保持する責任を負う。キャッシュ・コヒーレンシを保持する際に、一般的には「スヌープ」技術が用いられる。スヌープ環境においては、共有を容易にするために、各キャッシュ・ラインを、共有状態、排他的状態、変更状態、無効状態等のいずれか1つの状態にあるものとしてマーク付けすることができる。
I/Oユニット5054(図16)は、プロセッサに、例えば、テープ、ディスク、プリンタ、ディスプレイ、及びネットワークを含む周辺機器に取り付けるための手段を与える。I/Oユニットは、ソフトウェア・ドライバによってコンピュータ・プログラムに提示されることが多い。IBM(登録商標)によるSystem zのようなメインフレームにおいては、チャネル・アダプタ及びオープン・システム・アダプタが、オペレーティング・システムと周辺機器との間に通信をもたらすメインフレームのI/Oユニットである。
さらに、他のタイプのコンピューティング環境が、本発明の1以上の態様から利益を得ることができる。一例として、環境は、特定のアーキテクチャ(例えば、命令実行、アドレス変換などのアーキテクチャ化された機能、及びアーキテクチャ化されたレジスタを含む)又はそのサブセットを(例えば、プロセッサ及びメモリを有するネイティブ・コンピュータ・システム上で)エミュレートするエミュレータ(例えば、ソフトウェア又は他のエミュレーション機構)を含むことができる。このような環境においては、エミュレータを実行しているコンピュータが、エミュレートされる機能とは異なるアーキテクチャを有する場合も、エミュレータの1以上のエミュレーション機能により、本発明の1以上の態様が実施され得る。一例として、エミュレーション・モードにおいては、エミュレートされる特定の命令又はオペレーションがデコードされ、適切なエミュレーション機能が構築され、個々の命令又はオペレーションを実施する。
エミュレーション環境においては、ホスト・コンピュータは、例えば、命令及びデータを格納するメモリと、メモリから命令をフェッチし、フェッチされた命令のためのローカル・バッファリングを任意で提供する命令フェッチ・ユニットと、フェッチされた命令を受信し、フェッチされた命令のタイプを判断する命令デコード・ユニットと、命令を実行する命令実行ユニットとを含む。実行は、データをメモリからレジスタ内にロードするステップと、データをレジスタから再びメモリに格納するステップと、又はデコード・ユニットにより判断されるように、何らかのタイプの算術演算又は論理演算を実行するステップとを含むことができる。一例においては、各ユニットは、ソフトウェアで実装される。例えば、ユニットが実行する演算は、エミュレータ・ソフトウェア内の1以上のサブルーチンとして実装される。
より具体的には、メインフレームにおいて、アーキテクチャ化されたマシン命令は、プログラマ、通常現在では「C」プログラマによって、多くの場合コンパイラ・アプリケーションを介して用いられる。ストレージ媒体内に格納されたこれらの命令は、z/ArchitectureのIBM(登録商標)サーバにおいて、又は代替的に他のアーキテクチャを実行するマシンにおいて、自然に実行することができる。これらの命令は、既存及び将来のIBM(登録商標)メインフレーム・サーバにおいて、及び、IBM(登録商標)の他のマシン(例えば、Power Systemsサーバ及びSystem x(登録商標)サーバ)上で、エミュレートすることができる。これらの命令は、IBM(登録商標)、Intel(登録商標)、AMD(商標)などによって製造されたハードウェアを用いて種々のマシン上でLinuxを実行しているマシンにおいて実行することができる。z/Architecture下でそのハードウェアで実行することに加えて、Linuxを利用することができると共に、一般に実行がエミュレーション・モードであるHercules、UMX又はFSI(Fundamental Software,Inc)によるエミュレーションを使用するマシンを利用することもできる。エミュレーション・モードにおいては、ネイティブ・プロセッサによって、エミュレーション・ソフトウェアが実行され、エミュレートされたプロセッサのアーキテクチャをエミュレートする。
ネイティブ・プロセッサは、一般的に、エミュレートされたプロセッサのエミュレーションを実行するためにファームウェア又はネイティブ・オペレーティング・システムのいずれかを含むエミュレーション・ソフトウェアを実行する。エミュレーション・ソフトウェアは、エミュレートされたプロセッサ・アーキテクチャの命令のフェッチと実行を担当する。エミュレーション・ソフトウェアは、エミュレートされたプログラム・カウンタを維持し、命令境界を常時監視している。エミュレーション・ソフトウェアは、一度に1以上のエミュレートされたマシン命令をフェッチすることができ、ネイティブ・プロセッサにより実行するために、その1以上のエミュレートされたマシン命令を、対応するネイティブマシン命令のグループに変換することができる。これらの変換された命令は、より速い変換を実現できるように、キャッシュに入れることができる。それにも関わらず、エミュレーション・ソフトウェアは、エミュレートされたプロセッサ・アーキテクチャのアーキテクチャ規則を維持して、エミュレートされたプロセッサのために書かれたオペレーティング・システム及びアプリケーションが正確に動作することを保証しなければならない。さらに、エミュレートされたプロセッサ上で実行するように設計されたオペレーティング・システム又はアプリケーション・プログラムが、エミュレーション・ソフトウェアを有するネイティブ・プロセッサ上で実行できるようにすべく、エミュレーション・ソフトウェアは、これらに限られるものではないが、制御レジスタ、汎用レジスタ、浮動小数点レジスタ、例えばセグメント・テーブル及びページ・テーブルを含む動的アドレス変換機能、割り込み機構、コンテキスト・スイッチ機構、時刻(Time of Day、TOD)クロック、並びにI/Oサブシステムへのアーキテクチャ化インターフェースを含むエミュレートされたプロセッサのアーキテクチャによって識別されるリソースを提供しなければならない。
エミュレートされた特定の命令がデコードされ、サブルーチンが呼び出されて個々の命令の機能を実行する。エミュレートされたプロセッサの1の機能をエミュレートするエミュレーション・ソフトウェア機能は、例えば、「C」サブルーチン又はドライバに実装され、または好ましい実施形態の説明を理解した当業者の技術の範囲内にあるような、特定のハードウェア用のドライバを提供する他の方法で実装される。種々のソフトウェア及びハードウェア・エミュレーションの特許には、これらに限られるものではないが、Beausoleil他による「Multiprocessor for Hardware Emulation」という名称の特許文献1、Scalzi他による「Preprocessing of Stored Target Routines for Emulating Incompatible Instructions on a Target Processor」という名称の特許文献2、Davidian他による「Decoding Guest Instruction to Directly Access Emulation Routines that Emulate the Guest Instructions」という名称の特許文献3、Gorishek他による「Symmetrical Multiprocessing Bus and Chipset Used for Coprocessor Support Allowing Non−Native Code to Run in a System」という名称の特許文献4、Lethin他による「Dynamic Optimizing Object Code Translator for Architecture Emulation and Dynamic Optimizing Object Code Translation Method」という名称の特許文献5、Eric Trautによる「Method for Emulating Guest Instructions on a Host Computer Through Dynamic Recompilation of Host Instructions」という名称の特許文献6、及び他の多が含まれれ、これらの参考文献は、当業者が利用可能なターゲット・マシンのための異なるマシン用に設計された命令形式のエミュレーションを達成する様々な既知の方法を示す。
図18において、ホスト・アーキテクチャのホスト・コンピュータ・システム5000’をエミュレートする、エミュレートされたホスト・コンピュータ・システム5092の一例が提供される。エミュレートされたホスト・コンピュータ・システム5092では、ホスト・プロセッサ(CPU)5091は、エミュレートされたホスト・プロセッサ(又は仮想ホスト・プロセッサ)であり、且つ、ホスト・コンピュータ5000’のプロセッサ5091のものとは異なるネイティブな命令セット・アーキテクチャを有するエミュレーション・プロセッサ5093を含む。エミュレートされたホスト・コンピュータ・システム5092は、エミュレーション・プロセッサ5093がアクセス可能なメモリ5094を有する。例示的な実施形態において、メモリ5094は、ホスト・コンピュータ・メモリ5096の部分と、エミュレーション・ルーチン5097の部分とに区分化される。ホスト・コンピュータ・メモリ5096は、ホスト・コンピュータ・アーキテクチャに従い、エミュレートされたホスト・コンピュータ・システム5092のプログラムに利用可能である。エミュレーション・プロセッサ5093は、エミュレートされたプロセッサ5091の命令セット以外のアーキテクチャのアーキテクチャ化された命令セットのネイティブ命令を実行し、このネイティブ命令はエミュレーション・ルーチン・メモリ5097から取得されたものであり、且つ、エミュレーション・プロセッサ5093は、シーケンス及びアクセス/デコード・ルーチンにおいて取得される1以上の命令を用いることにより、ホスト・コンピュータ・メモリ5096の中のプログラム由来の実行のためのホスト命令にアクセスすることができ、このシーケンス及びアクセス/デコード・ルーチンは、アクセスされたホスト命令をデコードして、アクセスされたホスト命令の機能をエミュレートするためのネイティブ命令実行ルーチンを判断することができる。ホスト・コンピュータ・システム5000’のアーキテクチャのために定められた、例えば、汎用レジスタ、制御レジスタ、動的アドレス変換、及びI/Oサブシステムのサポート、並びにプロセッサ・キャッシュといったファシリティを含む他のファシリティを、アーキテクチャ化ファシリティ・ルーチンによってエミュレートすることができる。エミュレーション・ルーチンは、エミュレーション・ルーチンの性能を高めるために、エミュレーション・プロセッサ5093において利用可能な(汎用レジスタ、及び仮想アドレスの動的変換といった)機能を利用することもできる。ホスト・コンピュータ5000’の機能をエミュレートする際に、プロセッサ5093を補助するために、専用のハードウェア及びオフ・ロード・エンジンを設けることもできる。
本明細書で用いられる用語は、特定の実施形態を説明する目的のためのものにすぎず、本発明を限定することを意図するものではない。本明細書で用いられる場合、単数形「1つの(a)」、「1つの(an)」及び「その(the)」は、文脈が特に明示しない限り、複数形も同様に含むことを意図したものである。さらに、「含む(comprise)」及び/又は「含んでいる(comprising)」という用語は、本明細書で用いられる場合、記述された特徴、整数、ステップ、動作、要素、及び/又はコンポーネントの存在を示すが、1以上の他の特徴、整数、ステップ、動作、要素、コンポーネント、及び/又はそれらの群の存在又は追加を排除するものではないことも理解されるであろう。
下記の特許請求の範囲におけるすべての手段又は機能要素を加えたステップに対応する構造、材料、動作、及び均等物は、もしあれば、その機能を、明確に請求されている他の特許請求された要素と組み合わせて機能を果たすいずれの構造、材料、又は動作を含むことが意図されている。本発明の説明は、例証及び説明のために提示されたものであり、網羅的であること又は本発明を開示された形態に限定することを意図したものではない。当業者には、本発明の範囲及び精神から逸脱しない多くの修正及び変形が明らかであろう。本発明の原理及び実際の適用を最も良く説明するため、また、他の当業者が、企図される特定の使用に適した種々の修正を伴う種々の実施形態について本発明を理解できるように、上記実施形態は、選択され、説明された。
第23章 Vector String(ベクトル・ストリング)命令
ベクトル・ストリング・ファシリティ

命令
別に指定しない限り、全てのオペランドはベクトル・レジスタ・オペランドである。アセンブラ構文における「V」はベクトル・オペランドを指示する。
VECTOR FIND ANY EQUAL
左から右へ進み、第2のオペランドの全ての符合なし2進整数要素は、第3のオペランドの符合なし2進整数要素の各々と、等値性に関して比較され、Mフィールド内にZero Search(ゼロ検索)フラグが設定されている場合は、任意でゼロと比較される。
フィールド内のResult Type(結果タイプ)(RT)フラグがゼロである場合、第3のオペランド内のいずれかの要素又は任意でゼロと一致する第2のオペランド内の各要素に対して、第1のオペランド内の対応する要素のビット位置が1に設定され、それ以外はゼロに設定される。Mフィールド内のResult Type(RT)フラグが1である場合、第3のオペランド内の一要素又はゼロと一致する第2のオペランド内の左端要素のバイト・インデックスが、第1のオペランドのバイト7に格納される。
各命令は、推奨される拡張ニーモニック及びそれらの対応する機械アセンブラ構文を記述するExtended Mnemonic(拡張ニーモニック)部分を有する。
プログラミング上の注意:任意で条件コードを設定する全ての命令に関して、条件コードが設定される場合には性能が低下する可能性がある。
フィールド内のResult Type(RT)フラグが1であり、どのバイトも等しくないことが見出されるか、又はゼロ検索フラグが設定されている場合にゼロである場合、ベクトル内のバイト数に等しいインデックスが第1のオペランドのバイト7に格納される。
フィールドは、要素サイズ制御(ES)を指定する。ES制御は、ベクトル・レジスタ・オペランド内の要素のサイズを指定する。予約値が指定された場合、指定例外が認識される。
0−バイト
1−ハーフワード
2−ワード
3−15−予約
フィールドは以下の形式を有する。
フィールドのビットは、以下のように定義される。
・Result Type(RT):ゼロの場合、結果の各要素は、その要素についての全ての範囲比較のマスクとなる。1の場合、バイト・インデックスが第1のオペランドのバイト7に格納され、ゼロが全ての他の要素に格納される。
・Zero Search(ゼロ検索)(ZS):1の場合、第2のオペランドの各要素は、ゼロとも比較される。
・Condition Code Set(条件コード設定)(CC):ゼロの場合、条件コードは設定されず、変更されない。1の場合、条件コードは、以下の節で指定されるように設定される。
特別条件
指定例外が認識され、以下のいずれかが生じた場合、その他のいずれの動作も行われない。
1.Mフィールドが3から15までの値を含む。
2.Mフィールドのビット0がゼロでない。
結果の条件コード:
CCフラグがゼロである場合、コードは変更されない。
CCフラグが1である場合、コードは以下のように設定される。
0 ZSビットが設定されており、第2のオペランド内のゼロより下位のインデックス付き要素内に一致が存在しない場合。
1 第2のオペランドの幾つかの要素が、第3のオペランド内の少なくとも1つの要素と一致する場合。
2 第2のオペランドの全ての要素が、第3のオペランド内の少なくとも1つの要素と一致する場合。
3 第2のオペランド内のいずれの要素も、第3のオペランド内のいずれの要素とも一致しない場合。
プログラム例外:
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたES値)
・トランザクション制限
拡張ニーモニック:
VECTOR FIND ELEMENT EQUAL
左から右へ進み、第2のオペランドの符合なし2進整数要素が、第3のオペランドの対応する符合なし2進整数要素と比較される。2つの要素が等しい場合、左端等値要素の第1のバイトのバイト・インデックスが、第1のオペランドのバイト7に配置される。第1のオペランドの残りのバイトにゼロが格納される。いずれのバイトも等しくない場合、又は、ゼロ比較が設定されている場合であっていずれのバイトもゼロでない場合、ベクトル内のバイト数に等しいインデックスが、第1のオペランドのバイト7に格納される。残りのバイトにはゼロが格納される。
フィールド内にZero Search(ZS)ビットが設定されている場合、第2のオペランド内の各要素は、等値性に関してゼロとも比較される。第2及び第3のオペランドのいずれかの他の要素が等しいことが見出される前に、第2のオペランド内にゼロの要素が見出された場合、ゼロであることが見出された要素の第1のバイトのバイト・インデックスが第1のオペランドのバイト7に格納され、他の全てのバイト位置にはゼロが格納される。Condition Code Set(CC)フラグが1である場合、条件コードはゼロに設定される。
フィールドは、要素サイズ制御(ES)を指定する。ES制御は、ベクトル・レジスタ・オペランド内の要素のサイズを指定する。予約値が指定された場合、指定例外が認識される。
0−バイト
1−ハーフワード
2−ワード
3−15−予約
フィールドは以下の形式を有する。
フィールドのビットは、以下のように定義される。
・Reserved(予約):ビット0−1は予約されており、ゼロでなければならない。そうでない場合には、指定例外が認識される。
・Zero Search(ZS):1の場合、第2のオペランドの各要素は、ゼロとも比較される。
・Condition Code Set(CC):ゼロの場合、条件コードは変更されない。1の場合、条件コードは、以下の節で指定されるように設定される。
特別条件
指定例外が認識され、以下のいずれかが生じた場合、その他のいずれの動作も行われない。
1.Mフィールドが3から15までの値を含む。
2.Mフィールドのビット0−1がゼロでない。
結果の条件コード:
フィールドのビット3が1に設定されている場合、コードは以下の様に設定される:
0 ゼロ比較ビットが設定されており、比較により、いずれの等値比較よりも小さいインデックスを有する要素内で第2のオペランド内のゼロ要素を検出した場合。
1 比較により、第2のオペランドと第3のオペランドとの間で何らかの要素の一致を検出した場合。ゼロ比較ビットが設定されている場合、この一致は、ゼロ比較要素に等しいか又は小さいインデックスを有する要素において生じる。
2 −−
3 比較したいずれの要素も等値ではなかった場合。
フィールドのビット3がゼロである場合、コードは変更されない。
プログラム例外
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたES値)
・トランザクション制限
拡張ニーモニック
プログラミング上の注意:
1.バイト・インデックスは、いずれの要素サイズに関しても常に第1のオペランド内に格納される。例えば、要素サイズがハーフワードに設定され、第2のインデックス付きハーフワードが等値比較された場合、4のバイト・インデクッスが格納されることになる。
2.第3のオペランドは、ゼロ値を有する要素を含んではならない。第3のオペランドがゼロを含み、他のいずれかの等値比較の前に第2のオペランド内のゼロ要素と一致した場合、ゼロ比較ビットの設定に関わらず、条件コード1が設定される。
VECTOR FIND ELEMENT NOT EQUAL
左から右へ進み、第2のオペランドの符合なし2進整数要素が、第3のオペランドの対応する符合なし2進整数要素と比較される。2つの要素が等しくない場合、左端非等値要素の第1のバイトのバイト・インデックスが、第1のオペランドのバイト7に配置され、他の全てのバイトにゼロが格納される。Mフィールド内のCondition Code Set(CC)ビットが1に設定されている場合、条件コードはどのオペランドがより大きかったかを示すように設定される。全ての要素が等しかった場合、ベクトル・サイズに等しいバイト・インデックスが第1のオペランドのバイト7に配置され、他の全てのバイト位置にはゼロが配置される。CCビットが1である場合、条件コード3が設定される。
フィールド内にゼロ検索(ZS)ビットが設定されている場合、第2のオペランド内の各要素は、等値性に関してゼロとも比較される。第2のオペランドのいずれかの他の要素が非等値であることを見出される前に、第2のオペランド内にゼロ要素が見出された場合、ゼロであることが見出された要素の第1のバイトのバイト・インデックスが第1のオペランドのバイト7に格納される。全ての他のバイトにはゼロが格納され、条件コード0が設定される。
フィールドは、要素サイズ制御(ES)を指定する。ES制御は、ベクトル・レジスタ・オペランド内の要素のサイズを指定する。予約値が指定された場合、指定例外が認識される。
0−バイト
1−ハーフワード
2−ワード
3−15−予約
フィールドは以下の形式を有する。
フィールドのビットは、以下のように定義される。
・Zero Search(ZS):1の場合、第2のオペランドの各要素は、ゼロとも比較される。
・Condition Code Set(CC):ゼロの場合、条件コードは設定されず変更されない。1の場合、条件コードは以下の節で指定されるように設定される。
特別条件
指定例外が認識され、以下のいずれかが生じた場合、その他のいずれの動作も行われない。
1.Mフィールドが3から15までの値を含む。
2.Mフィールドのビット0−1がゼロでない。
結果の条件コード:
フィールドのビット3が1に設定されている場合、コードは以下の様に設定される:
0 ゼロである比較ビットが設定されており、比較により、両オペランド内のゼロ要素をいずれの非等値比較よりも下位のインデックス付き要素内で検出した場合。
1 要素不一致が検出され、VR2内の要素がVR3内の要素より小さい場合。
2 要素不一致が検出され、VR2内の要素がVR3内の要素より大きい場合。
3 比較した全ての要素が等値であり、且つ、ゼロ比較ビットが設定されている場合には第2のオペランド内にゼロ要素が見出されなかった場合。
フィールドのビット3がゼロである場合、コードは変更されない。
プログラム例外:
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたES値)
・トランザクション制限
拡張ニーモニック
VECTOR STRING RANGE COMPARE
左から右へ進み、第2のオペランドの符合なし2進整数要素が、第3及び第4のオペランド内の要素の偶奇対によって定義される値の範囲と比較される。第4のオペランドからの制御値との組合せが、実行される比較の範囲を定める。ある要素が第3及び第4のオペランドによって指定される範囲のいずれかと一致する場合、一致であると見なされる。
フィールド内のResult Type(RT)フラグがゼロである場合、第2のオペランド内の比較される要素に対応する第1のオペランド内の要素のビット位置が、その要素がいずれかの範囲に一致する場合に1には設定され、それ以外はゼロに設定される。
フィールド内のResult Type(RT)フラグが1である場合、第3及び第4のオペランドによって指定される範囲のいずれかと一致する第2のオペランド内の第1の要素のバイト・インデックス、又はZSフラグが1に設定されている場合にはゼロ比較と一致する第2のオペランド内の第1の要素のバイト・インデックスが、第1のオペランドのバイト7に配置され、残りのバイトにはゼロが格納される。いずれの要素も一致しない場合、ベクトル内のバイト数に等しいインデックスが第1のオペランドのバイト7に配置され、残りのバイトにはゼロが格納される。
フィールド内のZero Search(ZS)フラグが1に設定されている場合、第3及び第4のオペランドによって与えられる範囲に対して、第2のオペランド要素のゼロとの比較を行う。ゼロ比較が他のいずれの真の比較よりも下位のインデックス付き要素内にある場合、条件コードはゼロに設定される。
オペランドは、Mフィールド内のElement Size(要素サイズ)制御によって指定されるサイズの要素を含む。
第4のオペランド要素は、以下の形式を有する。
ESが0に等しい場合、
ESが1に等しい場合、
ESが2に等しい場合、
第4のオペランド要素内のビットは、以下の様に定義される。
・Equal(等しい)(EQ):1のとき、等値比較がなされる。
・Grater Than(大なり)(GT):1のとき大なり(greater than)比較が実行される。
・Less Than(小なり)(LT):1のとき、小なり(less than)比較が実行される。
・全ての他のビットは予約され、将来の互換性を保証するためにゼロにすべきである。
制御ビットは、任意の組合せで用いることができる。いずれのビットも設定されていない場合、比較は常に偽の結果を生じることになる。全てのビットが設定されている場合、比較は常に真の結果を生じることになる。
フィールドは、要素サイズ制御(ES)を指定する。ES制御は、ベクトル・レジスタ・オペランド内の要素のサイズを指定する。予約値が指定された場合、指定例外が認識される。
0−バイト
1−ハーフワード
2−ワード
3−15−予約
フィールドは以下の形式を有する。
フィールドのビットは。以下のように定義される。
・Invert Result(反転結果)(IN):ゼロの場合、制御ベクトル内の値の対について比較が続けられる。1の場合、その範囲内の比較の対の結果が反転される。
・Result Type(RT):ゼロの場合、結果の各要素は、その要素についての全ての範囲比較のマスクとなる。1の場合、インデックスが第1のオペランドのバイト7に格納される。残りのバイトにはゼロが格納される。
・Zero Search(ZS):1の場合、第2のオペランドの各要素は、ゼロとも比較される。
・Condition Code Set(CC):ゼロの場合、条件コードは設定されず、変更されない。1の場合、条件コードは、以下の節で指定されるように設定される。
特別条件
指定例外が認識され、以下のいずれかが生じた場合、その他のいずれの動作も行われない。
1.Mフィールドが3から15までの値を含む。
結果の条件コード:
0 ZS=1であり、且つ、ゼロがいずれの比較よりも下位のインデクス付き要素内に見出される場合。
1 比較が見出された場合。
2 −−
3 比較が見出されなかった場合。
プログラム例外:
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたES値)
・トランザクション制限
拡張ニーモニック
LOAD COUNT TO BLOCK BOUNDARY
16にて制限された指定ブロック境界を横切ることなく、第2のオペランド位置からロードすることが可能なバイト数を含んだ32ビットの符合なし2進整数が、第1のオペランド内に配置される。
変位は、12ビットの符号なし整数として扱われる。
第2のオペランド・アドレスは、データをアドレス指定するのには使用されない。
フィールドは、ロードされる可能なバイト数を計算するためのブロック境界サイズに関してCPUに信号を送るのに用いられるコードを指定する。予約値が指定された場合には、指定例外が認識される。
コード境界
0 64バイト
1 128バイト
2 256バイト
3 512バイト
4 1Kバイト
5 2Kバイト
6 4Kバイト
7−15 予約
結果の条件コード:
0 オペランド1が16の場合
1 −−
2 −−
3 オペランド1が16より小さい場合
結果の条件コード:
プログラム例外
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定
プログラミング上の注意:LOAD COUNT TO BLOCK BOUNDARYは、ロードされたバイト数を判定するために、VECTOR LOAD TO BLOCK BOUNDARYと併せて使用されることが予期される。
VECTOR LOAD GR FROM VR ELEMENT
フィールド内のES値で指定されるサイズを有し、第2のオペランド・アドレスでインデックス付けされた第3のオペランドの要素が、第1のオペランド位置内に配置される。第3のオペランドは、ベクトル・レジスタである。第1のオペランドは、汎用レジスタである。第2のオペランド・アドレスによって指定されたインデックスが、指定された要素サイズの第3のオペランド内の最高番号を付された要素よりも大きい場合、第1のオペランド内のデータは、予測不可能である。
ベクトル・レジスタ要素がダブルワードより小さい場合、要素は64ビット汎用レジスタ内で右寄せされ、残りのビットにはゼロが入る。
第2のオペランド・アドレスは、データをアドレス指定するのには使用されず、その代りに、アドレスの右端の12ビットが、第2のオペランド内の要素のインデックスを指定するのに使用される。
フィールドは、要素サイズ制御(ES)を指定する。ES制御は、ベクトル・レジスタ・オペランド内の要素のサイズを指定する。予約値が指定された場合、指定例外が認識される。
0−バイト
1−ハーフワード
2−ワード
3−ダブルワード
4−15−予約されており、変更されない。
結果の条件コード:コードは変更されない。
プログラム例外:
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたES値)
・トランザクション制限
拡張ニーモニック
VECTOR LOAD TO BLOCK BOUNDARY
第1のオペランドが、第2のオペランドからのバイトを伴うゼロでインデックス付けされたバイト要素で開始して、ロードされる。境界条件に遭遇した場合、第1のオペランドの残り部分は予測不可能である。ロードされていないバイトに対して、アクセス例外は認識されない。
VLBBの変位は、12ビット符合なし整数として取り扱われる。
フィールドは、ロードするためのブロック境界サイズに関してCPUに信号を送るのに用いられるコードを指定する。予約値が指定された場合には、指定例外が認識される。
コード境界
0 64バイト
1 128バイト
2 256バイト
3 512バイト
4 1Kバイト
5 2Kバイト
6 4Kバイト
7−15 予約
結果の条件コード:コードは変更されない。
プログラム例外:
・アクセス(フェッチ、オペランド2)
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・指定(予約されたブロック境界コード)
・トランザクション制限
プログラミング上の注意:
1.ある特定の状況において、データがブロック境界を越してロードされることがある。しかし、これは、そのデータについてのアクセス例外がない場合にのみ起ることになる。
VECTOR STORE
第1のオペランド内の128ビット値が、第2のオペランドによって指定される記憶位置に格納される。VSTの変位は、12ビット符号なし整数として取り扱われる。
結果の条件コード:コードは変更されない。
プログラム例外:
・アクセス(ストア、オペランド2)
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・トランザクション制限
VECTOR STORE WITH LENGTH
左から右へ進み、第1のオペランドからのバイトが、第2のオペランド位置に格納される。汎用レジスタにより指定された第3のオペランドは、格納する最高インデックス付きバイトを表す値を含んだ32ビット符号なし整数を含む。第3のオペランドが、ベクトルの最高バイト・インデックスより大きいか又は等しい値を含む場合、第1のオペランドの全てのバイトが格納される。
アクセス例外は、格納されたバイトについてのみ認識される。
VECTOR STORE WITH LENGTHに関する変位は、12ビット符号なし整数として取り扱われる。
結果の条件コード:条件コードは変更されない。
プログラム例外:
・アクセス(ストア、オペランド2)
・DXC FEを伴うデータ、ベクトル・レジスタ
・ベクトル拡張ファシリティがインストールされていない場合の演算
・トランザクション制限
RXBの説明
全てのベクトル命令は、命令のビット36−40において、RXBとラベル付けされたフィールドを有する。このフィールドは、ベクトル・レジスタが指示する全てのオペランドの最上位ビットを含む。命令によって指定されていないレジスタ指示のためのビットは、予約され、ゼロに設定されるべきであり、さもなければ、プログラムは、将来、互換的に動作することができない。その最上位ビットが4ビット・レジスタ指示の左に連結されて、5ビットのベクトル・レジスタ指定が作成される。
ビットは以下の様に定義される:
0.命令のビット8−11内のベクトル・レジスタ指示のための最上位ビット。
1.命令のビット12−15内のベクトル・レジスタ指示のための最上位ビット。
2.命令のビット16−19内のベクトル・レジスタ指示のための最上位ビット。
3.命令のビット32−35内のベクトル・レジスタ指示のための最上位ビット。
Vector Enablement(ベクトル・イネーブルメント)制御
ベクトル・レジスタ及び命令は、制御レジスタ・ゼロ内のベクトル・イネーブルメント制御(ビット46)及びAFPレジスタ制御(ビット45)の両方が1に設定されている場合にのみ使用することができる。ベクトル・ファシリティがインストールされ、ベクトル命令がイネーブルメント・ビット設定なしに実行される場合、DXC EF hexによるデータ例外が認識される。ベクトル・ファシリティがインストールされていない場合、演算例外が認識される。
100:コンピューティング環境
102:ネイティブ中央演算処理ユニット(CPU)
104:メモリ
106:入力/出力デバイス
108:バス
110:ネイティブ・レジスタ
112:エミュレータ・コード
200:ゲスト命令
202:命令フェッチ・ユニット
204:命令翻訳ルーチン
206:ネイティブ命令
210:エミュレーション制御ルーチン
902a、902b:オペコード・フィールド
904:ベクトル・レジスタ・フィールド
906:インデックス・フィールド
908:ベース・フィールド
910:変位フィールド
912:RXBフィールド
954:VRTフィールド

Claims (20)

  1. コンピューティング環境の命令指定子を変換する処理をコンピュータに実行させるためのプログラムであって
    プロセッサにより、第1のコンピュータ・アーキテクチャに対して定義された第1の命令から不連続指定子を取得するステップであって、前記不連続指定子は、第1の部分及び第2の部分を有し、前記不連続指定子を取得するステップは、前記第1の部分を前記命令の第1のフィールドから取得し、前記第2の部分を前記命令の第2のフィールドから取得するステップを含み、前記第1のフィールドは、前記第2のフィールドから分離している、ステップと、
    前記第1の部分及び前記第2の部分を使用して連続指定子を生成するステップであって、前記連続指定子を生成するステップは、前記第1の命令のオペコードに基づく1以上の規則を用いる、ステップと、
    前記連続指定子を使用して第2の命令の実行に用いられるリソースを示すステップであって、前記第2の命令は、前記第1のコンピュータ・アーキテクチャとは異なる第2のコンピュータ・アーキテクチャに対して定義され、且つ、前記第1の命令の機能をエミュレートする、ステップと、
    実行させる、プログラム
  2. 前記プロセッサは、エミュレータを含み、前記第1の部分は、1以上の第1のビットを含み、前記第2の部分は、1以上の第2のビットを含み、前記連続指定子を生成するステップは、前記1以上の第2のビットを前記1以上の第1のビットと連結して前記連続指定子を形成するステップを含み、前記1以上の第2のビットは、前記連続指定子の最上位ビットである、請求項1に記載のプログラム
  3. 前記第1のフィールドは、前記第1のフィールドに関連付けられたオペランド位置を有し、前記1以上の第2のビットは、前記第2のフィールドの複数のビットのサブセットであり、前記不連続指定子を取得するステップは、前記第1のフィールドの前記オペランド位置に基づいて、前記第2のフィールドの前記複数のビットから前記1以上の第2のビットを選択するステップを含む、請求項2に記載のプログラム
  4. 前記第1のフィールドの前記オペランド位置は、第1のオペランドとしてのものであり、前記1以上の第2のビットは、前記第2のフィールドの左端位置から選択される、請求項3に記載のプログラム
  5. 前記第1のフィールドは、レジスタ・フィールドから成り、前記第2のフィールドは、拡張フィールドで構成されており、前記第1の部分は、前記レジスタ・フィールドからの複数のビットで構成されており、前記第2の部分は、前記レジスタ・フィールドに対応する前記命令の位置における、拡張フィールドからのビットで構成されており、前記連続指定子を生成するステップは、前記拡張フィールドからの前記ビットを前記レジスタ・フィールドからの前記ビットと連結して前記連続指定子を提供するステップを含む、請求項1〜4のいずれか1項に記載のプログラム
  6. 前記連続指定子を使用してリソースを示すステップは、前記連続指定子を使用して、前記第2の命令によって使用されるレジスタにマップするステップを含む、請求項1〜5のいずれか1項に記載のプログラム
  7. 前記連続指定子によってマップされる前記レジスタは、前記連続指定子と同じ値を有する、請求項6に記載のプログラム
  8. 前記連続指定子によってマップされる前記レジスタは、前記連続指定子と異なる値を有する、請求項6に記載のプログラム
  9. 前記第1のコンピュータ・アーキテクチャは、前記第1のコンピュータ・アーキテクチャのレジスタ・スペースのサブセクションにアクセスするためのレジスタ・フィールドを有する第1の命令と、前記レジスタ・スペースの前記サブセクション及び残りのサブセクションにアクセスするための不連続レジスタ・フィールドを有する第2の命令とを有する命令セットを含み、前記第1の命令は、前記残りのサブセクションにアクセスすることから除外される、請求項1〜8のいずれか1項に記載のプログラム
  10. 前記第1のフィールドは、レジスタ・フィールドで構成されており、前記第2のフィールドは、拡張フィールドで構成されており、前記第1の部分は、前記レジスタ・フィールドからの複数のビットで構成されており、前記第2の部分は、前記レジスタ・フィールドに対応する前記命令の位置における、前記拡張フィールドからのビットで構成されており、前記連続指定子を生成するステップは、前記拡張フィールドからの前記ビットを前記レジスタ・フィールドからの前記ビットと連結して前記連続指定子を提供するステップを含み、
    前記プロセッサにより、前記第1の命令から、別の不連続指定子を取得するステップであって、前記別の不連続指定子は、別の第1の部分及び別の第2の部分を有し、前記別の不連続指定子を取得するステップは、前記別の第1の部分を前記命令の別の第1のフィールドから取得、前記別の第2の部分を前記拡張フィールドの別のビットから取得するステップを含み、前記別の第1のフィールドは、前記第1のフィールド及び前記拡張フィールドから分離している、ステップと、
    前記別の第1の部分及び前記別のビットを使用して別の連続指定子を生成するステップであって、前記別の連続指定子を生成するステップは、前記第1の命令のオペコードに基づく1以上の規則を用いる、ステップと、
    前記別の連続指定子を用いて、前記第2の命令の実行に用いられるリソースを示すステップと、
    をさらに実行させる、請求項1に記載のプログラム
  11. コンピューティング環境の命令指定子を変換するためのコンピュータ・システムであって、
    メモリと、
    前記メモリと通信するプロセッサと、
    を含み、前記コンピュータ・システムは方法を実行するように構成され、前記方法は、
    プロセッサにより、第1のコンピュータ・アーキテクチャに対して定義された第1の命令から不連続指定子を取得するステップであって、前記不連続指定子は、第1の部分及び第2の部分を有し、前記不連続指定子を取得するステップは、前記第1の部分を前記命令の第1のフィールドから取得し、前記第2の部分を前記命令の第2のフィールドから取得するステップを含み、前記第1のフィールドは、前記第2のフィールドから分離している、ステップと、
    前記第1の部分及び前記第2の部分を使用して連続指定子を生成するステップであって、前記連続指定子を生成するステップは、前記第1の命令のオペコードに基づく1以上の規則を用いる、ステップと、
    前記連続指定子を使用して、第2の命令の実行に用いられるリソースを示すステップであって、前記第2の命令は、前記第1のコンピュータ・アーキテクチャとは異なる第2のコンピュータ・アーキテクチャに対して定義され、且つ、前記第1の命令の機能をエミュレートする、ステップと、
    を含む、コンピュータ・システム。
  12. 前記プロセッサは、エミュレータを含み、前記第1の部分は、1以上の第1のビットを含み、前記第2の部分は、1以上の第2のビットを含み、前記連続指定子を生成するステップは、前記1以上の第2のビットを前記1以上の第1のビットと連結して前記連続指定子を形成するステップを含み、前記1以上の第2のビットは、前記連続指定子の最上位ビットである、請求項11に記載のコンピュータ・システム。
  13. 前記第1のフィールドは、前記第1のフィールドに関連付けられたオペランド位置を有し、前記1以上の第2のビットは、前記第2のフィールドの複数のビットのサブセットであり、前記不連続指定子を取得するステップは、前記第1のフィールドの前記オペランド位置に基づいて、前記第2のフィールドの前記複数のビットから前記1以上の第2のビットを選択するステップを含む、請求項12に記載のコンピュータ・システム。
  14. 前記第1のフィールドの前記オペランド位置は、第1のオペランドとしてのものであり、前記1以上の第2のビットは、前記第2のフィールドの左端位置から選択される、請求項13に記載のコンピュータ・システム。
  15. 前記第1のフィールドは、レジスタ・フィールドを含み、前記第2のフィールドは、拡張フィールドを含み、前記第1の部分は、前記レジスタ・フィールドからの複数のビットを含み、前記第2の部分は、前記レジスタ・フィールドに対応する前記命令の位置における、拡張フィールドからのビットを含み、前記連続指定子を生成するステップは、前記拡張フィールドからの前記ビットを前記レジスタ・フィールドからの前記ビットと連結して前記連続指定子を提供するステップを含む、請求項11〜14のいずれか1項に記載のコンピュータ・システム。
  16. 前記連続指定子を使用してリソースを示すステップは、前記連続指定子を使用して、前記第2の命令によって使用されるレジスタにマップするステップを含む、請求項11〜15のいずれか1項に記載のコンピュータ・システム。
  17. 前記連続指定子によってマップされる前記レジスタは、前記連続指定子と同じ値又は前記連続指定子と異なる値のうちの一方を有する、請求項16に記載のコンピュータ・システム。
  18. コンピューティング環境の命令指定子を変換する方法であって、
    プロセッサにより、第1のコンピュータ・アーキテクチャに対して定義された第1の命令から不連続指定子を取得するステップであって、前記不連続指定子は、第1の部分及び第2の部分を有し、前記不連続指定子を取得するステップは、前記第1の部分を前記命令の第1のフィールドから取得し、前記第2の部分を前記命令の第2のフィールドから取得するステップを含み、前記第1のフィールドは、前記第2のフィールドから分離している、ステップと、
    前記第1の部分及び前記第2の部分を使用して連続指定子を生成するステップであって、前記連続指定子を生成するステップは、前記第1の命令のオペコードに基づく1以上の規則を用いる、ステップと、
    前記連続指定子を使用して、第2の命令の実行に用いられるリソースを示すステップであって、前記第2の命令は、前記第1のコンピュータ・アーキテクチャとは異なる第2のコンピュータ・アーキテクチャに対して定義され、且つ、前記第1の命令の機能をエミュレートする、ステップと、
    を含む方法。
  19. 前記プロセッサは、エミュレータを含み、前記第1の部分は、1以上の第1のビットを含み、前記第2の部分は、1以上の第2のビットを含み、前記連続指定子を生成するステップは、前記1以上の第2のビットを前記1以上の第1のビットと連結して前記連続指定子を形成するステップを含み、前記1以上の第2のビットは、前記連続指定子の最上位ビットである、請求項18に記載の方法。
  20. 前記第1のフィールドは、レジスタ・フィールドを含み、前記第2のフィールドは、拡張フィールドを含み、前記第1の部分は、前記レジスタ・フィールドからの複数のビットを含み、前記第2の部分は、前記レジスタ・フィールドに対応する前記命令の位置における、拡張フィールドからのビットを含み、前記連続指定子を生成するステップは、前記拡張フィールドからの前記ビットを前記レジスタ・フィールドからの前記ビットと連結して前記連続指定子を提供するステップを含む、請求項18又は請求項19に記載の方法。
JP2014561527A 2012-03-15 2012-11-15 不連続命令指定子の連続命令指定子への変換 Active JP6108362B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/421,657 2012-03-15
US13/421,657 US9280347B2 (en) 2012-03-15 2012-03-15 Transforming non-contiguous instruction specifiers to contiguous instruction specifiers
PCT/IB2012/056436 WO2013136144A1 (en) 2012-03-15 2012-11-15 Transforming non-contiguous instruction specifiers to contiguous instruction specifiers

Publications (2)

Publication Number Publication Date
JP2015514242A JP2015514242A (ja) 2015-05-18
JP6108362B2 true JP6108362B2 (ja) 2017-04-05

Family

ID=49158813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014561527A Active JP6108362B2 (ja) 2012-03-15 2012-11-15 不連続命令指定子の連続命令指定子への変換

Country Status (24)

Country Link
US (2) US9280347B2 (ja)
EP (1) EP2769301B1 (ja)
JP (1) JP6108362B2 (ja)
KR (1) KR101643065B1 (ja)
CN (1) CN104169877B (ja)
AU (1) AU2012373735B2 (ja)
BR (1) BR112014022638B1 (ja)
CA (1) CA2867115C (ja)
DK (1) DK2769301T3 (ja)
ES (1) ES2779033T3 (ja)
HK (1) HK1201354A1 (ja)
HR (1) HRP20200393T1 (ja)
HU (1) HUE048409T2 (ja)
IL (1) IL232817A (ja)
LT (1) LT2769301T (ja)
MX (1) MX340050B (ja)
PL (1) PL2769301T3 (ja)
PT (1) PT2769301T (ja)
RU (1) RU2568241C2 (ja)
SG (1) SG11201404825SA (ja)
SI (1) SI2769301T1 (ja)
TW (1) TWI533207B (ja)
WO (1) WO2013136144A1 (ja)
ZA (1) ZA201406612B (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103373A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Variable caching structure for managing physical storage
WO2012103367A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Guest to native block address mappings and management of native code storage
WO2012103245A2 (en) 2011-01-27 2012-08-02 Soft Machines Inc. Guest instruction block with near branching and far branching sequence construction to native instruction block
WO2012103253A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Multilevel conversion table cache for translating guest instructions to native instructions
CN108874693B (zh) 2011-01-27 2022-09-23 英特尔公司 使用处理器的转换后备缓冲器的基于客户指令到本机指令范围的映射
WO2012103359A2 (en) 2011-01-27 2012-08-02 Soft Machines, Inc. Hardware acceleration components for translating guest instructions to native instructions
US9268566B2 (en) 2012-03-15 2016-02-23 International Business Machines Corporation Character data match determination by loading registers at most up to memory block boundary and comparing
US9459868B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Instruction to load data up to a dynamically determined memory boundary
US9715383B2 (en) 2012-03-15 2017-07-25 International Business Machines Corporation Vector find element equal instruction
US9459864B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Vector string range compare
US9280347B2 (en) 2012-03-15 2016-03-08 International Business Machines Corporation Transforming non-contiguous instruction specifiers to contiguous instruction specifiers
US9459867B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Instruction to load data up to a specified memory boundary indicated by the instruction
US9454366B2 (en) 2012-03-15 2016-09-27 International Business Machines Corporation Copying character data having a termination character from one memory location to another
US9710266B2 (en) 2012-03-15 2017-07-18 International Business Machines Corporation Instruction to compute the distance to a specified memory boundary
US9454367B2 (en) 2012-03-15 2016-09-27 International Business Machines Corporation Finding the length of a set of character data having a termination character
US9588762B2 (en) 2012-03-15 2017-03-07 International Business Machines Corporation Vector find element not equal instruction
WO2014031540A1 (en) * 2012-08-20 2014-02-27 Cameron Donald Kevin Processing resource allocation
US9513906B2 (en) 2013-01-23 2016-12-06 International Business Machines Corporation Vector checksum instruction
US9823924B2 (en) 2013-01-23 2017-11-21 International Business Machines Corporation Vector element rotate and insert under mask instruction
US9471308B2 (en) 2013-01-23 2016-10-18 International Business Machines Corporation Vector floating point test data class immediate instruction
US9804840B2 (en) 2013-01-23 2017-10-31 International Business Machines Corporation Vector Galois Field Multiply Sum and Accumulate instruction
US9715385B2 (en) 2013-01-23 2017-07-25 International Business Machines Corporation Vector exception code
CN109358948B (zh) 2013-03-15 2022-03-25 英特尔公司 用于支持推测的访客返回地址栈仿真的方法和装置
WO2014151652A1 (en) 2013-03-15 2014-09-25 Soft Machines Inc Method and apparatus to allow early dependency resolution and data forwarding in a microprocessor
US9703562B2 (en) 2013-03-16 2017-07-11 Intel Corporation Instruction emulation processors, methods, and systems
US20140281398A1 (en) * 2013-03-16 2014-09-18 William C. Rash Instruction emulation processors, methods, and systems
US9558032B2 (en) 2014-03-14 2017-01-31 International Business Machines Corporation Conditional instruction end operation
US9454370B2 (en) 2014-03-14 2016-09-27 International Business Machines Corporation Conditional transaction end instruction
US10120681B2 (en) 2014-03-14 2018-11-06 International Business Machines Corporation Compare and delay instructions
US10353680B2 (en) 2014-07-25 2019-07-16 Intel Corporation System converter that implements a run ahead run time guest instruction conversion/decoding process and a prefetching process where guest code is pre-fetched from the target of guest branches in an instruction sequence
US11281481B2 (en) 2014-07-25 2022-03-22 Intel Corporation Using a plurality of conversion tables to implement an instruction set agnostic runtime architecture
US20160026487A1 (en) * 2014-07-25 2016-01-28 Soft Machines, Inc. Using a conversion look aside buffer to implement an instruction set agnostic runtime architecture
US9792098B2 (en) * 2015-03-25 2017-10-17 International Business Machines Corporation Unaligned instruction relocation
US20170022314A1 (en) 2015-07-24 2017-01-26 Weyerhaeuser Nr Company Grafted crosslinked cellulose
US10055208B2 (en) * 2015-08-09 2018-08-21 Oracle International Corporation Extending a virtual machine instruction set architecture
US10235170B2 (en) * 2016-09-30 2019-03-19 International Business Machines Corporation Decimal load immediate instruction
CN110851345B (zh) * 2019-09-23 2023-04-14 上海辛格林纳新时达电机有限公司 一种系统参数的调用方法及调用装置
CN113268726B (zh) * 2020-02-17 2023-10-20 华为技术有限公司 程序代码执行行为的监控方法、计算机设备
US11263131B2 (en) * 2020-04-08 2022-03-01 Alibaba Group Holding Limited System and method for allocating memory space
US11914997B2 (en) 2020-12-29 2024-02-27 Shanghai Zhaoxin Semiconductor Co., Ltd. Method and system for executing new instructions
US11669328B2 (en) 2020-12-29 2023-06-06 Shanghai Zhaoxin Semiconductor Co., Ltd. Method and system for converting instructions
US11816487B2 (en) 2020-12-29 2023-11-14 Shanghai Zhaoxin Semiconductor Co., Ltd. Method of converting extended instructions based on an emulation flag and retirement of corresponding microinstructions, device and system using the same
US11625247B2 (en) 2020-12-29 2023-04-11 Shanghai Zhaoxin Semiconductor Co., Ltd. System for executing new instructions and method for executing new instructions
US11789736B2 (en) 2020-12-29 2023-10-17 Shanghai Zhaoxin Semiconductor Co., Ltd. Method and system for executing new instructions
US11604643B2 (en) 2020-12-29 2023-03-14 Shanghai Zhaoxin Semiconductor Co., Ltd. System for executing new instructions and method for executing new instructions
US11803383B2 (en) 2020-12-29 2023-10-31 Shanghai Zhaoxin Semiconductor Co., Ltd. Method and system for executing new instructions
US20220206809A1 (en) 2020-12-29 2022-06-30 Shanghai Zhaoxin Semiconductor Co., Ltd. Method and system for executing new instructions

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62276668A (ja) 1985-07-31 1987-12-01 Nec Corp ベクトルマスク演算制御ユニツト
US5073864A (en) 1987-02-10 1991-12-17 Davin Computer Corporation Parallel string processor and method for a minicomputer
US5222225A (en) 1988-10-07 1993-06-22 International Business Machines Corporation Apparatus for processing character string moves in a data processing system
JPH0831032B2 (ja) 1990-08-29 1996-03-27 三菱電機株式会社 データ処理装置
US5465374A (en) 1993-01-12 1995-11-07 International Business Machines Corporation Processor for processing data string by byte-by-byte
AU6629894A (en) 1993-05-07 1994-12-12 Apple Computer, Inc. Method for decoding guest instructions for a host computer
AU7108994A (en) 1993-06-14 1995-01-03 Apple Computer, Inc. Method and apparatus for finding a termination character within a variable length character string or a processor
JPH0721034A (ja) 1993-06-28 1995-01-24 Fujitsu Ltd 文字列複写処理方法
US5509129A (en) 1993-11-30 1996-04-16 Guttag; Karl M. Long instruction word controlling plural independent processor operations
US6185629B1 (en) 1994-03-08 2001-02-06 Texas Instruments Incorporated Data transfer controller employing differing memory interface protocols dependent upon external input at predetermined time
US5551013A (en) 1994-06-03 1996-08-27 International Business Machines Corporation Multiprocessor for hardware emulation
DE69520350T2 (de) 1994-09-27 2001-08-09 Nkk Corp., Tokio/Tokyo Galvanisiertes stahlblech und verfahren zur herstellung
US5790825A (en) 1995-11-08 1998-08-04 Apple Computer, Inc. Method for emulating guest instructions on a host computer through dynamic recompilation of host instructions
US5812147A (en) 1996-09-20 1998-09-22 Silicon Graphics, Inc. Instruction methods for performing data formatting while moving data between memory and a vector register file
US5931940A (en) 1997-01-23 1999-08-03 Unisys Corporation Testing and string instructions for data stored on memory byte boundaries in a word oriented machine
JP4467791B2 (ja) 1997-11-24 2010-05-26 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 情報管理及び検索
US6009261A (en) 1997-12-16 1999-12-28 International Business Machines Corporation Preprocessing of stored target routines for emulating incompatible instructions on a target processor
US6041402A (en) * 1998-01-05 2000-03-21 Trw Inc. Direct vectored legacy instruction set emulation
US6094695A (en) 1998-03-11 2000-07-25 Texas Instruments Incorporated Storage buffer that dynamically adjusts boundary between two storage areas when one area is full and the other has an empty data register
US6334176B1 (en) 1998-04-17 2001-12-25 Motorola, Inc. Method and apparatus for generating an alignment control vector
US6308255B1 (en) 1998-05-26 2001-10-23 Advanced Micro Devices, Inc. Symmetrical multiprocessing bus and chipset used for coprocessor support allowing non-native code to run in a system
US7100026B2 (en) 2001-05-30 2006-08-29 The Massachusetts Institute Of Technology System and method for performing efficient conditional vector operations for data parallel architectures involving both input and conditional vector values
US6463582B1 (en) 1998-10-21 2002-10-08 Fujitsu Limited Dynamic optimizing object code translator for architecture emulation and dynamic optimizing object code translation method
JP3564395B2 (ja) 1998-11-27 2004-09-08 松下電器産業株式会社 アドレス生成装置および動きベクトル検出装置
US6192466B1 (en) 1999-01-21 2001-02-20 International Business Machines Corporation Pipeline control for high-frequency pipelined designs
US8127121B2 (en) 1999-01-28 2012-02-28 Ati Technologies Ulc Apparatus for executing programs for a first computer architechture on a computer of a second architechture
US6189088B1 (en) 1999-02-03 2001-02-13 International Business Machines Corporation Forwarding stored dara fetched for out-of-order load/read operation to over-taken operation read-accessing same memory location
US6499116B1 (en) 1999-03-31 2002-12-24 International Business Machines Corp. Performance of data stream touch events
US6802056B1 (en) 1999-06-30 2004-10-05 Microsoft Corporation Translation and transformation of heterogeneous programs
US6381691B1 (en) 1999-08-13 2002-04-30 International Business Machines Corporation Method and apparatus for reordering memory operations along multiple execution paths in a processor
US6513109B1 (en) 1999-08-31 2003-01-28 International Business Machines Corporation Method and apparatus for implementing execution predicates in a computer processing system
US6449706B1 (en) 1999-12-22 2002-09-10 Intel Corporation Method and apparatus for accessing unaligned data
JP2001236249A (ja) 2000-02-24 2001-08-31 Nec Corp メモリ管理装置およびメモリ管理方法
US6625724B1 (en) 2000-03-28 2003-09-23 Intel Corporation Method and apparatus to support an expanded register set
US6349361B1 (en) 2000-03-31 2002-02-19 International Business Machines Corporation Methods and apparatus for reordering and renaming memory references in a multiprocessor computer system
US6701424B1 (en) 2000-04-07 2004-03-02 Nintendo Co., Ltd. Method and apparatus for efficient loading and storing of vectors
US6408383B1 (en) 2000-05-04 2002-06-18 Sun Microsystems, Inc. Array access boundary check by executing BNDCHK instruction with comparison specifiers
KR100852563B1 (ko) 2000-10-18 2008-08-18 코닌클리즈케 필립스 일렉트로닉스 엔.브이. 디지털 신호 처리 장치 및 방법
US7487330B2 (en) 2001-05-02 2009-02-03 International Business Machines Corporations Method and apparatus for transferring control in a computer system with dynamic compilation capability
JP3900863B2 (ja) 2001-06-28 2007-04-04 シャープ株式会社 データ転送制御装置、半導体記憶装置および情報機器
US6839828B2 (en) 2001-08-14 2005-01-04 International Business Machines Corporation SIMD datapath coupled to scalar/vector/address/conditional data register file with selective subpath scalar processing mode
US6907443B2 (en) 2001-09-19 2005-06-14 Broadcom Corporation Magnitude comparator
US6570511B1 (en) 2001-10-15 2003-05-27 Unisys Corporation Data compression method and apparatus implemented with limited length character tables and compact string code utilization
US20100274988A1 (en) 2002-02-04 2010-10-28 Mimar Tibet Flexible vector modes of operation for SIMD processor
US7089371B2 (en) 2002-02-12 2006-08-08 Ip-First, Llc Microprocessor apparatus and method for prefetch, allocation, and initialization of a block of cache lines from memory
US7441104B2 (en) 2002-03-30 2008-10-21 Hewlett-Packard Development Company, L.P. Parallel subword instructions with distributed results
US7373483B2 (en) * 2002-04-02 2008-05-13 Ip-First, Llc Mechanism for extending the number of registers in a microprocessor
US7376812B1 (en) 2002-05-13 2008-05-20 Tensilica, Inc. Vector co-processor for configurable and extensible processor architecture
US20040049657A1 (en) * 2002-09-10 2004-03-11 Kling Ralph M. Extended register space apparatus and methods for processors
US6918010B1 (en) 2002-10-16 2005-07-12 Silicon Graphics, Inc. Method and system for prefetching data
US7103754B2 (en) 2003-03-28 2006-09-05 International Business Machines Corporation Computer instructions for having extended signed displacement fields for finding instruction operands
US20040215924A1 (en) 2003-04-28 2004-10-28 Collard Jean-Francois C. Analyzing stored data
US7035986B2 (en) 2003-05-12 2006-04-25 International Business Machines Corporation System and method for simultaneous access of the same line in cache storage
US20040250027A1 (en) 2003-06-04 2004-12-09 Heflinger Kenneth A. Method and system for comparing multiple bytes of data to stored string segments
US7610466B2 (en) 2003-09-05 2009-10-27 Freescale Semiconductor, Inc. Data processing system using independent memory and register operand size specifiers and method thereof
US7904905B2 (en) 2003-11-14 2011-03-08 Stmicroelectronics, Inc. System and method for efficiently executing single program multiple data (SPMD) programs
GB2411973B (en) 2003-12-09 2006-09-27 Advanced Risc Mach Ltd Constant generation in SMD processing
US20060095713A1 (en) 2004-11-03 2006-05-04 Stexar Corporation Clip-and-pack instruction for processor
US7421566B2 (en) 2005-08-12 2008-09-02 International Business Machines Corporation Implementing instruction set architectures with non-contiguous register file specifiers
US9436468B2 (en) 2005-11-22 2016-09-06 Intel Corporation Technique for setting a vector mask
US8010953B2 (en) 2006-04-04 2011-08-30 International Business Machines Corporation Method for compiling scalar code for a single instruction multiple data (SIMD) execution engine
US7565514B2 (en) 2006-04-28 2009-07-21 Freescale Semiconductor, Inc. Parallel condition code generation for SIMD operations
CN101097488B (zh) 2006-06-30 2011-05-04 2012244安大略公司 从接收的文本中学习字符片段的方法及相关手持电子设备
US9069547B2 (en) 2006-09-22 2015-06-30 Intel Corporation Instruction and logic for processing text strings
US7536532B2 (en) 2006-09-27 2009-05-19 International Business Machines Corporation Merge operations of data arrays based on SIMD instructions
US7991987B2 (en) 2007-05-10 2011-08-02 Intel Corporation Comparing text strings
CN101755265A (zh) 2007-05-21 2010-06-23 茵科瑞蒂梅尔有限公司 交互式消息编辑系统和方法
US20090063410A1 (en) 2007-08-29 2009-03-05 Nils Haustein Method for Performing Parallel Data Indexing Within a Data Storage System
US7739434B2 (en) 2008-01-11 2010-06-15 International Business Machines Corporation Performing a configuration virtual topology change and instruction therefore
US7870339B2 (en) 2008-01-11 2011-01-11 International Business Machines Corporation Extract cache attribute facility and instruction therefore
US7895419B2 (en) 2008-01-11 2011-02-22 International Business Machines Corporation Rotate then operate on selected bits facility and instructions therefore
US7877582B2 (en) 2008-01-31 2011-01-25 International Business Machines Corporation Multi-addressable register file
KR20100126690A (ko) 2008-02-18 2010-12-02 샌드브리지 테크놀로지스, 인코포레이티드 널-종료 문자열 동작을 가속화하는 방법
DK176835B1 (da) 2008-03-07 2009-11-23 Jala Aps Fremgangsmåde til skanning, medium indeholdende et program til udövelse af fremgangsmåden samt system til udövelse af fremgangsmåden
US8386547B2 (en) 2008-10-31 2013-02-26 Intel Corporation Instruction and logic for performing range detection
US20120023308A1 (en) 2009-02-02 2012-01-26 Renesas Electronics Corporation Parallel comparison/selection operation apparatus, processor, and parallel comparison/selection operation method
JP5471082B2 (ja) 2009-06-30 2014-04-16 富士通株式会社 演算処理装置および演算処理装置の制御方法
US8595471B2 (en) 2010-01-22 2013-11-26 Via Technologies, Inc. Executing repeat load string instruction with guaranteed prefetch microcode to prefetch into cache for loading up to the last value in architectural register
JP2011212043A (ja) 2010-03-31 2011-10-27 Fujifilm Corp 医用画像再生装置および方法並びにプログラム
US20110314263A1 (en) 2010-06-22 2011-12-22 International Business Machines Corporation Instructions for performing an operation on two operands and subsequently storing an original value of operand
US8972698B2 (en) 2010-12-22 2015-03-03 Intel Corporation Vector conflict instructions
US9009447B2 (en) 2011-07-18 2015-04-14 Oracle International Corporation Acceleration of string comparisons using vector instructions
US9588762B2 (en) 2012-03-15 2017-03-07 International Business Machines Corporation Vector find element not equal instruction
US9454367B2 (en) 2012-03-15 2016-09-27 International Business Machines Corporation Finding the length of a set of character data having a termination character
US9459867B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Instruction to load data up to a specified memory boundary indicated by the instruction
US9280347B2 (en) 2012-03-15 2016-03-08 International Business Machines Corporation Transforming non-contiguous instruction specifiers to contiguous instruction specifiers
US9459868B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Instruction to load data up to a dynamically determined memory boundary
US9454366B2 (en) 2012-03-15 2016-09-27 International Business Machines Corporation Copying character data having a termination character from one memory location to another
US9459864B2 (en) 2012-03-15 2016-10-04 International Business Machines Corporation Vector string range compare
US9268566B2 (en) 2012-03-15 2016-02-23 International Business Machines Corporation Character data match determination by loading registers at most up to memory block boundary and comparing
US9710266B2 (en) 2012-03-15 2017-07-18 International Business Machines Corporation Instruction to compute the distance to a specified memory boundary
US9715383B2 (en) 2012-03-15 2017-07-25 International Business Machines Corporation Vector find element equal instruction

Also Published As

Publication number Publication date
ES2779033T3 (es) 2020-08-13
RU2568241C2 (ru) 2015-11-10
EP2769301A1 (en) 2014-08-27
CA2867115A1 (en) 2013-09-19
LT2769301T (lt) 2020-05-25
CA2867115C (en) 2020-12-08
BR112014022638B1 (pt) 2022-01-04
US20130246768A1 (en) 2013-09-19
HRP20200393T1 (hr) 2020-06-12
AU2012373735A1 (en) 2014-09-11
RU2012148583A (ru) 2014-05-20
MX340050B (es) 2016-06-22
WO2013136144A1 (en) 2013-09-19
TWI533207B (zh) 2016-05-11
MX2014010948A (es) 2014-10-13
ZA201406612B (en) 2016-05-25
SI2769301T1 (sl) 2020-06-30
PL2769301T3 (pl) 2020-06-01
HK1201354A1 (en) 2015-08-28
CN104169877A (zh) 2014-11-26
US20130246766A1 (en) 2013-09-19
US9280347B2 (en) 2016-03-08
PT2769301T (pt) 2020-03-26
TW201403468A (zh) 2014-01-16
DK2769301T3 (da) 2020-03-16
IL232817A0 (en) 2014-07-31
IL232817A (en) 2017-07-31
EP2769301B1 (en) 2020-02-19
US9454374B2 (en) 2016-09-27
KR101643065B1 (ko) 2016-07-26
JP2015514242A (ja) 2015-05-18
SG11201404825SA (en) 2014-09-26
BR112014022638A2 (ja) 2017-06-20
AU2012373735B2 (en) 2016-06-02
BR112014022638A8 (pt) 2021-12-14
HUE048409T2 (hu) 2020-07-28
EP2769301A4 (en) 2014-11-19
KR20140104974A (ko) 2014-08-29
CN104169877B (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
JP6108362B2 (ja) 不連続命令指定子の連続命令指定子への変換
JP6246140B2 (ja) データを命令が指示する指定されたメモリ境界までロードするためのコンピュータ・プログラム、コンピュータ・システムおよび方法
JP6138175B2 (ja) 指定されたメモリ境界までの距離を計算するためのコンピュータ・プログラム、コンピュータ・システムおよび方法
JP6278906B2 (ja) データを動的に判断されたメモリ境界までロードする方法、システムおよびコンピュータ・プログラム
JP6238241B2 (ja) Vector string range compare
JP6238242B2 (ja) Vector find element not equal命令
JP6238243B2 (ja) Vector find element equal命令
JP6305351B2 (ja) 終了文字を有する文字データ・セットの長さを見出す
JP6323837B2 (ja) Vector Checksum命令を実行するためのコンピュータ・プログラム、コンピュータ・システム及び方法
JP6184426B2 (ja) 終端文字を有する文字データのメモリ位置間でのコピーのための方法、システム、およびコンピュータ・プログラム(終端文字を有する文字データのメモリ位置間でのコピー)
JP6128532B2 (ja) ゾーン形式から10進浮動小数点形式への変換
JP2019145164A (ja) ベクトル例外コードを処理するコンピュータ・プログラム、コンピュータ・システム及び方法
JP6410238B2 (ja) Vectorfloatingpointtestdataclassimmediate命令を処理するためのコンピュータ・システム、コンピュータ・プログラム及び方法
JP6380955B2 (ja) Vector generate mask命令を処理するためのコンピュータ・プログラム、コンピュータ・システム及び方法
JP6115920B2 (ja) 10進浮動小数点形式からゾーン形式への変換
JP2016507831A (ja) Vectorgaloisfieldmultiplysumandaccumulate命令を処理するためのコンピュータ・システム、コンピュータ・プログラム及び方法
AU2012373736B2 (en) Instruction to compute the distance to a specified memory boundary

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170228

R150 Certificate of patent or registration of utility model

Ref document number: 6108362

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150