JPH09505427A

JPH09505427A - ワード・アラインされた分岐目標を有する処理システム

Info

Publication number: JPH09505427A
Application number: JP8510021A
Authority: JP
Inventors: オリミズラヒ−シャロム; クン−リンコ
Original assignee: フィリップスエレクトロニクスネムローゼフェンノートシャップ
Priority date: 1994-09-16
Filing date: 1995-08-21
Publication date: 1997-05-27
Also published as: EP0729605A1; US5590358A; WO1996008762A2; DE69524379D1; DE69524379T2; EP0729605B1; WO1996008762A3; KR100385495B1; KR960706124A

Abstract

(57)【要約】本発明は、ワード・アラインされた（word-aligned）命令をバイトの倍数単位(multibyte)で取出す（fetch）が、バイト・アラインされた（byte-aligned）命令も使用可能なマイクロコントローラまたはプロセッサのアーキテクチャに関連する。飛び越し（jump）命令の目標番地（target address）はワード・アラインされるので、飛び越し命令はワード・アラインで取り出される。アセンブラまたはコンパイラは、ワード境界上にアラインされた分岐（branch）命令の目標番地を用いて、符号（code）を命令記憶の中にロードする。割込みからの復帰においては、プログラム・カウンターに、バイト・アラインされた完全な復帰番地をロードする。

Description

【発明の詳細な説明】ワード・アラインされた分岐目標を有する処理システム本発明は１個のプロセッサを有する処理システムに関連する。各種プロセッサの命令セットは、各データ項目または命令の第１バイトに対して差支えない範囲で各種の番地を定義している。通常のプロセッサは２種類に大別できる。すなわち：１）完全アライン型(fully-aligned).この場合には、番地は通常、バイト、ワード（２バイト）、ダブルワード（４バイト）など、特定の境界上にのみ存在する。この種のプロセッサで用いられる命令セットは、位置合わせサイズ(alignment ｓize)の倍数の（二進数の）命令サイズを有する。２）非アライン型(non-aligned).この場合には、番地のサイズはアラインに制約されない。すなわち、如何なる（許容できる）番地細分(granularity)からも出発できる。ただし、大抵の場合何らかのバイト番地から出発する。プロセッサまたはマイクロコントローラの性能評価について興味ある要素の１つは、記憶システム（キャッシュ、読み書き、読取り専用を含む）からの符号読取り方法である。現在のプロセッサやマイクロコントローラでは、内部の実行が高速化し、その結果命令に要求される帯域(bandwidth)が増加しているため、メモリーへのアクセスは通常倍数バイト(multi-byte)のバス（データ・パス）を経由して行なわれる。アクセスを高速化し、しかも不要なゲート遅延を回避する最も簡単な方法は、符号または命令読取りの度ごと、固定アライン(fixed alignme nt)で記憶へのアクセスを行なうことである。こうすれば、複雑なフェッチ後位置合わせ機構(post fetch alignment scheme)は、ほとんど（またはすべて）のシステム階層レベルで回避できる。この方式は、高性能または倍数バイト指向(m ulti-byte oriented)のプロセッサを実現するのに一般に受容されている。特に上記完全アライン型アーキテクチャではうまく機能する。現在のマイクロコントローラで興味あるもう一つの要素は、符号密度(code de nsity)である。各命令には相当な量の情報が含まれるので、必要な情報を格納するにはかなりのサイズが必要になる。特定の技術またはアーキテクチャに対応して、各命令を最適符号化するには多くの方法がある。一般に、極めて簡単なルールが用いられる。すなわち、最も頻繁に用いる命令は極力短くし、その帯域（動的な符号サイズ）と符号記憶サイズ（静的符号サイズ）の要求をカットするのである。このような符号化の効果は周囲条件により異なるが、コスト主導型設計のためにはこのルールは極めて有効で、プログラム符号密度は明らかに高まる。しかし、このルールに従うと、可変サイズ命令をしかも非アライン型番地で使わざるを得ないことになろう。しかし、非アライン型を用いたプロセッサでは、非アライン型番地への分岐命令に従って符号を取り出す場合、（目標命令の長さがアラインされた記憶アクセス境界を超えると）常に余分な記憶サイクルが必要になる。これは大きな欠陥であり、このため実行が遅れプロセッサの性能が落ちる。その対策には幾つもあるが、大部分は何らかのキャッシュ記憶を伴うため比較的高価になる。最も望ましい方式は、符号取出しと命令アラインの双方が簡単になることから、完全アライン型命令セットの採用である。しかし、単にコスト主導設計を考えて完全アライン方式をとると、分岐での欠陥は減るが、その結果の性能向上は符号サイズを犠牲にして得られることになる。必要とされる最適解は、非アライン型アーキテクチャで得られる符号記録密度の上昇と、完全アライン型アーキテクチャで得られるフェッチ速度の向上と簡単さ、の双方を満たすことである。本発明の大要本発明の目的は、符号記録密度を高め、しかもスケジュールされた分岐命令での取出しを速くすること(fast fetch)である。本発明のもう一つの目的は、命令をバイト境界でアライン可能にすることである。また本発明の目的は、分岐目標(branch target)など、フロー変化(flow chang e)における目標命令(target instruction)はワード境界にアラインすることにもある。ここでワードのサイズは、特定の具体例での読取りにおける記憶の位置合わせとサイズ(the alignment and a size of memory)によって定義される。更に、本発明の目的は、単一または倍数バイトで命令や符号の取出しを行なうプロセッサを実現することである。更に追加して、本発明の目的は、プログラム・カウンタに対する分岐目標の範囲(branch target range)を、与えられたオフセット・サイズに対する分岐命令に比較して、大きくすることにある。上記各目的は、以下の各項を含む処理システムにより達成できる： − １個の記憶； − １個のプロセッサで以下を含むもの − 記憶から命令情報を、一度に１ワードずつ取り出すためのフェッチ手段 − 命令情報から得られた命令を実行する手段。ここで少なくとも一部の命令は、ワード長の倍数(multiples)の間の中間長を有する − 命令情報を記憶に配置する(place)ための命令配置手段。ここで、この配置手段は、各命令ごとにそれがフロー変化命令の目標かどうかを検出する。またこの格納手段は、各特定命令がフロー変化の目標でない限り、それを記憶の中の符号密度を最大化するような形で配置する。もしその特定命令がフロー変化の目標だった場合、命令配置手段はその特定命令をワード境界に配置する。本処理システムは、例えば１個のマイクロコントローラ・アーキテクチャと１個のコンパイラを含む。本マイクロコントローラは、非アライン型の倍数バイト・フェッチ(multibyte fetches)を行い、またワード・アラインされた分岐番地へ飛越しを行う。従って：飛越し命令(jump-to instruction)はワード・アライン型のフィッチが可能である。更に本マイクロプロセッサは、ワード境界にアラインされた分岐命令目標番地を用いて符号を命令記憶へロードする。本発明に基づく処理システムの実施例には、上記プログラム・カウンタ・レジスタと結合した命令番地修正ユニットを含み、このユニットは、フロー変化目標への参照を含むフロー変化命令の制御の下で、プログラム・カウンタ・レジスタの内容を変更する。ここで異なるワード相互は上記参照の最下位のビットで区別される。従ってこの参照は１ワードの中の異なるバイト相互を区別するビットは含まない。このため、与えられた長さの参照によって、より大きな分岐目標範囲が得られる。本発明の詳細な構成と動作を以下更に詳細に説明し主張するが、それに伴い、上記以外の他の目的や利点が次第に明らかになる。その一環として付図を参照するが、その中の類似の数字は類似の部分を示す。図面の簡単な説明図１は、本発明に基づく１個のマイクロコントローラまたはプロセッサの要素を示す；図２と３は、記憶組織を示す；図４と５はスタックを示す；図６は倍数バイト・フェッチ(multi-byte fetch)におけるバイト・アラインを示す；図７はフェッチ動作中におけるプログラム・カウンタの修正を示す。好適な実施例の説明本発明は、分岐、飛越し、手続き呼出し(procedure calls)などで起こるプログラム・フローのスケジュールされた変化において、ワード・サイズ符号のスループットを最大にするものである。これを実現するため、本発明に基づくプロセッサまたはマイクロコントローラ、命令セット、及びアセンブラーまたはコンパイラは、すべてのフロー変化の入り口点（分岐目標など）をワード（２バイト）の境界にアラインし、バイトの倍数による符号フェッチを実行する。ここで倍数としては２バイトすなわち１ワードが望ましいが限定の必要はない。ワードの倍数フェッチも可能である。これにより分岐に入った場合の符号フェッチは迅速になる。このアーキテクチャは、命令が何らかのバイトにアラインできるので符号密度を最大にすることができ、またこのアーキテクチャでは命令をバイトの倍数で取出し、またフェッチ・ユニット上でフェッチ後アライン(post fetch alignm ent)を実行する。命令サイズは１ないし７バイトの範囲で長さが変わり、倍数バイト・フェッチ自体の位置合わせとサイズ(alignment and size)には制約されず、また符号の高密度も実現する。命令はバイト境界で取出されるが、分岐目標はワード境界でアラインされるので、本マイクロコントローラでは、同一の番地ビット数を用いた場合でも、分岐における目標番地の範囲が広くなる。というのは、目標番地はバイト相互を区別する最下位ビットを運ぶ必要がなく、代わりに最上位ビットが追加できるからである。本マイクロコントローラではまた、プログラム・フローにおける計画外の変化、例えば例外や割り込みが如何なるバイト番地で起こっても対応が可能である。これは割り込みや例外が起こった場合スタックに完全な復帰番地(return address)を格納しておくことによる。復帰命令(retur ninstruction)がスタックから上記完全な復帰番地をポップするので、これら予定外割り込みや例外が生じた場合には、バイト単位の細分番地へのプログラム分岐が可能である。もちろん、奇数番地への復帰は通常偶数番地への復帰よりも遅い。本発明によるマイクロコントローラ・システム10のアーキテクチャを図１に示す。このシステム10には、単一チップのマイクロコントローラ12及びこれと分離した内部の命令・データ記憶を含む。マイクロコントローラ12は外部装置14と16 に接続され、また20／24ビットの外部番地指定機能を介して、16メガバイトの外部命令記憶装置18、及び16メガバイトの外部データ記憶装置20に接続されている。マイクロコントローラ12はバス・インタフェイス・ユニット22を含み、このユニットは外部記憶18及び20との間で、16ビットの外部双方向番地・データ・バス 24を介して通信する。このバス上で、番地は２サイクルで転送され、20／24ビット番地の一部分が外部ラッチ（図示せず）に保持(latch)される。マイクロコントローラ12は、外部装置14及び16との間で、I/O ポート26-28 を介して通信する。これらポートは特別機能レジスタ群(SFR)40として番地指定可能である。ポート26-28 は、他の特別機能レジスタ同様、バス・インタフェイス・ユニット22を介して、内部周辺バス42の上で番地指定可能である。オンチップ特別機能レジスタ群40（その中あるものはビット番地指定可能）にはプログラム状態ワード(PSW )レジスタ44も含む。この44は割込み制御ユニット84と結合して内部・外部装置と通信する。PSW レジスタ44は、フラグ及び一般状態制御の目的で、ALU 72、実行ユニット70、及び復号ユニット(decode unit)74にも接続される。レジスタ群4 0には、割込みレジスタ44、タイマー・レジスタ50、及びシステム構成ビットを収容するシステム構成レジスタ(SCR)54をも含む。プログラム状態語レジスタ44 は、レジスタ動作一般については周辺バス42の上で番地指定可能であり、また他の実行関連動作については内部バス86への接続(a connection)を介して番地指定可能である。バス・インタフェイス・ユニット22により、周辺特別機能レジスタ40はマイクロコントローラのコア60と分離している。コア60はマイクロコードされた実行ユニット70を含み、このユニットはALU 72及びその他のユニットを用いて命令実行を制御する。復号ユニット74により解読される命令は、命令記憶空間の一部である内部EPROM 76から取り出されるか、または外部命令記憶18からフェッチ・ユニット78により取り出される。静的RAM 80は、レジスタ・ファイル82の汎用レジスタと同様、データ記憶空間の一部で、命令とデータの格納にも利用される。マイクロコントローラ12は図２と３に示すような記憶組織を含む。ここで図２は頁に分解した組織を、また図３は頁の内容を詳細に示す。既に述べたように、マイクロコントローラ12の記憶空間には、分離して存在する命令記憶とデータ記憶とが含まれる。プログラム記憶とデータ記憶が論理的に分離しているため、双方の記憶に対する同時アクセスが可能である。このマイクロコントローラ12では、それぞれ最大16メガバイトの分離したデータ記憶・プログラム記憶（24ビット番地）が使用できる。図３に示すようにデータ記憶空間118 は64K バイトの頁12 0に区切られる。バイト・レジスタRO-R7 が４バンク(banks)存在し（図４参照）、それらは、オンチップRAM（レジスタ・ファイル82の中の）の０番地から出発し、16進法の番地1Fに至るデータ記憶にもマップされている。４バンクのうち１個が、PSW レジスタ44の２ビットによって活動状態のバンクとして選択される。この選択されたバンクは汎用レジスタとして使われる(appear)。システム10の中の記憶は、バイト（８ビット）単位で番地指定される。１ワードは16ビットで、２連続バイトから成る。マイクロコントローラ12における記憶順序は「リトル・エンディアン(“Little Endian”)」により、１ワードの低位バイトが低位番地に記憶され、高位バイトが次に高い番地に記憶される。16ビットワードで番地指定可能なあらゆる記憶位置は、バイトでもワードでもアクセスできる。外部バス24は８または16ビットのモードで構成でき、チップのリセット状態でその何れかが選択される。選択した動作モード次第で、すべての16ビット外部アクセスは、厳密にワードによるか（16ビットモード）、または連続した記憶位置からのバイトによるか（８ビットモード）で行なわれる。８ビットモードで外部からワード・フェッチが行なわれる場合、分離したバイト・アクセスが２回起こる。（データがオンチップなら１回のワード・アクセスと同じ結果が得られる。）前記のように、マイクロコントローラ12は、番地指定可能な16メガバイト空間をプログラム記憶18として使用できる。命令セットには飛越し(jump)と呼出し(c all)を含み、その中にはローカルの符号空間で動作するもの、プログラム記憶の全空間にアクセスできるもの、及びレジスタ間接(register indirect)で動作するものがある。後に詳述するように、プログラム記憶目標番地のうち、マイクロ符号プログラム制御の下で、飛越し、呼出し、分岐、トラップ、割込みの各命令により参照されるものはワード・アラインされる。しかし、サブルーチンまたは割込みハンドラーからの復帰番地は、奇数または偶数の何れのバイト境界にアラインしてもよい。例えば、分岐命令は如何なる符号番地でも起こり得るが、分岐先は偶数番地のみである。分岐番地の位置合わせ(alignment)には２つの利点がある：１）命令に余分の１ビットを加えなくとも、分岐の範囲が２倍になる；２）分岐命令符号(branched-to code)は、もしワード・アラインされていれば実行が速い。というのは、この命令の最初の２バイト（１ワード）が同時に取出されるからである。マイクロコントローラ12では、スタックは図４と５に示すように高い番地から低い番地へと下方へ成長する。このマイクロコントローラ12のアーキテクチャでは LIFO方式（後入れ先出し）のスタックが使われる。如何なる場合でも、スタック・ポインタ（SP）はスタックにプッシュされた最後のワードを指している。新データがプッシュされるときには、記憶に書込む前にスタック・ポインタの指数が減少する。データがスタックからポップされるときには、データが記憶から読み出された後でスタック・ポインタの指数が増加する。マイクロコントローラ12はデータを格納するのに、最上位のビット(MSB)から行なうので、スタック・ポインタは常にスタックに書かれたワードの最下位ビット(LSB)を指す。このことは、汎用ポインタが記憶からデータにアクセスする方法と調和するので、スタック・ポインタの内容を汎用ポインタ・レジスタに複写してこれをスタックの状態を示すアクセス・パラメタとして使用してもよい。スタックの動作は、ユーザ・スタック・ポインタ(USP)とシステム・スタック・ポインタ(SSP)の２個を、レジスタ・ファイル82のレジスタに設けることにより容易になる。これらの16ビットスタック・ポインタは通例のトップ・オブ・スタック型のポインタで、プッシュ・ダウン・スタックの最上部のデータを番地指定する。このデータは暗黙のうちに、 PUSHとPOP 動作、サブルーチン呼出し、復帰、及びトラップ・例外などの割込み動作で参照される。このスタックは常に「ワード」アラインされている。スタックへのPUSH（バイト／ワード）があると、スタック・ポインタの指数は２だけ減少し（SP＝SP-2）、POP（バイト／ワード）があると、スタック・ポインタの指数は２だけ増加する（SP＝SP+2）。こうして、このスタック位置合わせ(stack a lignment)により、あらゆるスタック動作がワード境界（偶数番地）で行なわれることが保証され、その結果位置合わせ問題がなくなり、割込みの待時間(laten cy time)が短縮するのは、他の16ビットまたはそれより大きなスタックの動作でも同様である。SPはPUSHに先立って予め減少するので、ワード・アラインされたスタックはFEから下方に成長する。マルチタスクのシステムでは、１個のスタック・ポインタは監視システムに、もう１個は現在活動中のタスクにそれぞれ使われる。これにより、システム・ソフトとユーザ応用プログラムの分離ができ、防護機構として有効に働く。この２個のスタック・ポインタは、割込み性能の改善にも有効である。この２個のスタック・ポインタは同一のレジスタ番地を共用する。任意の時点で使用されレジスタ・ファイルに「現れる(“appear”)」スタック・ポインタは、プログラム状態語(PSW)レジスタ44の中のシステム・モード・ビット(SM)で決定される。ユーザ・モードの中では、すべてのプッシュ、ポップ、及びサブルーチン復帰番地は応用（またはユーザ）スタックを用いる。しかし、割込みは常にシステム・スタックを用いる。前記のように、レジスタ・ファイルには８個の16ビット・レジスタが存在する。これら８個のうち、１個はスタック・ポインタ(R7)用に保留されるが、他の７個は汎用ポインタ・レジスタとして、記憶の中の異なるセグメントへのアクセスに用いてよい。SFR 空間の中の「バイト」・レジスタには、７個の汎用ポインタ・レジスタ（SPではない）のそれぞれと組み合わさったビットが格納され、このそれぞれはDSまたはESレジスタの何れかを、間接番地指定モードのため、24ビット番地の最高位８ビットのソース(s ource)として選択する。このレジスタはセグメント選択レジスタと呼ばれる。例外と割込みの動作は、正常な命令処理を強制排除する事象で、プログラム・フローの中では予定・スケジュール外または予期しない変化である。各割込みとか例外動作には１個のベクトルが割当てられ、関連のハンドラー・ルーチンを指定する。例外・割込み処理は、ハンドラー・ルーチンへ制御を渡すのに必要なすべての動作を含むが、ハンドラー・ルーチン自体の実行は含まない。例外・割込みベクトルには、例外を扱うルーチンの番地を含む。例外・割込みベクトルはベクトル・テーブルと呼ぶデータ構造に収容される。このテーブルは符号記憶頁０の最初の256バイトに位置している。すべてのベクトルは２ワードから成り、それらは：(i)例外ハンドラーの番地とワード境界に位置するその処理エントリー点；及び、(ii)そのハンドラーのためのPSW の初期内容である。RESET 以外のすべての例外・割込み動作が起こると、現在進行中のプログラム・カウンタ(PC)とPSW の値は、一旦スタックに格納されて、現在の命令がその優先レベルに基づいて完了した後、再びサービスに入る。例外・割込み動作の間は、24ビットの復帰番地全体と現在のPSW ワードとがスタックの上にプッシュされる。スタックされたPC （ハイバイト）：PC（ローワード）の値は、現在の命令の流れの中での次の命令に関する24ビット番地である。次いで、プログラム・カウンタ(PC)には、対応するハンドラー・ルーチンの番地がベクトル・テーブルからロードされ、PSW には、対応するベクトルの上位ワードの中に格納された新たな値がロードされる。例外・割込みハンドラーの実行は、割込みからの復帰(RETI)命令が出るか、他の例外または割込みで高優先度のものが発生するまで進行する。このRETI命令でそれぞれのハンドラー・ルーチンは終結する。マイクロ符号プログラム制御の下で、この命令が出ると、24ビット復帰番地全体がスタックからPCにポップされ、スタックから原PSW が再ロードされ、プロセッサは（割込みで）中断していたルーチンの実行を再開する。マイクロコントローラ12の上で命令を実行するため、符号すなわち命令の番地を形成する方法には数種類ある。プログラム・フローの中でスケジュールまたは計画された変化には、単純な相対分岐(relative branch)、長い相対分岐、24ビットの飛越しと呼出し、及び復帰がある。単純な相対分岐では、プログラム・カウンタに８ビットの変位(displacement)を加えて新符号番地を生成する。この計算は、８ビット相対変位を１ビットだけシフトし（ワード番地への変位であるため）、結果を24ビットに延長し、それをプログラム・カウンタの内容に加え、そしてその結果の最下位ビットを強制的に０にすることにより達成される。長い相対無条件分岐(JMP)と16ビット相対変位を伴う呼出しは、同一のシーケンスを用いる。遠い飛越しと呼出しとは(far jumps and calls)、命令の中に24ビットの絶対番地を含むもので、プログラム・カウンタの内容全体が全く新たな値で置き換えられる。復帰命令が出ると、（プログラム・カウンタは）スタックから番地を獲得する。この番地は長さが16または24ビットで、復帰の型及びシステム構成レジスタ(SCR)の中の頁０モード・ビット(page zero mode bit)によって支配される。24ビット復帰番地の場合は、単純にプログラム・カウンタの値全体が置き換えられる。16ビット復帰番地の場合は、頁０モードの中のPCの下位16ビットが置き換えられるだけである。ここでPCの上位８ビットは０と仮定される。符号番地については、ポインタ・レジスタからの16ビット値に、プログラム・カウンタ (PC)または符号セグメント(CS)レジスタの上位８ビットを加えて24ビット符号番地を形成する。上記何れの８ビットを採るかは、使用されるポインタ・レジスタに対応するSSELレジスタの中のセグメント選択ビットが、０＝PC及び１＝CSの何れに設定されるかにより決定される。ここでCSは８ビットSFR の１つであることに注意されたい。取出された命令をワードかバイトの境界の何れかにアラインするようなフェッチ動作が可能である。この動作は、在来の非アライン型符号フェッチ回路と在来の位置合わせ回路（それぞれフェッチ・ユニット78及び復号ユニット74の中にある）の組合せにより実行される（図６参照）。在来の前フェッチ待ち行列(prefe tch queue)200が、符号記憶76または命令記憶18からワードを受取り、これを在来の位置合わせマルチプレクサ(alignment multiplexer)202に渡す。このマルチプレクサ202は、適当なバイト（単数または複数）を選択してこれを復号ユニット74の中の在来の復号論理回路204に渡す。この復号論理回路204はこの命令を解読し、それを、在来のステージング・レジスタ206 を介して、コアの他のユニット例えば実行ユニット70などに渡す。こうして命令はバイト・アラインされ、本来の順序でステージングできる。計画外プログラム・フロー変化に際して、ワード・アラインされた目標へのフローの飛越しを容易にしたり、そうした計画外プログラム・フロー変化からバイト・アラインされた復帰目標への復帰を容易にしたりするため、プログラム・カウンタ・レジスタの中のプログラム・カウンタ値が、図７に示す回路を使って調整される。正常順序による命令実行動作ではプログラム・フローが逐次進行し、各命令が実行された後、プログラム・カウンタ・レジスタ220の内容の最上位ビット(MSB)が加算器222に直接加わる。最下位ビット(LSB)は、ステージング・レジスタ206が分岐を示していない限り、AND ゲート223を介して加算器222に加わる。加算器222は、復号器ステージング・レジスタ206から供給される命令長を、マルチプレクサ224を経由してプログラム・カウンタ値に加算し、こうして更新されたPCがマルチプレクサ226を経由してプログラム・カウンタ・レジスタ220に再び格納(stored back)される。スケジュールされたフロー変化が起こって、例えば分岐命令の１つである飛越しとか呼出しがステージング・レジスタ206に現れた場合、AND ゲート223の働きで、最下位ビットは加算器222に加わらない。マルチプレクサ224は、命令長を示す代わりに、分岐オフセット(branchoffset)の最上位のビット列（ワード番地）及び強制的に“０”にした最下位ビットを加算器222に加える。加算器222は、LSB の増加したオフセット(LSB augumented offs et)をプログラム・カウンタ値に加算し、その値がプログラム・カウンタ・レジスタ220に格納される。フローで予期しない変化、例えば例外や割込みが起こった場合、元来のフロー、例えば割込みからの復帰などに復帰し次第、マルチプレクサ226はプログラム・カウンタ・レジスタ220に、内部バス86から得られた、例えば割込みの場合にはスタックから得られたフル復帰番地をロードする。既に触れた通り、本発明では、ある場合には飛越し目標の番地が１ワードの境界上にある(fall on)ことが要求される。飛越し目標がワード・アラインされていない状態が起こるのは、ワード境界にアラインされた命令が、下記に示すように奇数バイトをもつ場合である。この例では、BNE 命令が２バイトを占有し、MOV.B 命令が３バイトであるため、分岐目標(“L1”)に関する次の命令が奇数バイト番地に位置することとなる。アセンブラまたはコンパイラは、幾つもの方法によってこの問題を解決して、ワード・アラインされた飛越し目標番地を有する目的符号を作成できる。アセンブラまたはコンパイラにおける一つの解決法として、シンボル・テーブルを作成中、シンボル名テーブルの中で飛越し目標にシンボル名を割当てる際、そのシンボル・テーブルに、最終番地をワード境界上にアラインすべきかどうか示す領域をもたせるという方法がとれる。飛越し目標の位置ポインタまたはカウンタの値がワード境界にないという状況に遭遇した場合、すなわち最下位ビットが二進法の“ ０”でないか、位置ポインタが奇数を含んでいる場合には、その位置に単一のNO P 命令を挿入するという方法がとれる。そうすれば、位置ポインタは次のバイトへと増加する。この結果、次の命令とシンボルはワード・アラインされ、その位置の値には飛越し目標のシンボル名が割当てられ、結果として飛越し目標に割当てられる番地は強制的に次のワード・アラインされた位置カウンタ番地になる。その様子は下記に示す通りである。この解決法では、無駄な命令(NOP)が生じて実行ユニットはそれを処理せねばならない。結果として数個のクロック・サイクルが無駄になるが、ある種の場合には受容できる。例えば、ループ・パラメタ初期設定に際してこの余分なNOP を挿入すると、このアラインされたラベル(aligned label)がループ・エントリーとなって何回も分岐され得る場合などである。もう一つの解決法は、コンパイラに隣接符号を走査させて、バイト境界上にある飛越し目標を識別し、その目標命令に先行する何れかの命令長を拡張すればその目標がワード・アラインできるかどうかを判断することである。そうできるならその命令を拡張し、駄目ならNOP を挿入すればよい。ワード・アラインを実現するための拡張を下記に示す。この例では、オール“０”の余分なバイトが相対オフセットに加えられる。コンパイラかアセンブラを用いて、ワード境界上に飛越し目標を有する符号が作れるようにできるなら、非アライン型の符号プロセッサを用いたとしても、その計画的なプログラム・フロー変化で必然的に起こる不利益(penalty)が最小にでき、プロセッサ全体のスループットが増加する。本発明における多くの特徴と利益は詳細な仕様から明らかであり、従って後記の請求項では、本発明の真の精神と範囲から必然的に生まれるそうした特徴と利点をすべてカバーすることを意図する。更に、関連技術に精通する当業者にとっては、多数の変形や変更は容易に案出できるので、本発明をここで示し説明した構造と動作に厳密に限定することは望ましくない。例えば、本発明は位置合わせが４バイト境界で望まれる場合にも適用可能である。従って、適切な変形またはそれに相当する内容は、すべて本発明に依存しその範囲に入る可能性がある。

Claims

【特許請求の範囲】１．１個の処理システムにおいて、 ― １個の記憶と； ― 命令情報を上記記憶から一度に１ワードずつ取り出すためのフェッチ手段を含み、また、上記命令情報から得られた実行命令で、少なくともその一部はワード長の倍数の中間長を有する実行命令を実行する手段を含む１個のプロセッサと； ― 上記命令情報をメモリ内に配置するための命令配置手段と；を有して成り、上記命令配置手段は、各命令ごとにその命令が１個のフロー変化命令のフロー変化目標であるかどうかを検出し、また上記命令配置手段は、各特定の命令ごとに、それがフロー変化目標でなければ記憶内部の符号密度を最大にできるように配置し、それがフロー変化目標である場合にはワード境界に配置することを特徴とする処理システム。２．請求項１に記載の処理システムにおいて、更に、計画外のプログラム・フロー変化から、ワード境界に配置されていない命令に復帰するための飛越し手段を含むことを特徴とする処理システム。３．請求項１に記載の処理システムにおいて、上記命令配置手段が、フロー変化目標である命令をワード境界上に配置するために、命令の拡張及び符号の操作を行なう１個のコンパイラを含むことを特徴とする処理システム。４．請求項１に記載の処理システムにおいて、上記実行手段が、バイト・アラインされた命令を受取る１個の命令待ち行列；及び上記行列に結合して実行のため上記命令をアラインする１個の位置合わせマルチプレクサ；を含むことを特徴とする処理システム。５．請求項１に記載の処理システムにおいて、上記実行手段は、取出した命令の番地を明示する１個のプログラム・カウンタ・レジスタ；及び、上記プログラム・カウンタ・レジスタと結合した１個の命令番地修正ユニット；を有して成り、それによりフロー変化目標への参照を含むフロー変化命令の制御の下で、上記プログラム・カウンタ・レジスタの内容を修正し、上記参照の最下位ビットは異なるワードを区別することを特徴とする処理システム。６．１個の処理システムにおいて、飛び越し目標命令をワード境界にアラインするため、命令の拡張と符号の操作を行なう１個のコンパイラと；バイト・アラインされた命令を受取る１個の命令待ち行列を含むプロセッサと；上記行列と結合し上記命令を実行のためアラインする位置合わせマルチプレクサと；取出した命令の番地を指定する１個のプログラム・カウンタ・レジスタ；上記プログラム・カウンタ・レジスタと結合し、ワード番地を用いてプログラム・カウンタを修正する１個の命令番地修正ユニットと；計画外のプログラム・フロー変化からバイト・アラインされた番地を用いて復帰するための飛び越し手段と：及び上記の取出した命令を実行するための実行手段と；を有して成ることを特徴とする処理システム。７．コンピュータ命令を実行する方法において、ａ．フロー変化目標である命令をワード境界にアラインすること；ｂ．順次実行の可能な命令をバイト境界にアラインすること；及びｃ．ワード境界にアラインされた命令をバイトの倍数ずつ取出して実行すること；を含むことを特徴とするコンピュータ命令を実行する方法。８．請求項７に記載の方法において、ｄ．計画外の復帰は、バイト・アラインされたプログラム飛び越し番地を用いて行なうこと；を更に含むことを特徴とするコンピュータ命令を実行する方法。