JPH07248923A

JPH07248923A - コンパイラ

Info

Publication number: JPH07248923A
Application number: JP4084894A
Authority: JP
Inventors: Shigeyoshi Kaneko; 栄美金子
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-03-11
Filing date: 1994-03-11
Publication date: 1995-09-26

Abstract

(57)【要約】【目的】遅延スロットを埋める有効な命令が基本ブロ
ック内にない場合でも、遅延スロットに有効な命令を置
くことができるような命令スケジューリング方法を有す
るコンパイラを提供することである。【構成】パイプライン機構を有するプロセッサで実行
され、字句解析部と、構文解析部と、中間コード解析部
と、命令スケジューリング部を有する中間コード最適化
部と、コード生成部とを備えたコンパイラにおいて、前
記命令スケジューリング部において、中間コードに対
し、遅延分岐命令の遅延スロットに有効な命令を埋める
ような最適化を行う際であって、基本ブロック内に遅延
スロットを埋める有効な命令が存在しない場合に、分岐
先の命令を分岐命令の直後に複写し、分岐前のプログラ
ムに対し、前記複写した命令の次の命令から実行するた
めの処理を行うサブルーチン間命令スケジューリング部
を前記命令スケジューリング部に備えてある。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、高級プログラミング言
語等で記述された原始プログラムから目的プログラムを
生成するコンパイラに関し，特に、パイプライン機構を
持ったプロセッサ向けの命令スケジューリングの最適化
をするためのコンパイラに関する。

【０００２】

【従来の技術】パイプライン処理とは一連のプロセッサ
の処理を複数のサブ処理に分割し、各段階のサブ処理を
各サブ処理装置に次々と入力して同時に行うものであ
る。従って、定常状態では処理を分割しただけ並列に処
理がされていることになる。

【０００３】しかしながら、パイプライン機構を持つプ
ロセッサ向けのコンパイラでは、並列に命令が実行され
るため、命令が利用する演算装置やレジスタなどの資源
に衝突（インタロック）が生じてしまう。特に、パイプ
ライン特有の処理である前の命令の実行結果を待たずに
次の命令の読み込みを行う機能を有するため、例えば命
令が目的プログラムリストの順序通りに実行されない分
岐命令である場合には、分岐命令の後にｎｏｐ（No OPe
ration：計算機は別に何もしないで、ただプログラムを
次に進めることだけを指示する命令をいう。）をコンパ
イラ側で付け加えなければならない。このため、前記目
的プログラムのステップ数の増加やパイプラインの停止
等により、プログラムの実行時間も増加してしまうとい
う問題点があった。

【０００４】そこで、目的プログラムにおける基本ブロ
ック内の命令コードを並べ換えたり、分岐命令により、
パイプライン制御が乱れるのを回避するため、サブルー
チンコールや、ブランチ命令等の遅延分岐命令の直後の
命令（以下遅延スロットという。）に、有効な命令を置
いたりするような「命令スケジューリング」と呼ばれる
最適化手法が用いられている。

【０００５】なお、「基本ブロック」とは、先頭の命令
から、最後の命令まで１つづつ順に実行される一連の命
令の並びで構成されたものをいい、前記一連の命令の並
びの途中にラベルの定義や分岐命令は含まないものをい
う。

【０００６】従来のコンパイラの構成図の一例を図５に
示す。このコンパイラは、字句解析部５１と、構文解析
部５２と、中間コード生成部５３と、中間コード最適化
部５４と、コード生成部５６とを備え、更に中間コード
最適化部５４には、パイプライン・アーキテクチャ向き
の命令スケジューリング部５５を備えている。

【０００７】次に従来のコンパイラの動作を説明する。
一般にコンパイラとは、高級プログラミング言語等で記
述された原始プログラムを機械語で記述された目的プロ
グラムに翻訳するものをいう。まず、入力となる原始プ
ログラム５０に対し、字句解析部５１において原始プロ
グラム５０に記述された字句の解析を行い、構文解析部
５２において原始プログラム５０内の構文の解析を行
い、中間コード生成部５３において、構文解析部５２で
生成された構文木をもとに中間コードを生成する。この
中間コードも目的プログラムではあるが、パイプライン
処理用の最適化処理が施されていない。従って、以下に
説明する最適化処理を行う。まず、中間コード最適化部
５４において、中間コードに対してプログラムの意味を
変えないで、演算の数をできるだけ減らすような変形を
施す。中間コード最適化部５４では、パイプライン・ア
ーキテクチャ向きの最適化として命令スケジューリング
部５５を備え、遅延分岐命令の遅延スロットに、“ｎｏ
ｐ”以外の有効な命令を置くように、命令を並べ換える
ような最適化を行う。中間コード最適化部５４で最適化
された中間コードは、コード生成部５６に渡され目的プ
ログラム５７が生成される。

【０００８】命令スケジューリング部５５の詳細な処理
の流れの一例を図６に示す。また、図６の流れ図で用い
る最適化処理のタイプを図７に示す。図６で用語として
用いている［タイプ１］から［タイプ３］の方法とは、
図７に示す［タイプ１］から［タイプ３］の方法を示す
ものとする。

【０００９】従来のコンパイラの命令スケジューリング
方法として、図７に示す３種類のタイプを、以下の手順
で組合せて用いることにより、遅延分岐命令のスケジュ
ーリングを行う方法が開示されている（文献：T.R Gros
s “Code Optimization Techniques for Pipelined Arc
hitecture ”）。

【００１０】以下、前記開示された遅延分岐命令のスケ
ジューリングを行う方法についての説明を行う。まず、
前記方法の手順を説明する。（１）［タイプ１］の最適化によって、分岐命令の前の
命令を分岐命令の後に移動させることを試みる。無条件
分岐命令に対しては、この方法で遅延スロットを埋める
ことができる。（２）（１）で遅延スロットが埋まらなかった場合に
は、［タイプ２］及び［タイプ３］の最適化により残り
を埋める。

【００１１】次に、前記方法により、図８の原始プログ
ラムに対する中間コードが、命令スケジューリング部５
５によって最適化処理される様子を、図６の流れ図と図
７に従って説明する。

【００１２】図８は、Ｃ言語で記述された原始プログラ
ムである。今、図８のプログラムが中間コード生成部５
３までの各処理部によって、命令スケジューリングを施
していない図９のような中間コードに変換されていると
する。図９において、“：”（コロン）が付加された文
字列、ｆｕｎｃ：、ｓｕｂ１：、及び、ｓｕｂ２：はラ
ベルを表し、“ｃａｌｌ”命令は、オペランドに指定さ
れたラベルが示すサブルーチンを呼び出す命令（サブル
ーチンコール命令）を表している。なお、“ｃａｌｌ”
命令は分岐命令（無条件分岐命令）である。例えば、図
９の第４行目の命令であるｃａｌｌｓｕｂ１は、サブルーチン“ｓｕｂ１”を呼び出す命令を表して
いる。

【００１３】図９の中間コードは、まだ命令スケジュー
リング最適化は施されていない状態を表している。この
中間コードに対して、命令スケジューリング部５５によ
って、命令スケジューリングを行う。

【００１４】図６において、図９の中間コードの第１行
目から処理を進め、第３行目までは、遅延分岐命令では
ないので図６のステップ１２９により次の行へ移行す
る。第４行目の命令であるｃａｌｌｓｕｂ１は、遅延分岐命令であるのでステップ１２０からステッ
プ１２１へ移行する。

【００１５】ステップ１２１において、第４行目の“ｃ
ａｌｌ”命令に対し、［タイプ１］の方法により、“ｃ
ａｌｌ”命令の直前の命令であるｍｏｖ％ｉＯ，％ｏＯを“ｃａｌｌ”命令の直後に移動することで、遅延スロ
ットが埋められるか試みる。このとき“ｍｏｖ”命令
は、分岐条件に依存しないためこの方法が成立する。よ
って、ステップ１２２により［タイプ１］の方法を実行
し第３行目の命令であるｍｏｖ％ｉＯ，％ｏＯを第４行目の命令であるｃａｌｌｓｕｂ１の直前に移動し、次の行へ移行する。

【００１６】次に、遅延分岐命令は、第６行目のｃａｌｌｓｕｂ２であるため、この命令に対し［タイプ１］の方法を試み
る。第６行目の“ｃａｌｌ”命令の直前の命令は、前の
処理で移動したｍｏｖ命令である。この命令は、サブル
ーチンｓｕｂ１への分岐前に実行されていなければなら
ないため、ここでは命令の入れ換えはできず、ステップ
１２３へ移行する。

【００１７】［タイプ２］の方法では、分岐先の命令を
遅延分岐命令の直後にコピーするが、この場合、遅延分
岐命令がサブルーチンコール命令であり、分岐先の命令
が基本ブロック内の命令ではないため成立せずステップ
１２５へ移行する。

【００１８】［タイプ３］の方法では、分岐しないパス
上の命令を移動するが、この場合、該当する命令がない
ため、ここでも移動可能な命令はなくステップ１２９に
より次の行の処理へ移行する。以下同様の処理を図９の
中間コード全てに対して行う。

【００１９】以上のように、従来のパイプライン機構を
持ったプロセッサ向けのコンパイラにより、命令スケジ
ューリングの最適化をすることにより、中間コードに対
してプログラムの意味を変えずに、最適化前の中間コー
ドに対して、演算のステップ数を減らすことができる。

【００２０】

【発明が解決しようとする課題】しかしながら、従来の
パイプライン機構を持ったプロセッサ向けのコンパイラ
では以下のような問題点が生じる。

【００２１】上述した処理によって、図９の中間コード
は図１０のように変換される。第４行目の遅延分岐命令
であるｃａｌｌｓｕｂ１に対しては、遅延スロットに“ｎｏｐ”以外の有効な命
令であるｍｏｖ％ｉＯ，％ｏＯを置くことができたが、第６行目の命令であるｃａｌｌｓｕｂ２に対しては、”ｎｏｐ“以外の命令を置くことができな
いまま、命令スケジューリング部５５による最適化処理
を終了している。つまり、分岐命令の後の遅延スロット
に分岐命令がある場合には、”ｎｏｐ“以外の命令を置
くことができない。すなわち、基本ブロック内の命令に
対してのみ、命令の入れ換えを施すような従来のコンパ
イラの命令スケジューリング方法では、必ずしも遅延分
岐命令の遅延スロットに有効な命令を入れることができ
ない場合があった。

【００２２】本発明では、このような問題点を解決し、
遅延スロットを埋める有効な命令が基本ブロック内にな
い場合でも、遅延スロットに有効な命令を置くことがで
きるような命令スケジューリング方法を有するコンパイ
ラを提供する。

【００２３】

【課題を解決するための手段】上記問題点を解決するた
め、本発明の特徴は、パイプライン機構を有するプロセ
ッサで実行され、字句解析部と、構文解析部と、中間コ
ード解析部と、命令スケジューリング部を有する中間コ
ード最適化部と、コード生成部とを備えたコンパイラに
おいて、前記命令スケジューリング部において、中間コ
ードに対し、遅延分岐命令の遅延スロットに有効な命令
を埋めるような最適化を行う際であって、基本ブロック
内に遅延スロットを埋める有効な命令が存在しない場合
に、分岐先の命令を分岐命令の直後に複写し、前記複写
した命令の次の命令に進むための処理を行うサブルーチ
ン間命令スケジューリング部を前記命令スケジューリン
グ部に備えることである。

【００２４】ここで、前記複写した命令の次の命令に進
むための処理には、分岐先のアドレスを複写した命令分
進める処理を行うことが好ましく、更に好ましくは、分
岐元の分岐命令に分岐先のアドレスを複写した命令分進
める処理を行うことが好ましい。

【００２５】

【作用】本発明のコンパイラの命令スケジューリング部
では、中間コードに対し従来の命令スケジューリングを
行っても、基本ブロック内から遅延分岐命令の遅延スロ
ットに有効な命令を置くことができない場合に、サブル
ーチン間命令スケジューリング部を起動し、分岐先の命
令を分岐命令の直後にコピーし、前記複写した命令の次
の命令に進むための処理を行うことで遅延スロットに有
効な命令を置くことを可能にする。

【００２６】

【実施例】本発明の一実施例を、図面に基づいて説明す
る。まず、本発明に係るコンパイラの構成図を図１に示
し、図１を用いて本発明に係るコンパイラの動作の概要
について説明する。

【００２７】本発明のコンパイラは、字句解析部１１
と、構文解析部１２と、中間コード生成部１３と、中間
コード最適化部１４と、コード生成部１７とを備え、更
に中間コード最適化部１４が備えている命令スケジュー
リング部１５にサブルーチン間命令スケジューリング部
１６を追加して備えていることを特徴としている。

【００２８】本コンパイラでは命令スケジューリング部
１５において、中間コードに対し従来の命令スケジュー
リングを行っても、基本ブロック内から遅延分岐命令の
遅延スロットに有効な命令を置くことができない場合
に、サブルーチン間命令スケジューリング部を起動し、
サブルーチンにまたがる分岐先から、遅延スロットを埋
める有効な命令を見つけ出し、該当する命令を分岐命令
の直後にコピーし、分岐先アドレスを命令分進めるよう
な処理を行うことを特徴としている。

【００２９】命令スケジューリング部１５の詳細な処理
の流れを示す図を図２に、サブルーチン間命令スケジュ
ーリング部１６の処理の流れを示す図を図３に示す。ま
た、図２，図３の流れ図で用いる最適化処理のタイプを
図４に示す。図２，図３で用語として用いている［タイ
プ１］から［タイプ４］の方法とは、図４に示す［タイ
プ１］から［タイプ４］の方法を示すものとする。

【００３０】本発明のコンパイラの命令スケジューリン
グ部１５では、図４に示す４種類のタイプを以下の手順
で組み合わせて用いることにより、遅延分岐命令のスケ
ジューリングを行う。

【００３１】（１）まず［タイプ１］の最適化によっ
て、分岐命令の前の命令を分岐命令の後に移動させるこ
とを試みる。無条件分岐命令に対しては、この方法で遅
延スロットを埋めることができる。（２）（１）で遅延スロットが埋まらなかった場合に
は、［タイプ２］及び［タイプ３］の最適化により残り
を埋める。（３）（１），（２）の方法で遅延スロットが埋まらな
かった場合に、サブルーチン間命令スケジューリング部
１７を起動し、［タイプ４］の最適化により遅延スロッ
トを埋める。

【００３２】次に、図８の原始プログラムに対する中間
コードが、命令スケジューリング部１５によって最適化
処理される様子を、図２，図３の流れ図と図４に従って
説明する。

【００３３】図８は、従来例で用いた原始プログラムと
同じプログラムである。今、図８のプログラムが中間コ
ード生成部１３までの各処理部によって、図９のような
中間コードに変換されているものとする。図９も、従来
例で用いた命令スケジューリング処理前の中間コードと
同じであり、まだ命令スケジューリング最適化は施され
ていない状態を表している。この中間コードに対して、
命令スケジューリング部１５によって命令スケジューリ
ングを行う。

【００３４】図２において、図９の中間コードの第１行
目から処理を進め、第３行目までは遅延分岐命令ではな
く、また、次の命令があるため、ステップ１０９により
次の行へ移行する。第４行目のｃａｌｌｓｕｂ１は遅延分岐命令であるので、ステップ１００からステッ
プ１０１へ移行する。

【００３５】ステップ１０１において、第４行目の“ｃ
ａｌｌ”命令に対し［タイプ１］の方法により“ｃａｌ
ｌ”命令の直前の命令ｍｏｖ％ｉＯ，％ｏＯを“ｃａｌｌ”命令の直後に移動することで、遅延スロ
ットが埋められるか試みる。このとき“ｍｏｖ”命令は
分岐条件に依存しないため、この方法が成立する。よっ
て、ステップ１０２により［タイプ１］の方法を実行
し、第３行目のｍｏｖ％ｉＯ，％ｏＯを第４行目のｃａｌｌｓｕｂ１の直前に移動し次の行へ移行する。

【００３６】次に遅延分岐命令であるのは、第６行目のｃａｌｌｓｕｂ２であるので、この命令に対し［タイプ１］の方法を試み
る。第６行目の“ｃａｌｌ”命令の直前の命令は、前の
処理で移動したｍｏｖ命令である。この命令は、サブル
ーチンｓｕｂ１への分岐前に実行されていなけらばなら
ないため、ここでは命令の入れ換えはできずステップ１
０３へ移行する。

【００３７】［タイプ２］の方法では、分岐先の命令を
遅延分岐命令の直後にコピーするが、この場合、遅延分
岐命令がサブルーチンコール命令であり、分岐先の命令
が基本ブロック内の命令ではないため、成立せずステッ
プ１０５へ移行する。

【００３８】［タイプ３］の方法では分岐しないパス上
の命令を移動するが、この場合、該当する命令がないた
めステップ１０７へ移行し、サブルーチン間命令スケジ
ューリング部１６を起動する。

【００３９】図３において、ステップ１１０で［タイプ
４］の方法を試みる。第６行目の命令であるｃａｌｌｓｕｂ２の分岐先はサブルーチン“ｓｕｂ２”であるので、第２
５行目のラベルであるｓｕｂ２：以降の命令の中から、第６行目の“ｃａｌ
ｌ”命令の遅延スロットを埋めることができる命令が存
在するかを調べる。ここで、サブルーチン“ｓｕｂ２”
の第１番目の命令ｓｅｔｈｉ％ｈｉ（ｄａｔａ），％ｏ３が遅延スロットを埋めることができるので、ステップ１
１１へ移行し［タイプ４］の方法に従い、以下の処理を
行う。

【００４０】（１）分岐先の命令ｓｅｔｈｉ％ｈｉ（ｄａｔａ），％ｏ３を分岐命令ｃａｌｌｓｕｂ２の直後にコピーする。（２）分岐命令ｃａｌｌｓｕｂ２の分岐先を示すアドレスを１命令分進め、ｃａｌｌｓｕｂ２＋４に変更する。ここで、１命令分の命令長は４であるとす
る。

【００４１】以下、同様の処理を図９の中間コード全て
に対して行うことにより、図９の中間コードは、図１１
のように変換される。

【００４２】このように、従来のコンパイラの命令スケ
ジューリング方法では、図１０の第６行目のように、遅
延分岐命令の遅延スロットに“ｎｏｐ”以外の有効な命
令を置くことができなかったような場合でも、本発明の
コンパイラの命令スケジューリング部によれば、図１１
の第６行目のように遅延スロットに有効な命令を置くこ
とが可能になる。

【００４３】

【発明の効果】従来のコンパイラでは、遅延分岐命令の
遅延スロットに有効な命令を置くことができなかったよ
うな場合でも、本発明によれば、コンパイラの命令スケ
ジューリング部の遅延分岐命令スケジューリング部によ
り、基本ブロック外からも、遅延スロットを埋める命令
を見つけ出すことが可能になる。従って、”ｎｏｐ“を
追加することによる目的プログラムのステップ数の増加
を回避することができ、プログラムの実行をより高速化
することが可能になる。

【図面の簡単な説明】

【図１】本発明の実施例のコンパイラの構成図。

【図２】本発明の実施例のコンパイラの命令スケジュー
リング部の処理の流れ図。

【図３】本発明の実施例のコンパイラのサブルーチン間
命令スケジューリング部の処理の流れ図。

【図４】本発明の実施例のコンパイラのサブルーチン間
命令スケジューリング部の処理のタイプを示す図。

【図５】従来のコンパイラの構成図。

【図６】従来のコンパイラの命令スケジューリング部の
処理の流れ図。

【図７】従来のコンパイラの命令スケジューリング部の
処理のタイプを示す図。

【図８】Ｃ言語のプログラムを示す図。

【図９】図８のプログラムが、コンパイラによって変換
されて得た中間コードを示す図。

【図１０】図９の中間コードが、従来のコンパイラの命
令スケジューリング部によって最適化されて得た中間コ
ードを示す図。

【図１１】図９の中間コードが、本発明の実施例のコン
パイラの命令スケジューリング部によって最適化されて
得た中間コードを示す図。

Claims

【特許請求の範囲】

【請求項１】パイプライン機構を有するプロセッサで
実行され、字句解析部と、構文解析部と、中間コード解析部と、命
令スケジューリング部を有する中間コード最適化部と、
コード生成部とを備えたコンパイラにおいて、前記命令スケジューリング部において、中間コードに対
し、遅延分岐命令の遅延スロットに有効な命令を埋める
ような最適化を行う際であって、基本ブロック内に遅延
スロットを埋める有効な命令が存在しない場合に、分岐先の命令を分岐命令の直後に複写し、分岐前のプログラムに対し、前記複写した命令の次の命
令から実行するための処理を行うサブルーチン間命令ス
ケジューリング部を前記命令スケジューリング部に備え
ることを特徴とするコンパイラ。