JPWO2008072334A1 - コンパイル方法及びコンパイラ - Google Patents

コンパイル方法及びコンパイラ Download PDF

Info

Publication number
JPWO2008072334A1
JPWO2008072334A1 JP2008549167A JP2008549167A JPWO2008072334A1 JP WO2008072334 A1 JPWO2008072334 A1 JP WO2008072334A1 JP 2008549167 A JP2008549167 A JP 2008549167A JP 2008549167 A JP2008549167 A JP 2008549167A JP WO2008072334 A1 JPWO2008072334 A1 JP WO2008072334A1
Authority
JP
Japan
Prior art keywords
processing block
processing
scheduler
stage
statements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008549167A
Other languages
English (en)
Inventor
浩一郎 山下
浩一郎 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2008072334A1 publication Critical patent/JPWO2008072334A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/45Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions
    • G06F8/458Synchronisation, e.g. post-wait, barriers, locks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/45Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions
    • G06F8/456Parallelism detection

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

コンピュータにより、予め決められたタイミングで途中結果を出力すると共に時系列的に処理されるソフトウェアのコンパイルを行うコンパイル方法は、ソフトウェアのソースコードに含まれる処理シーケンスから並列性及び条件分岐に関する処理ブロックを抽出する抽出ステップと、抽出された処理ブロックのリストラクチャリングを行い実行コードを自動的に生成する生成ステップとを含む。

Description

本発明は、コンパイル方法及びコンパイラに係り、特に組み込み機器上におけるソフトウェアの実行コードを自動的に生成するコンパイル方法及びコンパイラに関する。
図1は、組み込み機器上におけるソフトウェアの実行コードを生成する従来のコンパイラの構成を示す図である。図1に示すコンパイラは、組み込み機器のソフトウェアを単一のアプリケーションとして効率的に実行するために、実行コードの最適化を行う。図1に示すコンパイラは、翻訳装置(フロントエンド)2、最適化装置(ミドルパス)4及びコード生成装置(バックエンド)5を有する。フロントエンド2はソースコード1から中間言語3−1を生成し、ミドルパス4は中間言語3−1から中間言語3−2を生成する。バックエンド5は、中間言語3−2から最適化された実行コード6を生成する。コンパイルによる翻訳作業の過程で、ミドルパス4において不要な変数の削除や命令のパッキング、呼び出し関数のインライン展開等の単純な再構築(リストラクチャリング)を行う。
このような実行コードの最適化のためのリストラクチャリングでは、命令コードの削除や単純置換を行い、ソースコード1に記述された処理シーケンスの構造そのものを変更するようなリストラクチャリングは行わない。
動画処理や通信処理等の処理の実行を開始した後は、CPUの処理能力に関係なく予め決められた時刻において周期的に途中の演算結果を出力するような時系列処理のソフトウェアがある。このような時系列的(シーケンシャル)に記述されたソフトウェアを図1に示すコンパイラでコンパイルして実行コードを生成した場合、処理の開始から終了までのトータルの演算量がCPUの処理能力に見合ってる場合においても、図2に示す例のように処理P3,P4が開始される順番によっては、処理が間に合わず遅延を生じることがある。図2は、時系列処理(シーケンシャル処理)の遅延を説明する図である。図2において、P1〜P4は処理を示し、t1は開始条件判断時刻、t2は処理P3の実際の終了時刻、t3は処理P4の期待終了時刻、t4は処理P4の実際の終了時刻、t5は処理P3の期待終了時刻を示す。この場合、処理P4の実際の終了時刻t4は、処理P4の期待終了時刻t3より遅く、遅延D1が生じている。
一般的には、上記のように平均的なCPUの処理能力が十分であっても、局所的な処理の観点ではCPUの処理能力が不十分な状態が起こり得ると想定される場合、ソフトウェアは図3で示すように設計段階でバッファ8を定義することにより処理遅延の問題を回避する。図3は、時系列処理の遅延の回避を説明する図である。図3中、図2と同一部分には同一符号を付し、その説明は省略する。図3において、P3y,P4yは夫々y番目に実行される処理P3,P4、P4zはz番目に実行される処理P4、t2yは処理P3yの実際の終了時刻、t3yは処理P4yの期待終了時刻、t5yは処理P3yの期待終了時刻である。
図4は、従来の動的スケジューラのイメージを示す図である。同図中、11はタスク又はスレッド、12はタスク又はスレッド11から報告される実行情報テーブル、13は情報テーブルに基づいてスケジューリングを行う動的スケジューラ、14はオペレーティングシステム(OS)16内のコンテキストスイッチ・プロセス管理機能、15は動的スケジューラ13の指示によるスイッチを示す。従来の組み込み機器で効率的に複数のタスク又はスレッド11を並列(同時)に実行する場合、図4に示す動的スケジューラ13では、アプリケーションに動的なプロファイリング機能を持たせ、メモリやCPU使用量を随時OS16に報告する。動的スケジューラ13は、常時収集された情報の情報テーブル12を参照して動的にタスク又はスレッド11の優先度を定義し、OS16のコンテキストスイッチ・プロセス管理機能14によりタスク又はスレッド11のスイッチ15を行う。
このように複数のタスク又はスレッド11を効率的に実行するための動的スケジューラ13は、OS16と連動したアプリケーションとは別動作をするソフトウェア、即ち、外部(又は、外付けの)スケジューラである。このため、対象とするソフトウェアが必要とするCPUの演算量の観点からは、このような動的スケジューラ13は純粋なオーバーヘッドとみなされる。
そこで、情報テーブル12を参照して優先度を定義する動的スケジューラ13によるオーバーヘッドを発生させないために、一般的にはラウンドロビン、或いは、予め固定的に設定された優先度に従って能動的に動作しないオーバーヘッドの小さいスケジューラを用いる手法があるが、全てのソフトウェアを効率的に実行することはできない。
処理時間を最短にする実行コードを生成し、且つ、動的スケジューラ13によるオーバーヘッドを回避するためには、実行コード中に実行開始を定義する静的スケジューラ機構を埋め込む手法が用いられることがある。
静的スケジューラは、メモリやCPUの使用量を動的に報告しない代替手段として、コンパイル時に分岐命令に着目し、分岐命令からジャンプする従属処理のメモリやCPUの使用量に対して、分岐予測の係数を乗じた見込みの情報テーブルに基づいてコンパイル時にスケジューリングを決定する。
静的スケジューラは、動的に最適な処理を行う動的スケジューラに対して、実行時のスケジューリングに対するオーバーヘッドは小さいが、特に実行毎に演算量や取り扱うデータ量が変化するような構造のソフトウェアでは、スケジューリング精度が落ち、処理時間を最短に行えるとは限らない。このため、静的スケジューラは、一般的にはCPU上で処理を行いたい演算量が予めわかっているソフトウェアに用いられる。
従来のコンパイラは、コードレベルの最適化や時系列的に記述されたソースコードのコンパイル時にデータ依存や制御依存の解析を行い、並列実行可能な処理を分割し、並列に配置されたCPUに対する実行コードを生成する。このようにして、時系列的に記述されたソースコードからより多くの並列性を抽出し、実行開始から終了までの処理時間を最短に行える実行コードを生成する。
動的スケジューラは、例えば特許文献1や特許文献2にて提案されている。又、多重レベルスケジューラは、例えば特許文献2にて提案されている。
特開平6−110688号公報 特開2003−84989号公報 特開平8−212070号公報
組み込み機器のソフトウェア実行環境は、高度化するOSやコンパイル環境により変化しており、パーソナルコンピュータ(PC)やワークステーション等で動作していた汎用のソフトウェアが組み込み機器で動作するようになってきている。一方、組み込み機器では、CPUやメモリ等の限られたリソースを用いて、対象とするソフトウェアを効率的に実行することが望まれている。
従来の組み込み機器では、リストラクチャリングを伴わないコード最適化レベルのコンパイラが起動されるか、或いは、複数のタスク又はスレッドが起動するようなソフトウェア構成の場合にはスケジューラが起動される。
一方で、ソフトウェアをより効率的に動作させためには、ソフトウェアの実装者により対象となる組み込み機器に適した移植作業を手動で行う必要があった。
このように、組み込み機器の限られたソフトウェア実行環境では、ソフトウェア、特に時系列的に記述されたソースコードで、且つ、予め決められた時刻に周期的に途中の演算結果を出力するような時系列処理を行うアプリケーションを実行する際に、低いオーバーヘッド、高いスケジューリング精度、CPUやメモリ等のリソースの効率的な利用を可能とする実行コードをコンパイラにより自動的に生成することが求められている。
そこで、本発明は、限られたソフトウェア実行環境でもソフトウェアの実行コードを効率的に生成することが可能なコンパイル方法及びコンパイラを実現することを目的とする。
上記の課題は、コンピュータにより、予め決められたタイミングで途中結果を出力すると共に時系列的に処理されるソフトウェアのコンパイルを行うコンパイル方法であって、該コンピュータにより、該ソフトウェアのソースコードに含まれる処理シーケンスから並列性及び条件分岐に関する処理ブロックを抽出する抽出ステップと、該コンピュータにより、抽出された処理ブロックのリストラクチャリングを行い実行コードを自動的に生成する生成ステップとを含むことを特徴とするコンパイル方法によって達成できる。
上記の課題は、コンピュータにより、予め決められたタイミングで途中結果を出力すると共に時系列的に処理されるソフトウェアのコンパイルを行うコンパイラであって、該コンピュータにより、該ソフトウェアのソースコードを第1の中間言語に翻訳して記憶部に保存するフロントエンドと、該コンピュータにより、該記憶部に保存された該第1の中間言語に基づいて該ソースコードに含まれる処理シーケンスから並列性及び条件分岐に関する処理ブロックを抽出し、抽出された処理ブロックのリストラクチャリングを行い第2の中間言語を生成して記憶部に保存するミドルパスと、該コンピュータにより、該記憶部に保存された該第2の中間言語に基づいて実行コードを自動的に生成するバックエンドとを備えたことを特徴とするコンパイラによって達成できる。
本発明によれば、限られたソフトウェア実行環境でもソフトウェアの実行コードを効率的に生成することが可能なコンパイル方法及びコンパイラを実現することができる。
従来のコンパイラの構成を示す図である。 時系列処理の遅延を説明する図である。 時系列処理の遅延の回避を説明する図である。 従来の動的スケジューラのイメージを示す図である。 本発明のコンパイラの一実施例の構成を示す図である。 ソフトウェアを構成するソースコードの分類を説明する図である。 ステートメントの依存関係を表現した依存グラフの一例を示す図である。 図7の依存グラフを元に処理順序を入れ替えた例を示す図である。 ソフトウェアのフロー構成例を示す図である。 実施例の第一段階の処理を示すフローチャートである。 無条件ジャンプ及びループ処理のブロックの演算代入処理ブロックとしての再定義を説明する図である。 演算代入処理ブロック同士の再定義を説明する図である。 スレッド化処理ブロック及びスケジューラ化処理ブロックの再定義を説明する図である。 スレッド化処理ブロック及びスケジューラ化処理ブロックを説明する図である。 実施例の第二段階の処理を示すフローチャートである。 スレッド化処理ブロックへのステートメントの追加方法を説明する図である。 スケジューラ化処理ブロックへのステートメントの追加方法を説明する図である。 最外郭スケジューラ化処理ブロックのタイマ処理を説明する図である。 実施例の第三段階の処理を説明するフローチャートである。 実施例の動作時のタイミングチャートのイメージを示す図である。 図2の従来手法と実施例のタイミングチャートのイメージを比較する図である。 実施例のスケジューラ化処理ブロックのイメージを示す図である。 実際のプログラムに対してコンパイルを行った場合のリソースの利用効率の測定結果を従来手法と実施例について示す図である。
符号の説明
31 ソースコード
32 フロントエンド
33−1,33−2 中間言語
34 ミドルパス
35 バックエンド
36 実行コード
81 タスク又はスレッド
83 動的スケジューラ
84 コンテキストスイッチ・プロセス管理機能
86 OS
88 タイマ機能
本発明のコンパイル方法及びコンパイラでは、組み込み機器上で動作するソフトウェアのうち、時系列的に記述されたソフトウェアのソースコードを、コンパイル時における中間言語のプリプロセッシングでタスク又はスレッド化し、スケジューリングコードを生成するリストラクチャリングを行うことにより、小さいオーバーヘッドの実現とCPU等のリソースの利用効率の向上を可能とすることができる実行コードを生成する。
つまり、組み込み機器上で動作するアプリケーションのうち、動画処理や通信処理等の時系列処理を行うようなループ構成のアプリケーションにおいて、コンパイルの初期段階で構造解析の終わった中間言語(中間コード)上でステートメントレベルで分類された処理ブロックから、条件分岐の処理ブロックで構成されるスケジューラの構築、タイマハンドラ化、及び条件分岐後に実行される演算代入処理の処理ブロックの抽出、スレッド化を行い、ウェイトによるCPUの解放(リリース)、シグナルに応答するウェイクアップ(Wake-Up)機構を挿入するような再構築(リストラクチャリング)を行うことで、実行時に必要なタイミングで必要な演算処理を行い、不要なときはCPUを解放するような仕組みによりCPUを含むリソースの利用効率を向上させる。
このように、本発明では、実行対象のソフトウェアの元となるソースコードをコンパイル過程の中間言語レベルで解析、分類し、抽出された処理ブロックから並列(同時)に処理可能な処理ブロック及び、スケジューリングに関する処理ブロックとして再定義し、必要最低限のステートメントを挿入する。これにより、不要な外部ステートメント(コード)を削除し、対象とするソフトウェアの専用スケジューラをリストラクチャリングにより実現することができる。
図5は、本発明のコンパイラの一実施例の構成を示す図である。コンパイラの本実施例は、本発明のコンパイル方法の一実施例を採用する。本実施例では、本発明が組み込み機器上におけるソフトウェアの実行コードを生成する場合に適用されている。組み込み機器は、CPU等のプロセッサとメモリ等の記憶部を備え、プロセッサが記憶部に格納されたプログラムを実行する周知のハードウェア構成を有するコンピュータ(又はコンピュータシステム)である。
図5に示すコンパイラは、組み込み機器のソフトウェアを単一のアプリケーションとして効率的に実行するために、実行コードの最適化を行う。図5に示すコンパイラは、翻訳装置(フロントエンド)32、最適化装置(ミドルパス)34及びコード生成装置(バックエンド)35を有する。フロントエンド32はソースコード31から中間言語33−1を生成して記憶部に保存し、ミドルパス34は記憶部に保存された中間言語33−1から中間言語33−2を生成して記憶部に保存する。バックエンド35は、記憶部に保存された中間言語33−2から最適化された実行コード36を生成し、必要に応じて記憶部に保存する。コンパイルによる翻訳作業の過程で、ミドルパス34において不要な変数の削除や命令のパッキング、呼び出し関数のインライン展開等の単純なリストラクチャリングを行う。フロントエンド32やバックエンド35は単純な翻訳装置であり、能動的に実行コードの最適化を行うことはない。実行コードの最適化を行わない場合には、フロントエンド32が生成した中間言語33−1を直接バックエンド35が解読し、実行コードを生成するため、ミドルパス34は使用されない。
一般的に、コンパイル処理は、ソースコードで示された処理シーケンスを対象とするCPU等の演算装置(プロセッサ)が解読できる実行コードに変換する。又、ミドルパスでは、伝播しない変数及び数式文の削除やサブルーチンのインライン展開、或いは、ループをイタレーション単位で展開するアンローリング処理等の汎用的な最適化手法により、より効率的な実行コードを生成する。
これに対し、本実施例は、ミドルパス34に組み込まれる効率的な実行コードの生成手法に特徴がある。図5に示すミドルパス34は、中間言語33−1を入力とし、以下に示す手順によりリストラクチャリングを行い、中間言語33−2を生成する。中間言語33−1のレベルでリストラクチャリングを行う。このため、フロントエンド32及びバックエンド35については従来と同様のものを変更することなく使用可能であり、ミドルパス34は既存のコンパイラに汎用的に組み込むことが可能である。
図6は、ソフトウェアを構成するソースコード31の分類を説明する図である。図6は、ソフトウェアを構成するソースコード31をステートメントレベルで分類した場合を示し、全てのソースコード31は中間言語33−1に翻訳された後、以下のいずれかの処理区分ps1〜ps4に分類することができる。処理区分ps1は、演算及びメモリやレジスタ等の記憶部に演算結果の代入を行う演算代入処理であることを示す。処理区分ps2は、バックエッジを含むジャンプ命令で示されるループ処理、即ち、バックエッジジャンプであることを示す。処理区分ps3は、条件分岐或いは条件付きジャンプ命令で示される分岐処理であることを示す。処理区分ps4は、サブルーチンや関数コール等を示し、無条件ジャンプ命令であることを示す。
本実施例では、任意の構成の中間言語33−1に着目してリストラクチャリングを行うので、汎用的な最適化処理がどこで行われても構わないが、ループ構造をそのまま使用するため、リストラクチャリングを行う前にアンローリング手法等のループ最適化手法は適用しないものとする。
コンパイラは、中間言語33−2を生成する際に必ず変数テーブルを内部に持ち、中間言語33−2の各ステートメントは昇順で採番されており、参照する変数(式の右辺)と、定義する変数(式の左辺)を持つ。x番目のステートメントをSxで表した場合、Sxの参照変数の集合体を(式1)、Sxの定義変数の集合を(式2)で表す。
Use(Sx) (式1)
Def(Sx) (式2)
(式1)及び(式2)は、集合化されたステートメントグループSGにも適用され、y番目のステートメントグループSGyに対して同様に(式3)及び(式4)を定義する。
Use(SGx) (式3)
Def(SGx) (式4)
又、定義及び参照される変数が存在しない場合の表現として、空集合をΦ用いる。
ステートメントSxが条件分岐文の場合、条件を判定するための参照変数のみが存在するため、(式5)が成立する。
Def(Sx) = Φ、Use(Sx) ≠ Φ (式5)
ステートメントSxがサブルーチンコールに因る無条件ジャンプ文の場合、(式6)が成立する。
Def(Sx) = Use(Sy) = Φ (式6)
ステートメント間の依存関係は、互いに定義及び参照する変数集合に対して同一の要素が含まれるか否かで定義される。m番目及びn番目のステートメントに関して、(式1)及び(式2)から導かれる変数の集合体において、m<nの関係で(式7)が成立する場合、正方向依存が存在する。
Def(Sm) ∩ Use(Sn) ≠ Φ (式7)
ここで、SmとSnが正方向依存δであることを表現する式として(式8)を定義する。
Sm δ Sn (式8)
m>nの関係で(式7)が成立する場合、逆方向依存が存在する。SmとSnが逆方向依存δiであることを表現する式として、(式9)を定義する。
Sm δi Sn (式9)
又、(式10)が成立する場合、出力依存が存在する。
Def(Sm) = Def(Sn) (式10)
SmとSnが出力依存δoであることを表現する式として、(式11)を定義する。
Sm δo Sn (式11)
(式11)が成立するSm, Sn について、m<k<nの関係を満たす任意のkに対して(式12)が成り立つ場合、Smで定義される変数はどこでも参照されることなく、Snにおいて上書きされることから、Smを削除することが可能である。
(Def(Sm) = Def(Sn)) ∩ Use(Sk) = Φ (式12)
(式8)、(式9)及び(式11)を一般的には依存方程式と呼び、全てのステートメントに対して(式1)及び(式2)を導くことで、各ステートメントの依存関係を表現した依存グラフを作成することができる。
図7は、ステートメントの依存関係を表現した依存グラフの一例を示す図である。同図中、Sa〜Sfは、ステートメントを示す。図7に示す例では、ステートメントSaの定義結果をステートメントSdが参照し、ステートメントSdが参照している変数をステートメントSfで定義することを表している。又、ステートメントSbの定義変数はどこでも使用されることなく、ステートメントSfにおいて再定義されることから(式12)が成立するとみなされ、ステートメントSbはコード中から削除されることになる。
原則として(式8)、(式9)及び(式11)の関係にあるステートメントは、何らかの依存関係にあるステートメントであり、処理順序を入れ替えることはできない。言い換えると、(式8)、(式9)及び(式11)のいずれの関係も成立しないステートメント同士は、処理順序の入れ替えを行うことができる。
上記の観点から、図7において、(式13)に示すようにステートメントSaとステートメントSdから構成されるグループをSGx、ステートメントScとステートメントSeから構成されるグループをSGyとした場合、これらは(式14)から依存関係にないため、互いに処理順序を入れ替えることが可能である。(式14)において、「¬δ」は依存関係がないことを示す。又、上述のようにステートメントSbは削除可能なため、図7で示す依存グラフは図8に示すグラフと等価となる。図8は、図7の依存グラフを元にステートメントの処理順序を入れ替えた、即ち、ソートされた例を示す図である。
SGx = (Sa, Sd), SGy = (Sc, Se) (式13)
つまり、
Def(SGx) = Def(Sa) ∪ Def(Sd), Use(SGx) = Use(Sa) ∪ Use(Sd)
Def(SGy) = Def(Sc) ∪ Def(Se), Use(SGy) = Use(Sc) ∪ Use(Se)
且つ、
(Def(Sa)或いはDef(Sd) ∩ (Use(Se) 或いは Use(Se)) = Φ
(Use(Sa)或いはUse(Sd) ∩ (Def(Se) 或いは Def(Se)) = Φ
(Def(Sa)或いはDef(Sd) ∩ (Def(Se) 或いは Def(Se)) = Φ
が成立するため、(式14)が得られる。
SGx ¬δ SGy (式14)
図9は、ソフトウェアのフロー構成例を示す図である。図9中、ps1〜ps4は、夫々図6に示す処理区分ps1〜ps4の処理に対応する処理ブロックを示す。中間言語に展開されたステートメントの列は、図9で示すように、複数代入処理の処理ブロックps1の間に条件分岐の処理ブロックps3或いは無条件ジャンプの処理ブロックps4が挟まった形態を取る。条件分岐の処理ブロックps3及び無条件ジャンプの処理ブロックps4は、データ依存ではなく制御構造を示すものであり、処理フローが一旦途切れるとみなされるため、図5に示すミドルパス34の処理単位を、条件分岐の処理ブロックps3及び無条件ジャンプの処理ブロックps4のステートメントで区切られた演算代入処理の処理ブロックps1、即ち、代入ステートメントの集合と考える。
本実施例では、第一段階の処理として、図9に示す演算代入処理の処理ブロックps1に対して、上記ステートメント間の依存方程式に基づく並べ替えを行うものとする。図10は、本実施例の第一段階を示すフローチャートである。図10において、入力は中間言語33−1であり、出力も中間言語33−1である。
図10に示す第一段階は、全ての制御ステートメントで区切られた演算代入ステートメントのグループに対して行われる。先ず、ステップSt1で定義及び参照される変数の抽出が行われ、ステップSt2で依存グラフの定義が行われる。又、ステップSt3で不要なステートメントの削除が行われ、ステップSt4で依存グラフに基づくステートメントのソートが行われる。
第一段階の依存解析において、従来はコンパイル段階でポインタ変数等の依存関係を明確に抽出できない場合があった。本実施例の第一段階は、第二段階以降の操作をより簡便に行うための前処理であるため、必ずしも全ての依存関係を抽出できる必要はない。
本実施例の第二段階では、上記の中間言語レベルで整理されたステートメント列に対し、後述する方式に従ってステートメントのグループの結合及び再定義を行う。又、第二段階では、上記処理区分で分類された処理ブロックを結合する作業を行うが、一般的なソフトウェアは、ネスト構造のループ、入れ子構成の条件分岐、サブルーチン配下のループ、条件分岐等の階層構造を有する。このため、本実施例の第二段階で行う操作は、ネスト又は入れ子構造にある最も内側の階層の処理ブロックから順に行っていくものとする。
ネスト又は入れ子構造の最も内側の処理ブロックは、必ず演算代入処理の処理ブロックになっている。第一段階において、最も内側の処理ブロックに存在したステートメントが依存方程式の解により削除された場合には、該当する入れ子構造も削除される。
ネスト又は入れ子構造の最も内側の処理ブロックの処理にあたっては、呼び出し元の処理ブロックが無条件ジャンプ、即ち、コールされるサブルーチンの本体である場合には、これを前段処理区分の無条件ジャンプの処理ブロックと結合して再グループ化し、演算代入処理ブロックとして再定義する。
一般的なコード最適化において、ステートメントがインライン展開されていれば、この操作は第一段階の処理において通常の演算代入処理ブロックの整理と共に処理されるが、本実施例においては、ステートメントがインライン展開される必要はなく、単にステートメントのグループ化が行われるだけで良い。
ネスト又は入れ子構造の最も内側の処理ブロックの処理にあたっては、呼び出し元の処理ブロックがループ処理(バックエッジジャンプ)の処理ブロック、即ち、ループ内部に条件分岐等の制御構造を伴わない単純ループの本体である場合には、これを再グループ化し、演算代入処理ブロックとして再定義する。
図11は、無条件ジャンプ及びループ処理(バックエッジジャンプ)の処理ブロックの演算代入処理ブロックとしての再定義を説明する図である。図11に示すように、呼び出し元の処理ブロックが無条件ジャンプの処理ブロックである場合には、これを前段処理区分の無条件ジャンプの処理ブロックと結合して再グループ化し、演算代入処理ブロックとして再定義する。又、図11に示すように、呼び出し元の処理ブロックがループ処理(バックエッジジャンプ)の処理ブロックである場合には、これを再グループ化し、演算代入処理ブロックとして再定義する。
上記の如き演算代入処理ブロックの再定義を行った結果、ネスト又は入れ子の同一階層に演算代入処理ブロックが縦列に並ぶことがある。この場合、縦列に並んだ演算代入処理ブロックは結合され、再び演算代入処理ブロックとして再定義される。
図12は、演算代入処理ブロック同士の再定義を説明する図である。図12において、「代入演算」は代入演算処理ブロックを示し、破線で囲まれた処理ブロックは結合された処理ブロックを示す。
次に、呼び出し元の処理ブロックが条件分岐処理の処理ブロックの場合、即ち、条件分岐の真偽いずれかの従属節にあたる場合、特に処理ブロック間の結合処理を行うことなく、これをスレッド化処理ブロックとして再定義する。
図13は、スレッド化処理ブロック及びスケジューラ化処理ブロックの再定義を説明する図である。ネスト又は入れ子構造の階層的な解析により、スレッド化処理ブロックの構成要素は必ずしも1つの処理ブロックとは限らず、又、スレッド化処理ブロックの構成要素は演算代入処理ブロックだけとは限らない。
又、ある処理ブロックの後続の処理ブロックが条件分岐処理である場合、これらの処理ブロックを結合し、スケジューラ化処理ブロックとして再定義する。
スレッド化処理ブロックとスケジューラ化処理ブロックには密接な関係があり、スレッド化処理ブロックは条件分岐からの従属節であるため、必ず該当する条件分岐を含んだスケジューラ化処理ブロックと連携することになる。
上記の処理ブロック化を対象とするコードに対して、ネストや入れ子構造も考慮してスレッド化処理ブロック及びスケジューラ化処理ブロックを再定義する。図14は、スレッド化処理ブロック及びスケジューラ化処理ブロックを説明する図である。図14に示すプログラム中、41は図14において階層の最も上位に属するスケジューラ化処理ブロック、42はスケジューラ化処理ブロック41に従属するスレッド化処理ブロック、43はスケジューラ化処理ブロック41の一階層下に含まれるスケジューラ化処理ブロック、44はスケジューラ化処理ブロック43に従属するスレッド化処理ブロック、45はスレッド化処理ブロック42の一階層下に含まれるスケジューラ化処理ブロック、46はスケジューラ化処理ブロック45に従属するスレッド化処理ブロックを夫々示す。
図15は、本実施例の第二段階の処理を示すフローチャートである。図15において、入力は中間言語33−1であり、出力も中間言語33−1である。
図15に示す第二段階は、上記第一段階で行った依存グラフに基づくステートメントのソートの結果に対して行われる。先ず、ステップSt11は、処理ブロック化を対象とするプログラムのコードに対して、ネスト又は入れ子構造にある最も内側の階層の処理ブロックから順に処理を開始する。ステップSt12は、呼び出し元の処理ブロックが条件分岐処理であるか否かを判定する。ステップSt12の判定結果がYESであると、ステップSt13は、条件分岐の従属節をスレッド化処理ブロックとして再定義し、処理はステップSt11へ戻り、ネスト又は入れ子構造にある最も内側の階層の次の階層の処理ブロックの処理を開始する。他方、ステップSt12の判定結果がNOであると、ステップSt14は、後続の処理ブロックが条件分岐処理に続くものであるか否かを判定し、判定結果がNOであると、処理はステップSt11へ戻り、ネスト又は入れ子構造にある最も内側の階層の更に次の階層の処理ブロックの処理を開始する。又、後続の処理ブロックが条件分岐処理でありステップSt14の判定結果がYESであると、ステップSt15は、これらの処理ブロックと後続の処理ブロックを結合してスケジューラ化処理ブロックとして再定義する。ステップSt15の後、処理はステップSt11へ戻り、ネスト又は入れ子構造にある最も内側の階層の次の階層の処理ブロックの処理を開始する。
本実施例の第二段階では、上記の中間言語レベルで整理されたステートメント列に対し、後述する方式に従ってステートメントのグループの結合及び再定義を行う。又、第二段階では、上記処理区分で分類された処理ブロックを結合する作業を行うが、一般的なソフトウェアは、ネスト構造のループ、入れ子構成の条件分岐、サブルーチン配下のループ、条件分岐等の階層構造を有する。このため、本実施例の第二段階で行う操作は、ネスト又は入れ子構造にある最も内側の階層の処理ブロックから順に行っていくものとする。
本実施例の第三段階では、第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに制御ステートメントを付加し、スレッドとスケジューラとして最終的な中間言語(中間コード)を生成する。
条件分岐及び条件を算出する演算と、それに従属する処理ブロックの呼び出しは、動的スケジューラとスケジューリングされるスレッドの関係と等価である。本実施例では、外部(又は、外付けの)スケジューラを使用しない構造とするため、スケジューラ化処理ブロックの構造にスレッドのコンテキストスイッチ機能と同様の動きをする仕組みを設ける。又、スレッド化処理ブロックには、スケジューラの要求時にのみ動作する仕組みを設ける。
そこで、本実施例の第三段階では、スケジューラ化処理ブロックとそれに従属するスレッド化処理ブロックに対して次のような操作を行う。
図16は、スレッド化処理ブロックへのステートメントの追加方法を説明する図である。先ず、図16に51で示すようにスレッド化処理ブロック55をループで囲み、52で示すようにループの入口部分(先頭部分)にシグナルを受信待ちし、シグナルを受信するまではCPUを解放(リリース)するウェイト(wait)機構のようなOSのサービスコールを挿入する。又、53,54で示すように、スレッド化された処理ブロック同士が並列動作することも考慮し、並列実行(同時実行)する処理ブロックを(式8)、(式9)及び(式11)で導かれる依存方程式に基づいて解析し、依存関係にある場合、セマフォ(Semaphore)やミューテックス(Mutex)による排他制御コードを挿入する。つまり、53で示すように排他ロックをかけると共に、54で示すように排他ロックを解除する。上記の操作により、構造を変更されたスレッド化処理ブロック55をイベント処理スレッド59として定義して起動するようなコードをプログラム本体に追加することができる。
上記の操作により、処理動作を行わなくても良いタイミングでは、イベント処理スレッド59はCPUを解放しているため、不要なCPUリソースを使用することがない。
図17は、スケジューラ化処理ブロックへのステートメントの追加方法を説明する図である。スケジューラ化処理ブロックには条件分岐処理が含まれており、その条件分岐が発生するタイミングが上記のイベント処理スレッド59を起動するタイミング(スケジューリングする)であると考えられる。そこで、条件分岐後の従属節に、図17に61で示すように従属するイベント処理スレッド59が期待するシグナル(即ち、条件A又はBが成立すると動作させるイベントに対するシグナル)を発行するステートメント(コード)を挿入し、これをスケジューラ化処理ブロック69として定義する。
元となるソースコード31中、スケジューラ化処理ブロック65が入れ子構造の内部にある場合、そのスケジューラ化処理ブロック65を起動するのはその親階層にあるスケジューラ化処理ブロックである。図14の例では、シグナルに応答するウェイクアップ機構が挿入されたようなリストラクチャリングにより、45で示す入れ子の内側のスケジューラ化処理ブロックは、41で示す上位階層のスケジューラ化処理ブロックからのシグナル発信を契機に、ダイナミックに起動されることになる。
本実施例では、主に時系列処理、即ち、予め決められたタイミングで途中の演算結果を出力するような汎用的なプログラミング言語で記述されたプログラムを想定しており、このようなプログラムは、一般的にはプログラムの最も上位の階層でループ構造を取る。本実施例の第二段階の処理を行うと、必ず最外郭ループに囲まれたスケジューラ化処理ブロック、即ち、最外郭スケジューラ化処理ブロックが存在することになる。
上記最外郭スケジューラ化処理ブロックを起動する動的シグナル発生装置はないため、最外郭スケジューラ化処理ブロックについては、図18に示すように、OSのタイマ機能を用い、周期的にOSからシグナル(タイマ信号)を送信し、自動起動させるようなタイマハンドラのような仕組みを組み込む。図18は、最外郭スケジューラ化処理ブロックのタイマ処理を説明する図である。図18中、図17と同一部分には同一符号を付し、その説明は省略する。図18において、64はOSから周期的に送信されるシグナル(タイマ信号)、65Aは最外郭スケジューラ化処理ブロック、69Aは61で示すように従属するイベント処理スレッド59が期待するシグナル(即ち、条件A又はBが成立すると動作させるイベントに対するシグナル)を発行するステートメント(コード)が挿入されて定義されたスケジューラ化処理ブロックを示す。
図19は、本実施例の第三段階の処理を説明するフローチャートである。図19において、入力は中間言語33−1であり、出力は中間言語33−2である。
図19に示す第三段階は、上記第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに対して行われる。先ず、ステップSt21は、処理の対象となる処理ブロックがスレッド化処理ブロックであるか、或いは、スケジューラ化処理ブロックであるかを判定する。処理対象となる処理ブロックがスレッド化処理ブロックの場合、ステップSt22〜St25のスレッド化処理ブロックへステートメントを追加する処理が行われる。他方、処理対象となる処理ブロックがスケジュール化処理ブロックの場合、ステップSt26〜St28のスケジューラ化処理ブロックへステートメントを追加する処理が行われる。
ステップSt22は、図16に51で示すようにスレッド化処理ブロック55をループで囲む。ステップSt23は、図16に52で示すようにループの入口部分にシグナルを受信待ちし、シグナルを受信するまではCPUを解放(リリース)するウェイト(wait)機構のようなOSのサービスコールを挿入する。ステップSt24は、図16に53,54で示すようにスレッド化された処理ブロック同士が並列動作することも考慮し、並列実行(同時実行)する処理ブロックを(式8)、(式9)及び(式11)で導かれる依存方程式に基づいて解析し、依存関係にあるか否かを判定する。ステップS24の判定結果がYESの場合、ステップS25は、セマフォ(Semaphore)やミューテックス(Mutex)による排他制御コードを挿入し、処理は終了する。他方、ステップSt24の判定結果がNOであると処理は終了する。
ステップSt26は、条件分岐後の従属節に図17に61で示すように従属するイベント処理スレッド59が期待するシグナル(即ち、条件A又はBが成立すると動作させるイベントに対するシグナル)を発行する送信機構(ステートメント)を挿入し、これをスケジューラ化処理ブロック69として定義する。ステップSt27は、スケジューラ化処理ブロックが最外郭スケジューラ化処理ブロックであるか否かを判定する。ステップSt27の判定結果がYESであると、ステップSt28は、タイマハンドラを組み込み、処理は終了する。他方、ステップSt27の判定結果がNOであると、処理は終了する。
上記第三段階の操作を行うことにより、ソースコード31中に含まれた処理シーケンスから動的スケジューラ機能を導き出すことができ、外部スケジューラを用いる場合のようなオーバーヘッドが発生しない。又、不要なバッファリングを行う必要がないため、メモリの利用効率が高くなる。更に、各処理ブロックは、必要時にCPUを使用するような仕組み、即ち、処理動作が不要な時にはCPUを解放する仕組みも同時に組み込まれるため、CPUのリソースも効率的に使用することが可能になる。
図20は、本実施例の動作時のタイミングチャートのイメージを示す図である。図20は、OSのタイマ機能を用いて得られる周期的なシグナル(タイマ信号)、スケジューラ化処理ブロックにより実現される動的スケジューラ、及びイベント処理スレッドET1,ET2のタイミングを示す。
ネスト又は入れ子構造になっているコードのうち、同一階層にあるスケジューラがあり、且つ、上記(式14)で導出されるステートメント(又は処理ブロック)の順序の入れ替えが可能な場合、スケジューラ化処理ブロックの処理順序を入れ替えることで、動的スケジューリングにおける割付優先度の制御の考え方を導入することが可能である。一般的に、動的スケジューラの割付優先度の決定は、ヒューリスティック(heuristic)なアルゴリズムに従って行われ、CPUの使用量(処理ブロックのクリティカルパス)、メモリの使用量(データ使用量)等をアルゴリズムが判断に用いるパラメータ(又は係数)として使用する。優先度のソートの鍵となるパラメータを決定するに当たり、最良の解を得るには対象とするソフトウェアの性質に依存することが大きい。
本実施例では、上記第一段階〜第三段階の処理をコンパイラのミドルパス34に組み込むため、一般的なコンパイラによる最適化の手法として2パスコンパイルの考えを導入することができる。一般的な2パスコンパイラでは、1回目のコンパイルで生成された実行コードに基づいて実際に組み込み機器等を動作させてプロファイリングを行い、プロファイリングの結果に基づいて2回目のコンパイルを行う。
プロファイリングを用いる2パスコンパイルを許すコンパイラに本実施例を適用した場合、スケジューラ化処理ブロックの優先度によるソートを、このプロファイリング結果に基づいて行うことが可能である。従って、本手法を用いることで、より精度の高いスケジューリング結果を得ることが可能になる。
このようにして、ミドルパス34は、図5のバックエンド35が解読可能な中間言語33−2を生成し、コンパイラは実行コード36を生成する。
図21は、図2の従来手法と本実施例のタイミングチャートのイメージを比較する図である。図21中、図2及び図20と同一部分には同一符号を付し、その説明は省略する。図21の上部は本実施例の動作タイミングを示し、下部は図2の従来手法の動作タイミングを示す。図21において、OH1は本実施例における複数スレッド化により生じるオーバーヘッドを示し、R1は本実施例におけるCPU解放期間を示す。本実施例によれば、処理P3の実際の終了時間は従来手法における終了時間t2より多少遅くなるが、処理P4を確実に期待終了時間t3までに終了することができる。このため、本実施例では、時系列処理することで定期的に途中演算結果を出力するようなソフトウェアにおいて、従来手法において生じていた分岐タイミングの逸脱による処理完了時間の遅延を回避することができる。又、本実施例では、図3の従来手法のようなバッファリングを行う必要がないため、メモリの利用効率が高くなる。
図22は、本実施例のスケジューラ化処理ブロック、即ち、動的スケジューラのイメージを示す図である。同図中、81はタスク又はスレッド、82はCPUのアイドル状態、83はコンテキストスイッチ機能を有すると共にスケジューリングを行う動的スケジューラ、84はOS86内のプロセス管理機能、85は動的スケジューラ83の指示によるスイッチ、88はOS86内のタイマ機能を示す。組み込み機器で効率的に複数のタスク又はスレッド81を並列(同時)に実行する場合、図22に示す動的スケジューラ83は、OS86のタイマ機能88からのシグナルに基づいて動的にタスク又はスレッド81の優先度を定義すると共に、そのコンテキストスイッチ機能及びOS86のプロセス管理機能84によりタスク又はスレッド81のスイッチ85を行う。本実施例によれば、スレッドとタイマハンドラに分解されたソースコード31は、能動的にCPUを解放しアイドル状態82にするため、不要なCPUのリソースを使用することがない。又、動的スケジューラ83を構成するスケジューラ化処理ブロックは、元々ソースコード31中に存在するコードであるため、複数スレッド化により生じるオーバーヘッドも極めて小さい。
図23は、実際のプログラムに対してコンパイルを行った場合のリソースの利用効率の測定結果を上記従来手法と実施例について示す図である。図23に示すように、プログラムPAは動画プレーヤのソフトウェアであり、プログラムPBは通信処理のソフトウェアである。プログラムPA,PBは、いずれも時系列処理を基本とし、予め決められたタイミングで途中結果を出力するソフトウェアである。プログラムPCは静止画処理のソフトウェアであり、プログラムPDは算術演算のソフトウェアである。プログラムPCは、XGAの圧縮画像の伸張を行うソフトウェアである。プログラムPDは、既にプログラマによりソースコードレベルで最適化が行われた流体計算用のソフトウェアである。
図23からもわかるように、本実施例によれば、全てのプログラムPA〜PDについて、CPU負荷が上記従来手法の場合と比べて低減されることが確認された。又、本実施例によれば、プログラムPA,PB,PCについては、メモリ使用量が上記従来手法の場合と比べて低減されることが確認された。更に、本実施例によれば、プログラムPA,PB,PCについては、CPUの消費電力をピーク時の消費電力より低減できることが確認された。尚、本実施例によれば、プログラムPCについては、スレッド化の効果は少ないものの、第一段階のステートメント調整による効果が見られた。
このように、主に時系列処理型のプログラムの完成度にもよるが、本実施例によれば、CPU及びメモリ、即ち、リソースの使用量は、従来手法を用いる場合と比べて30%前後低減することが確認できた。又、副次効果としてCPUのアイドル状態を生成することができるため、CPUの消費電力を低減する効果もあることが確認された。
本発明は、CPUやメモリ等のリソースを有する各種電子機器に適用可能であり、特にリソースが限られた組み込み機器に好適である。
以上、本発明を実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。

Claims (20)

  1. コンピュータにより、予め決められたタイミングで途中結果を出力すると共に時系列的に処理されるソフトウェアのコンパイルを行うコンパイル方法であって、
    該コンピュータにより、該ソフトウェアのソースコードに含まれる処理シーケンスから並列性及び条件分岐に関する処理ブロックを抽出する抽出ステップと、
    該コンピュータにより、抽出された処理ブロックのリストラクチャリングを行い実行コードを自動的に生成する生成ステップとを含むことを特徴とする、コンパイル方法。
  2. 該抽出ステップは、演算及び該コンピュータのメモリ及びレジスタに演算結果の代入を行う演算代入処理の処理ブロックに対して、ステートメント間の依存方程式に基づく並べ替えを行い中間言語レベルで整理されたステートメント列を求める第一段階と、該整理されたステートメント列に対してステートメントのグループの結合及び再定義を行う第二段階を有することを特徴とする、請求項1記載のコンパイル方法。
  3. 該生成ステップは、該第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに制御ステートメントを付加し、スレッドとスケジューラとして最終的な中間言語を生成する第三段階を有し、
    該スケジューラ化処理ブロックは、後続の処理ブロックが条件分岐処理であると処理ブロックと結合されて再定義されたものであり、
    該スレッド化処理ブロックは、呼び出し元の処理ブロックが条件分岐処理であると条件分岐の従属節が再定義されたものであることを特徴とする、請求項2記載のコンパイル方法。
  4. 該第一段階は、全ての制御ステートメントで区切られた演算代入ステートメントのグループに対して行われ、定義及び参照される変数の抽出、各ステートメントの依存関係を表現した依存グラフの定義、不要なステートメントの削除、及び該依存グラフに基づくステートメントのソートからなることを特徴とする、請求項2又は3記載のコンパイル方法。
  5. 該第二段階は、ネスト又は入れ子構造にある最も内側の階層の処理ブロックから順に該ステートメントのグループの結合及び再定義を行うことを特徴とする、請求項2〜4のいずれか1項記載のコンパイル方法。
  6. 該第二段階は、該第一段階のソートの結果に対して行われ、処理ブロック化を対象とするプログラムのコードに対して、呼び出し元の処理ブロックが条件分岐処理であると条件分岐の従属節をスレッド化処理ブロックとして再定義し、該条件分岐処理ではなく、且つ、後続の処理ブロックが条件分岐処理に続くものであるとこれらの処理ブロックを結合してスケジューラ化処理ブロックとして再定義することを特徴とする、請求項5記載のコンパイル方法。
  7. 該第三段階は、該第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに対して行われ、
    処理の対象となる処理ブロックがスレッド化処理ブロックの場合はスレッド化処理ブロックへステートメントを追加する処理を行い、
    処理対象となる処理ブロックがスケジュール化処理ブロックの場合はスケジューラ化処理ブロックへステートメントを追加する処理を行うことを特徴とする、請求項3〜6のいずれか1項記載のコンパイル方法。
  8. 該スケジューラ化処理ブロックはスレッドのコンテキストスイッチ機能を有し、該スレッド化処理ブロックはスケジューラの要求時にのみ動作する仕組みを有することを特徴とする、請求項3記載のコンパイル方法。
  9. 該第三段階は、最外郭ループに囲まれたスケジューラ化処理ブロックについては、該コンピュータのOSのタイマ機能を用いて周期的にシグナルを送信して自動起動させるタイマハンドラの仕組みを組み込むことを特徴とする、請求項3記載のコンパイル方法。
  10. 該第三段階は、演算処理が不要な期間において該コンピュータを解放する機構を有する制御ステートメントを付加することを特徴とする、請求項3記載のコンパイル方法。
  11. コンピュータにより、予め決められたタイミングで途中結果を出力すると共に時系列的に処理されるソフトウェアのコンパイルを行うコンパイラであって、
    該コンピュータにより、該ソフトウェアのソースコードを第1の中間言語に翻訳して記憶部に保存するフロントエンドと、
    該コンピュータにより、該記憶部に保存された該第1の中間言語に基づいて該ソースコードに含まれる処理シーケンスから並列性及び条件分岐に関する処理ブロックを抽出し、抽出された処理ブロックのリストラクチャリングを行い第2の中間言語を生成して記憶部に保存するミドルパスと、
    該コンピュータにより、該記憶部に保存された該第2の中間言語に基づいて実行コードを自動的に生成するバックエンドとを備えたことを特徴とする、コンパイラ。
  12. 該ミドルパスは、演算及び該記憶部に演算結果の代入を行う演算代入処理の処理ブロックに対して、ステートメント間の依存方程式に基づく並べ替えを行い該第1の中間言語レベルで整理されたステートメント列を求める第一段階と、該整理されたステートメント列に対してステートメントのグループの結合及び再定義を行う第二段階を有することを特徴とする、請求項11記載のコンパイラ。
  13. 該ミドルパスは、該第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに制御ステートメントを付加し、スレッドとスケジューラとして該第2の中間言語を生成する第三段階を有し、
    該スケジューラ化処理ブロックは、後続の処理ブロックが条件分岐処理であると処理ブロックと結合されて再定義されたものであり、
    該スレッド化処理ブロックは、呼び出し元の処理ブロックが条件分岐処理であると条件分岐の従属節が再定義されたものであることを特徴とする、請求項12記載のコンパイラ。
  14. 該第一段階は、全ての制御ステートメントで区切られた演算代入ステートメントのグループに対して行われ、定義及び参照される変数の抽出、各ステートメントの依存関係を表現した依存グラフの定義、不要なステートメントの削除、及び該依存グラフに基づくステートメントのソートからなることを特徴とする、請求項12又は13記載のコンパイラ。
  15. 該第二段階は、ネスト又は入れ子構造にある最も内側の階層の処理ブロックから順に該ステートメントのグループの結合及び再定義を行うことを特徴とする、請求項12〜14のいずれか1項記載のコンパイラ。
  16. 該第二段階は、該第一段階のソートの結果に対して行われ、処理ブロック化を対象とするプログラムのコードに対して、呼び出し元の処理ブロックが条件分岐処理であると条件分岐の従属節をスレッド化処理ブロックとして再定義し、該条件分岐処理ではなく、且つ、後続の処理ブロックが条件分岐処理に続くものであるとこれらの処理ブロックを結合してスケジューラ化処理ブロックとして再定義することを特徴とする、請求項15記載のコンパイラ。
  17. 該第三段階は、該第二段階でグループ化を行ったスケジューラ化処理ブロック及びスレッド化処理ブロックに対して行われ、
    処理の対象となる処理ブロックがスレッド化処理ブロックの場合はスレッド化処理ブロックへステートメントを追加する処理を行い、
    処理対象となる処理ブロックがスケジュール化処理ブロックの場合はスケジューラ化処理ブロックへステートメントを追加する処理を行うことを特徴とする、請求項13〜16のいずれか1項記載のコンパイラ。
  18. 該スケジューラ化処理ブロックはスレッドのコンテキストスイッチ機能を有し、該スレッド化処理ブロックはスケジューラの要求時にのみ動作する仕組みを有することを特徴とする、請求項13記載のコンパイラ。
  19. 該第三段階は、最外郭ループに囲まれたスケジューラ化処理ブロックについては、該コンピュータのOSのタイマ機能を用いて周期的にシグナルを送信して自動起動させるタイマハンドラの仕組みを組み込むことを特徴とする、請求項13記載のコンパイラ。
  20. 該第三段階は、演算処理が不要な期間において該コンピュータを解放する機構を有する制御ステートメントを付加することを特徴とする、請求項13記載のコンパイラ。
JP2008549167A 2006-12-14 2006-12-14 コンパイル方法及びコンパイラ Pending JPWO2008072334A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/324966 WO2008072334A1 (ja) 2006-12-14 2006-12-14 コンパイル方法及びコンパイラ

Publications (1)

Publication Number Publication Date
JPWO2008072334A1 true JPWO2008072334A1 (ja) 2010-03-25

Family

ID=39511366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008549167A Pending JPWO2008072334A1 (ja) 2006-12-14 2006-12-14 コンパイル方法及びコンパイラ

Country Status (6)

Country Link
US (1) US20090254892A1 (ja)
EP (1) EP2093667A4 (ja)
JP (1) JPWO2008072334A1 (ja)
KR (1) KR101085330B1 (ja)
CN (1) CN101563673A (ja)
WO (1) WO2008072334A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101522444B1 (ko) * 2008-10-24 2015-05-21 인터내셔널 비지네스 머신즈 코포레이션 소스 코드 처리 방법, 시스템, 및 프로그램
US8875111B2 (en) * 2009-04-23 2014-10-28 Microsoft Corporation Intermediate language representation and modification
US8689191B2 (en) * 2010-03-05 2014-04-01 International Business Machines Corporation Correct refactoring of concurrent software
US8863128B2 (en) * 2010-09-30 2014-10-14 Autodesk, Inc System and method for optimizing the evaluation of task dependency graphs
US9430204B2 (en) 2010-11-19 2016-08-30 Microsoft Technology Licensing, Llc Read-only communication operator
US9507568B2 (en) 2010-12-09 2016-11-29 Microsoft Technology Licensing, Llc Nested communication operator
US9395957B2 (en) * 2010-12-22 2016-07-19 Microsoft Technology Licensing, Llc Agile communication operator
US8464232B2 (en) * 2010-12-27 2013-06-11 Aleksandr F. Urakhchin Compiler compiler system with syntax-controlled runtime and binary application programming interfaces
US9239732B2 (en) * 2011-02-16 2016-01-19 Microsoft Technology Licensing Llc Unrolling aggregation operations in asynchronous programming code having multiple levels in hierarchy
CN102193812B (zh) * 2011-06-03 2014-03-26 深圳市茁壮网络股份有限公司 一种代码编译方法、主机及系统
KR101277145B1 (ko) * 2011-12-07 2013-06-20 한국과학기술연구원 공통 표현을 이용한 중간 언어 변환 방법과 그를 위한 시스템 및 컴퓨터로 읽을 수 있는 기록매체
US9286040B2 (en) * 2012-01-18 2016-03-15 Mobilesmith, Inc. Software builder
US9251554B2 (en) 2012-12-26 2016-02-02 Analog Devices, Inc. Block-based signal processing
KR101449657B1 (ko) * 2013-03-05 2014-10-13 한국과학기술연구원 연산자의 값의 범위를 이용한 중간 언어 변환 방법과 그를 위한 시스템 및 컴퓨터로 읽을 수 있는 기록매체
US9298433B2 (en) * 2013-05-02 2016-03-29 Facebook, Inc. Optimizing intermediate representation of script code for fast path execution
JP6287018B2 (ja) * 2013-10-04 2018-03-07 富士通株式会社 可視化方法、表示方法、情報処理装置、可視化プログラム及び表示プログラム
CN103699377B (zh) * 2013-12-04 2017-02-01 国家电网公司 一种对程序代码进行重构操作组合的方法
US8978010B1 (en) * 2013-12-18 2015-03-10 Sap Ag Pruning compilation dependency graphs
US20150193358A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation Prioritized Memory Reads
CN104391733B (zh) * 2014-12-10 2017-11-24 华中科技大学 一种依据依赖关系动态编译软件包的方法
US9830134B2 (en) * 2015-06-15 2017-11-28 Qualcomm Incorporated Generating object code from intermediate code that includes hierarchical sub-routine information
JP6500626B2 (ja) 2015-06-16 2019-04-17 富士通株式会社 計算機、コンパイラプログラム、リンクプログラムおよびコンパイル方法
JP2017228029A (ja) 2016-06-21 2017-12-28 株式会社デンソー 並列化方法、並列化ツール、車載装置
US10558441B2 (en) * 2018-03-12 2020-02-11 International Business Machines Corporation Compiler for restructuring code using iteration-point algebraic difference analysis
US11416228B2 (en) 2018-09-13 2022-08-16 The University Of Chicago System and method of optimizing instructions for quantum computers

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736680A (ja) 1993-07-23 1995-02-07 Omron Corp 並列化プログラム開発支援装置
JPH1027108A (ja) * 1996-07-12 1998-01-27 Nec Corp スレッド実行方法
JP2001282549A (ja) * 2000-03-30 2001-10-12 Nec Corp プログラム変換装置及び方法並びに記録媒体
JP2006154971A (ja) * 2004-11-25 2006-06-15 Matsushita Electric Ind Co Ltd プログラム変換装置、プログラム変換実行装置およびプログラム変換方法、プログラム変換実行方法。

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5255385A (en) * 1990-02-26 1993-10-19 Hitachi, Ltd. Method of testing program, and compiler and program testing tool for the method
JPH06110688A (ja) 1991-06-13 1994-04-22 Internatl Business Mach Corp <Ibm> 複数の順序外れ命令を並行処理するためのコンピュータ・システム
US5347654A (en) * 1992-02-03 1994-09-13 Thinking Machines Corporation System and method for optimizing and generating computer-based code in a parallel processing environment
US5592679A (en) * 1994-11-14 1997-01-07 Sun Microsystems, Inc. Apparatus and method for distributed control in a processor architecture
JPH10228382A (ja) * 1997-02-14 1998-08-25 Nec Corp コンパイル方式
JPH11259437A (ja) * 1998-03-12 1999-09-24 Hitachi Ltd 不要バリア命令の削減方式
JP2000207223A (ja) * 1999-01-12 2000-07-28 Matsushita Electric Ind Co Ltd 並列処理向けのプログラム処理方法および装置、並びに並列処理向けのプログラム処理を実行するプログラムを記録した記録媒体および並列処理向けの命令列を記録した記録媒体
JP2002007364A (ja) * 2000-06-22 2002-01-11 Fujitsu Ltd 並列計算機システムのジョブスケジューリングを行うスケジューリング装置
JP3664473B2 (ja) * 2000-10-04 2005-06-29 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラムの最適化方法及びこれを用いたコンパイラ
US7089557B2 (en) * 2001-04-10 2006-08-08 Rusty Shawn Lee Data processing system and method for high-efficiency multitasking
JP3772713B2 (ja) 2001-09-12 2006-05-10 日本電気株式会社 プライオリティ動的制御方式、プライオリティ動的制御方法およびプライオリティ動的制御用プログラム
US8010956B1 (en) * 2005-01-28 2011-08-30 Oracle America, Inc. Control transfer table structuring
US7613595B2 (en) * 2005-03-01 2009-11-03 The Math Works, Inc. Execution and real-time implementation of a temporary overrun scheduler
US7966610B2 (en) * 2005-11-17 2011-06-21 The Mathworks, Inc. Application of optimization techniques to intermediate representations for code generation
JP4923240B2 (ja) * 2006-01-17 2012-04-25 国立大学法人東京工業大学 プログラム処理装置、並列処理プログラム、プログラム処理方法、並列処理コンパイラ、並列処理コンパイラを格納した記録媒体およびマルチプロセッサシステム
US8146066B2 (en) * 2006-06-20 2012-03-27 Google Inc. Systems and methods for caching compute kernels for an application running on a parallel-processing computer system
JP2009048252A (ja) * 2007-08-14 2009-03-05 Oki Electric Ind Co Ltd プログラム変換装置及びコンパイラプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736680A (ja) 1993-07-23 1995-02-07 Omron Corp 並列化プログラム開発支援装置
JPH1027108A (ja) * 1996-07-12 1998-01-27 Nec Corp スレッド実行方法
JP2001282549A (ja) * 2000-03-30 2001-10-12 Nec Corp プログラム変換装置及び方法並びに記録媒体
JP2006154971A (ja) * 2004-11-25 2006-06-15 Matsushita Electric Ind Co Ltd プログラム変換装置、プログラム変換実行装置およびプログラム変換方法、プログラム変換実行方法。

Non-Patent Citations (13)

* Cited by examiner, † Cited by third party
Title
CSND199800157005; リック・ナロー著,野口修男訳: '「特集 米国コンパイラ事情 Part3 「最適化チェック」より速く、より小さなコードを求めて」' C MAGAZINE 1990年9月号(Vol.2, No.9), 19900901, 第39〜49頁, ソフトバンク株式会社 *
CSND199800199009; 尾形三喜雄(外2名): '「MIPSコンパイラの最適化」' インターフェース 1991年1月号(Vol.17, No.1), 19910101, 第253〜270頁, CQ出版株式会社 *
CSND199900633004; 松岡恭正外2名: 'コンパイラにおける最適化の技法' インターフェース 第15巻、第3号, 19890301, p.196-210, CQ出版株式会社 *
CSNG200100414012; 飯塚大介(外3名): '「Cコンパイラにおけるループ最適化の検討」' 情報処理学会研究報告 Vol.99, No.66(99-HPC-77), 19990804, 第65〜70頁, 社団法人情報処理学会 *
CSNG200202412019; 小野徹行外2名: 'マクロデータフロープリプロセッサの実装' 情報処理学会研究報告 第2001巻、第22号, 20010309, p.109-114, 社団法人情報処理学会 *
CSNG200300001025; 笠原博徳(外2名): '「共有メモリマルチプロセッサシステム上での粗粒度タスク並列処理」' 情報処理学会論文誌 第42巻,第4号, 20010415, 第910〜920頁, 社団法人情報処理学会 *
JPN6012027172; 笠原博徳(外2名): '「共有メモリマルチプロセッサシステム上での粗粒度タスク並列処理」' 情報処理学会論文誌 第42巻,第4号, 20010415, 第910〜920頁, 社団法人情報処理学会 *
JPN6012058204; 飯塚大介(外3名): '「Cコンパイラにおけるループ最適化の検討」' 情報処理学会研究報告 Vol.99, No.66(99-HPC-77), 19990804, 第65〜70頁, 社団法人情報処理学会
JPN6012058206; リック・ナロー著,野口修男訳: '「特集 米国コンパイラ事情 Part3 「最適化チェック」より速く、より小さなコードを求めて」' C MAGAZINE 1990年9月号(Vol.2, No.9), 19900901, 第39〜49頁, ソフトバンク株式会社
JPN6012058207; 尾形三喜雄(外2名): '「MIPSコンパイラの最適化」' インターフェース 1991年1月号(Vol.17, No.1), 19910101, 第253〜270頁, CQ出版株式会社
JPN6012058209; ジョン・L・ヘネシー(外1名)著、成田光彰訳: 「コンピュータの構成と設計 第2版[上]-ハードウェアとソフトウェアのインタフェース-」 第2版第1刷, 19990517, 第149〜156頁, 日経BP社
JPN6013045977; 小野徹行外2名: 'マクロデータフロープリプロセッサの実装' 情報処理学会研究報告 第2001巻、第22号, 20010309, p.109-114, 社団法人情報処理学会
JPN6013045978; 松岡恭正外2名: 'コンパイラにおける最適化の技法' インターフェース 第15巻、第3号, 19890301, p.196-210, CQ出版株式会社

Also Published As

Publication number Publication date
WO2008072334A1 (ja) 2008-06-19
CN101563673A (zh) 2009-10-21
KR20090089382A (ko) 2009-08-21
EP2093667A4 (en) 2012-03-28
EP2093667A1 (en) 2009-08-26
KR101085330B1 (ko) 2011-11-23
US20090254892A1 (en) 2009-10-08

Similar Documents

Publication Publication Date Title
JPWO2008072334A1 (ja) コンパイル方法及びコンパイラ
US20110119660A1 (en) Program conversion apparatus and program conversion method
JP5036523B2 (ja) プログラム並列化装置
US20060130012A1 (en) Program conversion device, program conversion and execution device, program conversion method, and program conversion and execution method
US20100070958A1 (en) Program parallelizing method and program parallelizing apparatus
JP4965995B2 (ja) プログラム処理方法、処理プログラム及び情報処理装置
KR102402584B1 (ko) 사용자 어플리케이션의 특성에 따른 연산 디바이스 동적 제어 기법
Packirisamy et al. Exploring speculative parallelism in SPEC2006
JP2010009495A (ja) 情報処理装置、プログラム処理方法及びコンピュータプログラム
US11669366B2 (en) Reduction of a number of stages of a graph streaming processor
JP6427053B2 (ja) 並列化コンパイル方法、及び並列化コンパイラ
JP6488739B2 (ja) 並列化コンパイル方法、及び、並列化コンパイラ
JPWO2007105309A1 (ja) 並列化プログラム生成プログラム、並列化プログラム生成装置、及び並列化プログラム生成方法
Benkner et al. High-level support for pipeline parallelism on many-core architectures
JP2008276547A (ja) プログラム処理方法及び情報処理装置
US20150089149A1 (en) Arithmetic processing device and control method for arithmetic processing device
JP2005129001A (ja) プログラム実行装置、マイクロプロセッサ及びプログラム実行方法
JP6488738B2 (ja) 並列化コンパイル方法、及び、並列化コンパイラ
KR20080066402A (ko) 공통중간코드를 이용한 병렬 임베디드 소프트웨어의 설계방법
Wang et al. Code transformations for enhancing the performance of speculatively parallel threads
So et al. Procedure cloning and integration for converting parallelism from coarse to fine grain
Agathos et al. Compiler-assisted, adaptive runtime system for the support of OpenMP in embedded multicores
Limberg et al. A real-time programming model for heterogeneous MPSoCs
Cedersjö et al. Finding fast action selectors for dataflow actors
Badia et al. Impact of the memory hierarchy on shared memory architectures in multicore programming models

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120829

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120905

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20121109