WO2015075805A1

WO2015075805A1 - ソースコード分割方法及びｌｓｉ実装装置

Info

Publication number: WO2015075805A1
Application number: PCT/JP2013/081462
Authority: WO
Inventors: 田中　和彦; 稲田　圭介; 佐々本　学; 浩朗伊藤; 小味　弘典
Original assignee: 株式会社日立製作所
Priority date: 2013-11-22
Filing date: 2013-11-22
Publication date: 2015-05-28

Abstract

　集積回路全体を考慮した素子のレイアウトを行うためにハードウェア記述言語で記述された前記集積回路のソースコードを分割する方法であって、前記ソースコードの処理内容を解析し、処理の実行を示すノード間のデータの転送方向を示す向きを持った有向リンクの集合体として構成される有向グラフを生成するステップと、前記有向グラフに含まれるノードを、レジスタノードから他のノードへ向かうリンクであるレジスタ出力リンクまたは対象回路の入力端子からの他のノードへ向かうリンクである入力端子リンクから構成されるソースノード直結リンクを切断することで２つ以上のノードグループに分割するステップと、前記ソースコードから前記各ノードグループに含まれるノードに対応する記述を抽出し、それらを結合して前記各ノードグループに対応した分割後ソースコードを生成するステップとを備える。

Description

ソースコード分割方法及びＬＳＩ実装装置

　技術分野は、集積回路の素子のレイアウトに関する。

　特許文献１では、「従来の設計方法では、タイミングが考慮されていない論理階層に基づいてフロアプランを行うため、それらのモジュールがタイミングを満足しない程度に離れて配置されることがあるという問題点がある」（特許文献１［００１４］）こと等を課題とし、その解決手段として「ＲＴＬレベルの設計データを論理合成することによって、ゲートレベルのネットリストを得る。そのゲートレベルのネットリストに対して仮配線静的タイミング解析を行うことによって、タイミング情報を得る。得られたタイミング情報および前記ゲートレベルのネットリストに基づいて、始点および終点となる各フリップフロップと、それらフリップフロップの間のタイミングパス上に存在するゲートとからなる閉じたタイミンググループを構成する単位を、フロアプランモジュールとして定義する。そして、フロアプランモジュールに基づいて物理回路全体をグループ化し直し、フロアプランモジュールに基づいてフロアプランを行う。また、フロアプランモジュールごとにクロックバッファを設け、各フロアプランモジュール内の局所的なクロックスキューが最小になるようなクロックトポロジを構築する。」（特許文献１［００１７］、［００１８］参照）ことが記載されている。

特開２００８－７１０００

　しかし、特許文献１では、素子の再配置により新たなクリティカルパスが生じることを考慮していない。

　上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。
本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、ハードウェア記述言語で記述されたソースコードの処理内容を解析し、処理の実行を示すノード間のデータの転送方向を示す向きを持った有向リンクの集合体として構成される有向グラフを生成するステップと、生成した有向グラフに含まれるノードを、２つ以上のノードグループに分割するステップと、ソースコードから、２つ以上のノードグループに分割するステップによって生成されたノードグループに含まれるノードに対応する記述を抽出し、それらを結合してノードグループに対応した分割後ソースコードを生成するステップと、を備え、ノードはソースコード中のフリップフロップに対応するレジスタノードとそれ以外の他のノードとを含み、２つ以上のノードグループに分割するステップにおいて、レジスタノードから他のノードへ向かうリンクであるレジスタ出力リンクまたは対象回路の入力端子からの他のノードへ向かうリンクである入力端子リンクから構成されるソースノード直結リンクを切断することで２つ以上のノードグループに分割することを特徴とする。

　上記手段によれば、集積回路においてより低遅延な素子の配置を実現できる。

ｖｅｒｉｌｏｇのソースからＣＤＦＧへの変換フロー例変換対象の回路例変換対象回路のｖｅｒｉｌｏｇ記述例変換対象回路のｖｅｒｉｌｏｇ記述から呼び出されるヘッダーファイルの例プリプロセッサ処理済みファイルの例ＣＤＦＧの例字句解析、構文解析の説明図構文解析およびＣＤＦＧ生成の説明図生成されたＣＤＦＧツリー群の例ツリー結合処理のフローチャートの例結合後のＣＤＦＧの例スケジューリング処理の処理フローの例ｓｃｈｅｄ＿ｎｏｄｅ関数の処理フローの例暫定サブステップ割り当て例サブステップ番号調整例スケジューリング後のＣＤＦＧの例スケジューリング後のＣＤＦＧの例ＬＳＩ実装フローの例ＣＤＦＧのコーン分割の例（オーバーラップ無し）ＣＤＦＧのコーン分割の例（オーバーラップ有り）ＣＤＦＧのコーン分割の例（オーバーラップ有り）グループ分け後の回路例グループ分け後のｖｅｒｉｌｏｇソースコードの例グループ分け後のｖｅｒｉｌｏｇソースコードの例（上位階層）グループ分けの例コード変換装置の構成の例

　ＬＳＩ(Large Scale Integration)を実装する際に、要求された動作周波数で動作させるためには各フリップフロップ間のパスの最大遅延時間などのタイミングスペックを満足することが必要である。近年、ＬＳＩの微細化の進捗に伴い、素子間の配線遅延がパス全体の遅延時間に占める割合が大きくなってきている。これに伴い、回路素子の配置を最適化することで、タイミングクリティカルパス上にある回路素子間の配線長を短くし、配線遅延を低減することが重要となってきている。

　実際のＬＳＩではフリップフロップ間のパスの組み合わせは大量に存在する。そのため、タイミングがクリティカルなパスに限定してそのパスに含まれる素子の配置を制御する方法を採ると、タイミングがクリティカルでないパスについては、配置時に考慮されない。そうすると、素子が分散して配置され、新たなクリティカルパスとなってしまう可能性がある。このように、タイミングがクリティカルである一部のパスを対策して、逐次潰していく方式では再実装を行う度にクリティカルパスの発生場所が変化してしまうことがあり、実装処理が収束しない可能性がある。

　以下の実施例では、対象回路全体をグラフ構造に変換した上で、グラフに含まれるノード間の接続情報に基づいて、グラフに含まれるノードをいくつかのノードグループに分割する。その後、各グループに対応した回路を、グループ単位でＬＳＩ上の個別の領域に配置していくことで、同一グループ内に含まれる素子間の配線長を短くする。グループを分割する際には、フリップフロップの出力信号を分割位置として選択するようにする。

　以下の実施例によれば、クリティカルパスに含まれる一部の素子だけでなく、回路全体を考慮した上でグループ分けを行うため、再実装時の手戻りが少なく速やかに実装処理を収束させることが可能となる。

　また、フリップフロップの出力信号でグループの分割を行うことによって、フリップフロップ間のパスの途中の信号で分割した場合と比較して、グループ内のゲート段数が多くなるため、使用可能な論理最適化手法の選択肢が広くなる。

　また、分割後の前後パスへのタイミング予算配分処理が不要となるため、タイミング制約を掛けやすい。また、フリップフロップの出力信号は論理合成前のＲＴＬの回路記述に明示的な信号として存在しているため、ＲＴＬの回路記述を対象としたグループ分割を実施できる。
以下、図面を用いて本実施例について説明する。

図２６は、実施例１にかかるＬＳＩ実装設計装置１の一例である。

　ＬＳＩ実装設計装置１は、ＣＤＦＧ生成部２とＬＳＩ実装部３、ＣＰＵ６１０と、メモリ６１１と、記録部６１２と、入力部６１３と、出力部６１４とが、バス６２０を介して接続されて構成されている。ＣＤＦＧ生成部２は入力部６１３から入力されたハードウェア記述言語で記述された回路データから、内部の処理やデータフローを解析して、ＣＤＦＧ（Ｃｏｎｔｒｏｌ　Ｄａｔａ　Ｆｌｏｗ　Ｇｒａｐｈ）と呼ばれるグラフ構造のデータを生成する。ＣＤＦＧの詳細については後述する。ＬＳＩ実装部３は、入力部６１３から入力された回路データに対して、論理合成、配置配線等の実装処理を行い、最終的なＬＳＩの設計データ（ＧＤＳ２等）を生成する。本発明ではこの実装処理を行う際に、ＣＤＦＧ生成部２で生成したＣＤＦＧを使用する。

　次に、図２６の各部の動作を説明する。
最初にＣＤＦＧ生成部２の動作について説明する。ＣＤＦＧ生成部２は、プリプロセッサ処理部６００と、字句解析処理部６０１と、構文解析処理部６０２と、ツリー結合処理部６０３と、スケジューリング処理部６０４が、バス６２０を介して接続されて構成される。

　プリプロセッサ処理部６００と、軸解析処理部６０１と、構文解析処理部６０２と、ツリー結合処理部６０３と、スケジューリング処理部６０４は、図２６に例示するようにハードウェアとしてＬＳＩ実装設計装置１に搭載することができる。

　また、６００から６０５の各処理部は、記録部６１２に記録されたプリプロセッサプログラム６００、字句解析プログラム６０１と、構文解析プログラム６０２と、ツリー結合プログラム６０３と、スケジューリングプログラム６０４をＣＰＵ６１０がメモリ６１１に展開し、展開した各プログラムをＣＰＵ６１０が実行することによって各処理部の機能を発揮するようにして、ソフトウェアとしてＬＳＩ実装設計装置１に搭載しても良い。

　以下では、説明を簡略化するため、各処理部が主体となって各処理を行うこととして説明する。なお各処理部をソフトウェアで実現した場合にはその各種プログラムをＣＰＵ６１０が実行することで実現される各処理部を各処理の主体として説明する。

　プリプロセッサ処理部６００は、入力されたソースとヘッダーファイルからマクロの置換、コメントの除去などのプリプロセッサ処理を行う。

　字句解析処理部６０１は、プリプロセッサ処理済みファイルに字句解析処理を行い、トークンと呼ばれる単位に分割する。トークンとはこれ以上細かく分割すると、本来の意味を持たなくなる最小単位の文字列である。

　構文解析処理部６０２は、構文解析処理を行う。構文解析処理は、ｖｅｒｉｌｏｇソースコードの各行（または数行分の固まりであるブロック）に対応したトークン列から、部分的なＣＤＦＧ構造であるＣＤＦＧツリーを生成する処理である。

　ツリー結合処理部６０３は、ツリー結合処理を行う。ツリー結合処理は、複数個のＣＤＦＧツリーを一つのＣＤＦＧに結合する処理である。

　スケジューリング処理部６０４は、各処理の依存関係を保ったまま、各ノードを順次Ｃ言語のソースコードに変換するために各ノードの順序付け、すなわち、スケジューリング処理を行う。

　図１は、本実施例におけるハードウェア記述言語で記述されたソースコードからＣＤＦＧへの変換フローである。本フローチャートにおいて例えばステップ５０１をＳ５０１というように表現する。
本実施例では、ハードウェア記述言語としてｖｅｒｉｌｏｇを例に説明するが、本発明はこれに限定されるものではない。

　図２は、本実施例で変換対象となる回路である。変換対象の回路２０は乗算器２１、加算器２２、２５、フリップフロップ２３、２４で構成されている。フリップフロップ２３、２４はクロック信号ｃｌｋの立ち上がりエッジで動作し、非同期リセット信号ｒｓｔ＿ｎをＬｏｗレベルに設定すると出力が０にリセットされる。この回路２０は、フリップフロップ２３、２４によって二つのパイプラインステージに分割されている。フリップフロップ２３、２４よりも左側がステージ０、右側がステージ１となる。ステージは動作合成の分野ではステップという言葉で表現されることもある。

　図３に、この回路をｖｅｒｉｌｏｇで記述した例を示す。この図において、左側の数字は行番号であり、ソースコードには含まれない。本リストはｖｅｒｉｌｏｇに準拠しているため、各部の詳細説明は省略することとする。

　図４に、図３の２行目のｉｎｃｌｕｄｅ文で読み込まれるヘッダーファイルを示す。ヘッダーフェイルにはマクロの定義等が記載されている。
このｖｅｒｉｌｏｇソースコード１０とヘッダーファイル１１が本実施例における変換処理の対象となる。なお、本実施例では、ソースコード１０とヘッダーファイル１１はどちらも単一のファイルで実現しているが、複数のファイルで構成しても良いし、ヘッダーファイル１１は存在しなくても構わない。

　［プリプロセッサ処理Ｓ５００］
図１中のプリプロセッサ処理Ｓ５００において、プリプロセッサ処理部６００はｖｅｒｉｌｏｇソースコード１０とヘッダーファイル１１を読み込み、マクロの置換、コメントの除去などの処理を行う。プリプロセッサ処理Ｓ５００の出力であるプリプロセッサ処理済みファイル１２の例を図５に示す。プリプロセッサ処理を行うと行番号が変化することがあるため、プリプロセッサ処理前後の行番号の対応関係をテーブル化して記録部６１２に記録しておけば、両者のプリプロセッサ処理の前後で対応する行を容易に探索できるようになる。

　このプリプロセッサ処理済みファイル１２に対して、字句解析Ｓ５０１、構文解析Ｓ５０２、ツリー結合Ｓ５０３が行われることで、元のソースコードで実行される処理に対応したデータフローと制御フローを一つにまとめた中間形式であるＣＤＦＧ（Ｃｏｎｔｒｏｌ　Ｄａｔａ　Ｆｌｏｗ　Ｇｒａｐｈ）が生成される。

　［ＣＤＦＧの構造］
図６に、ＣＤＦＧの構造の一例を示す。
図６（ａ）は、この例における変換対象のｖｅｒｉｌｏｇソースコードであり、図５の３２行目のａｓｓｉｇｎ文に相当する。このｖｅｒｉｌｏｇソースコードによれば、信号ａ［１５：０］とｂ［１５：０］の乗算を行った後に、乗算の結果得られた値に信号ｘ［１５：０］を加算することが示されている。

　図６（ｂ）は、図６（ａ）のｖｅｒｉｌｏｇソースコードをＣＤＦＧに変換したものである。ＣＤＦＧにおいて、実行されるそれぞれの処理はノードで表わされ、各ノードは向きを持った矢印で接続されて図６（ｂ）のようにグラフ構造となる。

　図６（ｃ）は、ＣＤＦＧ構造体フィールド情報の例である。ＣＤＦＧ構造体フィールド情報には、各ノードごとの属性情報４０が格納されている。属性情報４０はＩＤ番号４１、ノードタイプ４２、信号名４３、バス情報４４、入力４５～４７、ｓｔ４８、ｓｓｔ４９から構成される。

　ＣＤＦＧはどのような方法で実装しても良いが、ここではリンク構造を持ったＣ言語の構造体の集合として実装している。

　図６（ｂ）において、信号ａ［１５：０］、ｂ［１５：０］、ｘ［１５：０］はそれぞれノード３０、３１、３２に対応している。また、これらのノードには図６（ｃ）に示すように、ＩＤ番号４１が「１」、「２」、「３」のように割り振られており、ノードタイプ４２は信号名等の識別子であることを示す「ＩＤ」となっている。

　図６（ａ）のｖｅｒｉｌｏｇソース中の乗算はノード３３に対応しており、加算はノード３４に対応している。そして、ノード３３、３４のＩＤ番号４１はそれぞれ「４」、「５」とされ、タイプ４２は、それぞれ乗算であることを示す「ＭＵＬＴ」、加算であることを示す「ＡＤＤ」と格納される。

　ここで、まず信号ａ［１５：０］とｂ［１５：０］に対して乗算を実行するため、ノード３３の入力０、１にそれぞれ信号ａ［１５：０］とｂ［１５：０］を示すＩＤ番号「１」と「２」がリンク情報として格納される。

　同様にノード３４はノード３３の出力とノード３２の出力に対して加算を行うため、入力０、１にそれぞれノード３３、ノード３２を示すＩＤ番号「４」と「３」がリンク情報として格納される。ノード３４の出力信号名であるｓは、図６（ａ）のｖｅｒｉｌｏｇソースコードで指定されている。

　なおこの表中のｓｔ４８、ｓｓｔ４９はそれぞれステップ、サブステップを意味している。ステップは図２におけるパイプラインステージに相当する概念である。サブステップは、ステップをさらに細分化した単位であり、詳細については後述する。サブステップの値はスケジューリング処理Ｓ５０４で決定するものであり、それ以前の時点では確定していないため、図６（ｃ）では「－」で記載されている。
この様にＣＤＦＧを使うとデータフロー及び制御フローを表現することが可能となる。

　［字句解析処理Ｓ５０１］
  次に図１のＳ５０１～Ｓ５０３のＣＤＦＧの生成手順を説明する。
  図７は、字句解析、構文解析の説明図である。
  図８は、構文解析及びＣＤＦＧ生成の説明図である。
  プリプロセッサ処理済みファイル１２は、字句解析処理部６０１による字句解析処理５０１でトークンと呼ばれる単位に分割される。字句解析処理Ｓ５０１を行うためのツールとしてはｌｅｘが有名であり、本実施例中の字句解析処理Ｓ５０１もｌｅｘを使って実現することが可能である。その使用方法については様々な文献に記載されているため、ここでは説明を省略する。また、ｌｅｘ以外のツールを使用することも可能であり、本発明はｌｅｘを使用した場合に限定されるものではない。

　［構文解析処理Ｓ５０２］
次に、字句解析処理５０１で得られたトークン列に対して構文解析処理部６０２が構文解析処理Ｓ５０２を行う。本実施例では、構文解析ツールとして有名なｙａｃｃを使用する場合を想定しているが、上記と同様にｙａｃｃ以外のツールを使用することも可能であり、本発明はこれに限定されるものではない。

　ｙａｃｃを使用する場合には、あらかじめ処理対象とする言語の構文をパターン情報として用意しておき、トークン列に対して順次パターンマッチングを行い、マッチした場合にはあらかじめ定義しておいたルールに対応する処理を行うという形式になる。

　図７の構文解析Ｓ５０２の例では、与えられたトークン列を左から順次走査しながらマッチングをしており、トークン列ｓ［１５：０］が最初にマッチしている（マッチング５０）。このパターンが出現した場合にはノードタイプがＩＤのノードを生成する様にルールを指定しておくと、図８のマッチング５０にあるようにノードｓが生成される。同様にマッチング５１、５２でノードａとノードｂが生成される。マッチング５３では乗算ノードが生成され、ノードａ、ｂと接続される。マッチング５４ではノードｘが生成され、次のマッチング５５では、加算ノードが生成され、乗算ノードとノードｘに接続される。最後にマッチング５６で左辺のノードと右辺のノードを結合することで、この行に対応したＣＤＦＧツリーが完成する。

　図９は、図５の他の行に対しても同様に字句解析処理Ｓ５０１と構文解析処理Ｓ５０２を順次実施することによって生成される、複数個のＣＤＦＧツリーの例である。

　図５の９～１５行目の入出力ポート定義は図９（ａ）の入出力ノードに変換される。今回の例では入力信号のノードタイプ４２は「ＩＮ」、出力信号のノードタイプ４２は「ＯＵＴ」となる。双方向の入出力ポートはノードタイプ４２が「ＩＮ」および「ＯＵＴ」の２つのポートに分けて記述する。

　図５の２１～３０行目のフリップフロップ記述は図９（ｂ）の様に変換される。この図の様にフリップフロップは入力側と出力側の２つのノードで表現し、それぞれのノードタイプ４２は「ＦＦ０」、「ＦＦ１」となる。「ＦＦ０」の値はクロックの立ち上がりで「ＦＦ１」に転送されることになる。

　図５の３２～３４行目の組み合わせ回路は図９（ｃ）の様に変換される。

　［ツリー結合処理Ｓ５０３］
ツリー結合処理部６０３は、ツリー結合処理Ｓ５０３を行う。ただし、必ずしも全てのノードが一つのＣＤＦＧに統合されるわけではない。この処理は、図９の各ＣＤＦＧツリー中のノードタイプがＩＤであるノードを削除し、本来のリンク先につなぎ替える処理となる。

　図１０は、ツリー結合処理のフローチャートの一例である。本フローチャートにおいて例えばステップ７０１をＳ７０１というように表現する。
まず、各ノードのＩＤ番号を指定するための変数ｉを０に初期化する（Ｓ７０２）。次にノードのＩＤ番号がｉに等しいノードｉを探して、そのノード情報を読み込む（Ｓ７０３）。次に読み込んだノードｉのノードタイプがＩＤであるかどうかの調査を行う（Ｓ７０４）。ＩＤでない場合はつなぎ替えが不要なので、ｉに１を加算して、本ノードの処理は終了する（Ｓ７１３）。まだ調査していないノードが残っていれば、次のノードの調査を実施する（Ｓ７１４）。

　一方、調査Ｓ７０４でノードタイプがＩＤであった場合は、本来のリンク先の探索を行う。まず、リンク先のノードのＩＤ番号を指定するための変数ｊを０に初期化する（Ｓ７０５）。次にノードのＩＤ番号がｊに等しいノードｊを探して、そのノード情報を読み込む（Ｓ７０６）。

　次に読み込んだノードｊのタイプがＩＤ、ＯＵＴ、ＦＦ０であるかどうかの調査を行う（Ｓ７０７）。ＩＤ、ＯＵＴ、ＦＦ０の場合にはそのノードは本来のリンク先になり得ないので、ｊに１を加算して、本ノードの処理は終了する（Ｓ７０９）。まだ調査していないノードが残っていれば、次のノードの調査を実施する（Ｓ７１０）。

　ノードｊのタイプがＩＤ、ＯＵＴ、ＦＦ０で無い場合は、ノードｉとノードｊの信号名を比較する（Ｓ７０８）。両者が等しい場合は、ノードｊが本来のリンク先であるため、全てのノードを走査して、リンク先がノードｉとなっているリンクのリンク先を全てのノードｊに変更する（Ｓ７１１）。その後、ノードｉを削除することで、ノードのリンク先変更処理が完了する。Ｓ７０８について、信号名が一致していない場合は、Ｓ７０９からＳ７１０の処理を行う。

　これらを全てのノードｉに対して実行すると、ツリー結合処理Ｓ５０３が完了する。

　図１１は、図９の全てのノードに対してツリー結合処理Ｓ５０３を行った結果である。

　［スケジューリング処理Ｓ５０４］
　スケジューリング処理部６０４は各ノードの順序付け、すなわち、スケジューリング処理Ｓ５０４を行う。

　ここで言うスケジューリングは動作合成等で用いられるステップのようなクロックサイクル単位のスケジューリングよりもさらに細かい単位のスケジューリングであり、これを実現するために、ここでサブステップという仮想時間単位を導入する。なお、以下の説明ではステップをｓｔ、サブステップをｓｓｔと省略することもある。この考え方では、各ノードはノードタイプにかかわらず、処理の実行に１サブステップ分の時間を使用するものと仮定してスケジューリングを行う。

　図１２は、スケジューリング処理Ｓ５０４の全体フローの一例である。
図１３は、図１２のフロー中のＳ７２５から再帰的に呼び出す関数ｓｃｈｅｄ＿ｎｏｄｅの処理フローの一例である。

　　スケジューリング処理Ｓ５０４は、各ノードに暫定的なサブステップ番号を設定する前半処理と、暫定的なサブステップ番号を調整して最終的なサブステップ番号を決定する後半処理に分けることができる。

　最初に、前半の暫定サブステップ番号の設定処理について説明する。この処理の概要は以下の通りである。

　１．出力ノード（ＯＵＴ）、ＦＦの入力ノード（ＦＦ０）に対して、サブステップ番号０を設定する。

　２．各出力ノードまたはＦＦの入力ノードを起点として、その入力ノードに対して、現在のノードのサブステップ番号から定数Ｎを減算した値を設定する（Ｎは正の定数であれば何でも良い。今回はＮ＝１としている）。ただし、そのノードに既に別のサブステップ番号が設定されており、その値が新しく設定しようとしているサブステップ番号よりも小さい場合は、以前の設定値をそのままサブステップ番号として使用する。

　３．順次入力側へノードをたどりながら２の処理を再帰的に実行する。

　図１２のスケジューリング処理Ｓ５０４の前半部分（Ｓ７２２～Ｓ７２７）が上記の「１．」の処理に該当し、そこから「２．」の処理として図１３の関数ｓｃｈｅｄ＿ｎｏｄｅを再帰的に呼び出して実行する。関数呼び出し時には引数の一つとして、対象とするノードに設定するサブステップ番号を指定する。なお、図１３の例は、各ノードの入力数は最大で３個である場合を想定しているが、本発明はこれに限定されるものではない。

　図１４は、上記の手順で図１１のＣＤＦＧの各ノードに対して暫定的なサブステップ番号を設定した様子の一例である。図中において五角形で囲まれた数字が各ノードのサブステップ番号である。「０」から順次１を減算しながらサブステップ番号を設定しているため、サブステップ番号は「０」以下の数となっている。またノード４０のサブステップ番号はノード４３からたどった場合は「－１」、ノード４２または４４からたどった場合は「－２」となるが、関数ｓｃｈｅｄ＿ｎｏｄｅ　中のＳ７３２～Ｓ７３４の処理によって最終的に、一番小さい値である「－２」が設定されている。

　スケジューリング処理５０４の後半の最初に行うＳ７６０とＳ７６１は全てのサブステップ番号を「０」以上の値にするための処理である。Ｓ７６０は全てのサブステップ番号の中で一番小さい値（ｓｓｔ＿ｍｉｎ）を探す処理である。図１４の例では「－３」が一番小さいのでｓｓｔ＿ｍｉｎ＝－３となる。次のＳ７６１では、全てのノードに対してサブステップ番号の値からｓｓｔ＿ｍｉｎの値を減算する。

　図１５は、上記の処理を図１４のＣＤＦＧに行った結果の例である。ここでＳ７６２を行い、入力ノードとＦＦの出力ノード（ＦＦ１）のサブステップ番号を０に設定する。この処理は必須ではないが、入力やフリップフロップ更新のタイミングを揃えることで、図示したＣＤＦＧが見やすくなるといったメリットがある。

　図１６は、Ｓ７６２を行った後のＣＤＦＧを、同じサブステップ番号が同じ列に並ぶように配置し、ステップ番号が同じノードをグループ分けして書き直したＣＤＦＧの例である。これがスケジューリング処理Ｓ５０４が完了した状態におけるＣＤＦＧとなる。

　このようにスケジューリング後のＣＤＦＧでは、各ノードはステップ番号とサブステップ番号を持つことになる。図６に対応する部分のスケジューリング後のＣＤＦＧ構造体のフィールド情報を図１７に示す。図６（ｃ）と比較すると、ｓｓｔの値が格納されていることおよび、ツリー結合処理によって先頭の３つのノードが結合後のノードに置き換わっていることがわかる。この様にＣＤＦＧ中にステップ番号とサブステップ番号を保持しているため、ここからステップ番号を用いてハードウェア記述言語のソースコードを生成することや、サブステップ番号を用いてプログラミング言語のソースコードを生成することが可能であり、ＣＤＦＧに言語変換のハブの役割を持たせることも可能である。

　次にＬＳＩ実装部３の動作について図２６を用いて説明する。

　ＬＳＩ実装部３は、論理合成部８００、配置配線部８０１、タイミング解析部８０２、領域分割部８０３、実装ファイル生成部８０４から構成されている。なお、ＣＤＦＧ生成部２と同様に、これらの各処理部についてはハードウェアで実現しても良いし、ＣＰＵ６１０上で動作するソフトウェアで実現することも可能である。

　ＬＳＩ実装部３の動作の概要を図１８を用いて説明する。領域分割部８０３は、ｖｅｒｉｌｏｇソースファイル１０とヘッダーファイル１１、ＣＤＦＧファイル１４を読み込み、ＣＤＦＧファイルに格納された情報を元に、ｖｅｒｉｌｏｇソースファイル１０に記載されている回路を複数個のモジュールに分割する。本実施例では対象回路を２個の領域に分割する場合を例に説明するが、本発明はこれに限定されるものではない。分割数は人間が設定しても良いし、それぞれのモジュールの回路規模が指定した閾値以下になるまで分割するといった方法も可能である。この場合、各モジュールの回路規模はＣＤＦＧの各ノードに対して演算種に基づいた重み付けをして合計することで見積もっても良いし、後続のフローで実施する合成結果からフィードバックしても良い。ＣＤＦＧを用いた分割処理の実現方法については後述する。

　領域分割部８０３は、分割処理が行われた後、分割後の２つのモジュール及びその上位階層のモジュールに対応したｖｅｒｉｌｏｇソースファイル１７が生成される。

　次に論理合成部８００では、ＥＤＡベンダーやＦＰＧＡベンダーが発売している市販の論理合成ツールを用いて、それぞれのソースファイルに対して論理合成を行い、ソースファイル１７に対応した３個の合成後ネットリストを得る。論理合成ツールの具体的な処理アルゴリズムについては、本発明の本質ではないためここでは説明しない。

　配置配線部８０１では、ＥＤＡベンダーやＦＰＧＡベンダーが発売している市販の配置配線ツールを用いて回路素子の配置および素子間の配線処理を行う。回路素子の配置方法としては、モジュール分割を無視して全素子を自由に配置する方法と、モジュール毎に配置する領域を制限して素子を配置する方法があるが、ここでは後者の方法を使用するものとする。この方法では、領域の大きさや位置を人間が指定する場合と、配置配線ツールが自動的に決定する場合があるが、ここでは説明を簡単にするため、本実施例では配置配線ツールが自動的に決定する場合を想定している。ただし、本特許は人間が領域の大きさや位置を指定する場合にも有効である。

　本実施例の配置配線処理では、最初に２つのモジュールを配置するための領域を決定した後、それぞれの領域内で各モジュールの配置を最適化する。今回は目標動作周波数を達成するために、各モジュール内で互いに接続される素子間の距離ができるだけ短くなるように最適化を行う。配置配線ツールは配置処理が完了して各素子の位置が決定すると、次に配線処理を実施し素子の間を接続していく。配置配線ツールの具体的な処理アルゴリズムの説明は省略する。　
　配置配線８０１が完了すると次に目標としている動作周波数を満足できているかを確認するため、タイミング解析を行う。タイミング解析についても具体的な処理内容の説明は省略する。

　タイミング解析の結果、実装後の回路が目標としている動作周波数で動作しないことが判明した場合には、本処理フローの前の処理に戻って、目標の動作周波数を満足するまでフローを繰り返し実行することになる。どの処理まで戻ればよいかは、状況に応じて変化するが、本実施例では配置配線処理８０１まで戻って、再度配置配線をやり直すこととする。配置をやり直す際には各素子の初期配置を決定するための乱数系列を変更するなどの方法で、前回実行したときとは異なる結果が得られるようにする。

　なお、今回はＬＳＩを複数領域に分割して実装しているため、目標としている動作周波数を満足している領域については配置配線をやり直す必要はない。そのため、ＬＳＩ全体でなく、目標としている動作周波数を満足していない部分のやり直しを行うこととなり、再配置配線処理の時間が短くて済む。この点は、領域分割を行うことによる大きな利点である。

　目標とする動作周波数を満足できた場合には、実装ファイル生成処理８０４によって、配置配線の結果をＬＳＩの実装データ１９に変換する。ＬＳＩの実装データ１９は、対象ＬＳＩがＡＳＩＣの場合はマスクパターン情報を格納したファイルになり、ＦＰＧＡの場合はコンフィギュレーションのための情報となる。
以上で、ＬＳＩまたはＦＰＧＡの実装フローが完了することになる。

　次に、領域分割処理８０３についてその処理方法を図２の回路を例に説明する。この回路に対応するｖｅｒｉｌｏｇソースコードは図３に、このソースコードから生成したＣＤＦＧは図１６に示す。実際には、図１６のＣＤＦＧは処理しやすいように図１７のような形式でデータ化されている。領域分割する際には、ＣＤＦＧの再下段にあるノードすなわち、出力ノード（ＯＵＴ）、ＦＦの入力ノード（ＦＦ０）からリンクを遡りながら、それぞれのノードのソースとなるノードをグループ化していく。以下の説明では、このようなグループをコーンと呼ぶこととし、最下段にある出力ノード（ＯＵＴ）とＦＦの入力ノード（ＦＦ０）を総称してシンクノード呼ぶこととする。

　なお、コーンを生成する際に、最上段のノードすなわち入力ノード（ＩＮ）およびＦＦの出力ノード（ＦＦ１）はコーンに含めない。以下の説明では、最上段にある入力ノード（ＩＮ）とＦＦの出力ノード（ＦＦ１）を総称してソースノードと呼ぶこととする。

　図１７のＣＤＦＧに含まれる全てのシンクノードに対してコーンを生成した結果を図１９に示す。この例ではシンクノードは４つ存在するため、それぞれに対応する形で４つのコーン７０～７３が生成されることになる。図１９の例では、それぞれのコーン７０～７３は排他になっているが、実際の回路では、各コーンは必ずしも排他になるわけではない。例えば、図２０のようなＣＤＦＧではコーン７１と７４がノード３３で重なり合っており、これらのコーンは排他では無くなっている。この場合には、領域分割処理８０３の中で、図２１のように重複しているノード３３を複製して新しいノード３３ａを生成することで、図２０のコーン７４は図２１のコーン７４ａのように変化し、各コーンを排他にすることが可能である。

　以上の方法によって、各コーンが排他になったら、次に各コーンをグループ化していく。先に述べたように本実施例では、対象回路を２つのモジュールに分割して実装するため、ここではコーンを２つのグループに分割する方法について説明するが、これを繰り返していくことで、対象回路を任意の個数のグループに分割することも可能である。

　図１９において、各コーンについて、そこに含まれているノードの数を数えることで、各コーンの論理規模を概算することが可能である。実際には、ノードの数を単純に数えるのではなく、ノードで実行する演算種による重み付け（加算は１、乗算はＮなど）や、ビット幅によるスケーリング（８ビット幅の加算器は１ビット幅の加算器の８倍など）を行うことで、より正確に各コーンの論理規模を見積もれるようになる。

　またソースノードと各コーンを接続するリンクの総数から、コーン同士の結びつきを定量化することが可能である。なお、コーン同士の結びつきを定量化する際には、ＦＦ１ノードは、対応するＦＦ０を含むコーンに含まれているものとみなして考える。

　図１９の例では、ＸのＦＦ１ノード１０００は対応するＦＦ０ノード１００１が含まれるコーン７１に属する物とみなす。ＸのＦＦ１ノード１０００とコーン７２の間には１６本の線があるため、コーン７１と７２の間の結びつきは１６であると定義する。同様にコーン７２と７３の結びつきは８となる。

　以上の様にすることで、各コーンの論理規模と、各コーン間の結びつきを定量化することが可能である。この結果を用いて、コーンをグループ分けする。ここでは、各グループの論理規模に大きな差異が生じないこと、および各グループ間の結びつきができるだけ小さくなるようにするといった観点からコーンをグループ分けする。このグループ分けを行う際には、上記のような論理規模、コーン間の結びつきといったパラメータのどれを重視して、どのように評価するかによって結果が変わってくることになる。

　本実施例では、コーン７１と７２がグループ０に、コーン７０と７３がグループ１にグループ分けされた場合を仮定して話を進める。このグループ分け状況を回路図上で見ると図２２のようになる。波線７５よりも上側がグループ０に対応しており、コーン７０と７３に対応する回路がある。下側がグループ１に対応し、コーン７１と７２に対応する回路がある。

　ＣＤＦＧの各ノードはｖｅｒｉｌｏｇソースコードと対応しているので、ＣＤＦＧ生成時に各ノードに対応するｖｅｒｉｌｏｇソースコードの行番号を属性情報として保存しておくことが可能である。例えば図１９のノード３３は図５の３２行目に対応する。これはプリプロセッサ処理５００を実行する際に作成した行番号の対応表を用いると図３の３７行目に対応することが判る。

　この属性情報を用いて、ｖｅｒｉｌｏｇソースコードをグループ毎に分割した例を図２３、２４に示す。この例では、元のｖｅｒｉｌｏｇソースコードをグループ毎に１０ａ、１０ｂの２つのソースファイルに分割し、それぞれのモジュールを１０ｃのソースファイルから呼び出す形になっている。モジュール名の重複を避けるため、分割後の各モジュールのモジュール名は元のモジュール名に一意な接尾語を付けたモジュール名に変更する。それぞれのモジュールは、変更後のモジュール名に拡張子．ｖを付けたファイル名を付け、記録部６１２へ格納する。

　グループ０に属している図１９のノード３３は、図３の３７行目に対応していたが、この行はグループ０に対応するソースファイル１０ａの３０行目に現れている。

　本実施例の手法では、フリップフロップの出力でグループの分割を行うため、ｖｅｒｉｌｏｇソースコードを行内で分割せずにグループ分けできるという長所がある。グループの分割箇所が任意のリンクとなっているとノード３３の出力リンクでグループ分けを行うようなケースがありうるが、この場合は図３の３７行目が二つのグループに分断されてしまうようなケースが発生しうることになる。

　このように論理合成後のネットリストでなく、ソースコードの段階で分割するため、分割後のソースコードに対して異なる条件で独立に論理合成を行うことが可能である。このため、目標としている動作周波数を満足することが難しいモジュールを含むソースコードについては、性能は高いが実行時間の長い高度な合成オプションを適用することも可能であり、さらに必要な場合には、分割後の特定のソースコードのみを他のソースコードに影響を与えることなく、手修正で最適化することも可能である。

　またフリップフロップの出力でグループの分割を行うことで、タイミング制約を掛けやすくなり、さらに回路の最適化の範囲が拡がるという利点が生じる。これについて図２５を用いて説明する。図２５の(a)は最適化対象回路の一部を抜粋したものであり、フリップフロップ０に格納されているデータが、５つの組み合わせ回路Ａ－Ｅによる処理を経由してフリップフロップ１に伝搬する回路であり、フリップフロップ０からフリップフロップ１への伝搬はクロック周期に対応する１０ｎｓ以内に行われる必要がある。これをモジュール分けする場合（ｂ）のようにフリップフロップの直後でなく、組み合わせ回路ＢとＣの間の１０１０でグループ分けをした場合を考える。

　この場合、前半のグループと後半のグループとを最適化するためにそれぞれのグループに対してタイミング予算を設定する必要がある。ここでは組み合わせ回路Ａ－Ｅの処理時間が全て等しいとして比例配分で前半に４ｎｓ、後半に６ｎｓ配分しているが、実際にはそれぞれの組み合わせ回路の処理時間は異なることが多いため、ゲート段数の仮見積もり等なんらかの手段でタイミング予算を割り当てる作業が必要になってしまう。

　一方、本実施例の方法により、必ずフリップフロップの直後でのみグループが分割されるようにすると、図（ｃ）のように組み合わせ回路Ａ－Ｅ全体で１０ｎｓというように設定すれば良く、タイミング予算の設定を大幅に簡略することが可能となる。

　また、図（ｂ）のグループ分けでは、組み合わせ回路ＢとＣとにまたがる回路最適化を行うことができないため、レジスタ間のパスの最適化に制約が生じることになる。例えば組み合わせ回路Ｂが二入力のＯＲゲートで、組み合わせ回路Ｃも二入力のＯＲゲートである場合、両者を跨る最適化を実施可能であれば、三入力のＯＲゲートに置き換えることで、ゲート段数を減らして高速化が可能であるが、図（ｂ）のグループ分けではこのような最適化を行えないことになる。

　一方、図（ｃ）のグループ分けでは、組み合わせ回路Ａ－Ｅのすべての範囲を跨いだ最適化が可能なため、上記のケースでは三入力のＯＲゲートへの置換も可能であり、最適化の自由度が高くなっている。

　なお、以上の説明はＡＳＩＣのような通常のＬＳＩを例に行ったが、本発明はＦＰＧＡのように、プログラミング可能な回路素子をあらかじめ配置しておき、各回路素子をプログラミングすることにより、必要な機能を実現するようなタイプのＬＳＩにも適用することが可能である。

１０：ｖｅｒｉｌｏｇで記載されたソースコード、１１：ｖｅｒｉｌｏｇで記載されたソースコード用ヘッダーファイル、１２：プリプロセッサ処理済みファイル、１３：中間形式のファイル、１４：ＣＤＦＧ形式のファイル、１７：ｖｅｒｉｌｏｇで記載された分割後のソースコード、１８：論理合成後のネットリスト、１９：ＬＳＩ実装データ、Ｓ５０：ｖｅｒｉｌｏｇ－ＣＤＦＧ変換、Ｓ５００：プリプロセッサ処理、Ｓ５０１：字句解析処理、Ｓ５０２：構文解析処理、Ｓ５０３：ツリー結合処理、Ｓ５０４：スケジューリング処理、８００論理合成処理、８０１：配置配線処理、８０２：タイミング解析処理、８０３：領域分割処理、８０４：実装ファイル生成処置

Claims

　ハードウェア記述言語で記述されたソースコードの処理内容を解析し、処理の実行を示すノード間のデータの転送方向を示す向きを持った有向リンクの集合体として構成される有向グラフを生成するステップと、
　生成した前記有向グラフに含まれるノードを、２つ以上のノードグループに分割するステップと、
　前記ソースコードから、前記２つ以上のノードグループに分割するステップによって生成されたノードグループに含まれるノードに対応する記述を抽出し、それらを結合して当該ノードグループに対応した分割後ソースコードを生成するステップと、を備え、
　前記ノードは前記ソースコード中のフリップフロップに対応するレジスタノードとそれ以外の他のノードとを含み、
　前記２つ以上のノードグループに分割するステップにおいて、レジスタノードから他のノードへ向かうリンクであるレジスタ出力リンクまたは対象回路の入力端子からの他のノードへ向かうリンクである入力端子リンクから構成されるソースノード直結リンクを切断することで２つ以上のノードグループに分割することを特徴としたソースコード分割方法。
　前記２つ以上のノードグループに分割するステップにおいて、ノードグループ間を接続するリンクの本数に基づいてノードグループを分割することを特徴とした請求項１記載のソースコード分割方法。
　前記ノードグループに含まれるノードは、当該ノードグループ以外の他のノードグループには含まれないことを特徴とした請求項１記載のソースコード分割方法。
　ノードが複数のノードグループに含まれる場合に、当該ノードが１つのノードグループに含まれるよう当該ノード及び当該ノードに関連するリンクを複製することを特徴とする請求項３記載のソースコード分割方法。
　複数の前記分割後ソースコードに対して異なる識別子を付けて記憶媒体へと書き出すステップを備えたことを特徴とした請求項１記載のソースコード分割方法。
　前記分割後ソースコードに対して、個別に論理合成処理を行うステップを備え、
　複数の前記分割後ソースコードに対応した複数の分割後ゲートレベルネットリストを生成することを特徴とした請求項１記載のソースコード分割方法。
　前記分割後ゲートレベルネットリストに対し、個別に配置配線処理を行うステップを備え、前記分割後ゲートレベルネットリストに対して配置配線処理を行い、前記分割後ゲートレベルネットリストに対応したＬＳＩ実装ブロックを生成した後、当該ＬＳＩ実装ブロックの間を配線することを特徴とした請求項６記載のソースコード分割方法。
　ハードウェア記述言語で記述されたソースコードの処理内容を解析し、処理の実行を示すノード間のデータの転送方向を示す向きを持った有向リンクの集合体として構成される有向グラフを生成する有向グラフ生成部と、
　生成した前記有向グラフに含まれるノードを、２つ以上のノードグループに分割し、当該分割されたノードグループに含まれるノードに対応する記述を抽出し、それらを結合して当該ノードグループに対応した分割後ソースコードを生成するノードグループ分割部と、を備え、
　前記ノードは前記ソースコード中のフリップフロップに対応するレジスタノードとそれ以外の他のノードとを含み、
　前記ノードグループ分割部は、レジスタノードから他のノードへ向かうリンクであるレジスタ出力リンクまたは対象回路の入力端子からの他のノードへ向かうリンクである入力端子リンクから構成されるソースノード直結リンクを切断することで２つ以上のノードグループに分割することを特徴としたＬＳＩ実装装置。
　前記ノードグループ分割部は、ノードグループ間を接続するリンクの本数に基づいてノードグループを分割することを特徴とした請求項８記載のＬＳＩ実装装置。
　前記ノードグループに含まれるノードは、当該ノードグループ以外の他のノードグループには含まれないことを特徴とした請求項８記載のＬＳＩ実装装置。
　前記ノードグループ分割部は、ノードが複数のノードグループに含まれる場合に、当該ノードが１つのノードグループに含まれるよう当該ノード及び当該ノードに関連するリンクを複製することを特徴とする請求項１０記載のＬＳＩ実装装置。
　前記ノードグループ分割部は、複数の前記分割後ソースコードに対して異なる識別子を付けて記憶媒体へと書き出すことを特徴とした請求項８記載のＬＳＩ実装装置。
　前記分割後ソースコードに対して個別に論理合成処理を行い、複数の前記分割後ソースコードに対応した複数の分割後ゲートレベルネットリストを生成する論理合成部を備えることを特徴とした請求項８記載のＬＳＩ実装装置。
　前記分割後ゲートレベルネットリストに対し、個別に配置配線処理を行い、前記分割後ゲートレベルネットリストに対応したＬＳＩ実装ブロックを生成した後、当該ＬＳＩ実装ブロックの間を配線する配置配線部を備えることを特徴とした請求項１３記載のＬＳＩ実装装置。