JP3907398B2

JP3907398B2 - 半導体集積回路装置の設計方法

Info

Publication number: JP3907398B2
Application number: JP2000349938A
Authority: JP
Inventors: 和祥竹村
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2000-11-16
Filing date: 2000-11-16
Publication date: 2007-04-18
Anticipated expiration: 2020-11-16
Also published as: US20020059554A1; US20040243959A1; US6785876B2; JP2002157291A

Description

【０００１】
【発明の属する技術分野】
本発明は、複数の機能を有する回路を複数個配置した半導体集積回路装置の設計方法に関する。
【０００２】
【従来の技術】
近年、複数のＬＳＩを共通の基板上に形成したシステムＬＳＩという概念が提起されており、システムＬＳＩの設計手法としても各種の提案がなされている。特に、システムＬＳＩの利点は、ＤＲＡＭなどのメモリや、ロジックＬＳＩや、高周波回路などのアナログ回路を１つの半導体装置内に収納して、多種，多機能の半導体装置を極めて高集積化して実現することができることである。
【０００３】
【発明が解決しようとする課題】
ところで、上記従来のシステムＬＳＩにおいては、システムＬＳＩを設計する際に、ＩＰ，コアと呼ばれる設計資産を利用することが多い。そのとき、各コアは個別に設計されたものなので、これらを統合したときには必ずしも円滑な動作が得られないことがある。しかし、従来のコア又はＩＰは、その中身がブラックボックスとなっているので、円滑な動作を確保するシステムを設計するためには多大の手間と時間とを要しているのが現実である。
【０００４】
本発明の目的は、ＩＰの機能の同一性を図りつつＩＰの選択を柔軟に行なうための手段を講ずることにより、最適化が容易な半導体集積回路装置の設計方法の提供を図ることにある。
【００１４】
【課題を解決するための手段】
本発明の第１の半導体集積回路装置の設計方法は、機能を格納する第１の記憶装置と、上記機能用のテストベンチを格納する第２の記憶装置と、機能を有するＩＰを格納する第３の記憶装置と、ＨＷモデルとＳＷモデルとを含むアーキテクチャモデルを格納する第４の記憶装置を有する半導体集積装置の設計システムによる半導体集積回路装置の設計方法であって、各々ある機能を有する複数のＩＰを、上記機能を有するＩＰを格納する第３の記憶装置に格納するステップ（ａ）と、ある仕様を満たすための機能群構造を、上記機能を格納する第１の記憶装置及び上記機能用のテストベンチを格納する第２の記憶装置から構築するステップ（ｂ）と、上記第３の記憶装置から上記機能群構造中の各機能について、当該機能を有するＩＰを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ（ｃ）と、上記ＩＰを機能ブロックレベルに階層展開するステップ（ｄ）と、上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象を、上記アーキテクチャモデルを格納する第４の記憶装置中のＨＷモデルとＳＷモデルとに割り当てるように分割するステップ（ｅ）と、上記ステップ（ｅ）の後、割り当てられた上記機能群構造中の各機能ブロックのＨＷモデルとＳＷモデルとへの割り当てを決定するための動的性能解析を行なうステップ（ｆ）とを含み、上記ステップ（ｆ）では、ある機能ブロックをＨＷに割り当てたときのＣＰＵの負荷率がある下限値よりも小さいときは、当該機能ブロックの割り当てがＳＷに切り換えられる。
【００１５】
本発明の第２の半導体集積回路装置の設計方法は、機能を格納する第１の記憶装置と、上記機能用のテストベンチを格納する第２の記憶装置と、機能を有するＩＰを格納する第３の記憶装置と、ＨＷモデルとＳＷモデルとを含むアーキテクチャモデルを格納する第４の記憶装置を有する半導体集積装置の設計システムによる半導体集積回路装置の設計方法であって、各々ある機能を有する複数のＩＰを、上記機能を有するＩＰを格納する第３の記憶装置に格納するステップ（ａ）と、ある仕様を満たすための機能群構造を、上記機能を格納する第１の記憶装置及び上記機能用のテストベンチを格納する第２の記憶装置から構築するステップ（ｂ）と、上記第３の記憶装置から上記機能群構造中の各機能について、当該機能を有するＩＰを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ（ｃ）と、上記ＩＰを機能ブロックレベルに階層展開するステップ（ｄ）と、上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象を、上記アーキテクチャモデルを格納する第４の記憶装置中のＨＷモデルとＳＷモデルとに割り当てるように分割するステップ（ｅ）と、上記ステップ（ｅ）の後、割り当てられた上記機能群構造中の各機能ブロックのＨＷモデルとＳＷモデルとへの割り当てを決定するための動的性能解析を行なうステップ（ｆ）とを含み、上記第４の記憶装置には、ＨＷの機能毎に当該ＨＷと等価な機能を有するＳＷモデルを格納しており、上記ステップ（ｆ）では、時間軸に沿って消費電力が上限を超えた場合は、当該機能ブロックの割り当てがＨＷに切り換えられる。
【００２９】
【発明の実施の形態】
−ＩＰＯＳデバイスの基本的な構造−
ここで配線の断面積を大きく確保しつつ、多種，多機能のデバイスを内蔵した半導体装置を実現するための１つの手段として、配線層を有する半導体配線基板例えばシリコン配線基板（Ｓｕｐｅｒ−Ｓｕｂ）上に、各種デバイスを内蔵したチップＩＰを搭載する構成がある。その場合、各チップＩＰ内に設けられる回路（ＩＣ）は半導体装置の設計上ＩＰ(Intellectual Property）として扱うことができ、各種ＩＰを半導体配線基板上に貼り合わせたものと考えることができる。つまり、半導体デバイス全体は、“ＩＰＯｎＳｕｐｅｒ−Ｓｕｂ”であるので、シリコン配線基板とＩＰ群とを備えた半導体デバイス全体を“ＩＰＯＳデバイス”とする。
【００３０】
図１（ａ），（ｂ），（ｃ）は、ＩＰ（チップＩＰ）群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載されるＩＰ群の例を示す平面図、及びシリコン配線基板の断面図である。図１（ａ），（ｂ）に示すように、シリコン配線基板１０上には各種ＩＰを搭載するための複数の領域が設けられており、、各領域には、例えば、Analog−ＩＰ，Logic −ＩＰ，ＣＰＵ−ＩＰ，Flash メモリ−ＩＰ，ＳＲＡＭ−ＩＰ，ＤＲＡＭ−ＩＰ，Ｉ／Ｏ−ＩＰなどの各種ＩＰ群がチップＩＰとして搭載可能となっている。図１（ｃ）に示すように、シリコン配線基板１０は、シリコン基板１１と、シリコン基板１０上に絶縁膜（図示せず）を挟んで設けられたグランドプレーン１２と、グランドプレーン１２の上に層間絶縁膜を挟んで設けられた第１配線層１３と、第１配線層１３の上に層間絶縁膜を挟んで設けられた第２配線層１４と、第２配線層１４の上にパッシベーション膜を挟んで設けられたパッド１５とを備えている。パッド１５，各配線層１３，１４及びグランドプレーン１２間は、それぞれコンタクト（図示せず）を介して所望の部位で互いに接続されている。そして、各ＩＰは、パッド１５上に貼り付けられて、各ＩＰが配線層１３，１４により互いにあるいはグランドプレーン１２に電気的に接続される構造となっている。
【００３１】
シリコン配線基板１０内の配線層１３，１４の寸法の制約は緩やかであり、数μｍ幅の配線をも設けることができるので、以下のような効果がある。経験的に、今までの半導体集積回路装置の微細化が進展した過程において、もっとも配線としての特性が良好であった世代の寸法を有する配線を設けることが可能となる。また、配線の電気インピーダンスを低減することができる。
【００３２】
そして、シリコン配線基板上のチップＩＰは多くの機能を有しているが、これに対しては２つの考え方がある。１つは、できるだけ多くの機能を使用するという考え方であり、もう１つは、使用する機能を制限するという考え方である。つまり、ユーザの多様な要求に応えるためには、多種の使用方法に対応できる構成を有していることが好ましいが、反面、実際の使用に際してはいずれかの機能に限定する必要がある。つまり、この２つの相反する要求を満足させることにより、ユーザの多様な要求に応えつつ、少品種，大量生産に適したＩＰＯＳデバイスを構築することができるのである。
【００３３】
したがって、後に選択，制限，切り換え，設定などの処理を柔軟に行なうことを前提として、つまり、機能に関する処理の柔軟性を保持しつつ，多種の機能をハードウェア（ＨＷ），ソフトウェア（ＳＷ）に分けて各ＩＰ（チップＩＰ）に組み込むことが重要となる。
【００３４】
そこで、以下の実施形態においては、ＩＰＯＳデバイスを例とした大規模なシステム（以下、「ＩＰＯＳシステム」という）に適したＨＷ／ＳＷ協調設計について説明する。ただし、本発明は、必ずしもＩＰＯＳシステムだけでなく、従来のいわゆるシステムＬＳＩなどの大規模な集積回路システムの設計にも適用が可能である。
【００３５】
（実施形態）
−ＨＷ／ＳＷ協調設計全体の概略−
図２は、本発明の実施形態におけるＨＷ／ＳＷ協調設計の概略的な手順を示すフロー図である。
【００３６】
ステップＳＴ１で、機能ライブラリ（機能Ｌｉｂ）やテストベンチを用いて機能設計を行ない、ステップＳＴ２で、ＩＰ機能Ｌｉｂを用いたＩＰ機能設計を行なう。このステップＳＴ１，ＳＴ２では、半導体デバイスに搭載される各ＩＰに要求される機能が例えばＣ言語により記述される。例えばＪＰＥＧの場合には、信号処理（アルゴリズム）だけが記載されているような状態である。
【００３７】
次に、ステップＳＴ３で、アーキテクチャモデルＬｉｂを用いてシステムのアーキテクチャ設計を行なう。システムのアーキテクチャモデルＬｉｂには、アーキテクチャモデルがシステムの設計に必要なＨＷ，ＳＷモデルとして存在しているので、このステップＳＴ３では、各モデルをバスに接続してシステム全体の概略的な構造を作り上げる。
【００３８】
次に、ステップＳＴ４で、各機能（機能ブロック）をアーキテクチャのコンポーネントに割り当てるマッピングを行なった後、ステップＳＴ５で、性能Ｌｉｂを用いて性能解析を行ない、その結果、不具合があればステップＳＴ３のアーキテクチャ設計，又はステップＳＴ４のマッピングに戻り、性能が満足されるまでこれらのステップを繰り返すループ処理を行なう。
【００３９】
次に、ステップＳＴ６，ＳＴ７で、それぞれＩＰハードウェアモデルＬｉｂを用いたＨＷ設計と、例えばＩＰソフトウェアモデルＬｉｂを用いたＳＷ設計とを個別に行なってから、ＨＷ及びＳＷが詳細化されてくると、ステップＳＴ８で、Ｉ／Ｆモデルを用いたＨＷ／ＳＷ協調検証を行なう。その後、ステップＳＴ９で、実チップを用いて実チップの機能を確認するための実チップ検証を行なう。
【００４０】
−機能設計及びＩＰ機能設計−
図３は、機能設計を行なうステップＳＴ１と、ＩＰ機能設計を行なうステップＳＴ２との詳細な処理の内容を説明するための部分フロー図である。
【００４１】
ステップＳＴ１においては、以下の手順により、機能設計を行なう。機能Ｌｉｂには、ｆ１，ｆ２，ｆ３，ｆ４などの種々の機能（ｆｕｎｃｔｉｏｎ）が格納されている。この機能ｆ１，ｆ２，ｆ３，ｆ４とは、例えば画像処理におけるＭＰＥＧＫＬ，ＪＰＥＧ，Blue-toothなどの機能である。また、テストベンチＬｉｂには、ｔｂ１，ｔｂ２，ｔｂ３，ｔｂ４などの種々のテストベンチが格納されている。このテストベンチｔｂ１，ｔｂ２，ｔｂ３，ｔｂ４は、機能設計が適正か否かを判断するための与えられるデータである。例えば、図３のステップＳＴ１中に示すように、機能ｆ１，ｆ２，ｆ３を組み合わせたデザインがある場合には、入力テストベンチとして、テストベンチからｔｂ１を取り出して、これを入力データとして与える。また、出力データとして例えば画像出力のテストベンチｔｂ２を与える。その結果、ここで作り上げたデザインが適正かどうかがある程度検証される。
【００４２】
次に、ステップＳＴ２におけるＩＰ機能設計は以下の手順で行なわれる。ＩＰ機能Ｌｉｂには、各機能ｆ１，ｆ２，ｆ３，ｆ４ごとに、この機能を実現するためのいくつかのＩＰが格納されている。例えば、機能ｆ１に対してｆ１−ｉｐ１〜ｆ１−ｉｐ４があり、機能ｆ２に対してｆ２−ｉｐ１〜ｆ２−ｉｐ３があり、機能ｆ３に対してｆ３−ｉｐ１，ｆ３−ｉｐ２がある。そこで、おおよその見当をつけて、デザイン中の機能ｆ１，ｆ２，ｆ３に対して用いるＩＰを指定する。例えば、機能ｆ１に対してはｆ１−ｉｐ４を、機能ｆ２に対してはｆ２−ｉｐ１を、機能ｆ３に対してはｆ３−ｉｐ２を用いるというようにパラメータを指定する。
【００４３】
次に、ステップＳＴ１で作り上げられたデザイン中の各機能ｆ１，ｆ２，ｆ３に、それぞれｆ１−ｉｐ４，ｆ２−ｉｐ１，ｆ３−ｉｐ２を当てはめる。つまり、ＩＰ機能の選択を行なう。この段階では、選び出された各ＩＰはいずれもステップＳＴ１における機能ｆ１，ｆ２，ｆ３を有しているので、ステップＳＴ１で検証した結果と同じ結果が得られる。
【００４４】
このように、機能が互いに共通する複数のＩＰをＬｉｂに格納しておいて、機能ごとに適当なＩＰを選択することにより、ＩＰを代えても機能の同一性が保持されるので、従来大きかった設計変更の確率をできるだけ小さくすることができる。
【００４５】
次に、ＩＰ機能をさらに詳細に個々の機能に分けるＩＰ機能の階層展開を行なう。例えば、ｆ１−ｉｐ４について階層展開をすると、ｆ１−ｉｐ４−Ａ（例えば逆コサイン変換）を行なってからｆ１−ｉｐ４−Ｂ（例えば量子化）を行ない、その後ｆ１−ｉｐ４−Ｃ（例えばハフマン符号化）を行なうという機能になっていたとする。つまり、ＩＰであるｆ１−ｉｐ４を機能ブロックｆ１−ｉｐ４−Ａ，ｆ１−ｉｐ４−Ｂ，ｆ１−ｉｐ４−Ｃに展開するのである。同様に、ｆ２−ｉｐ１，ｆ３−ｉｐ２についても階層展開を行なって、ｆ２−ｉｐ１についてはｆ２−ｉｐ１−Ａという機能ブロックが、ｆ３−ｉｐ２についてはｆ３−ｉｐ２−Ａ，ｆ３−ｉｐ２−Ｂという機能ブロックがそれぞれ得られたとする。そして、この階層展開された各機能ブロックをデザイン中の各機能ｆ１，ｆ２，ｆ３に置換する。この階層展開されたＩＰの中身をＨＷ／ＳＷ分割するのが本発明の１つの特徴である。
【００４６】
−アーキテクチャ設計−
次に、図４は、ステップＳＴ３における処理の内容を説明するための部分フロー図である。同図に示すように、アーキテクチャモデルＬｉｂには、ＣＰＵ，メモリ，ＡＳＩＣ（ロジック回路），ＢＵＳ，バスブリッジモデル，Ｉ／Ｆモデルなどのコンポーネント（ｃ）についての多くの種類が格納されている。そこで、このコンポーネントごとに各種のコンポーネントパラメータをもっているので、コンポーネントパラメータの値を与える。つまり、ＣＰＵについては動作周波数，キャッシュヒット率があり、ＤＲＡＭについては動作周波数，ビット幅があり、ＡＳＩＣについては動作周波数，ビット幅があり、ＢＵＳについてはバスクロック，バス幅，転送レート（ｂｐｓ），アービトレーション方法があり、バスブリッジモデルについてはバスブリッジ間遅延があり、Ｉ／ＦモデルとしてＵＡＲＴを選択したときには入出力転送レート（ｂｐｓ），入出力ビット幅，動作周波数，ビット幅がある。そして、各コンポーネントパラメータに具体的な値を入れる。そして、このパラメータ指定を行なってから、例えば図４に示すように、ＣＰＵ１（ｃ１），ＤＲＡＭ１（ｃ２），ＡＳＩＣ１（ｃ３），ＡＳＩＣ２（ｃ６）及びＵＡＲＴ（ｃ５）をＢＵＳ１，ＢＵＳ２及びバスブリッジ１（ｃ４）を介して接続した構造を有するアーキテクチャを作り上げる。
【００４７】
ここで、このアーキテクチャの特徴は、複数のバス（ＢＵＳ１，ＢＵＳ２）を備え、ＢＵＳ１−ＢＵＳ２間を接続するバスブリッジ１（ｃ４）をコンポーネントとして設けている点である。バスは３つ以上あってもよく、このような複数のバスを設けることにより、半導体デバイスのような半導体配線基板を有する構造に適したアーキテクチャを構築することができる。複数のバスの例としては、標準バスに低速バス，高速バスなどを別途設けたものが考えられる。そして、バスブリッジモデルを設けることにより、当該バスブリッジモデルに接続される２つのバスのビット幅が互いに異なる場合などにおいてもデータの円滑な転送を図ることができる。バスブリッジモデルの例としては、１６ビット幅のＢＵＳ（例えばバス１）のデータを８ビットずつ別のＢＵＳ（例えばＢＵＳ２）に送り込むバッファがある。また、アーキテクチャにおいて、Ｉ／ＦモデルをＡＳＩＣとは別に設けたことにより、入出力の信号を取り扱うＩ／Ｆモデルにおける信号の遅延や消費電力を考慮したシステムの最適化が可能になる。
【００４８】
−マッピング−
次に、図５は、ステップＳＴ４，ＳＴ５におけるマッピングと性能解析の概略とを説明するための部分フロー図である。
【００４９】
同図に示すように、ステップＳＴ４においては、ステップＳＴ２のＩＰ機能設計によって得られたデザイン中の階層展開されたＩＰを、ＨＷとＳＷとに割り当てる処理であるマッピングを行なう。例えば、テストベンチｔｂ１は、ＨＷとしてＩ／ＦモデルであるＵＡＲＴに割り当てられる。また、テストベンチｔｂ２は、ＨＷとしてＤＲＡＭ１に割り当てられる。また、階層展開されているｆ１−ｉｐ４中の機能ブロックｆ１−ｉｐ４−Ａ（ｂｌ１）はＨＷとしてＡＳＩＣ１に、機能ブロックｆ１−ｉｐ４−Ｂ（ｂｌ２），機能ブロックｆ１−ｉｐ４−Ｃ（ｂｌ３）はＳＷとしてＣＰＵ１に、ｆ２−ｉｐ１中の機能ブロックｆ２−ｉｐ１−Ａ（ｂｌ４）はＳＷとしてＣＰＵ１に、ｆ２−ｉｐ２中の機能ブロックｆ３−ｉｐ２−Ａ（ｂｌ５），機能ブロックｆ２−ｉｐ２−Ａ（ｂｌ６）はすべてＨＷとしてＡＳＩＣ２にそれぞれ割り当てられる。
【００５０】
ここで、このマッピングの特徴は、テストベンチをＩ／Ｆモデルにマッピングしたことである。従来、単に入力信号として扱われていたテストベンチをＨＷであるＩ／Ｆモデルにマッピングすることにより、後の性能解析の際に遅延を考慮した処理時間の解析が可能になり、また、Ｉ／Ｆモデルが動作することを考慮した消費電力の解析が可能になる。つまり、解析精度の向上を図ることができる。
【００５１】
また、このように、１つのＩＰをＨＷとＳＷとにわけてマッピングができるようになったのは、ＩＰ機能設計において、上述のようにＩＰを機能ブロックのレベルまで階層展開したからである。そして、マッピングに応じて、図５の左下に示すように、各機能とデザイン中のコンポーネントとのマッピング対応表が機能番号（ａ１〜ａｎ）とともに作成される。また、例えば機能ブロックｆ１−ｉｐ４−Ａ→機能ブロックｆ１−ｉｐ４−Ｂというパスは、ＡＳＩＣ１→ＢＵＳ１→（ＤＲＡＭ１→）ＣＰＵ１というデータのパスとなり、機能ブロックｆ１−ｉｐ４−Ｂ→機能ブロックｆ１−ｉｐ４−Ｃというパスは、ＣＰＵ１→（ＤＲＡＭ１→）ＣＰＵ２というデータのパスとなることが、ブロック間パステーブルとして作成され、設計装置の記憶装置（図示せず）に格納される。なお、括弧内のコンポーネントはその部分が経由される場合もあり、経由されない場合もあることを示している。
【００５２】
ここで、このように機能ブロック間パステーブルを作成することにより、後述するような動的な性能解析を精度よく行なうことができる。
【００５３】
次に、このようなマッピング結果を用いてステップＳＴ５における性能解析を行なう。このステップにおいては、静的解析と動的解析とを行なってもよいし、静的解析及び動的解析のうちいずれか一方のみを行なってもよい。
【００５４】
−性能解析（静的解析）−
性能解析のうち静的解析は、例えば所望のパラメータを変数としてシステム全体のコスト関数（Cost-tot）を定義して、このコスト関数（Cost-tot）を求める。そして、コスト関数（Cost−tot）が最小又はある上限値以下になるかを目標として設計を進める。このコスト関数（Cost-tot）の一例として、例えば下記式（１）

がある。ここで、ｋ１，ｋ２，ｋ３は重み係数であり、Ｓpeed_HW-totはＨＷ全体の処理速度であり、Ｓpeed_SW-totはＳＷ全体の処理速度であり、Ａrea _HW-totはＨＷ全体の面積であり、Ａrea _SW-totはＳＷ全体の面積であり、Ｐower_HW-totはＨＷ全体の消費電力であり、Ｐower_SW-totはＳＷ全体の消費電力である。つまり、この例では、パラメータである処理速度ができるだけ大きく，面積ができるだけ小さく、消費電力ができるだけ小さくなるようにシステムを構築したいと考えていることになる。そこで、コスト関数（Cost-tot）は小さいほどよいとする。例えば、各種のマッピングＭＡＰ１，ＭＡＰ２，ＭＡＰ３を行なった結果、コスト関数（Cost-tot）が図６に示す値になったとする。このときには、もっとも値が小さいマッピングＭＡＰ１が最適であると判断する。
【００５５】
ここで、例えば処理速度に関する計算は、マッピング結果を用いて、下記式（２）

のように行なわれる。ここで、式（２）において、図５に示すように、マッピングしたときの機能ブロック番号をｂｌ１〜ｂｌ６とし、コンポーネント番号をｃ１〜ｃ６とする。そして、ｆは動作周波数であり、Ｒはバスの転送レートであり、Ｐは機能のパスに対する優先順位（優先度）（０〜１の値）を表している。この優先順位Ｐは、バスに接続されるすべてのコンポーネントの優先度を合計すると１になるように設定されている。
【００５６】
すると、式（２）中の例えば機能ブロックｂｌ１（ｆ１−ｉｐ４−Ａ）の処理速度は、下記式（３）

のように求められる。つまり、処理速度はできる限り小さい方が好ましいことから、動作周波数ｆ，転送レートＲ，優先順位Ｐの逆数からコスト関数（Cost-tot）のうち処理速度Ｓpeedの成分を計算する。
【００５７】
次に、式（１）中のＳＷについての処理速度成分Ｓpeed_SW-totは、マッピングのブロック間パステーブルに基づいて、下記式（４）

により求められる。この計算の考え方は以下の通りである。機能ブロックをｆｕｎｃｔｉｏｎによって表すと、処理はＣ言語によって記述することができ、Ｃ言語で記述すればアセンブリ言語にコンパイルすることが可能となる。したがって、アセンブラのステップ数で処理速度を演算することができるからである。
【００５８】
ここで、すると、式（４）中の例えば機能ブロックｂｌ１（ｆ１−ｉｐ４−Ａ）の処理速度は、下記式（５）
Ｓpeed_SW-bl1（Ｓｔ_CPU-c1，ｆ_CPU ）＝Ｓｔ _CPU-c1 ／ｆ _CPU （５）
のように求められる。このステップ数が小さいほど速度が大きいので、式（５）の数値がなるべく小さいことが望ましいことになる。
【００５９】
次に、面積に関する計算は、マッピング結果を用いて、下記式（６）

のように行なわれる。つまり、ＩＰ機能を選択した後でＩＰ機能の階層展開を行なう前に使用される各ＩＰ（ｆ１−ｉｐ４，ｆ２−ｉｐ１，ｆ３−ｉｐ２）の情報があるので、これからＨＷ部分の面積を求めることができる。
【００６０】
次に、機能ブロックをコンパイルすると、アセンブラでメモリサイズがわかるので、ＳＷのメモリの部分をすべて加算しておいて、それにエリアＤＲＡＭというデータベースを用いてＤＲＡＭの１ビット当たりの面積（単価）を計算する。それに、メモリサイズを乗じると、下記式（７）
Ａrea _SW-tot＝（Ｍsize_SW-bl1＋…＋Ｍsize_SW-bl6）×Ａrea _DRAM（７）
により、求めることができる。
【００６１】
このように、ＩＰ内が機能ブロックに分割されたことにより、機能ブロックのＳＷの部分からメモリサイズを計算すると、各機能ブロック間で面積を重複して計算する場合があるので、これを考慮して面積の計算精度の悪化を防止するのである。
【００６２】
次に、ＨＷ部分の消費電力に関する計算は、マッピング結果を用いて、下記式（８）
Ｐower _HW-tot＝Ｐower _HW-b1＋…＋Ｐower _HW-bl6 （８）
のように行なわれる。すると、式（８）中の例えば機能ブロックｂｌ１（ｆ１−ｉｐ４−Ａ）の消費電力は、下記式（９）

により、表される。ただし、αは機能ブロックｂｌ１のパワー係数でＩＰ性能Ｌｉｂから抽出されるもの、ｆ_c3はコンポーネントｃ３（ＡＳＩＣ１）の動作周波数、Ｖ_c3はコンポーネントｃ３（ＡＳＩＣ１）の電圧、Ｐ_c3はコンポーネントｃ３（ＡＳＩＣ１）の優先順位（優先度）を示している。この優先度をトグル数の代わりに用いることで、トグル数がわからない静的解析においても、ある程度の確度で消費電力が求まることになる。
【００６３】
また、ＳＷ部分の消費電力に関する計算は、下記式（１０）
Ｐower_SW-tot＝Ｐower_SW-CPU-tot＋Ｐower_SW-MEM-tot （１０）
により求められる。式（１０）の第１項は、
Ｐower_SW-CPU-tot＝α_CPU×ｆ_CPU×Ｌoad_CPU （１１）
となる。ここで、α_CPUはＣＰＵのパワー係数でＩＰ性能Ｌｉｂから抽出されるもの、Ｌoad_CPUはＣＰＵロード（０〜１）であって、「ＳＷにマッピングされた機能ブロックのメモリサイズの合計（ｂｉｔ）」を「すべての機能ブロックをＳＷにマッピングしたときのメモリサイズの合計（ｂｉｔ）」で除したものである。
【００６４】
一方、式（１０）の第２項は、
Ｐower_SW-MEM-tot＝α_DRAM×ｆ_DRAM×（Ｖ_DRAM）² ×Ｐ_DRAM （１２）
となる。α_DRAMはＤＲＡＭのパワー係数でＩＰ性能Ｌｉｂから抽出されるもの、ｆ_DRAMはＤＲＡＭの動作周波数（Ｈｚ）、Ｖ_DRAMはＤＲＡＭの電圧、Ｐ_DRAMはＤＲＡＭの優先順位を示している。この優先度を用いることで、トグル数がわからない静的解析においても、ある程度の確度で消費電力が求まることになる。
【００６５】
そして、以上の計算を行なって上で、式（１）から最終的に決定されるコスト関数（Cost-tot）が最小になるか、下限値以下になったときに静的解析に関する限り、設計されたシステムが適切であると判断する。
【００６６】
−性能解析（動的解析）−
動的解析においては、面積Ａrea については静的解析と同じであるので、処理速度Ｓpeedと消費電力Ｐowerのみを求める。動的解析においては、設計システムに実際にデータを入力させて動作させるシミュレーションを行なう。したがって、実行時間（Ｔime （ｓｅｃ））や、各機能ブロックの入出力データ、トグル率がシミュレーションから得られる。
【００６７】
そこで、動的解析においては、基本的には、この得られた要素を上記式（１）〜（１２）に代入することにより、コスト関数（Cost-tot）の値を求めることができる。その際、式（１）における（Ｓpeed_HW-tot＋Ｓpeed_SW-tot）は、シミュレーションで得られた時間Ｔimeに置き換えることができ、式（９）における各コンポーネントの優先順位Ｐはシミュレーションで得られた各コンポーネントのトグル数で置き換えることができる。そして、式（１１）におけるＣＰＵロードＬoad_CPUは、実際のシミュレーションから求まる平均ロードを用いる。
【００６８】
さらに、式（１２）におけるＤＲＡＭの優先順位Ｐ（優先度）はシミュレーションで得られたＤＲＡＭのトグル数で置き換えることができる。
【００６９】
−ＨＷ／ＳＷ分割（静的分割）−
次に、ステップＳＴ４，ＳＴ５と共に行なわれるＩＰ内のＨＷ／ＳＷ分割について説明する。ＨＷ／ＳＷには静的分割と動的分割とがあるが、まず、静的な分割について説明する。
【００７０】
図７は、静的なＨＷ／ＳＷ分割を説明するための図である。同図に示すように、半導体デバイスなどのシステムに利用されるハードＩＰには、機能Ａ，機能Ｂ，機能Ｃ，機能Ｄがあり、かつ、これらの機能のＯＮ・ＯＦＦを設定するための設定レジスタがある。ただし、ＨＷ／ＳＷ分割における「機能」とは本実施形態における「機能ブロック」を意味している。一方、ＩＰ性能Ｌｉｂには、各機能Ａ，機能Ｂ，機能Ｃ，機能ＤについてのＳＷモデルが例えばＣ／Ｃ＋＋言語によって記述されて格納いる。このとき、各機能をＨＷとＳＷとによって動作させた結果、１つの機能を変更，修正，削除する必要が生じる場合がある。ここで、例えば、設定レジスタ内の機能ＤをＯＦＦにすることで、例えば機能Ｄへのクロックの供給を停止するなどの制御を行なって、機能Ｄが動作しないようにすることができる。これにより、無駄な電力の消費を抑制して消費電力の低減を図ることができる。また、各機能Ａ〜Ｄ間の接続を変更することもできる。
【００７１】
さらに、例えば１つの機能ＤをＨＷからＩＰ性能Ｌｉｂに用意されたＳＷモデルに切り換えたり、用意しているＬｉｂ内のＳＷモデルを修正することもできる。つまり、いずれかのＬｉｂ内に各機能と等価なＳＷモデルを準備しておくことにより、１つのＩＰ内をＨＷ／ＳＷ分割することができ、ハードＩＰの機能が不足したときにも設計を進めることができる。また、ＳＷの機能を修正，追加することにより、システムの変更に柔軟に対応することができる。
【００７２】
−動的なＨＷ／ＳＷ分割−
次に、動的なＨＷ／ＳＷ分割について説明する。図７に示すＨＷ／ＳＷ分割は、ＨＷ，ＳＷの設定を行なった後は、原則としてその後の修正は行なわない。それに対し、動的なＨＷ／ＳＷ分割，つまりＨＷ／ＳＷ動作の切り換えにおいては、機能（機能ブロック）が動作しながら柔軟に変更，追加，修正を受けることができる。このような動的なＨＷ／ＳＷ分割の例として、以下、第１〜第３の具体例について説明する。
【００７３】
１．第１の具体例
第１の具体例では、図７に示すＩＰにおいて、各機能のＯＮ，ＯＦＦをＳＷによって制御し、かつ、停止させる場合はＩＰ性能Ｌｉｂから同等のＳＷモデルを呼びだしてこれを用いる。設定レジスタへの制御信号により、各機能を動作させながらＨＷ／ＳＷの切り換えを行なうことができる。
【００７４】
２．第２の具体例
図８（ａ），（ｂ）は、動的なＨＷ／ＳＷの切り換えにおける消費電力Ｐowerのタイムチャート図である。また、図９は、このＨＷ／ＳＷの切り換え制御のためのプログラムの例をＣ言語で示す図である。図９に示すように、設定レジスタの制御により、ＳＷモデルからｆｕｎｃ−Ｃを呼び出してこちらを動作させた場合に、図８（ａ）に示すように、ＩＰの消費電力Ｐowerが消費電力の上限値ＭＡＸpowerを越える時があるとする。動的解析からどの機能が動作しているかが時間軸に応じてわかるので、あるレジスタに各機能の消費電力の合計を計算しながら書き込んでおいて、その値が上限値ＭＡＸpowerを超えるときを検出すればよい。そして、ＩＰの消費電力Ｐowerが消費電力の上限値ＭＡＸpowerを越えると、図９に示すように、設定レジスタの制御によりハードＩＰの機能ＣをＯＮにして、代わりにハードＩＰの機能Ｃを動作させる。これにより、図８（ｂ）に示すように、消費電力Ｐowerが上限値ＭＡＸpowerを越えることがなくなり、所望の制約条件の下での作動を確保することができる。つまり、この例では、当該ＩＰの機能Ａ，Ｃが動作する期間には機能ＣがＳＷによって実現にされるが、機能Ａ，Ｂ，Ｃが動作する期間には機能ＣがＨＷによって実現されるように設計することになる。
【００７５】
３．第３の具体例
図１０（ａ），（ｂ）は、動的なＨＷ／ＳＷの切り換えにおける処理速度Ｓpeedの消費電力依存性を示す図である。また、図１１は、このＨＷ／ＳＷの切り換え制御のためのプログラムの例をＣ言語で示す図である。図１１に示すように、ＣＰＵの設定レジスタの制御により、ＣＰＵのロード（％）がある値ＩＤＬＥよりも大きいときには機能ＣをＨＷにより実行し、ＣＰＵのロード（％）がある値ＩＤＬＥ以下のときに機能ＣをＳＷにより実行するよう制御する。つまり、機能Ｃを常にＨＷで実行すると、図１０（ａ）に示すように処理時間Ｔimeが上限値ＭＡＸtimeを越える事態が発生する。そこで、レジスタにＣＰＵのロード（％）を検知しながら書き込んでおいて、ＣＰＵのロード（％）がある値ＩＤＬＥを越えるときを検出しながら、ＣＰＵのロード（％）がある値ＩＤＬＥ以下のときには設定レジスタの制御によりハードＩＰの機能ＣをＯＦＦにして、代わりにＳＷモデルからｆｕｎｃ−Ｃを呼び出してＳＷを動作させる。そして、ＣＰＵのロード（％）がある値ＩＤＬＥを越えると、機能ＣをＨＷにより実行する。このような制御を行なうことにより、図１０（ｂ）に示すように、処理時間Ｔimeが上限値ＭＡＸtimeを越えることがなくなり、所望の制約条件の下での作動を確保することができる。
【００７６】
−ＨＷ／ＳＷ協調検証−
次に、ステップＳＴ８の協調検証について説明する。上述のステップＳＴ４のマッピング処理，ステップＳＴ５の性能解析処理に基づいて最終的に決定されたＨＷ，ＳＷの構成に従い、ステップＳＴ６，ＳＴ７で、ＨＷ設計とＳＷ設計とを行なって、ＨＷモデルとＳＷモデルとをそれぞれ作成する。ＨＷモデルを作成する際にはＩＰハードウェアモデルＬｉｂ（ＢＣＡ，ＲＴＬ又はゲートレベルで記述）を利用し、ＳＷモデルを作成する際にはＩＰソフトウェアモデルＬｉｂ（Ｃ言語，Ｃ＋＋言語又はアセンブラで記述）を利用する。
【００７７】
次に、ステップＳＴ８では、ステップＳＴ６，ＳＴ７で作成したＨＷモデル及びＳＷモデルを利用して、ＨＷ／ＳＷ協調検証を行なうが、そのためにはＨＷ−ＳＷ間のＩ／Ｆモデルが必要となる。そこで、以下の手順により、Ｉ／Ｆモデルモデルを作成する。
【００７８】
まず、図１３に示すようなメモリマップを作成する。このメモリマップは、ＳＷにプログラムをコンパイルしたものである。ＨＷは、レジスタをメモリにマッピングする。
【００７９】
そして、各機能ブロックのアドレスを決定し、各機能ブロックのアドレステーブルをデータバース化して、メモリマップＤＢに登録する。そして、図１４に示すように、メモリマップＤＢに登録されたＨＷのレジスタとアドレスとの対応表をとりだして、アドレスデコーダを作成する。
【００８０】
バスコントローラは、各ＨＷブロックのＰ（優先度）にしたがって、各バス毎のアービトレーション方法ごとに用意したＨＤＬテンプレートを生成する。すなわち、バスコントローラは、各ハードウェアのレジスタアドレスをメモリマップＤＢから抽出して、関数を作成し、これをドライバー関数テンプレートとしてＳＷモデルに格納する。
【００８１】
図１５は、基本ハードウェアアクセス用のドライバー関数テンプレートの一例を示す図である。このようなメモリマップＤＢ，アドレスデコーダ，関数テンプレートを利用することにより、設計されたシステムのＨＷによってＳＷを動作させたり、システムのＳＷによってＨＷを動作させることが可能になり、ＨＷ／ＳＷ協調検証を行なうことができる。
【００８２】
【発明の効果】
本発明により、ＩＰの機能に着目してより最適化された半導体集積回路装置を形成するための設計が可能になった。
【図面の簡単な説明】
【図１】（ａ），（ｂ），（ｃ）は、ＩＰ群を搭載するための配線基板となるシリコン配線基板の平面図、シリコン配線基板上に搭載されるＩＰ群の例を示す平面図、及びシリコン配線基板の断面図である。
【図２】本発明の実施形態におけるＨＷ／ＳＷ協調設計の概略的な手順を示すフロー図である。
【図３】機能設計とＩＰ機能設計との詳細な処理の内容を説明するための部分フロー図である。
【図４】システムアーキテクチャ設計における処理の内容を説明するための部分フロー図である。
【図５】マッピングと性能解析の概略とを説明するための部分フロー図である。
【図６】各種のマッピングを行なった結果のコスト関数（Cost-tot）の値の例を示す図である。
【図７】静的なＨＷ／ＳＷ分割を説明するための図である。
【図８】（ａ），（ｂ）は、動的なＨＷ／ＳＷの切り換えにおける消費電力Ｐowerのタイムチャート図である。
【図９】消費電力を考慮したＨＷ／ＳＷの切り換え制御のためのプログラムの例をＣ言語で示す図である。
【図１０】（ａ），（ｂ）は、動的なＨＷ／ＳＷの切り換えにおける処理速度Ｓpeedの消費電力依存性を示す図である。
【図１１】処理速度を考慮したＨＷ／ＳＷの切り換え制御のためのプログラムの例をＣ言語で示す図である。
【図１２】協調検証を説明するための図である。
【図１３】ＳＷにプログラムをコンパイルして得られたメモリマップを示す図である。
【図１４】メモリマップＤＢに登録されたＨＷのレジスタとアドレスとの対応表をとりだして、アドレスデコーダを作成する処理を示す図である。
【図１５】基本ハードウェアアクセス用のドライバー関数テンプレートの一例を示す図である。
【符号の説明】
１０シリコン配線基板
１１シリコン基板
１２グランドプレーン
１３第１配線層
１４第２配線層
１５パッド

Claims

機能を格納する第１の記憶装置と、上記機能用のテストベンチを格納する第２の記憶装置と、機能を有するＩＰを格納する第３の記憶装置と、ＨＷモデルとＳＷモデルとを含むアーキテクチャモデルを格納する第４の記憶装置を有する半導体集積装置の設計システムによる半導体集積回路装置の設計方法であって、
各々ある機能を有する複数のＩＰを、上記機能を有するＩＰを格納する第３の記憶装置に格納するステップ（ａ）と、
ある仕様を満たすための機能群構造を、上記機能を格納する第１の記憶装置及び上記機能用のテストベンチを格納する第２の記憶装置から構築するステップ（ｂ）と、
上記第３の記憶装置から上記機能群構造中の各機能について、当該機能を有するＩＰを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ（ｃ）と、
上記ＩＰを機能ブロックレベルに階層展開するステップ（ｄ）と、
上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象を、上記アーキテクチャモデルを格納する第４の記憶装置中のＨＷモデルとＳＷモデルとに割り当てるように分割するステップ（ｅ）と、
上記ステップ（ｅ）の後、割り当てられた上記機能群構造中の各機能ブロックのＨＷモデルとＳＷモデルとへの割り当てを決定するための動的性能解析を行なうステップ（ｆ）とを含み、
上記ステップ（ｆ）では、ある機能ブロックをＨＷに割り当てたときのＣＰＵの負荷率がある下限値よりも小さいときは、当該機能ブロックの割り当てがＳＷに切り換えられることを特徴とする半導体集積回路装置の設計方法。
機能を格納する第１の記憶装置と、上記機能用のテストベンチを格納する第２の記憶装置と、機能を有するＩＰを格納する第３の記憶装置と、ＨＷモデルとＳＷモデルとを含むアーキテクチャモデルを格納する第４の記憶装置を有する半導体集積装置の設計システムによる半導体集積回路装置の設計方法であって、
各々ある機能を有する複数のＩＰを、上記機能を有するＩＰを格納する第３の記憶装置に格納するステップ（ａ）と、
ある仕様を満たすための機能群構造を、上記機能を格納する第１の記憶装置及び上記機能用のテストベンチを格納する第２の記憶装置から構築するステップ（ｂ）と、
上記第３の記憶装置から上記機能群構造中の各機能について、当該機能を有するＩＰを選択して取り出して、上記機能群構造中の各機能と置き換えるステップ（ｃ）と、
上記ＩＰを機能ブロックレベルに階層展開するステップ（ｄ）と、
上記階層展開された各機能ブロックごとに、当該機能ブロックの実現化対象を、上記アーキテクチャモデルを格納する第４の記憶装置中のＨＷモデルとＳＷモデルとに割り当てるように分割するステップ（ｅ）と、
上記ステップ（ｅ）の後、割り当てられた上記機能群構造中の各機能ブロックのＨＷモデルとＳＷモデルとへの割り当てを決定するための動的性能解析を行なうステップ（ｆ）とを含み、
上記第４の記憶装置には、ＨＷの機能毎に当該ＨＷと等価な機能を有するＳＷモデルを格納しており、上記ステップ（ｆ）では、時間軸に沿って消費電力が上限を超えた場合は、当該機能ブロックの割り当てがＨＷに切り換えられることを特徴とする半導体集積回路の設計方法。