JP4272108B2 - データ処理装置用バス相互接続ブロックの設計に関するフレキシビリティの改善 - Google Patents

データ処理装置用バス相互接続ブロックの設計に関するフレキシビリティの改善 Download PDF

Info

Publication number
JP4272108B2
JP4272108B2 JP2004146789A JP2004146789A JP4272108B2 JP 4272108 B2 JP4272108 B2 JP 4272108B2 JP 2004146789 A JP2004146789 A JP 2004146789A JP 2004146789 A JP2004146789 A JP 2004146789A JP 4272108 B2 JP4272108 B2 JP 4272108B2
Authority
JP
Japan
Prior art keywords
path
candidate
paths
register
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004146789A
Other languages
English (en)
Other versions
JP2005004736A (ja
Inventor
ジェームズ マシュウソン ブルース
ジョン ハリス アントニー
Original Assignee
エイアールエム リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エイアールエム リミテッド filed Critical エイアールエム リミテッド
Publication of JP2005004736A publication Critical patent/JP2005004736A/ja
Application granted granted Critical
Publication of JP4272108B2 publication Critical patent/JP4272108B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F5/06Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)
  • Information Transfer Systems (AREA)
  • Electronic Switches (AREA)

Description

本発明は、データ処理装置に関し、とくにこのようなデータ処理装置に用いるバス相互接続ブロックの設計に関するフレキシビリティを改善する手法に関する。
データ処理装置の構成要素の設計は労働集約的な仕事であり、データ処理装置の複雑さが増えるのに伴って、さらに複雑さを増している。このような1つの構成要素は、データ処理装置の中の他の各種要素の間のバス接続を定義するために使用する、バス相互接続ブロックである。とくにバス相互接続ブロックは、いくつかのマスタ・デバイスが、いくつかのスレーブ・デバイスに対してアクセスすることを可能にするバスのインフラストラクチャを定義する。データ処理装置の複雑さが増えると、データ処理装置がこれらのマスタ・デバイスとスレーブ・デバイスを接続することができる方法の数も増加するので、相互接続するマスタ・デバイスとスレーブ・デバイスの数も増加する。これによってバス相互接続ブロックの設計の複雑さがかなり増大するが、バス相互接続ブロックによって指定される各種接続がとくに複雑になる。バス相互接続ブロックを設計する場合に考慮すべきことは、バス相互接続ブロックの各種特性、たとえば、タイミング特性、消費電力特性などが存在することである。とくに選んだ特性の要求条件を満たすこと(たとえばタイミング特性を向上させる事)を追求するために、バス相互接続ブロックの設計中になされる設計上の選択は、バス相互接続ブロックによって指定されるすべての接続にわたって繰り返されるのが普通であり、この繰り返しが選んだ特性の要求条件を満たすことに役立つのであるが、この設計上の選択は最適状態以下であり、対処することを必要とする他の望ましくない特性を導入することになる。
したがって、バス相互接続ブロックの設計に役立つとともに、前になされた設計に一応の影響を与え、設計の修正を繰り返して実行することを可能にする方法論と設計ツールを提供することが望ましい。
本発明の第1の態様から見ると、本発明は、バス相互接続ブロックのために選んだ特性の要求条件を満たすため、データ処理装置用バス相互接続ブロックの設計を修正する方法を提供している。このバス相互接続ブロックは、複数の接続を用意し、該複数の接続を介して、1つまたは複数のマスタ・デバイスが1つまたは複数のスレーブ・デバイスに対してアクセスすることができ、各接続は1つまたは複数の経路を有し、各経路は記憶素子によって分離された1つまたは複数の部分経路を有する。この方法は、(a)前記経路から1つまたは複数の候補経路(candidate path)を選択するステップと、(b)候補経路ごとに所定の基準を適用して、前記経路の中の記憶素子の数の修正が、前記選んだ特性の要求条件を満たすことに役立つか否かを決定するステップと、(c)各候補経路の中の前記記憶素子の数を修正し、該修正に対して、前記ステップ(b)で、その修正が前記選んだ特性の要求条件を満たすことに役立つと決定されているステップとを含む。
本発明のこの態様によれば、記憶素子は、たとえば、タイミングの改善、消費電力の低減などのようなバス相互接続ブロックに対して選んだ特性の要求条件を満たすことを目的として、これらの経路を明瞭な部分経路に分離するため、バス相互接続ブロックの中の経路に対して記憶素子を選択的に導入する。このような記憶素子をどこに配置するかを決定するために使用する方法は、バス相互接続ブロックの中に用意された各種経路から1つまたは複数の候補経路を選択することを含む。このような選択は、満足させることを追求中の選んだ特性の要求条件に依存して決まるので、候補経路ごとに所定の基準を適用して、その経路の中の記憶素子の数の修正(記憶素子の数を増やすか減らすか)が、選んだ特性の要求条件を満たすことに役立つか否かを決定する。この場合も、適用すべき所定の基準は、満足させることを追求中の選んだ特性の要求条件に依存して決まることは理解されるであろう。記憶素子の数の修正が選んだ特性の要求条件を満たすことに役立つと決定されることを想定すると、設計が改定され、記憶素子の数が修正される。この方法は、選んだ特性の要求条件が所望のレベルを満たしてしまうまで反復的に繰り返される。その上、このような方法によって、設計の修正を1接続ずつ検討しかつ実施することができることは、さらに理解されるであろう。
選んだ特性がタイミング特性であり、要求条件が前記タイミング特性の改善である1つの実施例における方法には、前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介してバス相互接続ブロックが前記マスタ・デバイスまたはスレーブ・デバイスに対して信号を出力するステップと、前記ステップ(b)で、バス相互接続ブロックから有効信号を出力するためにかかる時間が第1の所定の閾値を超えているか否かを候補経路ごとに決定するステップと、超えている場合は、前記ステップ(c)で、その候補経路に記憶素子を挿入し、その候補経路の中の部分経路の数を増加させるステップと、が含まれる。信号がバス相互接続ブロックからマスタ・デバイスまたはスレーブ・デバイスのいずれかに対して出力されると、信号が発行されるクロックサイクルの終わりで、マスタ・デバイスまたはスレーブ・デバイスによって、その信号が安全に受信されることを必要とすることは理解されるであろう。各マスタ・デバイスまたはスレーブ・デバイスは、その信号が有効に立ち上げられていると、その信号を受信するために或る長さの時間を必要とする。したがって、有効信号を出力するため、クロックサイクルのバス相互接続ブロックがもつ部分が指示される。これにより、バス相互接続ブロックによって有効信号を出力するために要する所定の閾値時間が提供され、その閾値時間を超えていることが決定されると、この実施例によれば、候補経路に対して記憶素子を挿入して、その候補経路の中の部分経路の数を増加させる。これは、候補経路を示す接続を介して送信される特定の信号すべてに対してクロックサイクルの数を増やすことになるが、その有効信号が発行されるクロックサイクル以内で、その有効信号が適切なマスタ・デバイスまたはスレーブ・デバイスによって受信されることを可能にするため、バス相互接続ブロックが有効信号を出力するために十分な時間が利用可能であることを保証する。
選んだ特性がタイミング特性であり、要求条件が前記タイミング特性の改善である1つの実施例における方法には、前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介して、バス相互接続ブロックが前記マスタ・デバイスまたはスレーブ・デバイスから信号を受信するステップと、前記ステップ(b)で、バス相互接続ブロックから有効信号を受信するために要するセットアップ(setup)時間が、第2の所定の閾値を超えているか否かを候補経路ごとに決定するステップと、超えている場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入し、その候補経路の中の部分経路の数を増加させるステップとが含まれる。
マスタ・デバイスまたはスレーブ・デバイスから信号を受信する場合、マスタ・デバイスまたはスレーブ・デバイスによってそれらの信号が有効に立ち上げられていると、さらにそのクロックサイクルの持続時間とマスタ・デバイスまたはスレーブ・デバイスによって、それらの信号を有効に立ち上げるために必要とする時間に基づいて、このようなセットアップに利用可能な所定の最長閾値時間が存在するであろう。したがって、特定の候補経路に対しセットアップ時間がその所定の閾値を超えていることが決定されると、その候補経路に対して記憶素子を挿入し、その候補経路の中の部分経路の数を増加させる。
選んだ特性がタイミング特性であり、要求条件が前記タイミング特性の改善である1つの実施例における方法には、前記ステップ(a)で、組み合わせ論理を組み込んで前記1つまたは複数の候補経路として、1つまたは複数の経路を選択するステップと、前記ステップ(b)で、その組み合わせ論理によって信号を処理するためにかかる時間が、第3の所定の閾値を超えているか否かを候補経路ごとに決定するステップと、超えている場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入し、その候補経路の中の部分経路の数を増加させるステップとが含まれる。
バス相互接続ブロックの中では、バス相互接続ブロックによって受信された信号に関するある種の処理機能を実行するために、各種組み合わせ論理が用意されるのが普通である。どの特定のクロックサイクル以内でも、処理すべき信号は、そのクロックサイクル中にそのバス相互接続ブロックに対して転送され、処理された後、マスタ・デバイスまたはスレーブ・デバイス、あるいはバス相互接続ブロックの中の何らかの記憶素子のどれかである宛先に対して出力される必要があるので、その組み合わせ論理が処理機能を実行することを可能にする所定の最長時間が存在するであろう。したがって、ステップ(b)でその組み合わせ論理によって信号を処理するためにかかる時間が、その所定の閾値時間を超えていると、候補経路に対して記憶素子を挿入し、候補経路の中の部分経路の数を増加させる。
上に説明したバス相互接続ブロックの中に記憶素子の配置を選択的に決定する3つの方法は、そのどれかを別々に適用してもよいし、相互に組み合わせて適用してもよい。
選んだ特性がタイミング特性であり、バス相互接続ブロックの設計には、除去の候補である複数の仮記憶素子が含まれ、修正に対する要求条件が、信号が所定の最長時間で横断不能な部分経路をひとつも導入しないことである1つの実施例における方法には、所定の最長時間として、バス相互接続ブロック用クロックサイクルの持続時間を指定するステップと、前記ステップ(a)で、前記1つまたは複数の候補経路として、少なくとも1つの仮記憶素子を含む1つまたは複数の経路を選択するステップと、前記ステップ(b)で、前記少なくとも1つの仮記憶素子の除去が、クロックサイクルの持続時間を超えない時間で信号が横断できる新しい部分経路になるか否かを候補経路ごとに決定するステップと、新しい部分経路になる場合は、前記ステップ(c)で、その候補経路から少なくとも1つの仮記憶素子を除去し、その候補経路の中の部分経路の数を減少させるステップとが含まれる。
バス相互接続ブロックの開発は、いくつかの段階で実行されるのが普通である。たとえば、レジスタ・トランスファ・ランゲージ(Register Transfer Language:RTL)を使用して、最初にバス相互接続ブロックの機能動作/挙動が定義される。よくする2つのRTLはVHDLとVerilogである。さらにこのようなRTLのコーディングを実行する前に、業務レベル(at a transactional level)で設計の意図が正しいことを立証するモデル化言語、たとえば、SystemCを使用して行動モデル(behavioural model)を構築してもよい。
ハードウエア構成要素のRTLによる表現が開発されると、1つまたは複数の合成ツールとレイアウトツールを通過して、実際のバス相互接続ブロックの設計レイアウトを指定する一連の相互接続されたハードウエア素子の系列を発生する。この合成処理は、たとえば、論理ゲートのリストと、回路網、つまり、相互接続のリストになるネット・リスト(Netlist)を生成するのが普通である。このレイアウト段階は、ゲートと相互接続の最適レイアウトを試行して見付けるために使用される。
上に説明した実施例では、バス相互接続ブロックの設計で仮記憶素子が配置されるが、普通はRTL段階で配置され、これらの仮記憶素子は除去の候補であり、上に説明した方法は、このような除去を実行すべきか否かを決定するために使用される。この方法は、レイアウト段階で実行できるのが普通である。この方法の利点は、レイアウト設計の他の領域に混乱を与えることを必要とせずに仮記憶素子を除去し、レイアウト段階の他の領域に不都合な連鎖反応が生じる可能性が皆無な状態で修正の実行を可能にすることができることである。仮記憶素子を除去すると、クロックサイクルの持続時間を超えない時間で信号が横断できる新しい部分経路になるか否かを決定する場合、通常、その特定の記憶素子の周囲のすべての経路、つまり、その記憶素子を通過する経路でタイミング解析を実行する。
候補経路のどれかに1つ以上の仮記憶素子が含まれていると、第1の繰り返しで、その経路の中のすべての仮記憶素子を除去することを追求することは適切ではないが、その代わりにステップ(b)における決定が、たとえば、その経路の中の仮記憶素子の1つのような選択された部分集合(subset)の除去に基づいて実行されることは理解されるであろう。さらに、候補経路の中の各部分経路を介して、実際のタイミングの信号が供給されると、除去すると考えられる選択した部分集合の中に、どの仮記憶素子を含めるべきか否かを決定するための基準を用意してもよいことは理解されるであろう。
複数の仮記憶素子を与えた後、それの除去を追求する代替方法として、代替可能な実施例における選んだ特性は、時間特性であり、要求条件は前記タイミング特性の改善であって、この方法には、バス相互接続ブロックに対してクロックサイクルの持続時間を指定するステップと、前記ステップ(a)で、前記1つまたは複数の候補経路として、クロックサイクルの持続時間で信号が横断できない容認不能部分経路を含む1つまたは複数の経路を選択するステップと、前記ステップ(b)で、容認不能部分経路の中に少なくとも1つの記憶素子を挿入して修正後の設計を発生することを前提として、修正後の設計のタイミング特性が、容認不能部分経路のタイミング特性を基準として改善されているか否かを決定するために、候補経路ごとに所定の基準を適用するステップと、改善されている場合は、前記ステップ(c)で、その容認不能部分経路の中に少なくとも1つの記憶素子を挿入して、候補経路の中の部分経路の数を増加させるステップが含まれる。ここでも、このような方法をレイアウト設計で実行することができる。その場合、1つの実施例では、この方法を実行した結果、1つまたは複数の記憶素子を挿入することが適切だと決定されることになっても記憶素子を挿入するために利用できるスペースがいくつかあるように、いくつかの利用可能なスペース、つまり、いくつかの「遊び(slack)」のあるオリジナル・レイアウトが設計される。
修正後の設計のタイミング特性が、修正前の設計のタイミング特性を基準として改善されているか否かを決定するために適用される所定の基準は、いろいろな型式をとってもよい。たとえば、1つの実施例における修正後の設計で、最長(つまり、持続時間が最長の)容認不能部分経路を信号が横断するためにかかる時間が、修正前の設計で最長(つまり、持続時間が最長の)容認不能部分経路を信号が横断するためにかかる時間よりも短いか否かを決定することができるが、その場合は修正後の設計のタイミング特性が修正前の設計のタイミング特性を基準として改善されていると考えてもよいであろう。代替可能な実施例において、所定の基準を適用するステップには、修正後の設計で容認不能部分経路の数が、修正後の設計で容認不能部分経路の数よりも小さいか否かを決定し、その場合は修正後の設計のタイミング特性が、修正前の設計のタイミング特性を基準として改善されていると考えてもよいことを含めてもよい。
さらには、このような決定をする場合、たとえば、上記2つの基準の例の組み合わせのように、いくつかの基準の組み合わせを考えてもよいであろう。
前述したように、1つの実施例におけるステップ(a)から(c)は、候補経路の選択のために繰り返され、既になされた設計の決定に一応の影響を与え、設計の処理が繰り返して処理されることになる。
前に説明した実施例では、修正後の設計を発生するため、記憶素子を挿入することが適切か否かがレイアウト段階で決定され、容認不能部分経路が存在しない修正後の設計が発生するまで、ステップ(a)から(c)が繰り返される。
選んだ特性が消費電力であり、要求条件が前記消費電力の低減である1つの実施例における方法には、前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介して、バス相互接続ブロックが関連するマスタ・デバイスまたはスレーブ・デバイスとインタフェースをとるステップと、前記ステップ(b)で、所定の基準を適用し、関連するマスタ・デバイスまたはスレーブ・デバイスを分離して消費電力を低減させることが適切であるか否かを候補経路ごとに決定するステップと、適切である場合は、前記ステップ(c)で、その候補経路の中に記憶素子を挿入し、関連するマスタ・デバイスまたはスレーブ・デバイスを分離して、その候補経路の中の部分経路の数を増加させるステップとが含まれる。
或る状態では、他のマスタ・デバイスまたはスレーブ・デバイスよりも使用頻度が少ないマスタ・デバイスまたはスレーブ・デバイスがあるので、たとえば、特定のスレーブ・デバイスが、或るマスタ・デバイスから発行される転送要求の大多数の意図的な受け手である場合、これらの転送要求を他のスレーブ・デバイスに対しても送信することは非効率であることは理解されるであろう。したがって、この実施例によれば、消費電力を低減させるために特定の候補経路に関連するマスタ・デバイスまたはスレーブ・デバイスを分離することが適切であるか否かを決定し、適切な場合は、関連するマスタ・デバイスまたはスレーブ・デバイスを分離するために、その候補経路に対して記憶素子を挿入するため、所定の基準を適用することができる。
関連するマスタ・デバイスまたはスレーブ・デバイスを分離することが適切であるか否かを決定するために適用される所定の基準が、いろいろな型式をとりうることは理解されるであろう。しかし、1つの実施例における所定の基準を適用するステップは、その候補経路に関連するマスタ・デバイスとスレーブ・デバイスの数と、これらの関連するマスタ・デバイスまたはスレーブ・デバイスによって使用される相互接続ブロックの帯域幅の関数(function)に基づいて、その関連するマスタ・デバイスまたはスレーブ・デバイスを分離することが適切であるか否かを決定することを含めることができる。関連するマスタ・デバイスまたはスレーブ・デバイスの数が増加するとともに、これらのデバイスによって使用される帯域幅が狭くなると、これらの関連するマスタ・デバイスとスレーブ・デバイスを分離するために記憶素子を挿入することが、結果としてかなりの電力の節減になる可能性が増大する。
記憶素子がいろいろな型式をとりうることは理解されるであろう。しかし、1つの実施例における記憶素子は、関連する部分経路を介して受信した信号のグループを格納するように動作可能なレジスタ・スライスである。
第2の態様から見ると、本発明は、本発明の第3の態様による方法を実行するコンピュータを構成するように動作可能な計算機プログラムを提供する。第3の態様から見ると、本発明は、本発明の第3の態様による計算機プログラムを運ぶ計算機プログラム製品を提供する。
添付の図面に示す好適実施例を参照し、例示するのみの方法で本発明を詳細に説明する。
図1Aは、レジスタ・スライス記憶部10と、ある種の関連する制御論理20から構成されたレジスタ・スライス1を模式的に示すブロック図である。本明細書では信号グループと呼ばれる、点Aから点Bまで流れる情報のチャネルが与えられているので、チャネルの中の各情報信号の発信元と宛先の間にレジスタを挿入するためにレジスタ・スライス1を使用することができる。したがって、図1を参照すると、個々の信号のグループとしてアドレスを指定する転送要求、その要求が書き込み転送要求であることの表示、データのサイズ、およびバースト・サイズに関する情報が宛先に伝搬される前に、レジスタ・スライス記憶部10の中に一時的に格納される。上記信号のほか、他の信号が有効として処理すべきか否かを示す有効信号(valid signal)が発行されるのが普通である。この有効信号が制御論理20で受信されると、制御論理20は、たとえばスレーブ・デバイスのような宛先からレディ信号を受信する。このレディ信号は、レジスタ・スライス記憶部10の中に格納済みのどんな信号でも、とにかくその宛先が受信する準備ができていることを識別するように設定されている。したがって、レジスタ・スライス記憶部10に新しいデータを書き込んでも安全なことを示している。たとえば、特定のクロックサイクル中に新しい値をレジスタ・スライス記憶部10に格納しながら、レジスタ・スライス記憶部10の現在の内容を宛先に出力することができる。したがって、レジスタ・スライス記憶部10に既にデータが含まれている場合、制御論理20を使用してセット・レディ信号が受信されるときまで有効データがレジスタ・スライス記憶部10に対して伝搬されることを防止する。レジスタ・スライス記憶部10は有効信号が設定される場合には受信信号をレジスタ・スライス記憶部10の中に格納するためだけに配置される。しかし、レジスタ・スライス記憶部によって出力される有効信号の値が表示する有効データをレジスタ・スライス記憶部が1つも含んでいない場合、有効データをレジスタ・スライス記憶部10に伝搬する前に立ち上げられるセット・レディ信号を制御論理20が待ち合わせる必要はない。
図1Bは、レジスタ・スライスの代替可能な実施例を示している。この実施例におけるレジスタ・スライス2には、主経路の中に含まれる2セットのレジスタ・スライス記憶素子12、14がある。以下、詳細に説明するように、この方法によると、レジスタ・スライスを通じて利用可能な帯域幅に影響を及ぼさずに戻ってくるレディ信号の経路の中にレジスタ22を配置することが可能になる。
レディ信号の戻り経路が、1クロックサイクルで横断するには長すぎる状態のとき、図1Bのレジスタ・スライスの実施例を使用して戻り経路にレジスタ・スライスを挿入することができる。しかし、この条件以外でもこうむることがある性能の欠点を除く狙いから、制御論理20は、次のサイクルでレディ信号の値(つまり、設定されているか否か)を予測するように調整され、その予測値をレジスタ22に格納する。レジスタ・スライス記憶素子12、14の少なくとも1つが空きの状態のとき、制御論理は、レディ信号が次のサイクルで設定されることを予測するように調整される。何故ならば、その予測が間違っているとしても、レジスタ・スライス2には、予測値と関係なく動作する論理からそれに対して転送される信号をレジスタ・スライス記憶素子12、14のどちらか1つの中に格納する容量があるからである。現在、レジスタ・スライス記憶素子の両方に有効データ信号が含まれている場合に限り、制御論理は、レディ信号が次のサイクルで設定されないことを予測する。何故ならば、そのときレディ信号が実際に設定されていなかった場合、制御論理はいかなる入力信号も受信できないからである。
図1Aの例と同様、制御論理は、受信したレディ信号に関係なく、それぞれ経路13または15を介して、レジスタ・スライス記憶素子12、14の選択された1つに有効信号を伝搬するように調整され、たとえば、それぞれ連続する受信した信号セットが異なるレジスタ・スライス記憶素子に送られるラウンドロビン方式を利用することができる(たとえば、信号の第1のセットは記憶素子12に、第2のセットは記憶素子14に、第3のセットは記憶素子12にというように、以下同様に送られる)。さらに制御論理20は、レジスタ・スライス記憶素子12、14の適切な1つから信号が出力され、レジスタ・スライス2からの出力が、信号を受信した順序と同じ順序になることを保証するように、制御経路17を介してマルチプレクサ16を制御する。
図1Aおよび1Bに示すレジスタ・スライス1、2は、点Aから点Bまで信号を転送するために必要なサイクルの数を増やす効果を有しているが、1クロックサイクルでカバーしなければならない部分経路の最大の長さを減らすという利点により、設計した装置が動作する最高クロック周波数が上昇する。
レジスタ・スライスを使用する1つの特殊な利点は、図2、3を参照して示すように、バーストを使うシステムで発生する。最初に図2を検討すると、マスタ・デバイス30がちょうど1つのデータ項目を読み出すことを要求すると、この処理は、経路35を介してスレーブ・デバイス40にアドレスを送る1サイクルと、経路35を介して戻されるデータに対する第2のクロックサイクルと2サイクルを必要とする。図3に示すシステムのレジスタ・スライスは、アドレス経路とデータ経路の両方で使用され、この同じ処理に4クロックサイクルが必要である。すなわち、経路70を介してレジスタ・スライス50にアドレスを報知するマスタ・デバイス30のための1サイクル、経路75を介してスレーブ・デバイス40にアドレスを転送する第2のサイクル、データを発生し、そのデータを経路80を介してレジスタ・スライス60に出力するスレーブのための第3のサイクル、および経路85を介してマスタ・デバイス30に送り返されるデータのための第4のサイクルである。したがって、このような転送を実行するためにこのような時間を減らすため、レジスタ・スライスは、クロック周波数を100%以上、上昇させることを可能にしなければならない。
しかし、その代わりとして転送が8つのデータ項目のバーストを指定したとすれば、図2のシステムでは、このことは、経路35を介してアドレスを発行する1サイクルと、経路45を介して8個のデータを受信する8サイクルの、全部で9サイクルを必要とすることは明白である。図3のシステムにおける同じ処理は、11個のサイクル、すなわち、経路70、75を介してアドレスを発行する2サイクルと経路80、85を介してデータを受信する9サイクルを必要とする。このシナリオにおけるレジスタ・スライスは、必要とする時間を減らすためにクロック周波数を22%以上、上昇させる必要があるにすぎない。
上記考察は、伝統的にレジスタ・スライス、またはパイプライン型手法が今日まで使用されてきた場合の簡単なポイント・ツー・ポイント接続に注目してきた。しかし、すべてのシステムがこのような簡単なポイント・ツー・ポイント接続を採用するとは限らない。
たとえば、図4は、パーソナル・オーガナイザ、移動電話機、テレビ用セットトップボックスなどのようなシステム・オン・チップ(System-on-Chip:SoC)の形をしたデータ処理装置を示している。SoC設計100には、バスの配置によって相互接続された複数の構成要素120、130、140、160、170、180がある。これらのバスの実際の相互接続は、相互接続ブロック150の中で指定される。相互接続ブロック150は、複数のバス・マスタ・デバイスとバス・スレーブ・デバイスを相互接続する接続のマトリックスを含む。したがって、各種バスを相互接続する相互接続ブロック150によって、各マスタ・デバイス120、130、140は、それぞれ対応するバス125、135、145に接続され、各スレーブ・デバイス160、170、180も、それぞれ対応するバス165、175、185に接続されうる。
各種要素を相互接続するバスは、指定されたバスプロトコルによって動作するのが普通であるから、たとえば、ARM社によって開発された「高度マイクロコントローラ・バス・アーキテクチャ」(Advanced Microcontroller Bus Architecture:AMBA)にしたがって動作することができる。
したがって、相互接続ブロック150が、各種マスタ・デバイスとスレーブ・デバイス間の相互接続の複雑な配列を説明することは理解されるであろう。この複雑な配列は、情報のいくつかの一方向チャネルを含む。図5を参照して次に説明する1つの実施例によれば、タイミング特性の改善、電力消費特性の低減などのようなバス相互接続に選ばれた特性の要求に一致することを追求するため、相互接続ブロックの中でレジスタ・スライスを選択的に配置する方法論とツールが提供されている。
図5は、これらの間に相互接続ブロックがある2つのマスタ・システムと4つのスレーブ・システムを示している。図5の相互接続ブロックは、易しく示すために簡単にしてあるが、代表的な実施例における相互接続ブロックは、図5に示す配列よりもかなり複雑であることは理解されるであろう。図5から判るように、マスタ1 200またはマスタ2 210が4個のスレーブ・デバイス220、230、240、250のどれとでも接続できるように、バス相互接続ブロックによっていくつかの経路が与えられる。マスタ・デバイスによって転送要求が発行されると、通常、スレーブ・デバイスへのアクセスがどのマスタに許可されるべきかを決定するためアービタが使用され、そのアービタはマルチプレクサ260に制御信号を送って、どの転送要求がスレーブ・デバイスに対して出力されるかを制御する。簡単にするため、図5にはアドレスバスだけが示されているが、マスタ・デバイスとスレーブ・デバイスの間に双方向のデータ経路が与えられていることは理解されるであろう。
輪郭が点線になっているボックス205、215、225、235、245、255および265は、レジスタ・スライス用の潜在的な場所を示している。場所265はすべてのマスタ・デバイスとスレーブ・デバイスの間の経路を中断しているから、共通の場所であることが判る。この場所のレジスタ・スライスは、レジスタの後にバスレベルマルチプレクサ260の組み合わせ的遅れを効果的に置く。1つの実施例における処理は、場所265のような潜在的な場所を識別するために実行され、これらの場所にレジスタ・スライスを追加することが適切か否かを決定する。この方法は、マルチプレクサ260を通過する経路のような組み合わせ論理を組み込んだこれら経路を、1つまたは複数の候補経路として選択することを含む。このような候補経路がマスタとスレーブの間の接続の全体、または、たぶんその接続の一部を形成することは理解されるであろう。
候補経路が選択されてしまうと、組み合わせ論理によって信号を処理するためにかかる時間が所定の閾値を超えるか否かが決定される。特定のクロックサイクルで、組み合わせ論理によって処理される信号は、記憶素子から組み合わせ論理に送られ、組み合わせ論理によって処理された後、出力信号が他の記憶素子に送られることが必要であることは理解されるであろう。したがって、組み合わせ論理の時間は、必要な処理機能を実行するために使用可能なクロックサイクル周期のある一部分であるにすぎないことは明白であるから、その組み合わせ論理によって信号を処理するためにかかる時間が、使用可能な時間を超過するか、超過しそうであるか否かに関する決定を実行することができる。イエスであれば、その候補経路の部分経路の数を増加するために、候補経路の中に記憶素子を挿入するように処理を調整する。この処理は、たとえば、RTL定義段階のような設計段階中の何らかの適切な段階、で実行されうる。
バス相互接続ブロックの中の他の場所でレジスタ・スライスを使用することは、タイミング特性を改善することに役立つ。たとえば、相互接続ブロック内に用意されている記憶素子のどれかと、マスタ2 210との間の経路のような経路を候補経路として選択し、該経路を介してバス相互接続ブロックがマスタ・デバイスまたはスレーブ・デバイスから信号を受信するように処理を実行してもよい。つぎに信号を受信するために要するセットアップ時間が、所定の閾値を超過するか否かを決定することができる。マスタ・デバイスまたはスレーブ・デバイスが信号を有効に立ち上げるために、或る量のクロックサイクルが必要であり、このためにバス相互接続ブロックによる信号の受信に使用される使用可能なクロック周期の一部分だけが残ることは理解されるであろう。信号を受信するために要するセットアップ時間が使用可能な時間を超過する場合、処理を調整して候補経路にレジスタ・スライスを挿入することができるので、たとえば、場所215にレジスタ・スライスを導入することを決定することができる。場所215のレジスタ・スライスは、何らかの大きな出力遅れをマスタ2 210から隠すであろう。
それだけでなく、たとえば、相互接続ブロック内に用意されている記憶素子のどれかと、スレーブ・デバイス4 250との間の経路のような経路を候補経路として選択し、該経路を介して、バス相互接続ブロックがマスタ・デバイスまたはスレーブ・デバイスに対して信号を出力するように処理を調整してもよい。バス相互接続ブロックがマスタ・デバイスまたはスレーブ・デバイスに対して信号を出力する経路、たとえば、相互接続ブロックの中の内部記憶素子のどれかとスレーブ・デバイス4 250との間の経路のような経路を候補経路として選択することができる。つぎに処理を調整して、その候補経路に対してバス相互接続ブロックから有効な信号を出力するためにかかる時間が所定の閾値を超過するか否かを決定することができる。そのときこれらの信号を有効に受信している受信装置に対して十分な時間を残すために、出力信号を有効に立ち上げるクロック周期の一部分だけが相互接続ブロックに対して使用可能であることは理解されるであろう。したがって、有効信号を出力するためにかかる時間が使用可能な時間を超過することが決定されると、この処理を調整して候補経路の中にレジスタ・スライスを挿入し、その候補経路の中の部分経路の数を増加させることができる。したがって、一例として、この処理は、スレーブ・デバイス4 250の大きな入力セットアップ時間を隠すために場所255にレジスタ・スライスを挿入することを決定することができる。
特定のマスタ・デバイスまたはスレーブ・デバイスを備えたインタフェースに対してローカルにレジスタ・スライスを配置する利点は、すべてのアクセスに対して必要なサイクル数に大きな影響を与えないことである。たとえば、マスタ・デバイス2 210に関連して場所215にレジスタ・スライスを配置すれば、この配置は、スレーブ・デバイス220、230、240または250のどれかにアクセスするためにマスタ・デバイス1 200によって必要とされるサイクル数にまったく影響を与えない。さらにマスタ・デバイス1 200がバスのトラヒックの大部分、たとえば90%を担当しているとすれば、場所215のレジスタ・スライスは全システムのクロック周波数を10%以上上昇させて、アドレスを発行する総合速度に利点を生じることが必要であるにすぎない。
上に説明した手法によれば、レジスタの場所のいかなる組み合わせも適切であると思われるので、たとえは、レジスタ・スライスを場所205、265、235、および255に配置してもよい。
個々のマスタ・デバイスまたはスレーブ・デバイスが相互接続ブロックの中でレジスタ・スライスを使用することから得る利点の例は、次の通りである。
1.マスタまたはスレーブ構成要素の設計が、入力経路または出力経路で組み合わせ論理を含んでいる場合。
2.マスタ・デバイスまたはスレーブ・デバイスが、バスの他の構成要素から遠い距離に物理的に配置されている場合。
3.マスタ・デバイスまたはスレーブ・デバイスが異なる電力領域で動作中であり、デバイスとシステムの残り部分との間に電圧レベル・シフターが必要な場合。
4.マスタ・デバイスまたはスレーブ・デバイスが、出力デバイスの能力が固定された「ハードウエア化された」構成要素として供給される場合。
5.マスタまたはスレーブ構成要素が、クロックツリーの異なる分岐に配置され、クロック配分のアンバランスが、その構成要素の出力された有効時間または入力されたセットアップ時間(the output valid or input setup time of that component)を効率的に増加している場合。
バス相互接続ブロック内でレジスタ・スライスを使用する考えのさらなる拡張は、レジスタ・スライスのレイアウト段階の最適化を実行することである。1つの実施例では、このことは初期設計の中で、設計のレイアウト段階中に除去の候補となるいくつかの仮(provisional)レジスタ・スライスを含めることによって達成されるのであるが、これらのレジスタ・スライスを除去してもシステムのクロック周波数が所要速度に到達することを防止しないと決定されると、これらのレジスタ・スライスは除去される。
図6は、レイアウト段階で実行されるとともに、レイアウトツールで実行される処理を示している。
ステップ300で、レイアウトツールを使用し、設計処理の初期段階、たとえば、RTL段階で含まれる仮レジスタ・スライスを含めて現在のレイアウトが生成される。nMAXが、除去すると考慮(considered for removal)されている仮レジスタ・スライスの全数を表す場合、各仮レジスタ・スライスには、1からnMAXまでの関連番号が与えられる。この番号nMAXは、仮レジスタ・スライスの全数、またはその全数の何らかの部分集合を含むことができることは理解されるであろう。ステップ305で、nは1に設定された後、処理はステップ310に進み、試作レイアウトを作るために、ここでレジスタ・スライスnが除去される。
次にステップ315で、レジスタ・スライスnを除去した結果生じた新しい各部分経路に対して、クロックサイクル周期より短いかクロックサイクル周期に等しい時間でこの部分経路を信号が伝搬するか否かを決定するため、レジスタ・スライスnの周囲の経路でタイミング解析が実行される。本明細書ではこのクロックサイクル周期をTMAXと呼称する。部分経路でタイミング解析を実行するいくつかの既知の手法が存在しており、普通、このような処理は、識別した各部分経路でゲートによる遅れと配線遅れと配線による遅れ(wire delay)を計算し、対応する部分経路を介して信号が転送されることを決定することを含むことは理解されるであろう。
この後ステップ320で、レジスタ・スライスnの周囲のこれらの経路のタイミングがすべて、TMAXより小さいか、TMAXに等しいか否か決定され、イエスであれば、ステップ325で試作レイアウトが、新しい現在のレイアウトとして採用される。これ以外の場合、処理はステップ330に分岐し、ここで試作レイアウトが廃棄されその代わりに既存の現レイアウトが使用される。
次に処理はブロック325またはブロック330からブロック340に進み、ここでnがnMAXに等しいか否か決定され、イエスであれば、すべてのレジスタ・スライスを除去すると考えられていることを示しているので、処理はステップ345で終了する。しかし、nがnMAXに等しくなければ、ステップ350でnを1だけ増分した後、処理はステップ310に戻り、次のレジスタ・スライスの除去を考慮する。
各仮レジスタ・スライスに1とnMAXの間の番号を付与する方法は、いろいろな方法で調整され、たとえば、(たとえば、各種既存部分経路のタイミング情報に基づいて)除去される可能性が最も高い仮レジスタ・スライスが最初に考慮される。代替方法として、高帯域幅のマスタ・デバイスに関連するレジスタ・スライスを最初に除去すると考慮されるように、レジスタ・スライスに番号を付与することを決定してもよい。
図7A、7Bは、このような仮レジスタ・スライスの除去を実行する代替可能な処理を示しており、ここではいくつかのステップが平行して実行される。より詳細には、ステップ400で仮レジスタ・スライスを含む現レイアウトが生成され、その後、ステップ405で除去すると考慮されるnMAX個のレジスタ・スライスが選択されることは理解されるであろう。この番号nMAXは、仮レジスタ・スライスの全数または部分集合を含むことができることは理解されるであろう。たとえば、いくつかの候補経路は、該経路に沿って与えられ候補経路を複数の部分経路に分割する複数の仮レジスタ・スライスを有し、この処理の同じ繰り返し中に、これらの仮レジスタ・スライスのすべてを除去することを考えることは適切ではないであろう。
図7A、7Bの次の説明から、この実施例が繰り返し処理となるように意図されているので、nMAXの選択は、図6の実施例で実行されたnMAXの選択とはたぶん異なっていることは理解されるであろう。図6の実施例では、設計における各仮レジスタ・スライスには独自の番号が付与されると予見されたので、nMAXは、除去すると考慮された仮レジスタ・スライスの全数に等しく選択された。しかし、図7A、7Bにおける仮レジスタ・スライスのグループは、処理の異なる繰り返しの中にあると考慮することができるので、どの特定の繰り返しの中でも、nMAXは、その繰り返しの中で除去すると考慮されている仮レジスタ・スライスの全数に選ばれる。さらに仮レジスタ・スライスに割り当てられた番号はユニークではないが、その代わり、その繰り返しの中で考慮されているレジスタ・スライスは、1からnMAXの番号が割り当てられる。しかし、代替可能な実施例におけるユニークな番号は依然として全仮レジスタ・スライスに割り当てられ、特定のグループのレジスタ・スライスが各繰り返しで考慮されるように各繰り返しではnMIN値とnMAX値の両方が存在している。
ステップ405でレジスタ・スライスの番号nMAXが選択されていると、ステップ410でテストが実行され、nMAXがゼロに等しいか否かを決定する。普通、これは、図7A、7Bを通じて最初の繰り返し中のケースではないが、何らかの後続繰り返しの中のステップ405で現実に除去される仮レジスタ・スライスがもはや皆無であると決定されると、最終的に起こるケースにある。ステップ410でnMAXがゼロであると決定されると、処理はステップ415に進み、ここで、1クロックサイクル以内に信号が部分経路を横断することができる部分経路は存在しないことを保証するために、バス相互接続ブロックの経路のタイミングで最終のダブルチェックが実行される。これはそのケースであってはならない。何故ならば、当初、信号はクロックサイクルの周期を超過することなく、すべての部分経路を横断することができたからであり、図7A、7Bの処理を使用してレジスタ・スライスが除去されるたびに、影響を受ける部分経路でチェックが実行されるからである。設計で他の部分経路は影響されないのが普通である。何故ならば、レジスタ・スライスの除去には、残りの設計のレイアウトに、いかなる修正も含まれないからである。しかし、ステップ415でダブルチェックが実行されることによって現れるいかなるタイミングの問題も識別することができる。
MAXがゼロに等しくないと仮定すると、処理はステップ420に進み、ここでnは1に等しく設定された後、ステップ425でレジスタ・スライスnが設計から除去される。
この後ステップ430で、nがnMAXに等しいか否か決定され、ノーであれば、ステップ435でnが1だけ増分された後、次のレジスタ・スライスnがステップ425で除去される。
ステップ430でnがnMAXに等しいと決定されると、処理はステップ440に進み、ここで再びnが1に等しく設定された後、ステップ445でレジスタ・スライスnの周囲の経路でタイミング解析が実行される。この処理は、図6を参照して前に説明した処理315に似ている。この後で処理はステップ460に進み、ここでレジスタ・スライスnの周囲の経路のタイミングがTMAXより小さいかTMAXに等しいこと、つまり、信号が1クロックサイクルですべての影響を受けた部分経路を横断することができるか否か決定される。この処理は、図6を参照して前に説明した処理320に似ている。新しいタイミングのすべてがTMAXより小さいと仮定すると、処理はステップ470に進み、ここでレジスタ・スライスnを除去するとして予定に入れる。次に処理はステップ480に進み、影響を受けた部分経路のすべてのタイミングがTMAXより小さいとは限らない場合は、ステップ460からステップ480に直接進み、ステップ480でnがnMAXに等しいか否か決定される。ノーであれば、ステップ485でnが1だけ増分された後、処理はステップ445に戻る。
nがnMAXに等しいと決定されると、処理はステップ490に進み、ここで再びnが1に等しく設定された後、ステップ495でレジスタ・スライスnを除去する必要があるか否か決定される。このことは、スケジュールをつくるステップ470で格納された情報によって示されている。レジスタ・スライスnが除去されると、そのレジスタ・スライスはステップ500で除去されて、改訂されたレイアウトを生成し、その後でその改訂されたレイアウトはステップ505で新しい現用レイアウトになる。次に処理はステップ510に進むか、またはレジスタ・スライスnが除去されないと決定された場合はステップ510からステップ495に直接進む。ステップ510でnがnMAXに等しいか否か決定され、ノーであれば、ステップ515でnが1だけ増分された後、処理はステップ495に戻る。ステップ510でnがnMAX等しいと決定されると、処理はステップ405に戻り、処理の他の繰り返しで考慮される何らかの残りの仮レジスタ・スライスを選択が実行される。前述の通り、或る繰り返しで次の繰り返しのnMAXがゼロであると決定されると処理は終了し、ステップ415でバス相互接続ブロックのタイミングがダブルチェックされる。
上で説明した、設計の中で既に与えられている仮レジスタ・スライスを除去する方法には利点がある。何故ならば、上記方法は、空間が多く最適とはいえないレイアウトが得られるにすぎない結果となる設計の他の領域に混乱を与えることを必要とせずにレジスタ・スライスを除去できるからである。それだけでなく、レジスタ・スライスを除去するこの方法は、相互接続の性能として最悪ケースのモデルを仮定して、システムの性能に関する重要な解析を実施するこを可能にするとともに、この方法がシステム性能の総合特性の改善になるだけのはずであるということが判っているので、どのレジスタ・スライスを除去しても安全である。しかし、設計の中で仮レジスタ・スライスを追加するためと、これらのレジスタ・スライスをレイアウト段階中に除去することを追求するための代替方法として、レイアウト段階で処理を実行し、新しいレジスタ・スライスを導入すべきか否かを決定することが可能である。図8の流れ図を参照し、例を示してこのような処理を説明する。
ステップ600で、現在の設計に基づき現用レイアウトが生成される。次にステップ605でどの経路が許容不能であるか否か、つまり、信号がこれらの部分経路を横断するためにかかる時間がクロックサイクル周期TMAXより大きい部分経路がどの経路に含まれているか否か決定される、ノーであれば、訂正処置は不要であり、処理はステップ610で終了する。しかし、許容不能経路が存在していることが想定されると、処理はステップ615に進み、ここで選んだ基準が適用され許容不能経路を選択する。この処理を実行する方法がいくつかあることは理解されるであろう。たとえば、タイミングが最も長い、つまり、最も受け入れがたい許容不能経路を選択してもよいし、代替方法としてこの選択をランダムに実施してもよい。
この後で、処理はステップ620に進み、ここで経路にレジスタ・スライスが追加され試作レイアウトを生成した後、ステップ625でタイミング解析が実行され、相互接続ブロックの中に容認不能経路がいまも存在しているか否か決定する。ステップ615で選択された容認不能経路の中にレジスタ・スライスを追加することは、その経路のタイミング特性を改善することは明白であるが、その経路は依然として容認不能な経路である。さらにシステムの中には他の容認不能経路がたぶん存在しており、事実、レイアウト設計に付随する動きによって、このようなレジスタ・スライスを導入すると、いくつかの経路のタイミングに不都合な連鎖反応(knock-on adverse effect)が生じる可能性がある。ステップ625で相互接続ブロックの中に容認不能経路が1つも残っていないことが決定されると、処理はステップ630で終了するが、それ以外の場合、処理はステップ635に進み、ここで所定の基準が適用され、現用レイアウトに優先して試作レイアウトを受け入れるか否か決定する。いくつかの基準を使用してこの決定が実行されることは理解されるであろう。たとえば、試作レイアウトの中の最長容認不能経路(つまり、タイミングが最長の経路)のタイミングが、現用レイアウトの中の最長容認不能経路よりも小さい場合、試作レイアウトを受け入れると決定してもよい。代替方法として、またはそれに加えて、現用レイアウトの中の容認不能経路の総数に比較して試作レイアウトの中の容認不能経路の総数を検討してもよい。現用レイアウトと比較して試作レイアウトのタイミング特性が改善されているか否かを決定する場合、他の各種基準を検討してもよいことは理解されるであろう。
ステップ635で所定の基準を適用したことの次に、ステップ640で、所定の基準の適用の結果得られた決定に基づいて試作レイアウトを受け入れるか否か決定される。試作レイアウトを受け入れるべき場合、処理はステップ645に進み、ここで試作レイアウトが現用レイアウトになった後、処理はステップ615に戻って、さらなる容認不能経路を選択する。ステップ640で試作レイアウトを受け入れるべきではないと決定されると、処理はステップ650に分岐し、ここで試作レイアウトが廃棄され、かわりに以前の現用レイアウトが使用された後、処理はステップ615に進み異なる容認不能経路を選択する。ステップ615で適用された選んだ基準は、以前に選択されたが、バス相互接続ブロック全体のタイミング特性を改善しないと考えられる容認不能経路の記録をとっておくのが普通であることは理解されるであろう。
設計の中でレジスタ・スライスを追加する場合、レイアウトを修正してレジスタ・スライスを挿入する余地をつくらなければならないので、レジスタ・スライスを挿入すると、そのときレジスタ・スライスを選択的に除去した図6、7の代替的方法を使用していた設計の他の領域で連鎖反応が生じる可能性が大きいことは理解されるであろう。それにもかかわらず、どんな特定の実施例でも2つの方法を使用することができることは理解されるであろう。たとえば、設計のときに仮レジスタ・スライスを与え、後でこれらのレジスタ・スライスを選択的に除去する方法は、そのとき、必要なタイミング特性に合致するために必要と思われる何らかのレジスタ・スライスを選択的に挿入するために使用される図8の処理とともに、基本処理として使用されうる。
バス相互接続ブロックの中でレジスタ・スライスを使用する他の可能性は、システムの中のいくつかのマスタおよびスレーブ構成要素を分離することである。どの時点でどのマスタ・デバイスがスレーブ・デバイスにアクセスできるようにするかを制御するために使用されるマルチプレクサ720とともに、4個のスレーブ・デバイス730、740、750、760と相互接続される2つのマスタ・デバイス700、710を示す図9を参照して、この可能性をさらに考察する。ここでも判りやすくするため、図9にはアドレス経路だけが示されている。電力消費を改善することを追求するため、或る経路を候補経路として選択し、該経路を介してバス相互接続ブロックがマスタ・デバイスとスレーブ・デバイスのインタフェースをとることを含む処理を実行してもよい。つぎに所定の基準を適用し、その候補経路の中のレジスタ・スライスの存在(provision)によって関連するマスタ・デバイスまたはスレーブ・デバイスを他の構成要素から分離することが適切であるか否かを決定する。このステップでいくつかの基準を使用できることは理解されるであろう。通常、その経路に接続されたマスタ・デバイスまたはスレーブ・デバイスの数が多くなればなるほど、これらのマスタ・デバイスまたはスレーブ・デバイスによって使用される相互接続ブロックの帯域幅が小さくなって、電力消費のより大幅な節約が達成される。
一例として、図9のシステムを検討すると、システムの帯域幅の大部分はスレーブ・デバイス1 730に対するものであることが判る。次に、スレーブ・デバイス740、750および760に与えられた経路にレジスタ・スライス770を挿入することは利点があると考えられる。マスタ・デバイスから転送要求が発信されると、その転送要求は、マルチプレクサ720を介してスレーブ・デバイス1 730とレジスタ・スライス770の双方に接続される。バス相互接続ブロックの中の復号器によって何らかの初期アドレスの復号が実行され、その要求が、スレーブ・デバイス1またはスレーブ・デバイス2,3および4の1つに行くことになっているか否かを決定する。アクセス要求がスレーブ・デバイス2,3および4の1つに行くことになっている場合にのみ、レジスタ・スライス770はアドレスの有効信号(address valid signal)を受信して、受信した信号をレジスタ・スライスの中に格納する原因となる。したがって、レジスタ・スライスがなければ、その転送要求は、アドレス有効信号を受信するスレーブ・デバイスの1つがある4個のスレーブ・デバイスのすべてに対して伝搬してしまうであろうが、レジスタ・スライス770が存在すると、これらのスレーブ・デバイスの1つがアクセス要求の意図した受け手でない限り、スレーブ・デバイス2,3または4に対するアクセスをすべて回避することによって、電力消費が大幅に減少した。この利点の代償(trade-off)は、スレーブ・デバイス2,3または4にアクセスするためにより多くのクロックサイクルが必要なことであるが、これらのスレーブ・デバイスは比較的まれにアクセスされると仮定すると、電力節減の利点は、レジスタ・スライス770の存在を正当化することができることは理解されるであろう。
これまでに考察してきた実施例のすべては、設計の中でレジスタ・スライスを含めるか含めないかを設計時点で決定する手法に関連している。このような手法は、予見される(たとえば、動作条件、動作環境などの)動作特性の最悪ケースのセットを検討した設計をする場合に役立つが、その設計の通りにつくられた装置の1台1台は異なる動作条件で使われるとともに、異なる動作環境に置かれるので、装置は最適状態以下で使用されることになる。たとえば、特定のどの実施例における装置も、設計中に検討された目標クロック速度よりも遅いクロック速度で動作し、設計中に検討された電圧レベルとは異なる電圧レベルで使用される等々である。その上、製造公差は設計の通りにつくられた装置の1台1台の間の差異となり、このため各装置の動作環境と同様、動作特性の変動を発生させる。
このような異なる動作条件と動作特性にデータ処理装置が適応できるようにするため、1つの実施例におけるデータ処理装置は、図10に示すような、1つまたは複数の選択可能レジスタ・スライスを含む。図10から判るように、このような各選択可能レジスタ・スライス800には、選択可能レジスタ・スライス800を通る経路、または迂回経路810のいずれかの選択を可能にするために用意されているマルチプレクサ820とともに、迂回経路810が付随している。マルチプレクサ820は、セットアップ情報に基づき、選択可能レジスタ・スライス800または該レジスタ・スライスに付随する迂回経路810のいずれかの選択を制御するコントローラにより、コントローラから供給されるイネーブル信号によって駆動され、選択可能レジスタ・スライス800を使用すべきか否かについて、実行時に動的に決定することを可能にする。
レジスタ・スライス800を迂回することにより、信号が特定の接続を横断するために要するクロックサイクルの数を減らすことができるが、このことは、特定のクロックサイクル中に信号がさらに遠くまで横断することを必要とする。1つの動作モードにおけるデータ処理装置は、たとえば、リセットの後で各選択可能レジスタ・スライスを使用する初期設定になる。何故ならば、このことは、データ処理装置があらゆる条件で機能的に動作できることが保証されると、データ処理装置は、コントローラの制御のもとに動作を迂回モードへ切り替えて、その場合の動作条件が迂回モードの使用を可能にすると決定されると、選択可能レジスタ・スライス800は選択的に迂回されるからである。
図11は、データ処理装置がバス相互接続ブロックである状態における選択可能レジスタ・スライスの手法の代表的な実施例を示している。図11に示すように、2つのマスタ・デバイス830、840は、バス相互接続ブロックを介してそれぞれ4つのスレーブ・デバイス860、870、880、890と相互接続されている。基本的構造は、図5を参照して以前に説明した構造と同じであり、図5と同様、判りやすくするためにアドレス経路だけが示されている。しかしこの例では、選択可能レジスタ・スライス、835、845、855、865、875、885および895は、各マスタ・デバイスとスレーブ・デバイスに対するインタフェースとマルチプレクサ850の出力とに関連するバス相互接続ブロックの中に組み込まれている。コントローラ825は各選択可能レジスタ・スライスの一部を形成するマルチプレクサに対して必要な制御信号を発生するために用意されている。
選択可能レジスタ・スライスのすべてが使用されているので、信号がマスタ・デバイスからスレーブ・デバイスまで伝搬するために4クロックサイクル要することが図11から判る。しかし、一例として、コントローラによって使用されるセットアップ情報に基づいて、スレーブ・デバイス880に付随するレジスタ・スライス885を迂回できることが決定されると、これによってスレーブ・デバイス880に対するアクセスにかかる時間が1サイクルだけ少なくなる。同様に、マスタ・デバイス830に付随する選択可能レジスタ・スライス835を迂回できることをセットアップ情報が示していると、これによってそのスレーブ・デバイスからスレーブ・デバイスに転送要求を送るためにかかる時間が1サイクルだけ少なくなる。さらに選択可能レジスタ・スライス855を迂回できることをセットアップ情報が示していると、これによってスレーブ・デバイスからスレーブ・デバイスにあらゆる転送要求を送るためにかかる時間が、1サイクルだけ少なくなる。
図11に示すアドレス経路に加えて、マスタ・デバイスとスレーブ・デバイスの間に、上に説明したように両方向のデータ経路が用意されており、上に説明したような選択可能レジスタ・スライスがデータ経路に挿入されると、マスタ・デバイスからスレーブ・デバイスまで、またはスレーブ・デバイスからマスタ・デバイスまでの特定の接続の中の部分経路の数を変更できることは理解されるであろう。
したがって、このような設計により、実際の動作条件を検討してデータ処理装置の動作効率の改善を追求するために、生産後の装置に大幅なフレキシビリティが使用できることが判るであろう。
コントローラ825によるレジスタ・スライスの制御について、採用することができるいくつかの異なる方法がある。第1の実施例では、所定のセットアップ情報を使用するコントローラによって起動時のレジスタ・スライスの構成を実行することができる。この実施例におけるデータ処理装置、図11の例の中のバス相互接続ブロックは、その装置を使用する特定の実施例に注意して必要なレジスタ・スライスだけを含むように起動時に構成される。この所定のセットアップ情報は、各種実施例、たとえば、研究所の中の環境で特徴付けされたような(laboratory characterisation environment)実施例に対して決定されているのが普通である。したがって、図11の例を考えると、バス相互接続ブロックが移動電話機の中にあるシステムで使用され、比較的低クロック速度または比較的停電力で走行するとすれば、所定のセットアップ情報をその実施に対して使用することができ、起動時にコントローラを使用して選択すべき適切なレジスタ・スライスと、どのレジスタ・スライスを迂回すべきかを決定することができる。代替方法として、高速のクロック速度と大電力、またはそのいずれかで動作するコンピュータの中で実施されるシステムの中で同じバス相互接続ブロックが使用されることになっていると、選択可能レジスタ・スライスの適切な選択を決定するため、コントローラは、起動時に異なるセットの所定のセットアップ情報を参照することができる。
第2の実施例では、起動時にレジスタ・スライスの構成を再度実行することができるが、適切なセットアップ情報を決定するため実行する動的テストと一緒に実行される。この方法によれば、どの経路がレジスタ・スライスの使用を必要とするかを決定するために実行するテスト処理を起動シーケンスに含めることができる。普通、このテスト処理には、選択可能レジスタ・スライスを挿入するか除去するかによって影響を受ける経路を介して送られる各種信号の、タイミングテストの性能が含まれる。一例として図11を考えると、このテスト処理には、各種選択可能レジスタ・スライスのいくつかの異なる選択構成(たとえば、全レジスタ・スライスを選択する、いくつかのレジスタ・スライスを選択する、いくつかのレジスタ・スライスを迂回する、またはすべてのレジスタ・スライスを迂回する等々)を採用することと、選択構成ごとに、特定のレジスタ・スライスを迂回することによって影響を受ける経路を介して各種信号を送り、これらの信号が1クロックサイクル以内に影響を受けた部分経路を安全に横断することができるか否かを決定することを含むのが普通である。各選択構成は、データ処理装置のユニークな設計を効率的に定義し、特定の設計に関連するタイミングテストの性能は当業者によってよく理解されるであろうから、ここでさらに詳細に考察することはしない。テスト信号がそのレジスタ・スライスの迂回から生じる拡張された部分経路を1サイクル以内で横断できることをタイミングテストが確認すると、どの選択可能レジスタ・スライスも迂回できるにすぎないことは理解されるであろう。
動的テスト方法を使用する利点は、この方法によって各装置が、その動作環境に適応できるようになることである。しかし、1つの潜在的欠点は、動作温度や供給電圧のような動作特性の小さな変化でも機能的障害を発生させることができることである。しかし、これが発生する可能性は、テスト手続きを実行する場合にこのような変動を考慮することによって少なくなりうる。たとえば、データ処理装置が特定のクロック速度で動作することになっていると、テスト手続きを実行する場合、若干速くしたクロック速度を使用してもよいので、テスト手続きに合格したレジスタ・スライスの特定の構成が選択された場合、温度変化に起因するような動作特性の小変化によって生じる変動では機能的障害を発生しないと確信できるであろう。
たとえば、データ処理装置の製造前のタイミング特性の中に不確定性が存在する場合や、データ処理装置の信号完全性特性の中に不確定性が存在する場合のように、いくつかの異なるケースで、起動時の構成が適用可能なことは理解されるであろう。
第3の実施例では、第1の実施例を参照して以前に考察したように、所定のセットアップ情報を使用することができるが、動作条件が変化すると構成を動的に実行することができる。たとえば、各種クロック速度、各種供給電圧などに対して、異なる所定のセットアップを定義することができる。つぎに動作中に動作条件の変化が起こることになっていると、たとえば、正規の動作モードからスタンバイ動作モードに変化すると、コントローラを動的に呼び出し、新しい動作条件に適切な選択可能レジスタ・スライスだけを選択するために、新しい動作条件に適切な所定のセットアップ情報を適用する。この処理は、動作条件の変化がクロック速度の変化を含む場合の例を示す図12の流れ図によって模式的に示されている。
ステップ900でクロック速度の変化が必要か否かが決定され、イエスであれば、処理はステップ905に進み、ここでクロック速度が上昇しているか低下しているかが決定される。クロック速度が上昇していると、処理はステップ910に進み、ここでレジスタ・スライスコントローラ825が新しいクロック速度に適した新しい値でプログラムされる。これらの新しい値は、新しいクロック速度に適した所定のセットアップ情報から取り出される。これによって、コントローラが各種選択可能レジスタ・スライスに改訂したセットのイネーブル信号を出力し、これらの値に依存して各レジスタ・スライスを選択するか、迂回する。この後ステップ915で、クロック速度を新しいクロック速度に変更する。
クロック速度が上昇している時、クロック速度の変化に先立ち、レジスタ・スライスの選択を実行することが適切なことは明らかである。それ以外の場合はその間に機能的障害が発生するからである。しかし、クロック速度が低下している時、処理はステップ905からステップ920に分岐し、ここで第1にクロック速度が新しいクロック速度に変更される。いかなるクロック速度の低下も、信号が各部分経路を横断するために利用可能な時間を増やすので、この点でいかなる機能的障害にもならないから、クロック速度のこの変更を第1に実行することは安全である。この後ステップ925で、新しいクロック速度に用意された適切な所定のセットアップ情報から決定される新しいクロック速度に適した新しい値で、コントローラ825をプログラムすることができる。前に考察したように、これらの値は、改訂したイネーブル信号のセットになり選択可能レジスタ・スライスに送られると、これらの値によって定義されるとおり各レジスタ・スライスを選択するか、迂回する。
次に処理はステップ900に戻り、後に続くクロック速度の変化の検出を待つ。
図12は、クロック速度の変化について示しているが、同様なシーケンスの流れは、たとえば、供給電圧の変化のような他の動作条件の変化に対しても実行されうる。供給電圧が変化していれば、ステップ905に相当して実行する適切な決定は、供給電圧が低下しているか否かに関する決定であることは理解されるであろう。供給電圧が低下していると、これによって信号が特定の接続を横断する速度が遅くなるので、電圧が変化する前に新しい値でコントローラ825をプログラムしない限り、機能的障害が発生する可能性があることになる。
第4の実施例では、第2の実施例を参照して以前に説明したように、セットアップ情報を決定するため動的テスト手続きが実行されるが、この場合、動的テストは起動時にちょうど実行されるのではなく、動作条件が変化する場合と、動作条件を変更することになっている場合に動的に実行される。この方法の利点は、各装置が自装置の動作環境に適応できるようにするとともに、さらに異なる動作条件ごとに適切なセットアップを使用することを保証するため、動作条件の各種変化に注意することである。動的テスト手続きを使用して、このような動的構成を可能にするように実行することができる処理の例を、図13を参照してさらに考察する。
起動時に、あるいはクロック速度、供給電圧などのような動作条件の変更が要求されると、いつでも図13のテスト手続きが採用される。ステップ930でテスト手続きが開始すると、その後のステップ935で、すべての選択可能レジスタ・スライスに対して迂回経路がオフに切り替えられる。したがって、このため第1の繰り返しで構成はテスト手続きに合格することが保証される。何故ならば、選択可能レジスタ・スライスは設計の中で含まれており、たとえば、最高のクロック速度/最低の供給電圧の組み合わせのような信号タイミングに対して最悪の場合のシナリオが考慮されているからである。
ステップ940で変数nを1に等しく設定した後、ステップ945でレジスタ・スライスnの迂回経路をオンに切り替える。迂回することをテストすることが決まっている候補であるレジスタ・スライスの全数があり、ここではnMAXと呼ぶことにするが、このような各レジスタ・スライスの値は、nのユニークな値である。各レジスタ・スライスに付随するnの値は勝手に決めても良く、あるいは代替方法として、nが最低値のレジスタ・スライスが迂回の候補になる可能性が最も高いように選ぶことができることは理解されるであろう。
この後のステップ950で、レジスタ・スライスnの迂回経路を通過するすべての接続がタイミングテストを受ける。前に考察したように、普通、これには、これらの接続を介していろいろな信号を送信し、これらの信号が、1クロックサイクル以内に影響を受けた部分経路を安全に横断できる否かを決定することが含まれる。ステップ955で、すべての接続がテスト手続きに合格するか否か、つまり、すべての信号が1クロックサイクルで必要な部分経路を横断したか否かが決定される。イエスであれば、処理はステップ965に進み、ここでnがnMAXに等しいか否かが決定される。代替方法として、すべての接続がテスト手続きに合格するとは限らない場合、処理はステップ960を介してステップ965に進み、ここでレジスタ・スライスnの迂回経路をオフに切り替える。特定の接続に対するテストが失敗したとすれば、このことは、考慮中のレジスタ・スライスが迂回すべき適切なレジスタ・スライスではないことを示しているので、ステップ960で迂回経路をオフに切り替えることは、処置の適切な過程である。
ステップ965でnがnMAXに等しいことが決定されると、処理はステップ975で終了する。何故ならば、この場合、テストすることが適切であると考えられる選択可能レジスタ・スライスのすべては、テストが終わっているはずだからである。ステップ965でnがnMAXに等しくないことが決定されると、ステップ970でnが1だけ増分された後、処理はステップ945に戻る。
この方法により、特定の動作条件に適用できるレジスタ・スライスの適切な選択を決定するため、各レジスタ・スライスの迂回を順番にテストできることが判る。テスト手続きは遷移中の新しい条件に対して実行され、以前に説明したように、このテスト手続きを調整して、装置の動作環境の変動の結果として発生することがある何らかのタイミング変動の余裕をみておくことができることは理解されるであろう。
レジスタ・スライスまたは迂回経路のいずれかを動的に選択する考え方は、図11を参照して示したようなバス相互接続ブロックを組み込んだデータ処理装置に対してだけでなく、データ処理装置の他の構成要素に対しても適用可能である。たとえば、使う方法をパイプラインの各ステージで論理の量にアンバランスが存在するパイプライン型データ処理装置で、この選択可能レジスタ・スライスを使用することができる。このようなデータ処理装置が図14に示されており、この中で乗加算動作(multiply-accumulate operation)を実行するパイプラインが示されている。各パイプライン・ステージは、レジスタ・スライス1000、1010、1020、1030、1040によってそれぞれ区切られている。図から判るように、論理素子1005は、必要なオペランドの値をフェッチするために1つのパイプライン・ステージに用意されており、その後の論理素子1015および1025は乗算演算を実行するために用意されている。選択可能レジスタ・スライス1020が選択されると、この乗算は2つのパイプライン・ステージで実行される。しかし、選択可能レジスタ・スライス1020が迂回される場合、この乗算処理は1つのパイプライン・ステージで実行される。この後、論理素子1035は、さらにパイプライン・ステージで使用され累積演算を実行する。
図記14を参照して示すように選択可能なパイプライン・ステージを使用すると、パイプラインの深さがシステムの要求条件に合致するようになる。このような方法の利点は、この方法によると、1回の設計でいろいろな顧客の要求条件に合致するようになることである。たとえば、一人の顧客は「命令当たりのサイクル数(cycles per instruction:CPI)」を所望することがありうるが、低いクロック周波数を所望しているにすぎないこともありうる。つまり、この顧客は、完全な速度というよりもむしろ効率を所望しているのかもしれない。しかし、他の顧客は高いクロック周波数を所望することがあり、目標クロック速度を満足たすためCPIの増加を受け入れる準備がなされている。このような選択可能レジスタ・スライスの使用を通じて、両要求条件を満たすことができるので、要求条件に応じてこれらの選択可能レジスタ・スライスを選択してもよいし、迂回してもよい。
さらにこのような選択可能レジスタ・スライスを用意すると、動作条件にしたがってパイプラインの深さを動的に適応させることが可能になるが、とくに電圧とクロック速度に対するパイプラインの深さ(つまり、各演算を実行するためのクロックサイクルの数)の代償が不能される。動作条件を検討することが適切であると決定された場合は、このような変化が成立する方法がいくつか存在している。1つの実施例におけるパイプライン型データ処理装置は、最初に命令が排出された後、パイプライン型データ処理装置がさらに命令を受信する前に、選択可能レジスタ・スライスを適切に選択または迂回することによってステージの数を変えることができる。しかし、代替可能な実施例では、パイプラインの中に特定の命令が発行されると、変更を呼び出すことができる。
動作条件にしたがってパイプラインが動的に適応することが所望される2つの例は次の通りである。
1.システムが所定のクロック速度で動作することが必要であるが、(たとえば、完全な供給電圧を必要とするいくつかの構成要素が、現在電力消費量が下げられているため)電圧を下げることが所望される場合、パイプラインの深さを動的に大きくすると、プロセッサは、低下した電圧と同じクロック速度で動作できるようになる。
2.システムが一定の電圧で動作しているが、(たとえば、システムの現在の性能の要求条件が低くされているため)クロック周波数を下げることが可能になると、各サイクルで利用できる時間が増えるので、パイプラインの深さを動的に小さくすることが可能になり、したがってCPIを少なくしてシステムのエネルギ消費を改善する。
図15は、計算機プログラムを実行して上に説明した設計機能を実行するために使用される型式のコンピュータ2000を示している。コンピュータ2000は、中央処理装置2020、ランダム・アクセス・メモリ2040、読み取り専用メモリ2060、ハードディスクドライブ2080、ディスプレイドライバ2100とディスプレイ2120、ユーザ用入出力回路2140、キーボード2160、マウス2180およびネットワークインタフェース装置2200と、これらすべてを結合する共有バス2220を含む。動作する場合、中央処理装置2020は、自装置のワーキングメモリとしてランダム・アクセス・メモリ2040を使用して計算機プログラムを実行する。計算機プログラムは、読み取り専用メモリ2060、ハードディスクドライブ2080に格納されるか、あるいはネットワークインタフェース装置2200を介して遠隔発信元(remote source)から取り出される。コンピュータ2000はディスプレイドライバ2100とディスプレイ2120を介して、ユーザに処理動作の結果を表示する。コンピュータ2000は、ユーザ用入出力回路2140、キーボード2160およびマウス2180を介してユーザから制御入力を受信する。
本明細書で説明したバス相互接続ブロックの設計を修正するために使用するツールは、ハードディスクドライブ2080上のコンピュータシステム2000の中、ランダム・アクセス・メモリ2040の中、読み取り専用メモリ2060の中に格納された、あるいはネットワークインタフェース装置2200を介してダウンロードした1つまたは複数の計算機プログラムの形をとる。この計算機プログラムは、配布のために使用できるコンパクトディスクやフロッピー(登録商標)ディスクドライブのような記録媒体で提供される。上に説明した計算機プログラムに制御されて動作する場合、コンピュータ2000の各種構成要素は、上に説明した機能と動作を実行するための適切な回路と論理を提供する役目をする。図15に示すコンピュータ2000は、計算機プログラムと上に説明した方法を実行する型式のコンピュータの1つの例にすぎないことは理解されるであろう。
本明細書の中で特定の実施例を説明してきたが、本発明はこれらの実施例に限定されるものではなく、本発明の範囲内でこれらの実施例に対して修正や追加を実行できることは理解されるであろう。たとえば、本発明の範囲を逸脱することなく、独立請求項の特徴を用いて以下の従属請求項の特徴の各種組み合わせをつくることができるのである。
レジスタ・スライスの実施例を模式的に示す図である。 レジスタ・スライスを使用しないシステム例を示す図である。 レジスタ・スライスを組み込んだシステム例を示す図である。 データ処理装置の中でバス相互接続ブロックの使用を示すブロック図である。 1つの実施例にしたがってバス相互接続ブロックの使用を示すブロック図である。 1つの実施例にしたがって一時的レジスタ・スライスを除去するために使用する手法を示す流れ図である。 他の実施例にしたがって一時的レジスタ・スライスを除去するために実行する処理を示す流れ図である。 他の実施例にしたがって一時的レジスタ・スライスを除去するために実行する処理を示す流れ図である。 1つの実施例にしたがって特定の経路の中にレジスタ・スライスを挿入することが適切か否かを決定するために採用する手法を示す流れ図である。 電力消費を減らすため1つの実施例にしたがってバス相互接続ブロックの中のレジスタ・スライスの使用を模式的に示すブロック図である。 1つの実施例にしたがって選択可能レジスタ・スライスの実施を模式的に示す図である。 内部に選択可能レジスタ・スライスが使用されているバス相互接続ブロックの1つの実施例を示すブロック図である。 このような選択可能レジスタ・スライスを使用することが、図11のバス相互接続ブロックの動的構成を可能にして、動作条件の変化を検討できるようにする方法を示す流れ図である。 図11のバス相互接続ブロックの動的構成を可能にして、動作条件の変化を検討できるようにし、選択可能レジスタ・スライスの適切なセットアップを決定するため、その動作条件でテスト手続きを実行できるようにする代替方法を示す流れ図である。 内部に選択可能レジスタ・スライスが用意され、動作条件に依存するパイプライン・ステージの数の変更を可能にするパイプライン型データ処理装置を示す流れ図である。 内部で各種実施例の設計過程を実行することができるコンピュータシステムのブロック図である。
符号の説明
1、2、770、800 レジスタ・スライス
10、12、14 レジスタ・スライス記憶素子
835、845、855、865、875、885、895、1000、1010、1020、1030、1040 選択可能レジスタ・スライス
20、1005、1015、1025、1035 論理素子
810 迂回経路
22 レジスタ
205、215、225、235、245、255、265 レジスタ・スライスの潜在的設置場所
16、260、720、820、850 マルチプレクサ
825 コントローラ
13、15 経路
35、70 アドレス経路
45、80 データ経路
17 制御経路
100 シリコンオンチップ設計
30、120、130、140、200、210、700、710、830、840 マスタ・デバイス
40、160、170、180、220、230、240、250、730、740、750、760、860、870、880、890 スレーブ・デバイス
125、135、145、165、175、185 マスタ、スレーブ間のバス
150 相互接続ブロック
15 バス相互接続ブロック
2000 コンピュータ
2020 CPU
2040 RAM
2060 ROM
2080 HDD
2100 ディスプレイドライバ
2120 ディスプレイ
2140 ユーザ用入出力ユニット
2160 キーボード
2180 マウス
2200 ネットワークインタフェース
2200 共通バス

Claims (16)

  1. バス相互接続ブロックについて選んだ特性の要求条件を満たすため、データ処理装置用バス相互接続ブロックの設計を修正する、コンピュータ上でプログラムを実行することにより実施される方法であって、前記バス相互接続ブロックは複数の接続を用意し、該1つまたは複数接続を介して、1つまたは複数のマスタ・デバイスが1つまたは複数のスレーブ・デバイスに対してアクセスすることができ、各接続が1つまたは複数の経路を有し、各経路が憶素子によって分離された1つまたは複数の部分経路を有する方法において、
    a) レイアウト生成手段によって、前記経路から1つまたは複数の候補経路を選択するステップと、
    b) 解析手段によって、候補経路ごとに所定の基準を適用して、前記経路の中の前記記憶素子の数の修正が、前記選んだ特性の前記要求条件を満たすことに役立つか否かを決定するステップと、
    c) レイアウト修正手段によって、前記ステップ(b)においてその修正が前記選んだ特性の要求条件を満たすことに役立つと決定された各候補経路の中の前記記憶素子の数を修正するステップと、
    含む方法。
  2. 請求項1に記載の方法であって、前記選んだ特性がタイミング特性であり、前記要求条件が前記タイミング特性の改善である前記方法において、
    前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介して、前記バス相互接続ブロックが前記マスタ・デバイスまたはスレーブ・デバイスに対して信号を出力するステップと、
    前記ステップ(b)で、前記バス相互接続ブロックから有効信号を出力するためにかかる時間が、第1の所定の閾値を超えているか否か、候補経路ごとに決定するステップと、
    超えている場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入し、前記候補経路の中の前記部分経路の数を増加させるステップと、
    を含む前記方法。
  3. 請求項1に記載の方法において、前記選んだ特性はタイミング特性であり、前記要求条件は前記タイミング特性の改善である前記方法において、
    前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介して、前記バス相互接続ブロックが前記マスタ・デバイスまたはスレーブ・デバイスから信号を受信するステップと、
    前記ステップ(b)で、前記信号を受信するためにかかる前記セットアップ時間が、第2の所定の閾値を超えているか否か、候補経路ごとに決定するステップと、
    超えている場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入して前記候補経路の中の前記部分経路の数を増加させるステップと、
    を含む前記方法。
  4. 請求項1に記載の方法において、前記選んだ特性はタイミング特性であり、前記要求条件は前記タイミング特性の改善である前記方法において、
    前記ステップ(a)で、前記1つまたは複数の候補経路として、組み合わせ論理を組み込んで1つまたは複数の経路を選択するステップと、
    前記ステップ(b)で、その組み合わせ論理によって前記信号を処理するためにかかる時間が、第3の所定の閾値を超えているか否か、候補経路ごとに決定するステップと、
    超えている場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入して前記候補経路の中の前記部分経路の数を増加させるステップと、
    を含む前記方法。
  5. 請求項1に記載の方法において、前記選んだ特性はタイミング特性であり、前記バス相互接続ブロックの前記設計は、除去の候補である複数の仮記憶素子を含み、前記要求条件は、前記ステップ(b)の修正実行により、所定の最長時間で信号が横断できない部分経路を作成しないようにする条件である前記方法において、
    前記所定の最長時間として、前記バス相互接続ブロック用クロックサイクルの持続時間を指定するステップと、
    前記ステップ(a)で、前記1つまたは複数の候補経路として、少なくとも1つの仮記憶素子を含む1つまたは複数の経路を選択するステップと、
    前記ステップ(b)で、前記少なくとも1つの仮記憶素子を除去すると、前記クロックサイクルの前記持続時間を超えない時間で信号が横断できる新しい部分経路になるか否かを候補経路ごとに決定するステップと、
    新しい部分経路になる場合は、前記ステップ(c)で、その候補経路から前記少なくとも1つの仮記憶素子を除去して前記候補経路の中の前記部分経路の数を減少させるステップと、
    を含む前記方法。
  6. 請求項5に記載の方法において、任意の候補経路が1つ以上の仮記憶素子を含む場合、前記ステップ(b)で、その候補経路の中の前記仮記憶素子の選択された部分集合の除去に基づいて前記決定が実行される前記方法。
  7. 請求項1に記載の方法において、前記選んだ特性はタイミング特性であり、前記要求条件は前記タイミング特性の改善である前記方法において、
    前記バス相互接続ブロック用クロックサイクルの持続時間を指定するステップと、
    前記ステップ(a)で、前記1つまたは複数の候補経路として、前記クロックサイクルの前記持続時間で信号が横断できない容認不能な部分経路を含む1つまたは複数の経路を選択するステップと、
    前記ステップ(b)で、所定の基準を適用し、容認不能部分経路の中に少なくとも1つの記憶素子を挿入して修正後の設計を発生することを前提として、前記修正後の設計のタイミング特性が、修正前の設計のタイミング特性を基準として改善されているか否かを候補経路ごとに決定するステップと、
    改善されている場合は、前記ステップ(c)で、容認不能な部分経路の中に前記少なくとも1つの記憶素子を挿入して、前記候補経路の中の前記部分経路の前記数を増加させるステップと、
    を含む前記方法。
  8. 請求項7に記載の方法において、所定の基準を適用する前記ステップは、前記修正後の設計の中の前記最長容認不能部分経路を信号が横断するためにかかる前記時間が、前記修正前の設計の中の前記最長容認不能部分経路を信号が横断するためにかかる前記時間よりも短いか否かを決定することを含む前記方法。
  9. 請求項7に記載の方法において、前記所定の基準を適用するステップは、前記修正後の設計の中の前記容認不能部分経路の数が、前記修正前の設計の前記容認不能部分経路の数よりも少ないか否かを決定することを含む前記方法。
  10. 請求項1に記載の方法であって、
    候補経路をさらに選択するため、前記ステップ(a)から(c)を繰り返すステップをさらに含む前記方法。
  11. 請求項7に記載の方法であって、候補経路をさらに選択するため、前記ステップ(a)から(c)を繰り返す前記ステップをさらに含む前記方法において、前記ステップ(a)から(c)は、容認不能部分経路が存在しない修正後の設計が発生するまで繰り返される前記方法。
  12. 請求項1に記載の方法であって、前記選んだ特性は消費電力であり、前記要求条件は前記消費電力の低減である前記方法において、
    前記ステップ(a)で、前記1つまたは複数の候補経路として1つまたは複数の経路を選択し、該1つまたは複数の経路を介して、前記バス相互接続ブロックが前記マスタ・デバイスまたはスレーブ・デバイスとインタフェースをとるステップと、
    前記ステップ(b)で、所定の基準を適用し、前記マスタ・デバイスまたはスレーブ・デバイスを分離して消費電力を低減させることが適切であるか否かを候補経路ごとに決定するステップと、
    適切である場合は、前記ステップ(c)で、その候補経路に対して記憶素子を挿入し、前記マスタ・デバイスまたはスレーブ・デバイスを分離して、その候補経路の中の部分経路の数を増加させるステップと、
    を含む前記方法。
  13. 請求項12に記載の方法において、前記所定の基準を適用するステップは、その候補経路の前記関連するマスタ・デバイスとスレーブ・デバイスの数と、前記マスタ・デバイスまたはスレーブ・デバイスによって使用される前記相互接続ブロックの帯域幅との関数に基づいて、そのマスタ・デバイスまたはスレーブ・デバイスを分離することが適切であるか否かを決定することを含む前記方法。
  14. 請求項1に記載の方法において、前記記憶素子は、関連する部分経路を介して受信した信号のグループを格納するように動作可能である前記方法。
  15. 請求項1に記載の前記方法をコンピュータに実行させる計算機プログラム
  16. 請求項1に記載の前記方法をコンピュータに実行させる計算機プログラムを記録したコンピュータによって読み取り可能な記録媒体
JP2004146789A 2003-06-12 2004-05-17 データ処理装置用バス相互接続ブロックの設計に関するフレキシビリティの改善 Expired - Lifetime JP4272108B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB0313648A GB2402761B (en) 2003-06-12 2003-06-12 Improvements in flexibility of a bus interconnect block for a data processing apparatus

Publications (2)

Publication Number Publication Date
JP2005004736A JP2005004736A (ja) 2005-01-06
JP4272108B2 true JP4272108B2 (ja) 2009-06-03

Family

ID=27590000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004146789A Expired - Lifetime JP4272108B2 (ja) 2003-06-12 2004-05-17 データ処理装置用バス相互接続ブロックの設計に関するフレキシビリティの改善

Country Status (3)

Country Link
US (1) US7117277B2 (ja)
JP (1) JP4272108B2 (ja)
GB (1) GB2402761B (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2402760B (en) * 2003-06-12 2006-01-11 Advanced Risc Mach Ltd Improvements in flexibility of use of a data processing apparatus
US20100217686A1 (en) * 2004-05-03 2010-08-26 Superlative, Inc. System for managing communication between a real estate agent and clients
JP4260720B2 (ja) * 2004-10-27 2009-04-30 日本テキサス・インスツルメンツ株式会社 バス制御装置
US7353317B2 (en) * 2004-12-28 2008-04-01 Intel Corporation Method and apparatus for implementing heterogeneous interconnects
US20100281245A1 (en) * 2005-01-12 2010-11-04 Nxp B.V. Method and apparatus for tuning a digital system
JP4444860B2 (ja) * 2005-03-10 2010-03-31 富士通株式会社 リコンフィギュラブル回路およびそのコンフィギュレーション方法
US7461187B2 (en) * 2005-07-07 2008-12-02 Canon Kabushiki Kaisha Bus system and data transfer method
JP4840963B2 (ja) * 2005-07-07 2011-12-21 キヤノン株式会社 バスシステム及びその制御方法
JP2009508201A (ja) * 2005-09-09 2009-02-26 フリースケール セミコンダクター インコーポレイテッド 相互接続、及び相互接続の設計方法
US7478356B1 (en) * 2005-09-30 2009-01-13 Xilinx, Inc. Timing driven logic block configuration
GB2453697B (en) 2006-08-04 2010-11-24 Advanced Risc Mach Ltd A bus interconnect device and a data processing apparatus including such a bus interconnect device
US8156273B2 (en) * 2007-05-10 2012-04-10 Freescale Semiconductor, Inc. Method and system for controlling transmission and execution of commands in an integrated circuit device
GB0709911D0 (en) * 2007-05-23 2007-07-04 Advanced Risc Mach Ltd Data processing apparatus and method for controlling a transfer of payload data over a communication channel
US9032113B2 (en) 2008-03-27 2015-05-12 Apple Inc. Clock control for DMA busses
TWI416302B (zh) * 2009-11-20 2013-11-21 Ind Tech Res Inst 具電源模式感知之時脈樹及其合成方法
JP2013122713A (ja) * 2011-12-12 2013-06-20 Toshiba Corp 半導体装置
KR101993258B1 (ko) * 2012-11-22 2019-09-27 삼성전자주식회사 레지스터 슬라이싱 회로 및 이를 포함하는 시스템 온 칩
US9465766B1 (en) * 2013-10-29 2016-10-11 Xilinx, Inc. Isolation interface for master-slave communication protocols
US10963409B2 (en) * 2016-08-19 2021-03-30 Arm Limited Interconnect circuitry and a method of operating such interconnect circuitry
US10474619B2 (en) * 2017-05-19 2019-11-12 General Electric Company Methods for managing communications involving a lockstep processing system
CN110069425A (zh) * 2019-04-24 2019-07-30 苏州浪潮智能科技有限公司 一种基于服务器多处理机板卡设备之间的数据处理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4162535A (en) * 1977-08-12 1979-07-24 Honeywell Inc. Triangular high speed I/O system for content addressable memories
FR2573888B1 (fr) * 1984-11-23 1987-01-16 Sintra Systeme pour la transmission simultanee de blocs de donnees ou de vecteurs entre une memoire et une ou plusieurs unites de traitement de donnees
US5638291A (en) * 1994-10-14 1997-06-10 Vlsi Technology, Inc. Method and apparatus for making integrated circuits by inserting buffers into a netlist to control clock skew
JPH0962716A (ja) * 1995-08-18 1997-03-07 Sony Corp 回路設計方法及び回路設計装置
US6023742A (en) * 1996-07-18 2000-02-08 University Of Washington Reconfigurable computing architecture for providing pipelined data paths
US6044448A (en) * 1997-12-16 2000-03-28 S3 Incorporated Processor having multiple datapath instances
US6117182A (en) * 1998-06-12 2000-09-12 International Business Machines Corporation Optimum buffer placement for noise avoidance
US6832180B1 (en) * 1999-10-29 2004-12-14 Sun Microsystems, Inc. Method for reducing noise in integrated circuit layouts
US6910195B2 (en) * 2003-02-05 2005-06-21 Intel Corporation Flip-flop insertion in a circuit design

Also Published As

Publication number Publication date
JP2005004736A (ja) 2005-01-06
GB2402761B (en) 2006-02-22
US20040267994A1 (en) 2004-12-30
US7117277B2 (en) 2006-10-03
GB2402761A (en) 2004-12-15
GB0313648D0 (en) 2003-07-16

Similar Documents

Publication Publication Date Title
JP4272108B2 (ja) データ処理装置用バス相互接続ブロックの設計に関するフレキシビリティの改善
JP4076973B2 (ja) データ処理装置を使用する場合のフレキシビリティの改善
US7251803B2 (en) Memory re-implementation for field programmable gate arrays
US7290075B2 (en) Performing arbitration in a data processing apparatus
JP3587256B2 (ja) コンピュータ装置
JP3150122B2 (ja) 低電力vlsiデザインのための制限付きレジスタ共用方法及びそのシステム
US7318213B2 (en) Apparatus, method and program for behavioral synthesis including loop processing
US9201996B2 (en) Behavioral synthesis apparatus, behavioral synthesis method, data processing system including behavioral synthesis apparatus, and non-transitory computer readable medium storing behavioral synthesis program
US20070028197A1 (en) Method and apparatus for auto-generation of shift register file for high-level synthesis compiler
US7606698B1 (en) Method and apparatus for sharing data between discrete clusters of processors
US7415689B2 (en) Automatic configuration of a microprocessor influenced by an input program
US10243758B2 (en) Apparatus and method for filtering transactions
US20040230934A1 (en) System and method for emulating systems with multiple field programmable gate arrays
US7162591B1 (en) Processor memory having a dedicated port
US7302667B1 (en) Methods and apparatus for generating programmable device layout information
US7636817B1 (en) Methods and apparatus for allowing simultaneous memory accesses in a programmable chip system
US6604163B1 (en) Interconnection of digital signal processor with program memory and external devices using a shared bus interface
US6532584B1 (en) Circuit synthesis method
US7809861B1 (en) System memory map decoder logic
Jozwiak et al. Hardware synthesis for reconfigurable heterogeneous pipelined accelerators
EP1550950A1 (en) Semiconductor device
US8468009B1 (en) Hardware emulation unit having a shadow processor
JPH08305547A (ja) Pldによるコンピュータおよびコンパイラおよびオペレーティングシステム
Saito et al. Control signal sharing of asynchronous circuits using datapath delay information
JP2002229921A (ja) インタフェース回路、論理回路検証方法、論理装置、情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090217

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4272108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140306

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250