JPH06502287A - ゼロオーバヘッドセルフタイムド繰り返し論理 - Google Patents

ゼロオーバヘッドセルフタイムド繰り返し論理

Info

Publication number
JPH06502287A
JPH06502287A JP3518063A JP51806391A JPH06502287A JP H06502287 A JPH06502287 A JP H06502287A JP 3518063 A JP3518063 A JP 3518063A JP 51806391 A JP51806391 A JP 51806391A JP H06502287 A JPH06502287 A JP H06502287A
Authority
JP
Japan
Prior art keywords
data
logic
overhead
delay
combinatorial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3518063A
Other languages
English (en)
Inventor
ウィリアムズ テッド イー
Original Assignee
ハル コンピューター システムズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ハル コンピューター システムズ インコーポレイテッド filed Critical ハル コンピューター システムズ インコーポレイテッド
Publication of JPH06502287A publication Critical patent/JPH06502287A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/535Dividing only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/35Delay-insensitive circuit design, e.g. asynchronous or self-timed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/535Dividing only
    • G06F7/537Reduction of the number of iteration steps or stages, e.g. using the Sweeny-Robertson-Tocher [SRT] algorithm
    • G06F7/5375Non restoring calculation, where each digit is either negative, zero or positive, e.g. SRT
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K19/00Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
    • H03K19/02Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
    • H03K19/08Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices
    • H03K19/094Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices using field-effect transistors
    • H03K19/0944Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices using field-effect transistors using MOSFET or insulated gate field-effect transistors, i.e. IGFET
    • H03K19/0948Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices using field-effect transistors using MOSFET or insulated gate field-effect transistors, i.e. IGFET using CMOS or complementary insulated gate field-effect transistors
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K19/00Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
    • H03K19/02Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
    • H03K19/08Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices
    • H03K19/094Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using semiconductor devices using field-effect transistors
    • H03K19/096Synchronous circuits, i.e. using clock signals
    • H03K19/0966Self-timed logic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Power Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Logic Circuits (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、ディジタル電子回路に関し、具体的には繰り返し分割アルゴリズムを 含むセルフタイムド(self−timed )回路に関する。本発明の設計技 術は“ゼロオーバヘツドセルフタイムド繰り返し論理″と呼ばれ、ZO3T[L と略称されるものである。
発明の背景 任意のシステムのタイミング性能は2つの尺度、即ち待ち時間(もしくはレイテ ンンー)または処理能力(もしくはスルーブツト)の一方によって判定すること かできる。入力から結果的な出力までの遅延を待ち時間と呼び、殆との実世界問 題はこの遅延を最小にすることを望んでいる。もしあるシステムか一時に幾つか の計算を進行させることができるものとすれば、2つの連続入力間の最小遅延か 処理能力、つまりそのシステムか計算要求を受け入れることかできる最大データ 率を決定する。これらの尺度の何れかによって評価される性能は、所望機能の組 合せ論理を通過する時の生の伝播遅延と、“他の”オーバヘッド遅延との合計に 依存する。理論的には言えば、最速回路は全てのオーバヘッドを有することなく 生の組合せ論理だけに起因する回路遅延を有する。本発明の新規性は、パイプラ イン内の待ち時間オーバヘッドを0まで減少させる。従って本ZOSTILの新 規性は、待ち時間を理論的下限に到達させるか、全組合せアレイの大きい、且つ 高価格な領域を必要としない機能を生成することである。
従来の同期回路設計技術は、組合せ論理をデータ記憶装置から分離している。
即ち、記憶装置は組合せ論理の区分間に挿入された実際の(もしくは明示)ラッ チによって提供されている。この設計技術は、回路待ち時間を増加させる少なく とも4つのオーバヘッド源を有している。これらの源は、1)ラッチを通過する 時の伝播遅延、2)クロックスキューを許容するために付加される余裕、3)シ ステム内の高速段における浪費時間、4)データ依存遅延の最大化、及び5)成 分の最悪例タイミングの想定である。
待ち時間オーバヘッドの第1の源はランチに起因するものであり、これはランチ かセクトアップ時間及び伝播遅延による付加的な遅延を導入するからである。
同期回路の最小サイクル時間は、ラッチのセットアツプ時間と、ラッチの伝播遅 延と、最大組合せ論理遅延との合計である。ZO3TIL方法による第1の新規 性は実際のランチを完全に排除し、CuO2ドミノ鎖内の各段の出力に“無料” の半ラツチを使用することによってこのオーバヘッドを完全に除去することであ る。
待ち時間オーバヘッドの第2の源は、クロックをシステム内の全てのランチに分 配する必要性から生ずるものである。通信段にはクロックの縁か同時に印加され なければならないか、ワイヤまたはトライバの遅延はスキューをもたらすから合 計クロック期間にある余裕を付加することによって補償しなければならない。
この付加される余裕もまたオーバヘッドである。従来の非同期設計技術は、クロ ックスキューに起因する大域クロックオーバヘッド及び余分な待ち時間オーバ・ \ラドを、通信データの前動性によって、大域的にてはなく局部的に除去するた めに、ハンドシェーキングブロックを使用していた。しかしなから、それてもこ れらの先行技術は実際のラッチを含み、従ってラッチ伝播遅延に起因する待ち時 間オーバヘッドを存している。先行技術はまた、ハンドシェーキング論理内の順 方向経路に起因するあるオーバヘッドも付加していた。ZO3TILの第2の新 規性は全ての制御経路を経路に順次に付加するのではなく、順方向評価と並列に 動作させるようにすることである。
待ち時間オーバヘッドの第3の源は、ランチ間の機能区分の不整合に起因するも のである。クロック期間の時間長は固定されているから、それをシステム内の全 ての異なる機能区分の最長伝播遅延に等しくセットしなければならない。最大時 間と、何れかの機能区分によって使用される実際の時間との間の差は浪費時間で あるから、これはオーバヘッドである。セルフタイムドデータ流では、データは クロック縁を待機するのではなくデータ駆動局部制御に基づいて順方向に流れる ことか可能であるから、この時間を浪費することはない。バイブラインの処理能 力はその最低速段によって制限されはするか、各段をそれか可能になり次第直ち に進行せしめることによって待ち時間か改善される。
待ち時間オーバヘッドの第4の源は、最悪例データ値に基づいて同期論理内のク リティカルバスを決定することから招来されるものである。もし大きい分散が存 在すれば、遅延の平均値と最大値との間の差に起因する大きい性能損失が存在す る。同期設計者は論理の本体を通る種々の経路を等化するためにトランジスタサ イジングを調整することを試みているが、セルフタイムドシステムでは、最大遅 延を最小にするのではなく遅延の確率的予測値を最小にすることか望ましい。
本発明の第3の新規性は、各論理ブロックの入力の何れかの既知の確率的分布を 使用して、合計遅延の予測値を最小にするようにそのブロックにおけるトランジ スタの大きさくもしくはサイズ)を決めることである。
待ち時間オーバヘッドの第5の源は、ある範囲の温度及び電圧レベルにわたって 性能を保証するために使用定格を下げることである。同期システム設計は、常に 控え目に定格を下げた“最悪例”仕様に基づかなければならない。何故ならばシ ステムは極端な環境においても動作しなければならないからである。しかし、実 際の条件は極端ではなく、考え得る性能と実際の設計された性能との間の差か浪 費性能である。セルフタイムド成分は常に現存する条件に対してそれらの最大速 度で走り、それらが実際に完了し次第それらの出力を供給する。完了表示を供給 することによって、それらを取り囲んでいるシステムに対して、常に最悪例を待 機するよりも早めにそれらの出力を使用可能ならしめる。
デュアルモノトニック信号の背景と命名へをデュアルモノトニック信号とすれば それは八〇及びAI と呼ぶ2つの“副信号”によって表され、もし両ワイヤが 同一の論理状態(例えば低)であれば信号Aは未だに評価されておらず、もし八 〇またはAIの何れかか状態を変化させればこれは信号へか評価を完了したこと を表し、そして2つのワイヤのとちらか変化したのかを注目することによってへ の状態か決定されるように符号化されている。例えばらしAo及びA1の両者の 2進値か0′であれば信号への値は未決定である。もしA1か1′に移れば(も しくは遷移すれば)への値は丁てあり、一方もし八〇が°1′に移ればAの値は 0″である。ワイヤの対は、評価中のそれらのワイヤ上の移り目はモノトニック でなければならないのでデュアルモノトニック対と呼ばれる。これらの移り目は 相互に排他的であり、何れか一方は評価が完了したことを表示し、そして他の回 路によって使用することか可能である。本明細書では信号名はイタリック体で表 示され、*”は論理否定を指示するために使用されている。また、デュアルモノ トニック信号の各半分には1または0の上付き添字を用いる。
る。各信号は3つの機能相、即ち1)事前充電またはリセット相、2)論理評価 相、または3)データ記憶相の1つであることかできる。これらの3つの相を図 1に示しである。図1は2人カデュアルモノトニックANDゲー:一と、その波 形図を示す。リセット相中には低活動(もしくはアクティブロー)事前充電信号 P。
か活動てあり、A及び8倍号は非活動でなければならない。これにより事前充電 されたノードXa及びYlが高にされ、Q出力は低にされる。論理評価相中には 八〇またはA1の何れか、及びBoまたはB’の何れかがモノトニック的に高に 移る。もしA1及びBoの両方が高に移ればANDゲートの01出力かモノトニ ック的に高に移り、またもし八〇またはBoの何れかが活動になれば、Q0出力 が高になる。データ記憶相中は、A及び8の両信号か低にされ、P″″は非活動 に留まる。この状態は事前充電ノードX1及びY”を非駆動にし、容量はそれら をメモリ素子として動作せしめるので、出力Q1及びQoはそれらが論理評価相 中に取っていた状態と同一の状態に留まる。以上のように、各ドミノ段は、デー タを記憶するために付加的なトランジスタも付加的な論理遅延も必要としないの で、“無料′の半ラツチを含むことになる。
されている。本発明はデータを記憶する第3の相を使用しており、それによりラ ッチを介入させることなくドミノ論理ゲートを縦続し、パイプライン化すること かできる。このシステムへの入力は、論理評価相中には厳格にモノトニックな移 り目を有していなければならず、また事前充電信号は事前充電信号に限って活動 でなければならない。更に、パイプライン化システムはその出力を入力へ戻して フィートし、繰り返し構造を形成させることが可能である。このようなフィード バックパイプラインは、全計算が完了するまでデータを循環させる論理の“ルー プまたは“環″として見られる。
事前充電機能ブロックの一時記憶城を使用するようにした新規性によって、実際 のラッチを省略することができる。各ドミノ段は無料で半ラツチの動作を提供す る。リセット制御論理は、機能ブロック評価と完全に並列に動作する。各リセッ ト制御ブロック内の完了検出論理は、後続機能ブロックの出力を観測してその全 ての出力の評価を完了したことを決定し、次いでそれ自体の機能ブロックにデー タ記憶相から事前充tmへ移ることを命令してその全ての出力をリセット状態に 駆動させる。その後に後続機能ブロックの出力がリセットされると、リセット制 御はその機能ブロックのための事前充電信号をターンオフし、次のデータ入力か 実際に到着した時のデータ評価相の準備を整えさせる。データをデュアルモノト ニック対に符号化することによって順方向ハンドシェークは必要がなくなり、従 って制御論理は回路のクリティカルバスから排除される。この新規な方法は、実 際のラッチの必要性を排除する第1の新規性と相俟って、パイプライン化論理を 通る真にゼロオーバヘッド最小待ち時間遅延経路を提供する。
ZOSTIL技術は、無ラッチ回路及び並列リセット制御を、繰り返し構造、即 ち“環”内へ組合せることを含む。これは、同一の基本機能を何回も何回も遂行 する算術演算にとって特に重要である。これらの機能の型の例は、乗算、除算、 平方根、正弦、及び余弦である。
ZO3T[1回路は、制御論理の適切な設計により、それらが遅延には無関係で あるので頑丈である。即ち、回路は回路要素の実際の遅延には拘わりなく正しく 機能する。従って、遅延を含む計算は、システムの論理的正確さ、または機能性 を保証するためには必要ないが、性能を推定するだけのために使用される。これ は、単一の論理段内の全ての計算を1クロツクサイクル内に遂行できるようにす るために大量の遅延計算を必要とする同期設計技術とは対照的である。遅延推定 が不適切であると、同期回路は常に正しい結果をもたらさない。
除算アルゴリズムは、最上位から最下位までの商ディジツトを連続的に決定する ことによっである商を生成する。各商ディジツトは次の部分剰余の計算に使用さ れ、それが次の商ディジツトの決定に必要であるので、除算は本質的に順次プロ セスである。従って、ZOSTIL技術を用いて設計されたパイプライン化環は 、算術除算を遂行するために理想的である。除算に特定の付加的な新規性は、2 つの剰余計算を並列に遂行できるように段を重ねてインタロックすることである 。
これは、SRT除算として知られるアルゴリズムを変更して幾つかの小さい剰余 計算を並列に遂行し、先行段からの商ディジツトが決定された時に正しい剰余を 選択することによって達成される。この新規性は、従来のアルゴリズムに比して 総合待ち時間を2倍まで改善する。
2人カデュアルモノトニックセルフタイムドMωゲートの回路図である。
のための論理をも含む。
図3=データ経路の併合。これは2つのセルフタイムドパイブラインを併合する ために必要な制御リセット論理を示す回路図である。
図4:データ経路の分割。これは1つのセルフタイムドパイブラインを分割する ために必要な制御リセット論理を示す回路図である。
図5=予測される合計遅延の改善。これは回路接続形態をとのように変化させれ ば、機能を変えずに予測される回路性能を改善できるかを示す。
図6.4段セルフタイムド環のための論理。これは事前充電機能ブロックの4段 バイブライン環である。
図7:4段セルフタイムド環のための従属グラフ。図6に示す回路図に従属すア ルゴリズムの1つの段におけるデータ流を示す回路図である。
図9・基数2 SRT除算の段間重ね実行。これはSRT除算における改善を示 す回路図である。
実施例の詳細な説明 本発明は、ZO3TILと略称される“ゼロオーバヘツドセルフタイムド繰り返 し論理“へ導く非同期回路設計技術における新規性を開発するものである。
している。各処理要素はデータと共に完了ステータスを表示することによって、 ラッチ毎に大域クロックへの再同期を待機することなく、データが到着し次第そ れに対する動作を開始することができる。
従来の非同期論理装置は中間結果を記憶するために実際のラッチを使用していた 。これらのラッチは回路のクリティカルバスに付加的な伝播遅延を導入するが計 算機能に直接的に貢献するものではない。本発明の第1の新規性は、CMO3ド ミノ機能ブロックを“無料”半ラツチとして使用することによって実際のラッチ を完全に排除することである。これは、ある機能ブロックをリセットしてデータ を駆逐する前に、ある機能ブロックからの出力が全ての後続段によって利用され たことをw1能ブロック事前充電のための制御が確認した場合に限って可能なの である。後続する機能ブロックかデータの使用を完了したことを決定するために は完了検出器を構成する必要かある。
各デュアルモノトニック対の2本のワイヤに接続されている簡単なORゲートは 、論理段からの各個々の信号出力のための完了探識を供給する。段はその全ての 出力が個々に完了した時を完了計算するものと見做される。一般にC要素と呼ば れるゲートの最後の木を、データ経路内の全ビットが変化した時を決定するため の完了検出器として使用することかできる。各C要素は、その複数の入力の状態 か同一である場合、その出力がこれらの入力の状態になるという特性を育してい る。C要素の木の出力は、全入力か完了である場合には完了を指示し、全入力か りセットを育している場合には出力はリセットを指示する。
完了信号が生成されると、それらは事前充電ブロックを適切にリセットするため の制御を供給するために使用されなければならない。従来のセルフタイムド回路 は順方向及び逆方向の両ハンドシェークを必要としたが、本発明の第2の新規性 はデュアルモノトニック対内に順方向データの完了表示を完全に埋め込み、順方 向ハンドシェークを排除することである。更に、逆方向ハンドシェークは、それ か順方向クリティカルバスに影響を与えないように設計することかできる。簡単 な単方向データ流の場合には、この制御は図2に示すような逆方向に向けられた インバータのシーケンスである。データ経路を併合または分割する場合には、制 御は図3及び4に示すようになる。これらの制御回路は何れも順方向に流れるデ ータの直接経路内になく、従ってこれらが順方向に流れるデータの波の待ち時間 に付加されることはない。
次のデータの波が現れて機能ブロックにその出力を再度評価させる前に、制御論 理は各機能ブロックをリセットする。データの波が離間している限り、各データ の波は何等の付加的なオーバヘッドも伴わずに、純粋な組合せ遅延のみに等しい 待ち時間をもって伝播する。
もしある問題か論理的機能の繰り返し実行を要求すれば、それは事前充電機能ブ ロックの環を構築するのに特に適切である。機能ブロックは同一であることかで き、またはそれらは異なる機能を実現することができる。環の段間のデータ経路 の幅は一定である必要はない。セルフタイムド環内のデータは、それか大きい組 合せアレイを通って進行することができる速度と同一の速度で環をループするか 、回路のシリコン領域は速度を大幅に低下させる。これの物理的類比はドミノの 円である。そのトリックは、倒れるドミノの波が、ドミノの長い列を伝わって行 くのと同じ速度で連続的に円に沿って進行して行くことてあり、これは各ドミノ をその後続するドミノか倒れた後に立たせることによって達成される。
通常線形バイブラインは段の処理能力によって判断される。しかしなから、単一 の繰り返し問題を解くために段が環状に接続されている場合には、答えを計算す るために要する時間は段を通る時の待ち時間に依存する。従って、あるループ内 の段にとっては処理能力よりは短い待ち時間を有していることの方か重要な特性 である。ゼロオーバヘッド制御論理は、厳格に機能ブロックの組合せ遅延の下限 までこの待ち時間を短縮する。
ゼロオーバヘッドを検証する従属グラフZOSTIL技術は、各ブロックが取る 実際の遅延には正確に無関係に機能する回路をもたらす。遅延の変化か回路の論 理演算に影響を与えないから、これらの設計は頑丈である。しかしなから、実際 の遅延は総合性能を決定し、相対的な遅延は回路を通るどの経路か制限している 経路、またはクリティカルバスであるのかを決定する。“ゼロオーバヘッド″設 計の目的は、所望組合せ論理を構成している機能ブロックだけによって性能か制 限されるようにすること、従って公称相対遅延の下でのクリティカルバスが如何 なる制御ブロックをも通過しないようにすることである。もし回路がゼロオーバ ヘッドを達成していないことを性能解析か示していれば、ゼロオーバヘッド待ち 時間が達成されるまで段を一層細かい粒状にすることによって変更することがで きる。
ある設計が制御に起因するオーバヘッドを育していないようにするために、考え 得る全てのクリティカルバスを示す従属グラフを描く。簡単な円及びその従属グ ラフを図6及び7に示す。環を回って流れるデータの臨界サイクル時間はグラフ の最長循環経路であろう。このグラフは全く限定的なペトリネットであり、ファ イヤリング規則は同一である。ノードは、その全先任者がマークされるとマーセ ルフタイムド回路は完了信号を存するデータを伴うから、爾後の計算は各データ か到着し次第開始することができる。処理時間が同一であることを要求しないか ら、真に要望されるのは遅延の合計予測値を最小にすることである。データ値が 等確率で分布されいる場合には、平均遅延が最小である時の予測値が勿論最小に される。しかしながら若干の場合には、設計者はデータ値がある特定の分布を育 することを知り得、この情報を使用して合計予測値を最小にして、正確に全デー タ値遅延の平均よりも良好にすることができる。
平均使用率よりも高い使用率を有していることが知られている経路を、それらに 含まれている若干の論理ブロックを短絡するか、またはそのブロックかより速く なるようにトランジスタを広げることによって、高速にすることかできる。例え ば図5において、もしマルチプレクサの両腕を反転すれば、遅延の予測値に正味 の改善がもたらされる。他方の腕にインバータの付加が必要にはなるが、より屡 々選択されることが知られている腕からインバータを除去しである。同様に、あ るブロックのある出力に2つの異なる経路の始まりのトランジスタを負荷しなけ ればならない場合には、余り屡々選択されることがない経路のトランジスタを狭 くするとその経路は緩速になるが、屡々選択される経路の部分てもあるその出力 ノードは軽負荷になるために高速になるから、予測遅延に総合的な改善かもだ除 算を遂行するためには、商ディジツトの選択を最上位ディジットから始めて最下 位ディジットまで進めることか必要である。商ディジツトの決定は、先行部分剰 余及び商ディジツトに基づいて次の部分剰余を再計算する各繰り返しの一部とし て行われる。繰り返しと繰り返しとの間に、部分剰余は使用されているディジッ トの基数(ベースまたはレイディックス)rだけ左ヘシフトされる。即ち各繰り 返しは R1−+ =rR+ Dql を実現するものである。ここにR1は段lからの部分剰余出力であり、rは基数 てあり、qlは段から決定される商ディジツトであり、Dは除数であり、そして シーケンスはrR,=被除数で初期化される。
通常の除算では、商ディジツトq1は集合(Ol・・・、r−11であり、完全 な商は、面内の各ディジット位置か単一の正しい表現だけを有していることから 、単一の有効表現だけを育する。不幸にも、各位置における正しいディノットを 決定するには正確な部分剰余の比較が必要であり、これは各商ディジツトを決定 する前に全部分剰余を計算しなければならないことを意味している。この計算に は各商ディジツトか選択できるようになる前に部分剰余を生成するために、完全 キャリー伝播減算が必要である。
除算のための1つの公知のアルゴリズムかSRTアルゴリズムとして知られてい る。SRT除算のキーアイデアは、集合(p、・・・、0.・・・、p)内に正 及び負の両整数を含ませて前動商ディジット冗長度の集合を作ることによって、 各繰り返しにおける完全キャリー伝播を回避することである。商ディジ・ソトは r、/2≦p≦r−1 の範囲を育していなければならない。冗長商デイジツト集合を用いると最終間結 果は、各位置毎の商ディジツトを選択するような幾つかの異なる方法て表現する ことかてきる。勿論、位置的に重み付けされた負の商ディジ・ノドを位置的に重 み付けされた正の商ディジツトから減算することによって、どのような有効表現 も常に所望の非冗長表現に変換することができる。この減算にはキャリー伝播か 必要であるが、これは段当たり1回ではなく全除算演算に1回連行するだけでよ い単一の演算である。更に、集積された浮動小数点チップでは、この全長キャリ ー伝播演算は、商結果を高速キャリー先取り加算を実現しているチップの別の部 分へ転送することによって遂行することが可能である。
SRT除算では商集合が同符号のディジットを含んでいるから、任意の位置のた めの商選択論理は除数及び部分剰余の近似を使用するだけでよい。これは、小さ い誤差は後段において反対符号の重要度の低い商ディジツトで補正できるからで ある。商ディジツトの選択には、各段において部分剰余の近似だけを必要とする ので、部分剰余の少数の最上位ビットだけを調べるだけでよい。
SRT除算の最も簡単な形状は基数r=2と、3つの商ディジツト、+I、O。
−1だけを使用するものである。これは、正しい商デイジツト選択を行うために 各段において上位4ビツトだけを見ればよい。このアルゴリズムの各段毎の通常 の順次データ流を図8に示す。別の実施例では、r=4及びr=16のようなよ り高い基数か一般的に使用されている。
商ディジツトの確率的分布は、SRT除算の数値的特性のために均一ではない。
基数2の場合には、3つの商ディノットは42%、35%、及び23%の確率を 存しており、回数の4%にわたって予め2つの商デジットを予測することさえて きる。内部部分剰余の符号ビットは、均一に分布した入力オペランドに対してさ えオンである確率がn%を有している。これらの統計は、セルフタイムト実施例 か改善の利点を取り入れることができることから、より屡々使用される回路経路 の速度を早めるために使用される。
股間の重ね実行の新規性 この新規性以前は、SRT除算の諸段階が純粋に順次であると考えられていた。
本発明においては、アルゴリズムの各股肉の諸段階は重ね合わされており、付加 的な平行処理か可能になった分だけ高速になる。本新規性に関するデータ流を図 9に示す。詳述すれば、各段における剰余形成のための部分4ビツトキヤリー保 管及びキャリー伝播アドレスは、先行商デイジツト選択と、段自体の除数倍数マ ルチブレクサと、54ビツトキヤリー保管加算器と共に並列に動作することかで きる。部分加算器への入力の1つは、先行段(選択された商ディジツトを知る必 要かある)からの選択された除数倍数であるとして使用されていた。しかし、も し部分アドレスが並列に動作すれば、商ディジツトは未だ決定されていない。代 わりに本新規性では、考え得る各商デイジツト毎の部分加算器を二重にし、それ らか早めにそして並列に計算を開始できるようにし、次いで先行段からの閤ディ ノットを入手した時にそれらの結果の中から選択する。3つの考え得る商ディン ノドか存在するから、各可能性毎に経路が必要である。幸いにも、商ディジツト の1つは0であるから、2つの部分キャリー保管加算器だけてよい。本新規性て は、遅延かキャリー伝播加算器によって支配されることから、段当たりの平均部 分伝播遅延を概ね半分だけトリムし、段間の重なり実行によって2つの連続段に おけるキャリー伝播加算を同時に実行できるようにしている。
SRT除算の股間型なり実行の新規性は、段のシーケンスをセルフタイミングす ることによってZOST[L新規性と組合せることが可能である。図9にそれぞ れのデータ流を示しである。これは、図3及び4に示す併合及び結合構造を使用 することをゼ・要とする。これらの段の4つをループにしたものは、これらの段 のための論理か極めて大きい組合せアレイ内に組立てられているかの如く高速で 、繰り返し動作する。
口 Figure 7 補正書の翻訳文提出書 (特許法第184条の7第1項) 平成 年 月 日

Claims (7)

    【特許請求の範囲】
  1. 1.CMOSドミノ機能ブロックを使用するゼロオーバヘッド繰り返し論理回路 であって、上記各機能ブロックに毎合わされていて後続する機能ブロックが上記 機能ブロックからのデータの使用を終了したことを決定する完了検出器と、上記 完了検出器に応答し出力が後続ブロックによって使用された場合に限って上記機 能ブロックを事前充電する機能ブロック事前充電手段とを短込み、機能ブロック が上記事前充電手段によってリセットされ、その中のデータが駆逐されることを 特徴とする論理回路。
  2. 2.実際のラッチを使用することなく、データトークンが一連の事前充電された 段を通るようにそれらを分離し続けることが可能なパイプラインまたは環。
  3. 3.その機能ブロックの生組合せ待ち時間に対してゼロオーバヘッドで繰り返す 論理。
  4. 4.繰り返し非同期回路内のクリティカルパスを解析するために使用される折り 畳まれた従属グラフ解析方法。
  5. 5.組合せアレイの速度でデータを順方向に連続的に伝播させる機能ブロックの パイプラインまたは環の設計方法。
  6. 6.組合せアレイを小集合の段に“包み込み”、その領域を用いずにアレイの性 能を達成する非同期環。
  7. 7.僅か数段の例示を必要とするだけで、組合せアレイの速度で繰り返す除算の ためのセルフタイムド集積回路。
JP3518063A 1990-10-10 1991-10-10 ゼロオーバヘッドセルフタイムド繰り返し論理 Pending JPH06502287A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US595,350 1990-10-10
US07/595,350 US5121003A (en) 1990-10-10 1990-10-10 Zero overhead self-timed iterative logic
PCT/US1991/007256 WO1992007361A1 (en) 1990-10-10 1991-10-10 Zero overhead self-timed iterative logic

Publications (1)

Publication Number Publication Date
JPH06502287A true JPH06502287A (ja) 1994-03-10

Family

ID=24382899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3518063A Pending JPH06502287A (ja) 1990-10-10 1991-10-10 ゼロオーバヘッドセルフタイムド繰り返し論理

Country Status (6)

Country Link
US (3) US5121003A (ja)
EP (1) EP0557342A4 (ja)
JP (1) JPH06502287A (ja)
KR (1) KR930702759A (ja)
TW (1) TW208745B (ja)
WO (1) WO1992007361A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729319B1 (ko) * 2000-04-25 2007-06-15 더 트러스티스 오브 컬럼비아 유니버시티 인 더 시티 오브 뉴욕 고용량 비동기 파이프라인 처리를 위한 회로 및 방법
JP2007531064A (ja) * 2003-07-01 2007-11-01 インターナショナル・ビジネス・マシーンズ・コーポレーション 集積回路チップ(パイプライン式の挿入のための回路および方法)
JP2013065317A (ja) * 2007-12-26 2013-04-11 Qualcomm Inc 非同期システムにおけるリーク制御のシステム及び方法

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3279337B2 (ja) * 1991-04-12 2002-04-30 ヒューレット・パッカード・カンパニー ねずみ取り論理回路用万能パイプラインラッチ
US5434520A (en) * 1991-04-12 1995-07-18 Hewlett-Packard Company Clocking systems and methods for pipelined self-timed dynamic logic circuits
US5656948A (en) * 1991-05-17 1997-08-12 Theseus Research, Inc. Null convention threshold gate
CA2103257A1 (en) 1991-05-17 1992-11-26 Karl M. Fant Null convention speed independent logic
US6900658B1 (en) * 1991-05-17 2005-05-31 Theseus Logic Inc. Null convention threshold gate
US5796962A (en) * 1991-05-17 1998-08-18 Theeus Logic Null convention bus
US5930522A (en) * 1992-02-14 1999-07-27 Theseus Research, Inc. Invocation architecture for generally concurrent process resolution
US5455831A (en) * 1992-02-20 1995-10-03 International Business Machines Corporation Frame group transmission and reception for parallel/serial buses
US5267240A (en) * 1992-02-20 1993-11-30 International Business Machines Corporation Frame-group transmission and reception for parallel/serial buses
JP3467286B2 (ja) * 1992-05-19 2003-11-17 ヒューレット・パッカード・カンパニー 論理評価システム
US5402012A (en) * 1993-04-19 1995-03-28 Vlsi Technology, Inc. Sequentially clocked domino-logic cells
US5459414A (en) * 1993-05-28 1995-10-17 At&T Corp. Adiabatic dynamic logic
US5592103A (en) * 1993-10-21 1997-01-07 Sun Microsystems, Inc. System for fast switching of time critical input signals
US5475320A (en) * 1994-08-11 1995-12-12 Texas Instruments Incorporated Data processing with a self-timed approach to spurious transitions
US5488319A (en) * 1994-08-18 1996-01-30 International Business Machines Corporation Latch interface for self-reset logic
EP0703530A3 (en) * 1994-09-21 1996-08-14 Texas Instruments Inc Detection in the change in logic state in a data processing system
JPH08106413A (ja) * 1994-10-06 1996-04-23 Fujitsu Ltd データ処理装置,データ転送方法及びメモリ装置
WO1996021277A1 (en) * 1995-01-06 1996-07-11 Theseus Research, Inc. Null convention threshold gate
US5517136A (en) * 1995-03-03 1996-05-14 Intel Corporation Opportunistic time-borrowing domino logic
US5521538A (en) * 1995-03-30 1996-05-28 At&T Corp. Adiabatic logic
US5495188A (en) * 1995-04-13 1996-02-27 International Business Machines Corporation Pulsed static CMOS circuit
US5541537A (en) * 1995-06-02 1996-07-30 International Business Machines Corporation High speed static circuit design
US5565798A (en) * 1995-08-21 1996-10-15 International Business Machines Corporation Self-timed control circuit for self-resetting logic circuitry
US5623450A (en) * 1995-09-08 1997-04-22 International Business Machines Corporation Conditional recharge for dynamic logic
US5615160A (en) * 1995-09-08 1997-03-25 International Business Machines Corporation Minimal recharge overhead circuit for domino SRAM structures
US5559453A (en) * 1995-09-28 1996-09-24 International Business Machines Corporation Interlocked restore circuit
US5886540A (en) * 1996-05-31 1999-03-23 Hewlett-Packard Company Evaluation phase expansion for dynamic logic circuits
US6211704B1 (en) * 1996-07-24 2001-04-03 Hyundai Electronics Industries Co., Ltd. Asynchronous sensing differential logic (ASDL) circuit
US5815687A (en) * 1996-09-19 1998-09-29 International Business Machines Corporation Apparatus and method for simulating domino logic circuits using a special machine cycle to validate pre-charge
US5964866A (en) * 1996-10-24 1999-10-12 International Business Machines Corporation Elastic self-timed interface for data flow elements embodied as selective bypass of stages in an asynchronous microprocessor pipeline
JP3504088B2 (ja) * 1996-10-30 2004-03-08 株式会社東芝 論理回路
US5912900A (en) * 1996-12-13 1999-06-15 International Business Machines Corporation Method and system for testing self-timed circuitry
US5870411A (en) * 1996-12-13 1999-02-09 International Business Machines Corporation Method and system for testing self-timed circuitry
US5896046A (en) * 1997-01-27 1999-04-20 International Business Machines Corporation Latch structure for ripple domino logic
US5914618A (en) * 1997-03-11 1999-06-22 Vlsi Technology, Inc. Optimum noise isolated I/O with minimized footprint
US6040716A (en) * 1997-05-19 2000-03-21 Texas Instruments Incorporated Domino logic circuits, systems, and methods with precharge control based on completion of evaluation by the subsequent domino logic stage
FR2766275B1 (fr) * 1997-07-21 1999-10-15 Sgs Thomson Microelectronics Circuit de validation de modeles de simulation
US5907693A (en) * 1997-09-24 1999-05-25 Theseus Logic, Inc. Autonomously cycling data processing architecture
US5977663A (en) * 1997-09-24 1999-11-02 Theseus Logic, Inc. Dynamic threshold gates with embedded registration
US6031390A (en) * 1997-12-16 2000-02-29 Theseus Logic, Inc. Asynchronous registers with embedded acknowledge collection
US6262593B1 (en) 1998-01-08 2001-07-17 Theseus Logic, Inc. Semi-dynamic and dynamic threshold gates with modified pull-up structures
US6269461B1 (en) 1998-04-27 2001-07-31 International Business Machines Corporation Testing method for dynamic logic keeper device
US6169422B1 (en) 1998-07-20 2001-01-02 Sun Microsystems, Inc. Apparatus and methods for high throughput self-timed domino circuits
EP1121631B1 (en) * 1998-07-22 2007-04-25 California Institute Of Technology Reshuffled communications processes in pipelined asynchronous circuits
US6128678A (en) 1998-08-28 2000-10-03 Theseus Logic, Inc. FIFO using asynchronous logic to interface between clocked logic circuits
US6865668B1 (en) * 1998-09-15 2005-03-08 Trustees Of Columbia University In The City Of New York Variable-length, high-speed asynchronous decoder circuit
CA2247548A1 (en) * 1998-09-15 2000-03-15 Steven M. Nowick A high-speed asynchronous decompression circuit for variable-length-coded data
US6316960B2 (en) 1999-04-06 2001-11-13 Intel Corporation Domino logic circuit and method
US6265899B1 (en) 1999-06-04 2001-07-24 S3 Incorporated Single rail domino logic for four-phase clocking scheme
US6556962B1 (en) 1999-07-02 2003-04-29 Intel Corporation Method for reducing network costs and its application to domino circuits
US6529861B1 (en) 1999-07-02 2003-03-04 Intel Corporation Power consumption reduction for domino circuits
US6201415B1 (en) 1999-08-05 2001-03-13 Intel Corporation Latched time borrowing domino circuit
US6529045B2 (en) 1999-09-28 2003-03-04 Intel Corporation NMOS precharge domino logic
US6275071B1 (en) 1999-12-29 2001-08-14 Intel Corporation Domino logic circuit and method
US6492837B1 (en) 2000-03-17 2002-12-10 Intel Corporation Domino logic with output predischarge
US6590424B2 (en) * 2000-07-12 2003-07-08 The Trustees Of Columbia University In The City Of New York High-throughput asynchronous dynamic pipelines
US6486706B2 (en) 2000-12-06 2002-11-26 Intel Corporation Domino logic with low-threshold NMOS pull-up
US6420904B1 (en) * 2001-01-25 2002-07-16 Koninklijke Philips Electronics N.V. Domino logic with self-timed precharge
US6404234B1 (en) 2001-05-09 2002-06-11 Intel Corporation Variable virtual ground domino logic with leakage control
US7283557B2 (en) 2002-01-25 2007-10-16 Fulcrum Microsystems, Inc. Asynchronous crossbar with deterministic or arbitrated control
US7698535B2 (en) 2002-09-16 2010-04-13 Fulcrum Microsystems, Inc. Asynchronous multiple-order issue system architecture
US7260753B2 (en) 2003-07-14 2007-08-21 Fulcrum Microsystems, Inc. Methods and apparatus for providing test access to asynchronous circuits and systems
US7065419B2 (en) * 2004-04-14 2006-06-20 Taiwan Semiconductor Manufacturing Company, Ltd. Job flow Petri Net and controlling mechanism for parallel processing
US7584449B2 (en) 2004-11-22 2009-09-01 Fulcrum Microsystems, Inc. Logic synthesis of multi-level domino asynchronous pipelines
US7814280B2 (en) 2005-01-12 2010-10-12 Fulcrum Microsystems Inc. Shared-memory switch fabric architecture
US7415702B1 (en) 2005-01-20 2008-08-19 Unisys Corporation Method for zero overhead switching of alternate algorithms in a computer program
US7916718B2 (en) 2007-04-19 2011-03-29 Fulcrum Microsystems, Inc. Flow and congestion control in switch architectures for multi-hop, memory efficient fabrics
US8104004B2 (en) * 2008-02-13 2012-01-24 Achronix Semiconductor Corporation Logic performance in cyclic structures
US8082527B1 (en) * 2008-07-07 2011-12-20 Xilinx, Inc. Representing the behaviors of a packet processor
US7746109B1 (en) 2009-04-02 2010-06-29 Xilinx, Inc. Circuits for sharing self-timed logic
US9002915B1 (en) 2009-04-02 2015-04-07 Xilinx, Inc. Circuits for shifting bussed data
US9411554B1 (en) 2009-04-02 2016-08-09 Xilinx, Inc. Signed multiplier circuit utilizing a uniform array of logic blocks
US7746108B1 (en) 2009-04-02 2010-06-29 Xilinx, Inc. Compute-centric architecture for integrated circuits
US8706793B1 (en) 2009-04-02 2014-04-22 Xilinx, Inc. Multiplier circuits with optional shift function
US7733123B1 (en) * 2009-04-02 2010-06-08 Xilinx, Inc. Implementing conditional statements in self-timed logic circuits
US7982496B1 (en) 2009-04-02 2011-07-19 Xilinx, Inc. Bus-based logic blocks with optional constant input
US7948265B1 (en) 2009-04-02 2011-05-24 Xilinx, Inc. Circuits for replicating self-timed logic
US8527572B1 (en) 2009-04-02 2013-09-03 Xilinx, Inc. Multiplier architecture utilizing a uniform array of logic blocks, and methods of using the same
US7746101B1 (en) 2009-04-02 2010-06-29 Xilinx, Inc. Cascading input structure for logic blocks in integrated circuits
US8402164B1 (en) 2010-10-27 2013-03-19 Xilinx, Inc. Asynchronous communication network and methods of enabling the asynchronous communication of data in an integrated circuit
US8788549B2 (en) 2011-05-02 2014-07-22 Saankhya Labs Private Limited Zero overhead block floating point implementation in CPU's
US10141930B2 (en) * 2013-06-04 2018-11-27 Nvidia Corporation Three state latch
US9520180B1 (en) 2014-03-11 2016-12-13 Hypres, Inc. System and method for cryogenic hybrid technology computing and memory
JPWO2021105814A1 (ja) * 2019-11-29 2021-06-03

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4503512A (en) * 1982-02-22 1985-03-05 Amdahl Corporation Cellular division circuit
US4631701A (en) * 1983-10-31 1986-12-23 Ncr Corporation Dynamic random access memory refresh control system
US4747082A (en) * 1984-11-28 1988-05-24 Hitachi Ltd. Semiconductor memory with automatic refresh means
JPS61253695A (ja) * 1985-05-07 1986-11-11 Hitachi Ltd 半導体記憶装置
US4827428A (en) * 1985-11-15 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Transistor sizing system for integrated circuits
US4710650A (en) * 1986-08-26 1987-12-01 American Telephone And Telegraph Company, At&T Bell Laboratories Dual domino CMOS logic circuit, including complementary vectorization and integration
US5023827A (en) * 1988-08-18 1991-06-11 Digital Equipment Corporation Radix-16 divider using overlapped quotient bit selection and concurrent quotient rounding and correction
US4856029A (en) * 1988-10-11 1989-08-08 Eastman Kodak Company Technique for processing a digital signal having zero overhead sync
US4999528A (en) * 1989-11-14 1991-03-12 Keech Eugene E Metastable-proof flip-flop

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729319B1 (ko) * 2000-04-25 2007-06-15 더 트러스티스 오브 컬럼비아 유니버시티 인 더 시티 오브 뉴욕 고용량 비동기 파이프라인 처리를 위한 회로 및 방법
JP2007531064A (ja) * 2003-07-01 2007-11-01 インターナショナル・ビジネス・マシーンズ・コーポレーション 集積回路チップ(パイプライン式の挿入のための回路および方法)
JP2013065317A (ja) * 2007-12-26 2013-04-11 Qualcomm Inc 非同期システムにおけるリーク制御のシステム及び方法

Also Published As

Publication number Publication date
EP0557342A4 (en) 1994-09-07
TW208745B (ja) 1993-07-01
WO1992007361A1 (en) 1992-04-30
KR930702759A (ko) 1993-09-09
US5671151A (en) 1997-09-23
US5121003A (en) 1992-06-09
US5513132A (en) 1996-04-30
EP0557342A1 (en) 1993-09-01

Similar Documents

Publication Publication Date Title
JPH06502287A (ja) ゼロオーバヘッドセルフタイムド繰り返し論理
US6867620B2 (en) Circuits and methods for high-capacity asynchronous pipeline
US6028987A (en) Method of operation of arithmetic and logic unit, storage medium, and arithmetic and logic unit
US4972362A (en) Method and apparatus for implementing binary multiplication using booth type multiplication
JP3244506B2 (ja) 小型乗算器
JPH0215088B2 (ja)
Kearney et al. Bundled data asynchronous multipliers with data dependent computation times
US4887233A (en) Pipeline arithmetic adder and multiplier
US5600569A (en) Method, system, and apparatus for automatically designing logic circuit, and multiplier
TW200405197A (en) Wide adder with critical path of three gates
JP3277089B2 (ja) 乗算器及び積和演算装置
WO2002008885A1 (en) HIGH-SPEED PARALLEL-PREFIX MODULO 2n-1 ADDERS
Louie et al. On digit-recurrence division implementations for field programmable gate arrays
Matsubara et al. 30-ns 55-b shared radix 2 division and square root using a self-timed circuit
Natarajan et al. Low power high performance carry select adder
Smith et al. Radix-4 modules for high-performance bit-serial computation
Meng et al. A clock-free chip set for high-sampling rate adaptive filters
Lu et al. A bit-level pipelined implementation of a CMOS multiplier-accumulator using a new pipelined full-adder cell design
Chown et al. VLSI design of a pipelined CORDIC processor
Upadhyay et al. Pipelining high-radix SRT division algorithms
Muscato et al. Locally clocked microprocessor
SAMATHA et al. Design of Low Delay 64-Bit Parallel Self Timed Adder
Yun et al. A low-control-overhead asynchronous differential equation solver
Bindal et al. Review of Combinational and Sequential Logic Circuits and Design
Dave High-speed Multi Operand Addition Utilizing Flag Bits