JP2003198360A - 半導体集積回路 - Google Patents

半導体集積回路

Info

Publication number
JP2003198360A
JP2003198360A JP2001400680A JP2001400680A JP2003198360A JP 2003198360 A JP2003198360 A JP 2003198360A JP 2001400680 A JP2001400680 A JP 2001400680A JP 2001400680 A JP2001400680 A JP 2001400680A JP 2003198360 A JP2003198360 A JP 2003198360A
Authority
JP
Japan
Prior art keywords
circuit
input
semiconductor integrated
integrated circuit
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001400680A
Other languages
English (en)
Inventor
Atsushi Kameyama
敦 亀山
Masako Yoshida
雅子 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001400680A priority Critical patent/JP2003198360A/ja
Publication of JP2003198360A publication Critical patent/JP2003198360A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Logic Circuits (AREA)

Abstract

(57)【要約】 【課題】 微細化を進めることでより高スループット化
が実現できる演算回路を具備する半導体集積回路を提供
する。 【解決手段】 複数ビットの入力から複数ビットの出力
を生成する演算回路を備えた半導体集積回路において、
演算回路は、複数ビット入力から複数ビット出力までの
全てのデータパス上の論理ゲート段数が同一でかつ、各
論理ゲートのファンイン、ファンアウトが同一となるよ
うにした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、論理回路を具備す
る半導体集積回路に関し、特に複数ビット入力から複数
ビット出力を生成する演算回路を有する半導体集積回路
に関する.
【0002】
【従来の技術】近年、半導体集積回路の集積度の向上は
著しく、ギガビット級の半導体メモリでは1チップに数
億個の半導体素子が、64ビットのマイクロプロセッサ
では1チップに数百万個から1千万個の半導体素子が集
積される。集積度の向上は素子の微細化によって達成さ
れ、1千万個以上の半導体素子を集積しているGHz動
作ハイエンドマイクロプロセッサにおいては、0.18
μmのゲート長のMOSトランジスタが用いられてい
る。ITRSのロードマップに従うと今後は、さらなる
高性能化の為に微細化が進められ、0.1μm以下のゲ
ート長のMOSトランジスタが用いられるようになる。
【0003】このような微細MOSトランジスタにおい
ては、ホットキャリア生成によるトランジスタ特性の劣
化やTDDB(Time Dependant Die
lectric Breakdown)による絶縁膜破
壊が起きる。また、チャネル長が短くなることによるし
きい値電圧の低下を抑えるため、基板領域やチャネル領
域の不純物濃度を高めると、ソース、ドレインの接合電
圧が低下する。従ってこれらの微細素子の信頼性を維持
するためには、電源電圧を下げることが非常に有効であ
る。低電源電圧化によって、ソース・ドレイン間の横方
向電界を弱めることで、ホットキャリアの発生を防ぐこ
とができ、またゲート・バルク間の縦方向電界を弱める
ことで、TDDBを防ぐことができる。さらに、電源電
圧を下げることによって、ソース・バルク間、ドレイン
・バルク間の接合に加わる逆バイアスを低下させること
ができ、接合耐圧の低下にも対応可能になる。
【0004】また、近年パーソナルコンピュータ(P
C)の市場拡大が著しい。この一つの要因として、パー
ソナルコンピュータの高性能化、特に心臓部であるMP
U(Micro Processing Unit)の
高性能化が挙げられる。MPUの高性能化のために、メ
モリや周辺論理回路よりも一世代以上先の微細化が進め
られており、既に市販のPC用途のMPUでは0.18
μmの微細トランジスタが積極的に用いられている。そ
の結果、1GHzを越える超高速クロック周波数で既に
動作するようになってきている。
【0005】しかし、高性能化のため、オンチップキャ
ッシュメモリ容量の増加などに伴うMPUの集積度向上
により、チップ消費電力が数Wクラスから数十Wクラス
と著しく増加している。今後も同様の消費電力増加の傾
向が続くことは、実装上・信頼性上許容されなくなりつ
つある。
【0006】以上のような微細トランジスタの信頼性確
保と電源電圧の自乗に比例する消費電力削減の意味合い
においても、回路が動作する際の電源電圧は年々低くな
ってきている。例えば0.18μmクラスの素子を用い
た場合も1.5V程度の低い電圧を用いることがあり、
さらに今後はITRSのロードマップによると微細化に
伴い電源電圧1Vあるいは0.5V程度まで低下すると
予測されている.
【0007】しかし、論理回路の電源電圧を低くしてい
くと、論理回路の低消費電力化、素子の信頼性確保は実
現できるものの、ゲート印加電圧の低減によりMOSト
ランジスタの駆動能力が低下する。このため、論理回路
の動作速度はスケーリング則で期待される程には高速な
特性は得られない。
【0008】また、一般的に高性能MPUの演算回路で
は演算部の高速化を狙い、加算器の桁上げ先見などの高
速化回路と通常のスタティック回路の2倍程度の高速化
が可能であるダイナミック回路を組み合わせて用いてい
る。しかしながら、素子の微細化とそれに伴う電源電圧
の低下のため、ダイナミックノード容量値減少に伴う保
持電荷量の減少、スケーリング則に従ったMOSトラン
ジスタのしきい値電圧の低下によるオフ時漏洩電流の増
大とそれの伴うダイナミックノードでの電荷漏洩、電源
電圧の低下による論理振幅の低減、などにより回路マー
ジンが大きく低下する。
【0009】電荷量の減少に対しては、ダイナミックノ
ードの容量を大きくする、電荷漏洩に対してはしきい値
電圧を高くするなどの対策が考えられるが、いずれの方
法を用いてもダイナミック回路の本来の特徴である高速
性が犠牲になるため、ダイナミック回路を高速演算器に
用いる利点がなくなる。したがって、素子の微細化が進
み、電源電圧が下がってくると、回路マージンがなくな
る点、あるいは高速性が損なわれる点のいずれかにより
ダイナミック回路で高速な演算器を構成することが非常
に困難になる。
【0010】次に演算器の性能を決定する項目に関して
説明を行う。図11は、代表的演算器である8x8ビッ
トの乗算器のブロック図を示す。乗算器は、2入力AN
D回路、半加算器(ハーフアダー:HA)及び、全加算
器(フルアダー:FA)により構成される。これによ
り、8ビットの入力(a7,a6,…,a0)と(b
7,b6,…,b0)とから、積である8ビットの出力
(P7,P6,…,P0)が得られる。この乗算器の最
大演算時間は、通常図11の太線で示した経路(データ
パス)で決定され、ANDゲート1段、半加算器2段と
全加算器12段の遅延時間の総和からなる。最小演算時
間は、a0とb0からP0の出力が得られる経路であ
り、ANDゲート1段である。従って、演算時間は、A
NDゲート1段で済む場合からANDゲート1段、半加
算器2段、全加算器12段を経る場合までばらつくこと
になる。
【0011】通常のシステムLSIでは、乗算回路の入
出力(ここではa0〜a7,b0〜b7とP0〜P7)
にDタイプフリップフロップ(DFF)などのラッチ回
路を配置するため、クロック周波数fclkは乗算回路
の最大演算時間(ここではANDゲート1段、半加算器
2段、全加算器4段を経る時間)をTmpyとすると、
1/Tmpy以下となり、演算器の最大演算時間がクロ
ック周波数を決定することになる。即ち、演算性能を重
視するDSP・MPUなどでは、演算のスループットは
演算器の最大演算時間で決定されることになる。
【0012】ここでは説明を判りやすくするために単純
な乗算器の例で示しているが、桁上げ先見回路などの高
速化回路を用いた乗算器あるいは加算器などにおいても
同様で、演算回路のクリティカルパスで決定される最大
演算時間がシステムLSIのクロック周波数あるいはシ
ステムLSIの演算能力を決定することになる。
【0013】
【発明が解決しようとする課題】図12は、超高速MP
Uの乗算器、加算器などの高速演算器などに用いられて
いるダイナミック回路の一例を示す。ここでは入力と同
じ論理が得られるノンインバート回路の例を示してい
る。このダイナミック回路は、ダイナミックノード40
1に充放電を行うpチャネルMOSFET402a及び
nチャネルMOSFET402b、論理ゲートであるn
チャネルMOSFET403、ダイナミックノードの結
果を外部に伝えるCMOSインバータ回路404、論理
回路部の電流漏洩の影響を少なくするキーパー回路を構
成するpチャネルMOSFET405から構成される。
【0014】通常、クロック信号CLKがローレベルの
ときプリチャージ用MOSFET402aによりダイナ
ミックノード401に充電を行い、クロック信号CLK
がハイレベル即ちエバリュエーション時に論理段MOS
FET403がダイナミックノード401の放電を行う
か否かを決定する。即ち入力INが“H”であり且つク
ロック信号CLKが“H”のとき、MOSFET402
b,403を介してダイナミックノード401の電荷が
放電される。MOSFET402b或いは403がオフ
の保持の場合には、キーパー回路MOSFET405で
電荷を保持する。そしてダイナミックノード401の電
位をCMOSインバータ回路404を介して出力する。
【0015】素子耐圧が2Vあるいはそれ以上ある0.
25μm程度のゲート長のMOSFETを用いる場合に
は論理回路部MOSFET403のしきい値電圧を0.
5V以上にすることが容易であるため、MOSFET4
03の漏洩電流は大きな問題にならない。しかし、ゲー
ト長が0.1μm以下まで微細化がすすんでくると、M
OSFETの耐圧及び信頼性の問題から電源電圧が1.
2Vから0.8V程度まで下がってくる。この場合、ス
ケーリング則に則って考えると通常のCMOS論理回路
のMOSFETのしきい値電圧は0.2−0.3V程
度、ダイナミック回路の論理回路部においてはやや高め
の0.3−0.35V程度に設定される。
【0016】このとき、微細化によりダイナミックノー
ド401の容量は小さくなり、さらにMOSFET40
3、402bを介する漏洩電流が二桁近く大きくなって
きており、論理回路部MOSFET403がオフの場合
のダイナミックノード401の保持電位をエバリュエー
ション時にハイレベル即ち電源電圧に維持するのはより
難しくなる。さらに微細化が進み0.05μm程度のゲ
ート長のMOSFETでは電源電圧が0.5−0.6V
程度になるため、CMOS回路のしきい値電圧が0.1
−0.15V、ダイナミック回路の論理回路部のしきい
値電圧が0.2Vになり、オフ時の漏洩電流が3桁程度
大きくなり、このままではダイナミック回路を動作させ
ることが極めて困難になる。
【0017】これらの問題を回避するためには、漏洩電
流を抑えるために論理回路部のMOSFET403のし
きい値電圧をよりプラス側に設定すること、あるいはキ
ーパー回路のMOSFET405駆動能力を高めること
で電荷保持を容易にする方法が考えられるが、いずれの
場合も結果的にダイナミック回路のゲートのスイッチン
グ速度の低下につながり、スタティック動作のCMOS
回路に対する優位性が失われる。
【0018】このような状況で演算器の特性を見みる
と、素子の微細化にもかかわらず、論理回路のスイッチ
ング速度の低下により、最大演算時間が増加するためク
ロック周波数が低下して、演算器のスループットが向上
しないという問題が明らかになる。すなわち演算回路の
性能が回路内のクリティカルパスの遅延時間である最大
遅延時間で決定されてしまうため、基本回路の遅延時間
の低下が演算器の性能低下に結びつく。
【0019】以上のように素子の微細化を進めていった
場合、レイアウト面積の縮小といった長所もあるが、速
度の観点では、内部の基本回路に高速化の為に用いられ
ているダイナミック回路がMOSFETの漏洩電流の増
大のため回路動作を保証することが厳しくなる。これを
回避するためには漏洩電流の少ないMOSFETを採用
する必要があるが、そうすると駆動能力の低下により、
高速化が難しくなる。
【0020】以上要するに、最大演算時間が演算回路の
性能を決定してしまう現状の演算回路構成では、微細化
が必ずしも演算回路の高速化につながらず、微細化を進
めていくにも拘わらず、最終的には演算回路の高スルー
プット化が困難である、といった問題がある。
【0021】本発明は、上記事情を考慮してなされたも
ので、その目的とするところは微細化を進めることでよ
り高スループット化が実現できる演算回路を具備する半
導体集積回路を提供することにある。
【0022】
【発明を解決するための手段】この発明は、複数ビット
の入力から複数ビットの出力を生成する演算回路を備え
た半導体集積回路において、前記演算回路は、複数ビッ
ト入力から複数ビット出力までの全てのデータパス上の
論理ゲート段数が同一でかつ、各論理ゲートのファンイ
ン、ファンアウトが同一であることを特徴とする。
【0023】この発明において好ましくは、演算回路を
構成する各論理ゲートは、スタティックCMOS回路で
あり、また各論理ゲートの立ち上がり時間と立下り時間
が±10%の精度で同一になるように設計されるものと
する。
【0024】この発明によると、演算回路を構成する全
てのデータパスの遅延時間が等しくなるから、スループ
ットが従来のように演算回路の最大遅延時間で決定され
るのではなく、パイプライン処理等によって高いスルー
プットを得ることができる。また演算回路のスループッ
トは、最も周波数特性の低い論理ゲートで決定されるこ
とになり、構成素子の微細化により、高いスループット
が得られる。
【0025】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1は、本発明の第1の実施の形態
に関わる半導体集積回路に設けられる演算回路である。
ここでは、8×8乗算器の場合について、各出力ビット
単位でスライスした回路図である。このビットスライス
回路SLは、図2に示す8×8乗算式における縦一列の
演算部に相当し、最大16ビット入力(a101〜a1
16)に対してANDゲートにより8個部分積をとり、
それそれを2個ずつトーナメント方式により加算を行っ
ている。
【0026】加算の際には、前段のビットスライス回路
からのキャリーイン(C2I1〜C2I4、C3I1〜
C3I2、C31I、C4I〜C14I)も同時に入力
する構成となり、最終的に各ビット出力に相当するC1
5Sおよび次段のビットスライス回路に与えるキャリー
アウト(C2O1〜C2O4、C3O1〜C3O2、C
31O、C4O〜C14O)を出力する。8×8乗算器
のビットスライス回路SL内部の構成は、半加算器(H
A)11(図4)、通常の3入力で2出力の全加算器
(FA)13(図5)、2入力AND入力の半加算器
(HA)12(図6)と4入力でサムとキャリーの2出
力である全加算器(FA)14(図7)からなる。
【0027】いずれのビットスライス回路SLにおいて
も入力ピンから出力ピンまでの各信号経路を構成する論
理ゲートの段数、ファンイン(FI)及びファンアウト
(FO)が同一になるように、ダミーゲートが加えられ
ている。各ブロックに関して以下に詳細な説明を行う。
【0028】図4は、図1に示すビットスライス回路S
L内部の後半で11段直列に接続されている半加算器1
1の論理構成を示している。入力信号aa,bbをそれ
ぞれ差動増幅器41a,41bにより真・偽の両相信号
に変換している。得られた信号の論理をとるNAND回
路42a1,42a2と、それらの出力の一致検出を行
うNAND回路43aの2段NANDを組み合わせ、更
に2段のインバータ44a,45aによるバッファを介
してサム(S)を生成する。
【0029】キャリー(C)の生成経路は、同様に信号
aa,bbの論理をとる2入力NAND回路42b1と
その出力を反転するNAND回路43bの2段NAND
及び、2段のインバータ44b,45bによるバッファ
により構成される。
【0030】NAND回路42b2は、差動増幅器41
a,41bのFOを全て2にするために挿入されたダミ
ーゲートである。また、キャリー生成経路のNAND回
路43bは、サム生成経路内のNAND回路43aと同
じ2入力NAND回路を用い、その一つの入力を“H”
レベル固定としてインバータとしており、これによりN
AND回路43aとFIを同じにしている。
【0031】これにより、入力aa、bbからサムSあ
るいはキャリーCまでの信号経路は、次の表1のように
なる。
【0032】
【表1】1段目:両相変換回路41a,41bで、FI
=1,FO=2、 2段目:2入力NAND回路(42a1,42a2),
(42b1,42b2)で、FI=2,FO=1、 3段目:2入力NAND回路43a,43bで、FI=
2,FO=1、 4段目:インバータ回路44a,44bで、FI=1,
FO=1、 5段目:インバータ回路45a,45bで、FI=1,
FO=1
【0033】次に全加算器13の内部論理構成を図5に
示す。二つの信号入力aa,bbとキャリー入力ccの
ための差動増幅器51a,51b,51cと、それらの
出力の論理をとる3入力NANND回路52a1−52
a4,52b1−52b4、更にそれらの出力の一致検
出を行う4入力NAND回路53a,53b及び、バッ
ファ段である2段ずつのインバータ54a,55a,5
5b,55bを有する。
【0034】4入力NAND回路42c1,52c2
は、差動増幅器51a,51b,52cのFOをすべて
同じく5にするために挿入されたダミーゲートである。
この回路では、入力aa,bb,ccからサムSあるい
はキャリーCの生成までの信号経路は、何れも下表2の
ようになる。
【0035】
【表2】1段目:両相変換回路51a,51b,51c
でFI=1,FO=5、 2段目:3入力NAND回路52a1−52a4,52
b1−52b4でFI=3,FO=1、 3段目:4入力NAND回路53a,53bでFI=
4,FO=1、 4段目:インバータ回路54a,54bでFI=1,F
O=1、 5段目:インバータ回路55a,55bでFI=1,F
O=1
【0036】図6は、図1に示すビットスライス回路S
L内部の初段に用いられている2入力AND入力の半加
算器12の内部論理構成を示している。入力信号aa,
bb,cc,ddをNAND回路61a,61bでAN
D演算を行いその出力を差動増幅器62a,62bによ
り真・偽の両相信号に変換している。得られた信号に対
して、図4の半加算器11と同様に、2段のNAND回
路(63a1,63a2)と64aを組み合わせてサム
Sを生成し、2段のNAND回路63b1と64を組み
合わせることによりキャリー(C)を生成する。
【0037】ここでも、差動増幅回路62a,62bの
FOを同一にすることでサムSとキャリーCの論理遅延
を同一にするため、2入力NAND回路63b2がダミ
ーゲートとして挿入されている。また、キャリー生成経
路の出力段NAND回路64bは、サム生成経路の出力
段と同じ2入力NANDを用い、その一つの入力を
“H”固定としてインバータとして、FIを揃えてい
る。このため、入力aa、bb、cc、ddからサムS
あるいはキャリーCまでの信号経路は、何れも下表3の
ようになる。
【0038】
【表3】1段目:2入力NAND回路61a,61bで
FI=2,FO=1, 2段目:両相変換回路62a,62bでFI=1,FO
=2、 3段目:2入力NAND回路(63a1,63a2),
63b1でFI=2,FO=1、 4段目:2入力NAND回路64a,64bでFI=
2,FO=1
【0039】次に、図1のビットスライス回路SLにお
ける4入力の全加算器14の内部論理構成を図7に示
す。入力aa,bbとcc、ddをそれぞれ半加算器7
1a,71bで演算を行い、その出力を差動増幅器72
a1,72a2,72b1,72b2で両相変換を行
う。得られた信号に対してNAND回路(73a1−7
3a3),74aを組み合わせることによりサム(S)
を生成し、同様にNAND回路(73b1−73b
3),74bを組み合わせることによりとキャリー
(C)を生成する。
【0040】差動増幅器72a1,72a2,72b
1,72b2のFOを全ての経路で2に揃えるために、
4個の2入力NAND回路73d,73c1−73c3
がダミーゲートとして挿入されている。キャリー生成経
路のNANDゲート73b2,73b3は、サム生成経
路のNAND回路73a1,73a2とFIを合わせる
ため、一つの入力を“H”固定とした2入力NANDを
用いてインバータとしている。更に、キャリー生成側の
NAND回路74bに合わせて、サム生成側でのNAN
D回路74aを3入力として、その一つの入力を“H”
固定としている。この回路では、入力aa,bb,c
c、ddからサムSあるいはキャリーCまでの信号経路
は何れも、表4のようになる。
【0041】
【表4】1段目:2入力NAND回路でFO=1, 2段目:両相変換回路でFO=2、 3段目:2入力NAND回路でFO=1、 4段目:2入力NAND回路でFO=1 (ここまでは半加算器71a,71b内部の経路) 5段目:両相変換回路72a1,72a2,72b1,
72b2でFI=1,FO=2、 6段目:2入力NAND回路(73a2,73a),
(73b1−73b3)でFI=2,FO=1、 7段目:3入力NAND回路74a,74bでFI=
3,FO=1、 4段目:インバータ回路75a,75bでFI=1,F
O=1、 5段目:インバータ回路76a,76bでFI=1,F
O=1
【0042】このように乗算器を構成する各ビットスラ
イス回路SLブロック内の経路の論理段数、FI,FO
は同一となっている。
【0043】図3A−図3Hは、図1に示すビットスラ
イス回路SLを16個接続して、図2に示す8×8乗算
を実現した乗算器の全体のブロック図を示す。図3A−
図3Hに示す16個のビットスライス回路SL1−SL
16はそれぞれ、図2に示す演算式の縦一列の演算部と
対応する。これらのビットスライス回路SL1−SL1
6に対して、A1−A8,B1−B8が供給される16
本の信号線301と、“L”レベル入力のための一本の
接地線302が共通に配設され、これらと各ビットスラ
イス回路の入力端子a101−a116の間での接続に
より、図2に示す8×8演算が実現されている。
【0044】この構成により、A1〜A8、B1〜B8
の各入力ピンからP1〜P16までの各出力ピンまでの
経路をみると、各信号経路を構成する論理ゲートの段
数、FI、FOが同一になる。具体的には、全てのビッ
トスライス回路SLでの入力から出力の経路が2入力A
ND入力半加算器、4入力全加算器、全加算器2段、半
加算器11段から構成される経路になる。この乗算器で
は、内部論理ゲートで信号劣化が無い場合には入力デー
タと同一のデータレートで出力される。換言すると、演
算器のスループットは信号劣化を起こさない最大周波数
で決定される。即ち、論理ゲートの周波数特性によって
決定され、従来の演算回路のような最大遅延時間で決定
されない。これは、クロックバッファ回路の特性がクロ
ックトリーの遅延時間で決定されず、クロックバッファ
回路の周波数特性で決定されるのと同様である。
【0045】図1、図2、図3A−3Hに係わる8x8
乗算器の回路要素に関して具体的に説明する。ここで
は、ゲート長0.14μmのCMOSプロセスを前提と
した検討結果を述べる。電源電圧はVDD=1.5Vと
する。このときのCMOS論理回路を構成するpチャネ
ルMOSFETのしきい値電圧は−0.25V、nチャ
ネルMOSFETのしきい値電圧は0.25Vとした。
【0046】論理回路は、NAND回路、インバータ回
路はともに図8に示す一般的なスタティックCMOS回
路を前提としている。3入力NAND回路は一般に、図
8(a)に示すように出力端子と基準電位端子の間に直
列接続されたnチャネルMOSFET804,805,
806を持つ。これに対してこの実施の形態では、図8
(b)に示すように、nチャネルMOSFET804、
805、806をそれぞれ、3個ずつのMOSFET要
素(804a,804b、804c),(805a,8
05b,805c),(806a、806b、806
c)に分割して、3個ずつ直列接続された3個のMOS
FET要素列として配列している。3個の入力IN1,
IN2,IN3は、各MOSFET要素列のそれぞれ1
段目、2段目、3段目と異なる位置のMOSFET要素
のゲートに接続する。これは、入力のゲートスイッチン
グ速度依存性を抑える目的であり、これにより伝播入力
にともなう遅延バラツキが抑えられる。
【0047】ここでは、3入力の例を示しているが、一
般にm入力NAND回路(m≧2)の場合にはnチャネ
ルMOSFETをm分割することで同様のゲート入力に
よるゲートスイッチング速度バラツキを抑えることがで
きる。そして、図4−図7で説明したように、異なる信
号経路の対応する論理段に例えば3入力NAND回路と
2入力NAND回路が必要な場合には、いずれにも3入
力NAND回路を用いて、2入力NANDが必要な箇所
では一つの入力端子を“H”固定することにより、FI
を同一にする。同様に、異なる信号経路の対応する論理
段に例えば2入力NAND回路とインバータが必要な場
合には、いずれにも2入力NAND回路を用いて、イン
バータが必要な箇所では一つの入力端子を“H”固定す
ることにより、FIを同一にする。
【0048】さらに、CMOS回路では、ゲートの立ち
上がり時間と立下り時間がほぼ等しくなるように、ゲー
ト幅を調整している。例えば、通常のインバータではp
チャネルMOSFETとnチャネルMOSFETのゲー
ト幅の比率を2.5倍、2入力NANDゲートではそれ
ぞれのpチャネルMOSFETとnチャネルMOSFE
Tのゲート幅の比率を1.25倍から1.04倍、3入
力NANDゲートではそれぞれのpチャネルMOSFE
TとnチャネルMOSFETのゲート幅の比率を0.8
3倍、4入力NANDゲートではそれぞれのpチャネル
MOSFETとnチャネルMOSFETのゲート幅の比
率を0.625倍としている。この比率を用いること
で、立ち上がり時間と立下り時間の変動量を±10%以
下としている。
【0049】入力信号から真・偽の両相信号を発生する
論理ゲートである、図4−図7に示す差動増幅回路とし
て、図9に示す構成を用いた。図9の差動増幅回路は、
3個直列接続されたインバータ601、602,603
からなるインバータ列と、このインバータ列により得ら
れる二つの差動入力が供給される二つの差動回路60
4、605により構成される。差動回路の604,60
5の出力は論理的に同一の出力端子同士を共通接続して
一つの差動出力を得る構成としている。
【0050】インバータ601,602,603はCM
OSインバータであって、それぞれのpチャネルMOS
FETとnチャネルMOSFETのゲート幅比が20/
8,20/8,10/8に設定されている。差動回路9
04,905では、pチャネルMOSFETとnチャネ
ルMOSFETのゲート幅比が20/8に設定されてい
る。この様な差動増幅回路構成を用いることにより、位
相差の少ない両相信号が得ることができる。
【0051】本乗算器の特性をSPICEシミュレーシ
ョンにより求めたところ、データレートとして2GB/
sで動作することを確認した。ここでは、判定はデータ
列のパルス幅の変動率が本来のデータより20%以下で
ある場合を動作OKとし、動作データレートを求めてい
る。シミュレーションではデータレートを決定している
のは半加算器の出力段に設けているインバータ回路の立
ち上がり特性であった。
【0052】データレート2GB/sは、従来の演算器
では最大演算時間500psに相当し、同一のプロセス
ではダイナミック回路で得られる特性と同等あるいはそ
れ以上のデータレートで動作する結果が得られた。従っ
て本乗算器のスループットは、0.14μmの素子を用
いた世代において最も高速な回路であるダイナミック回
路を用いた乗算器で得られる特性と少なくとも同等の性
能であることがわかった。また、本乗算器のレイテンシ
ー即ち遅延時間は3.5nsであった。
【0053】今後の素子の微細化に対して、本乗算器で
は通常のCMOS回路で構成しているため、回路マージ
ンが大きく、微細化の際の懸念点であるオフ時のリーク
電流の増大、電源電圧低下に伴う回路マージンの低下の
影響を抑制することが可能である。その結果微細化に伴
う素子の高性能化に追随して高性能化が計れることが容
易に予想がつく。これらの点がダイナミック回路のよう
に将来素子リーク電流の増大、電源電圧の低下により回
路マージンが低下するため、高速性能を維持したままで
は回路動作が厳しくなる回路と大きく異なる。
【0054】実施の形態では、演算回路の例として8×
8ビット符号無し乗算器の例を示したが、これは一例で
ありこの発明は加算器その他の他の高速演算回路にも同
様に適用可能である。例えば単純なnビット加算器の場
合で演算時間が大きな問題でない場合には、半加算器を
アレイ状に配列し、キャリーを隣のビットに伝播する構
成にすることで入力から出力までの全ての経路におい
て、論理段数とFI,FOが同一になるように構成でき
る。これは、乗算器内の大半の演算が各ビット演算結果
を加算すること及びキャリー伝播を行っていることから
もわかる。
【0055】図10は、簡単な加算器の例として2ビッ
ト加算器の例を示している。いずれの信号経路も入力か
ら半加算器3段を経ることで出力に到達する。また桁上
げ先見などの回路がある場合には桁上げ回路がFIある
いはFOの観点でクリティカルなパスになるため、全て
のデータ経路を桁上げ先見回路と同様のFI、FOにな
るようにダミーゲート回路を挿入することで、同様の構
成が可能となる.
【0056】また、回路の例として一般的なCMOS回
路を中心に説明を行ったが、パストランジスタ論理回
路、pseudo−NMOS回路あるいは電流モード論
理回路においても、論理回路の立ち上がり時間と立下り
時間がほぼ同程度になるように工夫することで、基本回
路として使用することができる。例えば、pseudo
−NMOS回路においては、nチャネルMOSFETの
駆動能力をpチャネルMOSFETの倍程度、即ち同一
のゲート幅にすることでほぼ立ち上がり時間と立下り時
間を同一にすることができる。あるいは、ウエル電位を
調整するしきい値補償回路を用いることで、立ち上がり
時間と立下り時間を±10%以内に抑えることでほぼ同
一にすることができる。
【0057】差動増幅回路の一例として図9にしめす回
路例を掲げたが、通常の参照電圧入力の差動回路の真・
偽2つの出力を用いても問題はない。
【0058】この発明の演算回路における性能、即ちス
ループットは、最終的に基本回路の周波数特性で決定さ
れる。その意味では、FIが小さいことが望ましい。F
Iが大きくなると寄生容量が大きくなるため、論理ゲー
トの周波数特性が大きく劣化するためである。実用性を
考えると、図1、図2、図3A−3Hに示す8×8乗算
器の場合のように最大FIは4以下であることが望まし
い。
【0059】さらに、CMOS回路、pseudo−N
MOS回路においては、各FETとしては絶縁ゲート型
のものを用いれば良く、ゲート絶縁膜がシリコン酸化膜
である狭義のMOSFETに限らず、一般的にMIS
(Metal Insulator Semicond
uctor)FETを用いても良いことは勿論である。
【0060】
【発明の効果】以上詳述したように本発明によれば、演
算回路内部の入力から出力までの各信号経路の論理段数
および各段におけるFI、FOを等しくすることによ
り、演算回路のスループット向上を図ることができる。
【図面の簡単な説明】
【図1】実施の形態に係わる8×8乗算器の各ビットス
ライス回路SLの基本構成を示すブロック図である。
【図2】同乗算器の各ビットスライス回路における演算
内容を示す図である。
【図3A】同乗算器のビットスライス回路SL1,SL
2部の入出力接続関係を示す図である。
【図3B】同乗算器のビットスライス回路SL3,SL
4部の入出力接続関係を示す図である。
【図3C】同乗算器のビットスライス回路SL5,SL
6部の入出力接続関係を示す図である。
【図3D】同乗算器のビットスライス回路SL7,SL
8部の入出力接続関係を示す図である。
【図3E】同乗算器のビットスライス回路SL9,SL
10部の入出力接続関係を示す図である。
【図3F】同乗算器のビットスライス回路SL11,S
L12部の入出力接続関係を示す図である。
【図3G】同乗算器のビットスライス回路SL13,S
L14部の入出力接続関係を示す図である。
【図3H】同乗算器のビットスライス回路SL15,S
L16部の入出力接続関係を示す図である。
【図4】同乗算器内ビットスライス回路で用いられてい
る半加算器の具体的構成を示す図である。
【図5】同乗算器内ビットスライス回路で用いられてい
る全加算器の具体的構成を示す図である。
【図6】同乗算器内ビットスライス回路で用いられてい
る2入力ANDゲート入力の半加算器の具体的構成を示
す図である。
【図7】同乗算器内ビットスライス回路で用いられてい
る4入力の全加算器の具体的構成を示す図である。
【図8】同乗算器の3入力NAND回路の具体的構成例
を示す図である。
【図9】同乗算器内の差動増幅回路の具体的構成例を示
す図である。
【図10】他の実施の形態による2ビット加算器の具体
的構成例を示す図である。
【図11】従来の8×8乗算器の基本構成を示すブロッ
ク図である。
【図12】ダイナミック回路の構成を示す図
【符号の説明】
SL(SL1〜SL16)…ビットスライス回路、1
1,12…ハーフアダー、13,14…フルアダー、3
01…信号線、302…接地線、41a,41b,51
a,51b,51c,62a,62b…差動増幅回路、
42a1,42a2,43a,42b1,42b2,4
3b,52a1−52a4,52b1−52b4,52
c1,52c2,53a,53b,61a,61b,6
3a1,63a2,63b1,63b2,64a,64
b,73a1,73a2,73b1−73b3,73c
1−73c3,73d…NAND回路、44a,45
a,44b,45b,53a,55a,54b,55
b,75a,76a,75b,76b…インバータ、7
1a,71b…ハーフアダー、801〜803…pチャ
ネルMOSFET、804a−804c,805a−8
05c,806a−806c…nチャネルMOSFE
T、901〜903…インバータ、904,905…差
動回路。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成13年12月28日(2001.12.
28)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】発明の名称
【補正方法】変更
【補正内容】
【発明の名称】 半導体集積回路

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数ビットの入力から複数ビットの出力
    を生成する演算回路を備えた半導体集積回路において、 前記演算回路は、複数ビット入力から複数ビット出力ま
    での全てのデータパス上の論理ゲート段数が同一でか
    つ、各論理ゲートのファンイン、ファンアウトが同一で
    あることを特徴とする半導体集積回路。
  2. 【請求項2】 前記演算回路内の論理ゲートはスタティ
    ックCMOS回路で構成され、各論理ゲートの立ち上が
    り時間と立下り時間が±10%の精度で同一になるよう
    に各極性のMOSFETを用いて構成されていることを
    特徴とする請求項1に記載の半導体集積回路。
  3. 【請求項3】 前記演算回路内の論理ゲートは、最大フ
    ァンインが4以下であるCMOS回路により構成されて
    いることを特徴とする請求項2に記載の半導体集積回
    路。
  4. 【請求項4】 前記演算回路内で真と偽の両相信号を生
    成する論理ゲートは、差動増幅回路であって、CMOS
    インバータが3個直列接続されたインバータ列と、この
    インバータ列の各段出力に得られる2通りの差動入力が
    それぞれ供給され、互いの同相出力端子を共通接続して
    1通りの差動出力を出す二つの差動回路とを備えたこと
    を特徴とする請求項2記載の半導体集積回路。
  5. 【請求項5】 前記演算回路内のファンイン数がm(≧
    2)の論理ゲートであるCMOS回路は、出力端子と基
    準端子間に直列に接続されるべきm個のMOSFET
    を、それぞれm個のMOSFET要素に分割して、m個
    ずつ直列接続されたm個のMOSFET要素列として配
    列して、同一の入力が各MOSFET要素列の異なる位
    置にあるMOSFET要素のゲートに接続されるように
    したことを特徴とする請求項2に記載の半導体集積回
    路。
  6. 【請求項6】 前記演算回路内に、異なるデータパスの
    対応する論理段の論理ゲートのファンアウトを同一にす
    るためのダミー論理ゲートが挿入されていることを特徴
    とする請求項1記載の半導体集積回路。
  7. 【請求項7】 前記演算回路内の異なるデータパスの対
    応する二つの論理ゲートのファンインを同一にするため
    に、その二つの論理ゲートの一方が固定バイアスが与え
    られた入力端子を有することを特徴とする請求項1記載
    の半導体集積回路。
JP2001400680A 2001-12-28 2001-12-28 半導体集積回路 Pending JP2003198360A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001400680A JP2003198360A (ja) 2001-12-28 2001-12-28 半導体集積回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001400680A JP2003198360A (ja) 2001-12-28 2001-12-28 半導体集積回路

Publications (1)

Publication Number Publication Date
JP2003198360A true JP2003198360A (ja) 2003-07-11

Family

ID=27605117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001400680A Pending JP2003198360A (ja) 2001-12-28 2001-12-28 半導体集積回路

Country Status (1)

Country Link
JP (1) JP2003198360A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022523942A (ja) * 2019-05-05 2022-04-27 長江存儲科技有限責任公司 正確なデューティサイクル制御を実装するダブルデータレート回路およびデータ生成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022523942A (ja) * 2019-05-05 2022-04-27 長江存儲科技有限責任公司 正確なデューティサイクル制御を実装するダブルデータレート回路およびデータ生成方法
JP7317981B2 (ja) 2019-05-05 2023-07-31 長江存儲科技有限責任公司 正確なデューティサイクル制御を実装するダブルデータレート回路およびデータ生成方法

Similar Documents

Publication Publication Date Title
Suzuki et al. A 1.5-ns 32-b CMOS ALU in double pass-transistor logic
Shoba et al. GDI based full adders for energy efficient arithmetic applications
Ohkubo et al. A 4.4 ns CMOS 54/spl times/54-b multiplier using pass-transistor multiplexer
US6590425B2 (en) Semiconductor integrated circuit apparatus
JPH06236254A (ja) 機能的に完全なセルフタイミング機能付き論理回路群
KR100423903B1 (ko) 고속 저전력 4-2 압축기
US6466960B1 (en) Method and apparatus for performing a sum-and-compare operation
JP3433405B2 (ja) 深いサブミクロン様式のvlsi設計用の低しきい値電圧mosfetデバイスと正規しきい値電圧mosfetデバイスを混合した論理ブロック
Sayil A survey of circuit-level soft error mitigation methodologies
Kun et al. A power-optimized 64-bit priority encoder utilizing parallel priority look-ahead
Delgado-Frias et al. A high-performance encoder with priority lookahead
JP2000235479A (ja) 和・比較演算を実行するための方法および装置
JP2007124343A (ja) データ保持回路
US7519648B2 (en) Encoder for a multiplier
US5732008A (en) Low-power high performance adder
Nagateja et al. Low voltage, high speed FinFET based 1-bit BBL-PT full adders
US6711633B2 (en) 4:2 compressor circuit for use in an arithmetic unit
JP2003198360A (ja) 半導体集積回路
Jeong et al. Robust high-performance low-power carry select adder
JP3216409B2 (ja) 半導体集積回路装置
Sarkar et al. Low Power implementation of Multi-Bit Hybrid Adder using Modified GDI Technique
DK et al. VLSI Implementation of Braun Multiplier using Full Adder
Anand et al. A low power and high speed 8-bit ALU design using 17T full adder
US6794903B2 (en) CMOS parallel dynamic logic and speed enhanced static logic
Khanum et al. Xnor-xor based full adder using double pass transistor logic