JP2010146474A - 半導体装置 - Google Patents

半導体装置 Download PDF

Info

Publication number
JP2010146474A
JP2010146474A JP2008325702A JP2008325702A JP2010146474A JP 2010146474 A JP2010146474 A JP 2010146474A JP 2008325702 A JP2008325702 A JP 2008325702A JP 2008325702 A JP2008325702 A JP 2008325702A JP 2010146474 A JP2010146474 A JP 2010146474A
Authority
JP
Japan
Prior art keywords
arithmetic processing
storage
voltage
period
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008325702A
Other languages
English (en)
Other versions
JP4966956B2 (ja
Inventor
Takayuki Kawahara
尊之 河原
Koichi Takayama
恒一 高山
Yoshiko Nagasaka
由子 長坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008325702A priority Critical patent/JP4966956B2/ja
Publication of JP2010146474A publication Critical patent/JP2010146474A/ja
Application granted granted Critical
Publication of JP4966956B2 publication Critical patent/JP4966956B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

【課題】本発明の目的は、回路性能を落さずに回路の消費電力を削減するための効率的な方法により、高速半導体装置の電力を低減することにある。
【解決手段】メモリが階層構造となっているシステムにおいて、キャッシュミスが生じた後、メインメモリの先頭アドレスの検出に入った時に、メインメモリの先頭アドレスを検出する命令を検出して演算器を第1の低電力モードに切り替える。また、先頭アドレスが見つかった後、メモリより演算器が備えるキャッシュメモリへの格納と平行して行われる演算器の動作を第2の低電力モードに切り替えて行うものである。
【選択図】図1

Description

本発明は、半導体装置に係り、特に、低電力プロセッサ用回路技術に関する。
従来、特開2000-214967号公報(特許文献1)に開示されているように、プロセッサに入力する電力制御命令信号をデコードして、装置内の回路ブロックの周波数やリーク電流を制御する方法が知られている。また、特開2004-318502号公報(特許文献2)に開示されているように、プロセッサに入力するメモリアクセス命令を検出して回路ブロックの周波数やしきい値電圧を制御する方法が知られている。更には、特開2002-229690号公報(特許文献3)に開示されているように、プロセッサ自身が他の命令から電力制御命令を発生し、装置内の回路ブロックの周波数やリーク電流を制御する方法が知られている。
リーク電流やしきい値電圧を制御する手段としては、1996年、IEEE, Journal of Solid-State Circuits, VOL.31, No.11、1770頁〜1779(非特許文献1)の"A 0.9-V, 150-MHz, 10-mW, 4 mm2, 2-D Discrete Cosine Transform Core Processor with Variable Threshold-Voltage (VT) Scheme"に記載のように、CMOSトランジスタの基板(ウエル)に電圧を印加し(この文献のFig.2を参照)、することが知られている。また、2005 年、IEEE International Electron Device Meeting Technical Digest Papers pp. 631-634(非特許文献2)や、特開2007-042730号公報(特許文献4)に開示されるように完全空乏(FD)型のSOI構造におけるCMOSトランジスタにおいて、その埋め込み酸化膜(BOX)層が30nm以下と薄いことを特徴としたトランジスタを用い、これにより、このBOX層をゲート絶縁膜と見立てたバックゲートを駆動してしきい値電圧を制御する手段が知られている。また、特開2004-318502にも開示されているように、電源と回路ブロックの間に別のMOSトランジスタを挿入する方法も知られている。
特開2000-214967号公報 特開2004-318502号公報 特開2002-229690号公報 特開2007-042730号公報 "1996年 IEEE, Journal of Solid-State Circuits", VOL.31, No.11、pp.1770-1779 "2005年、IEEE International Electron Device Meeting Technical Digest Papers"、pp. 473-476
しかしながら、電力制御命令信号をデコードして回路ブロックの周波数やしきい値電圧を制御する方法は種々あり、それらが一様に電力削減に効果があるわけではない。特に、近年の半導体装置では、そのメモリシステムは一般に階層構造を持ち、これをいかに制御するかが高性能や低電力実現の鍵となって来ている。また、半導体装置自体も大型化、複雑化しており、一般には複数のプロセッサ(演算ブロック)を多数個用いて並列動作を行わせ、またネットワークで接続して、高性能や低電力実現の鍵となって来ている。この中で、電力制御命令信号をデコードして回路ブロックの周波数やしきい値電圧を制御する時にメモリに階層構造が有る時に、このメモリへのアクセス形態に応じた半導体装置の回路ブロックの周波数やしきい値電圧の制御する効果的な方法についての従来の検討は無かった。
そこで、本発明の目的は、回路性能を落さずに回路の消費電力を削減するための効率的な方法を提供することにある。
上記目的を達成するための代表的な手段を以下に示す。第1の手段としては、メモリが階層構造となっているシステムにおいて、キャッシュミスが生じた後、メインメモリの先頭アドレスを検出する命令を検出して演算器を第1の低電力モードに切り替えるものである。また、先頭アドレスが見つかった情報がメモリより発信されたら演算器を元の高速モードに切り替えるものである。第2の手段としては、先頭アドレスが見つかった後、メモリより演算器が備えるキャッシュメモリへの格納と平行して行われる演算器の動作を第2の低電力モードに切り替えて行うものである。
メモリが階層構造となっているシステムにおいて、キャッシュミスが生じた後、メインメモリの先頭アドレスを検出する動作は、高速な大型システムでも100ナノ秒からマイクロ秒のオーダーでの時間を要する。この間は、演算器の特定の部分のみ動いておればよく、演算器の多くの部分は停止することができ、また、演算器を構成しているMOSトランジスタのしきい値電圧を絶対値で大きくしてリーク電流を低減することができる。
上記のみでも効果は大きいが、メモリより演算器が備えるキャッシュメモリへの格納の転送速度は一般に演算器がキャッシュメモリを用いて行う演算速度よりも一桁以上遅い。よって、第2の手段により、この期間に演算器が第2の低電力モードである低速かつしきい値電圧がキャッシュメモリを用いて行う時よりも高い値とできることにより、本来の全体の動作性能は落さずに、低電力化が可能となるのである。
メモリが階層構造となっているシステムにおいて、キャッシュミスが生じた後、メインメモリの先頭アドレスを検出する動作の間は、演算器を構成しているMOSトランジスタのしきい値電圧を絶対値で大きくしてリーク電流を低減し、これにより回路性能を落さずに回路の消費電力を削減することができる。
本発明の第1の実施例を図1を用いて説明する。この実施例の主要な内容は、半導体チップCHIP上のメモリコントローラがメモリ(主記憶)の制御を行うが、このメモリコントローラの動作状態に応じた、又は動作状態を示す信号によって、これがメモリ(主記憶)の先頭アドレスを探す状態となっている期間、演算を行う回路ブロックPUの電力状態を変化させるものである。全体の構成例は、半導体チップCHIP上に少なくともひとつの演算を行う回路ブロックPUがあり、これは電力状態を変化できる機能を備えており、内部バスBUS1にキャッシュメモリCMと共に接続されており、このBUS1にCHIP上の色々な回路ブロックを統括管理するCPUと、メモリと、外部との信号のやり取りを行なう回路ブロックでありがIO接続されている。IOはチップの外へのバスBUS3は接続され、このBUS3には例えばファイルメモリが接続されている。ファイルメモリは例えばフラッシュメモリやHDDなどで構成される。BUS1にはメモリコントローラが接続され、このメモリコントローラには、チップの外へのバスBUS2が接続され、BUS2にはメモリ(主記憶)が接続される。このメモリ(主記憶)は、例えばDRAMやMRAMなどの磁性体メモリなどである。このような構成において、前述のPUの回路CKTはCMOS素子で構成されており、電源は高電位Vdは、低電位はVsであるが、その基板又はバックゲートの電圧を制御できるようになっている。この基板又はバックゲートに与える電圧及びその端子がVP及びVNであり、pMOS用がVPであり、nMOSがVNである。これらの値は制御する回路ブロックがBBコントローラであり、回路CKTに与えるクロックCLKの周波数を制御する回路ブロックがCLKGである。これらは、PUひとつ毎に準備される場合もあれば、動作内容に応じて複数のPUで纏められることもある。
また、共通部分を取り出して、これ以外を各PUに備える場合もある。これらBBコントローラとCLKGによって、PUの電力状態を変えることができる。この電力状態を変える信号が、MSKとMSBであり、共にメモリコントローラの状態による信号である。つまり、メモリコントローラがメモリ(主記憶)の先頭アドレスを探す状態になっていることを示す信号であり、この信号によって、PUの回路CKTの周波数及び基板電圧(バックゲート電圧)が変えられ、低電力な状態とすることができるのである。なお、このメモリコントローラの状態は、BUS1に接続されたCPUが行っているので、このMSKとMSBはCPUが発生した信号であると言うこともできる。このような構成により、本発明では演算を行う回路ブロックPUがキャッシュメモリCMの情報のみでは動作が行えず(キャッシュミス)、CHIP外部のメモリ(主記憶)の先頭アドレスを探しに行っている期間において、MSKとMSBによって回路CKTの周波数と基板又はバックゲートに与える電圧を変えて、回路ブロックPUを低電力な状態を取ることができるという特徴がある。なお、回路ブロックPUは複数個存在する場合は、そのそれぞれにおいてこのような低電力な状態を取ることができるという特徴がある。
図2は、本発明の動作の主要な部分例を示したものである。MSBとMSKは、図1の回路CKTに与えるクロック周波数と基板電圧(バックゲート電圧)を変化させる信号である。VPとVNはその基板電圧(バックゲート電圧)信号であり、CLKはそのクロック周波数である。図1で、キャッシュメモリへのミスが生じ、メモリ(主記憶)の先頭アドレスを探す状態に時刻t1においてなったとしよう。すると、MSBとMSKが切り替わり、より電力の小さな状態へ回路CKTは移行する。すなわち、VPはそれまので電位VPLからVPHへ、VNはそれまのでVNLからVNHへ変化する。ここで回路CKTにおいては、VPLとVNLの電位では、pMOSもnMOSもそのしきい値電圧は低く高速動作が可能である。一方、VPHとVNHの電位では、pMOSとnMOSのしきい値電圧は高くリーク電流を低く抑えることができる。このt1では、CLKも変化させる。時刻t1以前では、高い周波数f1であったが、ここで低い周波数f2に切り替わる。これによって、メモリ(主記憶)の先頭アドレスを探す状態では、周波数は低く、しきい電圧は高いので、充放電電力もリーク電力も低く抑えることができる。この後、メモリ(主記憶)の先頭アドレスを探す動作が終了すると、この時刻t2で再びMSBとMSKが切り替わり、VPとVNはそれぞれVPLとVNLに戻り、CLKはf1に戻る。これにより高速動作が可能な状態となる。このように本実施例では、メモリ(主記憶)の先頭アドレスを探す状態において、電力を低く抑えることが可能となるのである。なお、後述するが、t2において、メモリ(主記憶)からのデータを用いて直接PUが動作を行う場合があり、これは一般的にキャッシュメモリCMの内容で動作を行う時よりも低速である。このため、これに適したクロック周波数CLKと基板電圧(バックゲート電圧) VPとVNを与えることもできる。
ここで本発明が適用される半導体装置のメモリの階層構造を図3に示す。
プロセッサに対してレジスタ−キャッシュ−主記憶−ファイル記憶と構成され、一般にプロセッサに近いほど、スピードは速いが容量は小さい。プロセッサは、図1の演算を行う回路ブロックPUやCPUであり、図1では省略しているが実行中又は次に実行する命令やデータを蓄えておくレジスタを有している。この下にはキャッシュがあり、図1のキャッシュメモリCMなどでありプロセッサが当面の演算を行うのに必要なデータを蓄えておく。このキャッシュはプロセッサの動作速度と同じか近い周波数(1/2や1/4)と高速に動作する。主記憶は、このキャッシュに入りきれない情報を蓄えておくものであり、キャッシュよりも低速であるが大きな記憶容量を備えている。このメモリとキャッシュメモリとのデータのやり取りは、纏まった大きさの単位で行われる。この動作は、先頭のアドレスをアクセスする動作と纏まった単位のデータを連続的に主記憶よりキャッシュへ転送する動作の2つとからなる。このうち、後者の転送する動作はプロセッサの周波数の一桁低い周波数程度であるが、前者の先頭のアドレスをアクセスする動作はこれよりも低速である。これは、バスの衝突を避けるためにプロセッサと主記憶が記憶内容を特定したことを確認する動作や、主記憶を構成するメモリのアクセス時間の制約などによる。これを制御しているのがメモリコントローラである。本発明は、先頭のアドレスをアクセスする動作が半導体装置では起こることを利用し、その間のプロセッサを低速動作又は停止させ、MOSトランジスタのしきい値電圧も高くしてリーク電力を抑え、低電力化を図るものである。この先頭のアドレスをアクセスする動作は通常の動作で起こるため、本発明によって処理性能が低くなることはない。メモリの階層構造としては、更にファイル記憶がある。これは、HDDやフラッシュメモリで構成された巨大な容量のメモリであるが、一般的に速度は遅い。よって、一般的な計算では、これに必要な情報は一旦主記憶に取り込んでから行う。又は、動作中であれば、不要な情報内容となった主記憶の部分に予測してファイル記憶内容を転送するなどこの動作が見えないようにする工夫をする。ファイル記憶にアクセスしている時間は長いため、このときはプロセッサを止めてしまうことは行われてきた。本発明は、主記憶の動作を解析した結果、ここに動作速度を損なわずに電力を削減できる状態を見出し、考案したものである。
図4に、レジスタは省力したが、計算中のプロセッサとキャッシュとメモリ(主記憶)のデータのやり取りの大きさに注目した関係を示す。ファイル記憶は、主に計算は終了後、又は計算準備のためのデータをやり取りに使用するので省略してある。(a)は、階層構造を示した図であり、プロセッサに対して、キャッシュとメモリ(主記憶) とがあり、一般にキャッシュは高速だがその容量は小さく、メモリ(主記憶) は中速(〜低速)であるがその容量は大きい。一般には、キャッシュメモリはプロセッサと同じチップ上のSRAMが用いられるが、最近容量がそれでも大きなものが要求されるようになってきており、DRAMが用いられる場合もある。また、磁性体メモリもその無限回の書き換え回数のために使用されることもある。この時は、磁性体メモリは不揮発のためこれを活かした使い方も可能である。メモリ(主記憶) は、主にはDRAMであるが、これも磁性体メモリが使用される場合がある。このような構成において、(b)〜(d)の3つの動作モードが存在する。(b)は、プロセッサがキャッシュの記憶内容を用いて高速に動作している場合であり、プロセッサの最高性能を引き出すことができる。(c)は、主記憶中のデータを直接用いてプロセッサが動作している状態であり、データの転送速度によって速度は制限されてしまう。一般にはプロセッサの最高性能の一桁低い性能となってしまう転送速度となる。(d)は、これまでも説明してきた、先頭アドレスを探しに行っている状態であり、プロセッサそのものは演算を行っていない。本発明を用いて、プロセッサを低電力な状態にできるのは第1には(d)の期間であるが、(c)の期間もプロセッサの動作は最高性能の一桁低い動作しかできないため、本発明を用いてしきい値電圧も高くしてリーク電力を下げることができる。
図5は、この(b)〜(d)の3つの動作モードの時間配分を示した例である。(1)は、プロセッサの最高性能を引き出せるプログラムの例であり、分子動力学の第1原理計算の例である。この例では、56%の期間が(b)のモードであり、(c)が25%、(d)が19%である。この例では、本発明を用いて、プロセッサを低電力な状態にできるのは、先頭アドレスを探しに行っている期間では19%の部分である。(2)は、(1)のようにキャッシュの内容のみでの計算が占める割合が大きくない例であり、多くのプログラムはこのような傾向となってしまう。この例では、20%は(b)のモードとできた例であり、45%が(c)であり、35%が(d)である。この例では、先頭アドレスを探しに行っている期間のみに着目した場合でも35%の期間をプロセッサの電力が小さな状態とできる。
ここで、基板電圧(バックゲート電圧)及びクロック周波数を変える回路ブロック図を図6に示しておく。回路CKTは、本発明を構成するしきい値電圧とクロック周波数が制御可能なCMOS回路であり、その電源電圧はVdとVsであり、基板電圧(バックゲート電圧)の端子及びその電圧はVP及びVNであり、入力しているクロックの端子及びその周波数はCLKである。VP及びVNをメモリへのアクセス状況に応じて変化させるBBコントローラは、プロセス変動などに応じた電圧を発生するVthp及びVthnを備えている。それぞれ電源VddとVssで動作し(これはVdとVsと同一の場合もあれば、異なる場合もある)、VthpではpMOSと抵抗とで電圧が発生させられ、VthnではnMOSと抵抗とで電圧を発生する。これらの電圧は、使用したpMOS及びnMOSがプロセス条件を反映することによって、プロセス条件に応じた電圧を発生する。これによってプロセスの変動を基板電圧(バックゲート電圧)の電圧によって補償することが可能となる。これらの電圧は、一旦OPアンプで安定化される。このときにはプロセスによらない基準電圧Vref.が必要である。これは良く知られたバンドギャップジェネレータなどで発生できる。この出力電圧が、それぞれVPL及びVNLであり、本発明では回路CKTの高速動作に適したしきい値となる基板電圧(バックゲート電圧)であり、前述のようにプロセス変動を補償することもできる。これらの電圧より一定電圧シフトした電圧をVoltage Shifterで作成する。これらは、電源電圧又は内部で発生した電圧とVPL及びVNLとでダイオードを用いたり、抵抗を用いたり、或いはチャージポンプを用いて発生することができる。この出力がVPH及びVNHであり、本発明では、回路CKTが高しきい値電圧となりリーク電流を下げることができる基板電圧(バックゲート電圧)となる。これらの発生電圧をMUXで切り替えて、VP又はVNの電圧として使用すれば良い。この切り替えは、図1のメモリコントローラMCよりの信号MSBによって、B Registorと示したレジスタの内容を書き換えることで行う。このレジスタが切り替わると、それに応じてMUXが切り替えられて、VP及びVNへの出力を、VPH/VPL及びVNH/VNLから選択することができるのである。なお、MUXでは切り替えと共に、OPアンプを用いて出力電圧の安定性を高めることも行われる場合がある。同様に、クロック周波数の切り替えにおいては、CLKGにおいて、PLLの発振周波数を分周器1/2及び1/4によって、それぞれ周波数が1/2及び1/4の周波数を発生させる。stopは周波数0かそれに近い周波数を発生するためにものである。これらの出力をMUXで切り替えて、CLKへの出力周波数とする。この切り替えは、図1のメモリコントローラMCよりの信号MSKによって、F Registorと示したレジスタの内容を書き換えることで行う。なお、MUXでは切り替えと共に、信号の駆動能力を高めることも行われる場合がある。以上、仕組みを用いることによって、本発明に必要な基板電圧(バックゲート電圧)及びクロック周波数を変える機能を実現することができる。
図7及び図8に、本発明の動作を纏めておく。図7は、先頭アドレスを探しに行っている状態のみ基板電圧(バックゲート電圧)及びクロック周波数を変える実施例であり、図8は、メモリ(主記憶)よりの情報でプロセッサが動作している時にも別の基板電圧(バックゲート電圧)及びクロック周波数に変える実施例である。
図7において、キャッシュミスが生じると、メモリ(主記憶)アクセスが開始され開始信号が出される。これによってメモリコントローラが動作し、これまでの仕組みを用いて、プロセッサ動作が停止又は低い周波数へ切り替えられ、それと共に、基板電圧(バックゲート電圧)が変化しプロセッサのMOSトランジスタは高しきい値電圧となる。これと平行して、メモリ(主記憶)では先頭アドレスへのアクセスが行われる。バスの調停の準備などを得てこの動作が完了すると、このメモリ(主記憶)アクセスにヒット信号がでる。これまでは、プロセッサは、低クロック周波数及び高しきい値電圧の状態である。しかし、メモリ(主記憶)アクセスにヒット信号により、プロセッサの状態は復帰させられ、クロック周波数も当初の高い周波数に復帰し、MOSトランジスタも高速動作が可能な低しきい値電圧となる。この後、メモリ(主記憶)よりのデータ転送が行われ、プロセッサは動作を開始する。このような動作により、本実施例では、メモリ(主記憶)にて先頭アドレスへのアクセスが行われている期間、プロセッサを低電力状態とすることができるという特徴がある。また、これはプロセッサ全体の処理能力を邪魔しない。
図8の実施例においては、キャッシュミスが生じ、メモリ(主記憶)アクセスが開始されプロセッサの動作を低電力化し、その後、メモリ(主記憶)のアクセスヒット信号が出るまでは、図7の動作の実施例と同じである。本実施例では、その後のメモリ(主記憶)よりのデータ転送が行われ、これによるプロセッサの動作における基板電圧(バックゲート電圧)によるしきい値電圧及びクロック周波数(第1の低しきい値電圧、第1のクロック周波数)を、キャッシュを用いてのものと異なる値(第2の低しきい値電圧、第2のクロック周波数)に設定するという特徴がある。すなわち、メモリ(主記憶)のアクセスヒット信号が出て、先頭アドレスの検出と準備が終わると、まず、第1の低しきい値電圧、第1のクロック周波数とする。この状態で、メモリ(主記憶)よりのデータ転送を行う。このデータ転送はプロセッサ本来の最高性能よりは遅い転送レートであるため、第1の低しきい値電圧、第1のクロック周波数で動作が可能である。その分低電力となる。この後、キャッシュに必要なデータが揃うと、その次からはプロセッサ本来の性能での動作が可能となる。ここで本実施例では、第2の低しきい値電圧、第2のクロック周波数になるようにプロセッサへのクロック周波数、基板電圧(バックゲート電圧)を制御するのである。これにより、プロセッサは高速動作が可能となり、キャッシュの内容を用いて動作を行う。
図9は、本発明におけるCMOS構造の例を示す図である。nMOSとpMOSとは、p−sub上で下記に説明する構造をつけた形で形成され、両者は溝堀型絶縁領域であるSSTIで分離される。pMOSについてまず述べると、埋め込み酸化膜UTB上に形成されている。UTBの厚さは、例えば10〜20nmである。Sはソース端子、Gはゲート端子、Dはドレイン端子であり、これらは、シリサイドSCを介して、p+領域(ソース)、n領域(チャネル形成領域)、p+領域(ドレイン)に接続されている。この厚みは、例えば20nm程である。ゲートのSCとn領域の間には酸化膜があり、いわゆるMOS構造となっている。この酸化膜は、酸化ハフニウムのようないわゆるHigh−k膜の場合もある。なお、ゲートはシリサイドで構成しているが、これは例えばNiSiである。他の金属材料も考えられる。UTB下にはn領域があり、これは端子BGと接続されている。よって、断面図の上に示した回路図に示したように、BGはUTBを絶縁膜として、n領域とキャパシタを介した形で接続されている。これは、このUTBを第2のゲート酸化膜と見立てると、MOS構造の背面に第2のゲートが存在する構造となっている。よって、このゲートをバックゲートBG呼ぶことにする。この構造を用いた回路の構成例が図1のCKTとなる。このBGの電圧を変えることによって、UTBの上部のMOSのしきい値を変えることができる。このような構造において、チャネル形成領域が上記例の20nm程厚さであると、ソースとドレインにはさまれたゲート下の半導体領域(チャネル領域)は、完全に空乏化している。このような、絶縁膜UTBの上に完全空乏化したチャネル領域を有する構造は、UTBの厚さを限定しない時、一般にはFD−SOI構造と呼ばれる。nMOSにおいても、同様であり、埋め込み酸化膜UTB上にn+領域(ソース)、p領域(チャネル形成領域)、n+領域(ドレイン)が形成され、UTB下にはp領域があり、これは端子BGと接続されている。nMOSにおいては、dnでバックゲート部分をすべて覆う。このようにすれば、UTBより下の領域では、nMOSのdnとpMOSのn領域とは、p領域であるp−subによって分離することができる。dnに逆バイアスを与えるために電圧が、VDNより印加される。これによって、回路の動作状態に応じてしきい値電圧を変えることができ、高速かつ低電力・低リーク電流である半導体装置を実現できる。
図10と図11にバックゲート(BG)に電圧を印加する場合の例を示す。
図10において、(a)は回路図であり、(b)はバックゲートBGの電圧VBGSを変えた時のドレイン電流IDSのゲート・ソース間電圧VGS依存性である。この(b)から例えばゲート・ソース間電圧VGSが0Vの点の電流、すなわちオフ状態でのリーク電流を値を見ると、BGの電圧VBGSが0Vの時は、ゲート幅1ミクロンメートル当り10のマイナス10乗アンペアであるのに対して、VBGSが1Vの時は、3桁以上大きな電流が流れることが分かる。また、この図は縦軸が対数であるのでわかりにくいが、VGSが1Vの点、すなわちオン電流においても20%程、VBGSが1Vの方が、VBGSが0Vの場合と比較して大きい。このように、同じゲート・ソース間電圧VGSにおいて、バックゲートの電圧VBGを変えることで異なる電流を取ることができる。よって、リーク電流の小さな状態、又はオン電流の大きな状態を作り出すことができるのである。
図11では、(a)の回路図に示すようにバックゲートとゲートを直接接し、ゲートGのみで駆動する時のドレイン電流Idsのゲート・ソース間電圧VGS依存性を示している。(b)において、Aの線がこの時の依存性である。なお、Bの線は、図10(b)のVBGSが1Vの時依存性の線を示し、Cの線は図10(b)のVGSが0Vの時依存性の線をします。このように、VGSが0V、すなわちオフ状態では小さなリーク電流を実現し、かつ、VGSが1Vでは大きなオン電流を実現している。これによって、高速かつ低電力、低リーク電流を実現できる。
本発明では、図1のCKTのように纏まった論理回路には図10のようにBGを独立に制御する。一般にシステムLSIは多くの回路ブロックが集まってできているが、すべての回路ブロックが常時動いているわけではなく、時間的、空間的に動作している部分は多くの回路ブロックの一部であり、これが時々刻々と移り変わっていく。よって、活性化される回路ブロックのみオン電流が高い状態とし、活性化していない多くの回路ブロックではオフ電流が極めて小さな状態とすることによって、高速化と、低電力化、低リーク化を達成することができる。更に、バックゲートがこの回路ブロックの外から駆動するのでこの回路ブロックの動作が進行していくので、CKT内の各回路はバックゲートを駆動することがない。回路ブロック内部では配線が短いので、各回路の駆動する負荷は殆どゲート容量で決まってしまう。よって、このゲート容量を増やさないことが重要であり、これを達成している。
図12と図13には、プロセッサと同一チップ上に形成されるメモリセルの例を示す。
図12は、4つのトランジスタTr1,Tr2,Dr1,Dr2で構成したSRAMの例であり、Tr1とTr2のバックゲートを、メモリセルの内部ノードであるN1とN2で制御している。B1とB2は信号を読み出すビット線であり、W1がワード線である。この構成によれば、Tr1とTr2の内、必要な片方のMOSのしきい値電圧を高く、他方を低く設定することができ、このメモリセルの電力を下げることができる。
図13には、6つのトランジスタTr1,Tr2,Ld1,Ld2,Dr1,Dr2で構成したSRAMの例であり、Ld1とDr1のバックゲートがそのゲートと接続され、同様にLd2とDr2のバックゲートがそのゲートと接続された構成を取る。この構成によれば、このメモリセルの安定度を高めることができる。
図14〜図16は、本発明を用いたプロセッサで構成される大型計算機の構成例を示す図である。
図14において、各プロセッサは、図1のCHIP又は図15に示すプロセッサである。この図14の例では、4つのプロセッサ、プロセッサ0〜プロセッサ3がひとつのノードを形成し、このノードM個(ノード1〜ノードM−1)がネットワークで形成されている。このプロセッサ0〜プロセッサ3は、同種のプロセッサが4つでも、或いは異なるプロセッサの組み合わせでも良い。このような構成の大型計算機は並列計算に向いており、各ノードに分配された必要な計算が、4つのプロセッサで同時に処理される。この時、例えば、プロセッサ0が、全体の計算のスケジューリングや他のノードとの通信処理を受け持つ。
図15は、プロセッサの他の構成例を示す実施例である。CPUと複数のアクセラレータ1〜アクセラレータnを備えている。OtherはIO回路含めた他の回路ブロックを示す。また、キャッシュッメモリを備え、外部のメモリを制御するメモリコントローラを備えている。このメモリコントローラの動作状態によって、このプロセッサがどの階層のメモリを扱っているのかを認識し、本発明では、外部メモリ(主記憶)の先頭アクセスを探している期間は、このプロセッサ上の少なくとも一部の回路のクロック及びバックゲートを制御する。このために、クロック発生及び制御とPLLとバックゲート電圧発生回路を備えている。この図15のプロセッサが、プロセッサ0〜プロセッサ3のひとつひとつに対応する。図15の本実施例によれば、複数のアクセラレータ1〜アクセラレータnを備えた高い処理性能を持つ計算機においても、その性能を損なうことなく、電力を削減できる半導体装置を実現ですきる。
図16に、図15のプロセッサを用いて、図14の計算機を構成したときの全体像を示す。各プロセッサは図15と同じものである。この図では、メモリコントローラに接続される主記憶であるメモリが示されている。このメモリの先頭アドレスを検出するときの動作においては、本実施例では、プロセッサの少なくとも一部のバックゲートや周波数を変化させて低電力とすることはできる特徴がある。更に、各プロセッサは4つごとにネットワークI/Fでひとつのノードとなり、これがM個接続されている。また、本実施例では他の特徴として、例えば、プロセッサ0が、他のプロセッサ1〜3の状態を制御することができる。例えば、他のノードとの通信のような時は、プロセッサ0のみが動作すれば良く、この時他のプロセッサのバックゲートや周波数に指令を与えることができる。
本発明は、半導体装置に係わり、高速処理計算を行うが電力の増大が問題となっているサーバやスーパーコンピュータなどの分野において、処理速度の低下をおこさずに消費電力を低下させることができる装置を実現するものである。
本発明の第1の実施例を示す図。 図1の回路例の主要な部分の動作例を示す図。 本発明でのメモリの階層構造を示す図。 メモリの階層構造での本発明での動作例を示す図。 図3の例の時間配分例を示す図。 本発明で用いる基板電圧、周波数発生回路例を示す図。 本発明の第2の実施例である動作フローを示す図。 本発明の第3の実施例である動作フローを示す図。 CMOSの断面図例を示す図。 nMOSの特性例を示す図。 ゲートとバックゲートを接続した時のnMOSの特性例を示す図。 4つのトランジスタで構成するSRAM回路例を示す図。 6つのトランジスタで構成するSRAM回路例を示す図。 本発明の第4の実施例である大型計算機の構成例を示す図。 本発明の第5の実施例であるプロセッサの構成例を示す図。 本発明の第6の実施例である大型計算機の構成例を示す図。
符号の説明
DCL…論理回路ブロック、BAC…バックゲート制御信号発生回路ブロック、PFC…出力バッファ回路ブロック、UTB…埋め込み酸化膜、OX…ゲート酸化膜、STI…溝堀型絶縁領域、SSTI…溝堀型絶縁領域(STIよりも浅い)、TB…埋め込み酸化膜(UTBの下層にある)。

Claims (8)

  1. 演算処理装置と、
    前記演算処理装置で使用される命令及びデータを含む記憶情報を蓄えた、アクセス速度が前記演算処理装置の動作速度よりも遅い大容量記憶装置と、
    前記記憶情報の少なくとも一部を蓄えた、アクセス速度が前記演算処理装置の動作速度よりも遅く、前記大容量記憶装置のアクセス速度よりも速い小規模記憶装置と、
    前記大容量記憶装置を制御する記憶制御装置と、を有し、
    前記演算処理装置が、ゲート端子とドレイン端子とソース端子と基板端子とを具備してなるCMOSトランジスタで構成され、
    前記CMOSトランジスタの基板端子に、前記小規模記憶装置に記憶された記憶情報が前記演算処理装置において実行される第1の期間では第1の電圧が印加され、
    前記大容量記憶装置が、前記演算処理装置で必要な記憶情報を前記演算処理装置へ送る準備を行う第2の期間では第2の電圧が印加され、
    前記第1の電圧と前記第2の電圧とは異なる電圧であって、前記第1の電圧は前記CMOSトランジスタのしきい値電圧の絶対値を大きくする電圧であることを特徴とする半導体装置。
  2. 前記第2の期間が、前記演算処理装置が前記小規模記憶装置に必要な記憶情報が無いことを検知し、前記記憶制御装置が前記大容量記憶装置へ前記演算処理装置が必要な記憶情報を求め、その後、前記記憶制御装置が前記大容量記憶装置の記憶情報の中より必要な記憶情報の先頭アドレスを検知し、前記記憶制御装置の制御により前記大容量記憶装置から必要なデータを送り始めるまでの期間であることを特徴とする請求項1記載の半導体装置。
  3. 前記CMOSトランジスタは、絶縁膜上に構成されたSOI構造を有し、ゲート端子と、ドレイン端子と、ソース端子と、該絶縁膜の下に設けられた半導体領域と、該半導体領域に電圧を印加できるバックゲート端子とを備え、
    前記第2の期間において、前記バックゲート端子に、前記CMOSトランジスタのしきい値電圧の絶対値を大きくする電圧であって、前記第1の期間とは異なる電圧が印加されることを特徴とする請求項1記載の半導体装置。
  4. 前記第2の期間が、前記演算処理装置が前記小規模記憶装置に必要な記憶情報が無いことを検知し、前記記憶制御装置が前記大容量記憶装置へ前記演算処理装置が必要な記憶情報を求め、その後、前記記憶制御装置が前記大容量記憶装置の記憶情報の中より必要な記憶情報の先頭アドレスを検知し、前記記憶制御装置の制御により前記大容量記憶装置から必要なデータを送り始めるまでの期間であることを特徴とする請求項3記載の半導体装置。
  5. 演算処理装置と、
    前記演算処理装置が使用する命令及びデータを含む記憶情報を蓄えた、アクセス速度が前記演算処理装置の動作速度よりも遅い大容量記憶装置と、
    前記記憶情報の少なくとも一部を蓄えた、アクセス速度が前記演算処理装置の動作速度よりも遅く、前記大容量記憶装置のアクセス速度よりも速い小規模記憶装置と、
    前記大容量記憶装置を制御する記憶制御装置と、を有し、
    前記演算処理装置が、ゲート端子とドレイン端子とソース端子と基板端子とを具備してなるCMOSトランジスタで構成され、
    前記演算処理装置が前記小規模記憶装置に記憶された記憶情報を用いて演算を実行する第1の期間において、前記CMOSトランジスタの基板端子に第1の電圧が印加され、前記演算処理装置は第1のクロック周波数に同期して動作し、
    前記大容量記憶装置が、前記演算処理装置に必要な記憶情報を前記演算処理装置へ送る準備を行う第2の期間において、前記演算処理装置は前記第1のクロック周波数より遅い周波数を有する第2のクロック周波数に同期して動作し、前記基板端子には、前記CMOSトランジスタのしきい値電圧の絶対値を大きくする前記第1の電圧とは異なる第2の電圧が印加されることを特徴とする半導体装置。
  6. 前記第2の期間が、前記演算処理装置が前記小規模記憶装置に必要な記憶情報が無いことを検知し、前記記憶制御装置が前記大容量記憶装置へ前記演算処理装置が必要な記憶情報を求め、その後、前記記憶制御装置が前記大容量記憶装置の記憶情報の中より必要な記憶情報の先頭アドレスを検知し、前記記憶制御装置の制御により前記大容量記憶装置から必要なデータを送り始めるまでの期間であることを特徴とする請求項5記載の半導体装置。
  7. 前記CMOSトランジスタは、絶縁膜上に構成されたSOI構造を有し、ゲート端子と、ドレイン端子と、ソース端子と、該絶縁膜の下に設けられた半導体領域と、該半導体領域に電圧を印加できるバックゲート端子とを備え、
    前記第2の期間において、前記バックゲート端子に、前記CMOSトランジスタのしきい値電圧の絶対値を大きくする電圧であって、前記第1の期間とは異なる電圧が印加されることを特徴とする請求項5記載の半導体装置。
  8. 前記第2の期間が、前記演算処理装置が前記小規模記憶装置に必要な記憶情報が無いことを検知し、前記記憶制御装置が前記大容量記憶装置へ前記演算処理装置が必要な記憶情報を求め、その後、前記記憶制御装置が前記大容量記憶装置の記憶情報の中より必要な記憶情報の先頭アドレスを検知し、前記記憶制御装置の制御により前記大容量記憶装置から必要なデータを送り始めるまでの期間であることを特徴とする請求項7記載の半導体装置。
JP2008325702A 2008-12-22 2008-12-22 半導体装置 Expired - Fee Related JP4966956B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008325702A JP4966956B2 (ja) 2008-12-22 2008-12-22 半導体装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008325702A JP4966956B2 (ja) 2008-12-22 2008-12-22 半導体装置

Publications (2)

Publication Number Publication Date
JP2010146474A true JP2010146474A (ja) 2010-07-01
JP4966956B2 JP4966956B2 (ja) 2012-07-04

Family

ID=42566816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008325702A Expired - Fee Related JP4966956B2 (ja) 2008-12-22 2008-12-22 半導体装置

Country Status (1)

Country Link
JP (1) JP4966956B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015148890A (ja) * 2014-02-05 2015-08-20 富士通株式会社 情報処理装置、情報処理システム、および情報処理システムの制御方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998022863A1 (fr) * 1996-11-21 1998-05-28 Hitachi, Ltd. Processeur a faible consommation d'energie
JP2000214967A (ja) * 1998-11-20 2000-08-04 Hitachi Ltd 低電力情報処理装置
JP2002006979A (ja) * 2000-06-19 2002-01-11 Seiko Epson Corp クロック制御装置、半導体集積回路装置、マイクロコンピュータ及び電子機器
JP2005115769A (ja) * 2003-10-09 2005-04-28 Nec Corp 情報処理装置
JP2005196430A (ja) * 2004-01-07 2005-07-21 Hiroshi Nakamura 半導体装置および半導体装置の電源電圧/クロック周波数制御方法
JP2007042730A (ja) * 2005-08-01 2007-02-15 Renesas Technology Corp 半導体装置およびそれを用いた半導体集積回路
JP2007193433A (ja) * 2006-01-17 2007-08-02 Matsushita Electric Ind Co Ltd 情報処理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998022863A1 (fr) * 1996-11-21 1998-05-28 Hitachi, Ltd. Processeur a faible consommation d'energie
JP2000214967A (ja) * 1998-11-20 2000-08-04 Hitachi Ltd 低電力情報処理装置
JP2002006979A (ja) * 2000-06-19 2002-01-11 Seiko Epson Corp クロック制御装置、半導体集積回路装置、マイクロコンピュータ及び電子機器
JP2005115769A (ja) * 2003-10-09 2005-04-28 Nec Corp 情報処理装置
JP2005196430A (ja) * 2004-01-07 2005-07-21 Hiroshi Nakamura 半導体装置および半導体装置の電源電圧/クロック周波数制御方法
JP2007042730A (ja) * 2005-08-01 2007-02-15 Renesas Technology Corp 半導体装置およびそれを用いた半導体集積回路
JP2007193433A (ja) * 2006-01-17 2007-08-02 Matsushita Electric Ind Co Ltd 情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015148890A (ja) * 2014-02-05 2015-08-20 富士通株式会社 情報処理装置、情報処理システム、および情報処理システムの制御方法
US9710047B2 (en) 2014-02-05 2017-07-18 Fujitsu Limited Apparatus, system, and method for varying a clock frequency or voltage during a memory page transfer

Also Published As

Publication number Publication date
JP4966956B2 (ja) 2012-07-04

Similar Documents

Publication Publication Date Title
US20200089407A1 (en) Inter zone write for zoned namespaces
KR101249648B1 (ko) 반도체장치 및 그것을 이용한 반도체집적회로
US7683669B2 (en) Semiconductor device, CPU, image processing circuit and electronic device, and driving method of semiconductor device
US9703704B2 (en) Semiconductor device
JP3884914B2 (ja) 半導体装置
JP2020042892A (ja) 半導体装置、及びダイナミックロジック回路
US9886997B2 (en) Semiconductor device for reducing an instantaneous voltage drop
Shuto et al. Nonvolatile static random access memory based on spin-transistor architecture
JP5364125B2 (ja) 半導体装置
JP6420165B2 (ja) 半導体装置
WO2009092163A1 (en) Operational mode control in serial-connected memory based on identifier
TW459230B (en) Static RAM having word line driving circuitry shared by all the memory cells provided therein
JP2009266339A (ja) 半導体記憶装置とその半導体記憶装置を用いた電子機器
JP4966956B2 (ja) 半導体装置
Kawahara et al. Green computing with emerging memory
Shastri et al. Read write stability with leakage minimization of 4t SRAM cell for nano CMOS technology
JP4972634B2 (ja) 半導体装置
US20080024197A1 (en) Method and architecture for power management of an electronic device
Sakthimurugan et al. Designing low power magentic flip flop in 45 nm FDSOI technology for large scale cluster based engineering application
WO2023138219A1 (zh) 一种存储器、时序控制方法及电子设备
Akashe et al. Read write stability of Dual-VT 7T SRAM Cell at 45 nm technology
US20230317145A1 (en) Method and apparatus to implement an integrated circuit to operate based on data access characteristics
US20230315331A1 (en) Method and apparatus to implement an integrated circuit including both dynamic random-access memory (dram) and static random-access memory (sram)
Srivastava et al. Effect of technology scale-down on power reduction strategies
Rahman et al. A new Tunnel-FET based RAM concept for ultra-low power applications

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120402

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees