JP2013211022A - 電子デバイスのための適応電圧スケーリング - Google Patents

電子デバイスのための適応電圧スケーリング Download PDF

Info

Publication number
JP2013211022A
JP2013211022A JP2013093504A JP2013093504A JP2013211022A JP 2013211022 A JP2013211022 A JP 2013211022A JP 2013093504 A JP2013093504 A JP 2013093504A JP 2013093504 A JP2013093504 A JP 2013093504A JP 2013211022 A JP2013211022 A JP 2013211022A
Authority
JP
Japan
Prior art keywords
delay
logic
processing core
synthesizer
integrated circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013093504A
Other languages
English (en)
Other versions
JP5539571B2 (ja
Inventor
Elgebaly Mohamed
モハメッド・エルゲバリー
Zaka Malik Khurram
クーラム・ザカ・マリク
Gee Chua-Eoan Ryuu
ルー・ジー.・チュア−エオアン
Seong-Ook Jung
ソン−オク・ジュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2013211022A publication Critical patent/JP2013211022A/ja
Application granted granted Critical
Publication of JP5539571B2 publication Critical patent/JP5539571B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Semiconductor Integrated Circuits (AREA)
  • Pulse Circuits (AREA)
  • Power Sources (AREA)
  • Telephone Function (AREA)
  • Logic Circuits (AREA)

Abstract

【課題】処理コアに対する電圧を適応スケーリングする。
【解決手段】処理コアに対する論理速度およびワイヤ速度は、例えば、異なる回路構成要素から構成されている複数の信号パスをもつリング発振器を使用して特徴付けられる。処理コアに対する目標クロック周波数は、例えば、コアに対する計算要件に基づいて決定される。複製のクリティカルパスは、特徴付けられた論理速度およびワイヤ速度と、目標クロック周波数とに基づいて形成される。この複製のクリティカルパスは、処理コア内の実際のクリティカルパスをエミュレートし、異なる閾値電圧をもつ論理セル、ダイナミックセル、ビット線セル、ワイヤ、異なる閾値電圧および/またはファンアウトをもつドライバ、等のような異なるタイプの回路構成要素を含み得る。処理コアに対する供給電圧および複製のクリティカルパスは、両者が望ましい性能を達成するように調節される。
【選択図】図3

Description

関連出願
本出願は、2005年10月31日に出願され、本発明の譲受人に譲渡され、全ての目的のために全体的に参照により本明細書に取り入れられる米国仮出願第60/732,228号(“ADAPTIVE VOLTAGE SCALING FOR AN ELECTRONIICS DEVICE”)の恩恵に権利を主張している。
本開示は、概ね、回路、より具体的には、電子デバイスのバッテリ電力を節約する技術に関する。
無線デバイス(例えば、セルラ電話)は、無線通信、メッセージング、ビデオ、ゲーム(gaming)、等のような種々のアプリケーションに幅広く使用されている。無線デバイスのアプリケーションおよび機能は、増大する消費者の需要を満たすために拡大し続けている。したがって、より精巧な無線デバイスが、小型のデバイスサイズでより多くのアプリケーションおよび機能をサポートするために、より高レベルの統合およびより速い動作速度を備えて設計され続けている。
高度に統合された無線デバイスは、より多くの電力を消費し得る。これは、高クロックで動作するときにとくに当てはまり得る。より高い電力消費はバッテリ寿命を短くし得るが、長いバッテリ寿命はポータブル無線デバイスに対する重要な設計およびマーケティングのパラメータであるので、これは非常に望ましくない。したがって、多くの設計努力は、良い性能を達成する一方で、バッテリ寿命を延ばすことに充てられることが多い。例えば、無線デバイスは、アイドルモードで動作しているときにできるだけ多くの回路の電力を落として、電力を節約するように設計されることが多い。電力消費は供給電圧のほぼ二次関数であるので、アクティブモードで動作しているときに電力消費を低減する効果的な方法は、供給電圧をスケール(scale)または調節することである。例えば、供給電圧を10パーセント低減すると、電力消費をほぼ20パーセント節約することができる。
供給電圧のスケーリングの目的は、要求される性能を維持する一方で、供給電圧をできるだけ低減することである。これは、集積回路(integrated circuit, IC)内のクリティカル信号パス、例えば、最も長い遅延をもつ信号パスを識別し、供給電圧を調節し、そのクリティカル信号パスがタイミングの要件を満たすようにすることによって達成され得る。この基準は、いくつかの理由で現代のVLSI回路において設定するのが難しい。第1に、供給電圧が変化すると、クリティカル信号パスは変わり得る。1つの信号パスは1つの供給電圧においてクリティカルであり、一方で、第2の信号パスは別の供給電圧においてクリティカルであり得る。第2に、所与の供給電圧において、クリティカル信号パスは、ICの処理および温度の変化に基づいてダイごとに異なり得る。従来より、これらの変化は、全ての条件における適切な動作を保証する大きな安全域(safety margin)を加えることによって説明されている。この大きな安全域は、一般に、時間のほとんどにおいてより高い電力消費をもたらす。
したがって、当技術において、無線デバイスに対するバッテリ電力をより効果的に節約する技術が必要とされている。
電子デバイス(例えば、セルラ電話)の供給電圧を適応してスケーリングする技術が、本明細書に説明されている。特定の実施形態において、処理コア(processing core)の論理速度およびワイヤ速度は、例えば、リング発振器を使用して特徴付けられる(characterize)。処理コアに対する目標クロック周波数は、例えば、コアに対する計算要件(computational requirement)に基づいて決定される。複製のクリティカルパス(replicated critical path)は、特徴付けられた論理速度およびワイヤ速度と目標クロック周波数とに基づいて、プログラム可能な遅延線のセットを使用して形成される。この複製のクリティカルパスは、処理コア内の実際のクリティカルパスをエミュレートし、異なるタイプの回路構成要素、例えば、異なる閾値電圧をもつ論理セル、ダイナミックセル、ビット線セル、ワイヤ、異なる閾値電圧および/またはファンアウトをもつドライバ、等を含むことができ、後で説明される。処理コアに対する供給電圧および複製のクリティカルパスは、両者が望ましい性能を達成するように調節される。
本発明の種々の態様および実施形態は、さらに詳しく別途記載される。
無線デバイスのブロック図。 適応電圧スケーリング(adaptive voltage scaling, AVS)を用いたASICを示す図。 処理コアに対するAVSユニットを示す図。 AVSユニット内の遅延合成器を示す図。 AVSユニット内の遅延合成器を示す図。 遅延合成器内の論理セルを示す図。 遅延合成器内のダイナミックセルを示す図。 遅延合成器内のビット線論理セルを示す図。 最少数のセルを備えた複製のクリティカルパスを示す図。 AVSユニット内の遅延整合回路を示す図。 AVSユニット内の制御ユニットを示す図。 AVSユニット内のIC処理モニタユニットを示す図。 AVSユニット内のAVS特徴付けユニットを示す図。 AVSユニット内のAVS特徴付けユニットを示す図。 2本の信号パスの性能のグラフ。 適応電圧スケーリングを行うプロセスを示す図。
本発明の特徴および性質は、全体を通じて同じ参照符号が同じものとして識別される図面と併せて、以下に示す詳細な説明からより明らかになるであろう。
“例示的”という用語は、本明細書において“例、事例、または実例としての役割を果たす”ことを意味するために使用されている。本明細書に説明されている任意の実施形態または設計は、他の実施形態または設計よりも好ましいまたは好都合であると必ずしも解釈されるとは限らない。
本明細書に説明されている適応電圧スケーリング技術は、種々のタイプの集積回路に使用され得る。例えば、これらの技術は、特定用途向け集積回路(application specific integrated circuit, ASIC)、ディジタル信号プロセッサ(digital signal processor, DSP)、ディジタル信号処理デバイス(digital signal processing device, DSPD)、プログラマブル論理デバイス(programmable logic devices, PLD)、フィールド プログラマブル ゲート アレイ(field programmable gate array, FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、等に使用され得る。これらの技術は、無線通信デバイス、セルラ電話、パーソナル ディジタル アシスタント(personal digital assistants, PDA)、ポータブルコンピュータ、等のような種々の電子デバイスにも使用され得る。分かり易くするために、この技術は無線デバイス、例えば、セルラ電話内のASICに関して以下で説明される。
図1は、無線デバイス100のブロック図を示しており、これは1つ以上の無線通信システムを監視すること、および/またはそれと通信することができ得る。受信パスにおいて、アンテナ112は、基地局および/または衛星によって送信された信号を受信し、受信信号を受信機(RCVR)114に与える。受信機114は、受信信号を処理し(例えば、フィルタリング、増幅、周波数ダウンコンバート、およびディジタル化)、サンプルをさらに処理するためにASIC120に与える。送信パスにおいて、ASIC120は、送信されるデータを処理し、データチップを送信機(TMTR)116に与える。送信機116は、データチップを処理し(例えば、アナログに変換、フィルタリング、増幅、および周波数アップコンバート)、変調された信号を生成し、これはアンテナ112を介して送信される。
ASIC120は、1つ以上の通信システムを監視すること、および/またはそれと通信することをサポートする種々の処理ユニットを含んでいる。図1に示されている実施形態において、ASIC120は、DSPコア130aおよび130b、プロセッサコア130cおよび130d、クロック発生器140、内部メモリ150、外部インタフェースユニット160、並びに他の回路170を含んでいる。DSPコア130aおよび130bは、受信パスに対する処理(例えば、復調および復号)、送信パスに対する処理(例えば、符号化および変調)、および/または他のアプリケーションおよび機能に対する処理を行う。各DSPコアは、1つ以上の乗算および累算(multiply-and-accumulate, MAC)ユニット、1つ以上の演算論理ユニット(arithmetic logic unit, ALU)、等を含み得る。プロセッサコア130cおよび130dは、ビデオ、オーディオ、グラフィックス、ゲーム、等のような種々の機能をサポートする。
クロック発生器140は、ASIC120内の処理ユニットによって使用されるクロックを発生し、外部回路142に連結し得る。外部回路142は、水晶、インダクタ、コンデンサ、等を含み得る。クロック発生器140は、1つ以上の位相ロックループ(phase locked loop, PLL)を含むことができ、PLLは、クロックを発生するのに使用される発振器を制御する。内部メモリ150は、ASIC120内の処理ユニットによって使用されるデータおよびプログラムコードを記憶する。外部インタフェースユニット160は、ASIC120の外部の他のユニットとインタフェースしている。他の回路170は、ASIC120内の種々の処理ユニットに対する電力を制御する電力制御ユニットを含み得る。
図1に示されている実施形態において、ASIC120は、電力管理ユニット180、揮発性メモリ190、および不揮発性メモリ192にさらに連結している。電力管理ユニット180は、バッテリ182に連結し、電力コネクタを介して外部電力をさらに受信する。電力管理ユニット180は、受信した電源を調整し、調整された供給電圧を、ASIC120内の処理ユニットに与える。揮発性メモリ190は、ASIC120によって使用されるデータおよびプログラムコードのための大容量記憶装置(bulk storage)を与える。不揮発性メモリ192は、大容量不揮発性記憶装置(bulk non-volatile storage)を与える。
一般に、無線デバイス100は、図1に示されている集積回路よりも少ない、多い、および/または異なる集積回路を含み得る。さらに、ASIC120は、図1に示されている処理ユニットよりも少ない、多い、および/または異なる処理ユニットを含み得る。一般に、ASIC120は、任意の数のDSPコアおよび任意の数のプロセッサコアを含み得る。ASIC120に含まれる処理ユニットの数および処理ユニットのタイプは、通常、無線デバイス100によってサポートされる通信システム、アプリケーション、および機能のような種々の要因によって決まる。
図2は、適応電圧スケーリング(adaptive voltage scaling, AVS)を用いたASIC120の実施形態を示している。この実施形態では、1つのAVSユニット230が各処理コア130ごとに与えられ、そのコアに対する供給電圧を適応してスケールするのに使用される。とくに、AVSユニット230aおよび230bは、それぞれDSPコア130aおよび130bに対する適応電圧スケーリングを行い、AVSユニット230cおよび230dは、それぞれプロセッサコア130cおよび130dに対する適応電圧スケーリングを行う。
各処理コア130は、コア内の同期回路をトリガするのに使用されるクロックをクロック発生器140から受信する。各コア130は、クロック発生器140とそのAVSユニット230とに、そのクロックに対する目標周波数を与える。この目標周波数は、コアに対する処理負荷と計算要件とに基づいて選択され得る。各処理コア130に対して、クロック発生器140は目標周波数でクロックを発生し、このクロックをコアとその関連するAVSユニット230とに与える。各処理コア130およびその関連するAVSユニット230は、調整された供給電圧 (Vdd)を電力管理ユニット180からさらに受信する。各処理コア130に対する供給電圧は、コアが目標クロック周波数で動作することができるように、その関連するAVSユニット230によって設定される。
図2に示されている実施形態において、各処理コア130に対するクロックは、クロック発生器140によって個々に設定され、各処理コア130に対する供給電圧は、電力管理ユニット180によって個々に設定され得る。他の実施形態では、多数の処理コアは、これらのコアに対して一緒に設定され得る共通の供給電圧および/または共通のクロックを共有し得る。
適応電圧スケーリングは、性能要件を満たすレベル、すなわち目標周波数における適切な動作によって量子化され得るレベルに、供給電圧を調節する閉ループシステムである。一般に、より大きい供給電圧はより少ない遅延に対応し、これは、より速いクロックを用いてより高い周波数で動作することを可能にする。ピーク供給電圧は、最も短い遅延と最も高い性能レベルとを与えることができる。しかしながら、この最も高い性能レベルは、時間の一部またはほとんどにおいて不要である。このような場合に、供給電圧は低減され得る。したがって、適応電圧スケーリングは、計算要件における変化を利用して、供給電圧をスケールし、平均電力消費を低減する一方で、要求される性能を維持する。その結果、バッテリ寿命を延ばすことができ、これは非常に望ましい。
各処理コア130に対するAVSユニット230は供給電圧を調節して、そのコアがその性能要件を満たすことができるようにする。実施形態において、各AVSユニットは、ICの処理、温度、および電圧の変化の全体にわたって、関連するコアの実際の性能をシミュレートする。各AVSユニットは、関連するコアに対するクリティカルパスをエミュレートし、そのクリティカルパスの性能を追跡し、そのクリティカルパスが目標性能を達成することができる可能な限り低いレベルに、供給電圧を調節する。異なる条件に対して実際のクリティカルパスを密接に追跡する能力により、非常に効果的な適応電圧スケーリングが得られる。
各AVSユニット230は、関連する処理コア130内のクリティカルパスの性能を追跡する。実施形態において、これは、関連するコア内のクリティカルパスに対する回路の混合(blend)に密接に整合している回路構成要素の混合をもつ遅延合成器を使用して達成される。これらの回路構成要素は、論理セル、異なる閾値電圧をもつトランジスタデバイス、ダイナミックセル、ビット線セル、ワイヤ、異なる閾値電圧および/またはファンアウトをもつドライバ、等を含むことができ、これは後で説明される。これらの異なる回路構成要素は、ICの処理、温度、および電圧の変化の全体にわたって異なって変化し得る電気的特性(electrical characteristics)(例えば、遅延)をもつ。
論理セルは、インバータおよび/または他の論理ゲートを用いて形成され得る。インバータおよび論理ゲートはトランジスタで実施され、トランジスタはPチャネル電界効果トランジスタ(P-channel field effect transistor, P-FET)、NチャネルFET(N−FET)、等であり得る。各FETデバイスは、特定の閾値電圧、すなわちデバイスがオンになる電圧で設計される。低い閾値電圧(low threshold voltage, LVT)は、FETデバイスによる遅延を低減するが、漏れ電流、すなわちFETデバイスがオフにされたときにFETデバイスを通る電流を増加する。逆に、高い閾値電圧(high threshold voltage, HVT)は、漏れ電流を低減するが、遅延を増加する。LVTおよびHVTのデバイスの組合せを使用して、必要に応じて良い性能を達成し、要求に応じて漏れを少なくすることができる。LVTおよびHVTデバイスの電気的特性は、ICの処理、温度、および電圧に関連して異なって変化し得る。コンピュータシミュレーションは、4のファンアウトまたは駆動能力を備えたHVTインバータが、他のHVT論理ゲートの遅延と共に適切に追跡する遅延をもつことを示している。しかしながら、このHVTインバータの遅延は、LVTインバータの遅延からの大きなずれをもつ。
ワイヤは、ICダイ上にエッチングされた比較的に長いトレースであり、ICダイ上で回路構成要素を相互接続する。ワイヤの遅延は、ワイヤの長さ、幅、および高さと、そのワイヤに対するドライバのファンアウトとによって影響を受ける。ワイヤの長さおよび幅は、一般に設計によって選択され、ワイヤの厚さは、一般にIC製造のプロセスによって定められる。2ミリメートル(millimeter, mm)のワイヤの遅延は、特定の電圧範囲に対して4のファンアウトをもつHVTインバータの遅延に対して2オーダまでで変化し得る。ドライバのファンアウトが増加すると、ドライバの遅延は、HVTインバータの遅延に対してより大きく変化する。技術的機能(technology feature)/トランジスタのサイズが小さくなり、ICダイの面積対機能サイズ(feature size)の比が大きくなり、より多くの論理セルがICダイにパッケージ化されるとき、ワイヤはクリティカルパスの性能により大きな影響を及ぼす。これは、集積レベルが高まるのにしたがって、より多くのワイヤを使用して、論理セルを接続するからである。さらに、幾何学的形状(geometrics)が小さくなるのにしたがって、ワイヤの抵抗および静電容量も大きくなる。したがって、ほとんど論理セルから構成されている従来のリング発振器または従来の遅延合成器は、ワイヤを含んでいるクリティカルパスの性能を正確に追跡しない。
図3は、関連する処理コア130xに対するAVSユニット230xの実施形態を示している。AVSユニット230xは、図2のAVSユニット230a乃至230dの各々に使用することができ、処理コア130xはコア130a乃至130dの任意の1つであり得る。
AVSユニット230x内で、パルス発生器310は、クロック発生器140からクロックを受信する。図3に示されていない実施形態では、パルス発生器310は、遅延合成器320に対する第1の入力信号(DSin)と、遅延整合回路330に対する第2の入力信号(DMin)とを発生する。DSinおよびDMin信号の各々は、クロックの各立ち上がり(leading edge)のパルスを含み得る。DMin信号におけるパルスは、DSin信号におけるパルスに対して一定量遅らされ得る。別途記載される別の実施形態では、パルス発生器310は、遅延合成器320および遅延整合回路330の両者に与えられる1つの入力信号(Din)を発生する。Din信号におけるパルスは、遅延合成器320を通って伝搬され、制御ユニット340の第1の入力を介して受信される。Din信号におけるパルスは、また、遅延整合回路330を通って伝搬され、制御ユニット340の第2の入力を介して受信される。遅延合成器320は、処理コア130xに対するクリティカルパスをモデル化する。遅延合成器320は、遅延合成器の柔軟なプログラミングを可能にするマルチプレクサを含む。しかしながら、これらのマルチプレクサは、複製のクリティカルパスの総遅延に実質的に関係し得る追加の遅延を取り込む。遅延整合回路330は、遅延合成器320内のマルチプレクサの遅延を説明する。
制御ユニット340は、遅延合成器320および遅延整合回路330からパルスを受信し、受信したパルスに基づいて遅延合成器320内の複製のクリティカルパスの“純粋な(pure)”遅延を測定する。制御ユニット340は、測定されたクリティカルパス遅延と、場合によっては温度センサ370からの温度測定とに基づいて、電圧制御(Vctrl)を生成する。電力管理ユニット180内の電圧調整器380は、制御ユニット340から電圧制御を受信し、調整された供給電圧(Vdd)を電圧制御に基づいて調節し、調整された供給電圧を処理コア130x、遅延合成器320、および遅延整合回路330に与える。
IC処理モニタユニット350は、ASIC120に対する論理およびワイヤ遅延を決定し、この情報をAVS特徴付けユニット(AVS characterization unit)360に与える。ユニット360は、処理コア130xに対する目標クロック周波数をさらに受信し、遅延合成器320内の複製のクリティカルパスに対する回路構成要素の適切な混合を選択するMux Sel信号(図4および5に示されている)を与える。AVSユニット230x内の種々のブロックは、別途詳しく記載される。
図3に示されているように、AVSユニット230xは、処理コア130x内のクリティカルパスに対する所望の性能を達成するように供給電圧をスケールする閉ループシステムの一部である。遅延合成器320は、処理コア130x内の実際のクリティカルパスに整合する回路構成要素の混合をもつ複製のクリティカルパスを得るようにプログラムされ得る。さらに、遅延合成器320は、回路構成要素の種々の混合を用いてプログラムされ、ICの処理および/または他の変化による実際のクリティカルパスの変化を追跡し得る。これは、実際のクリティカルパスの密接な追跡を可能にし、効率を高める。
図4Aおよび4Bは、図3におけるAVSユニット230x内の遅延合成器320の実施形態を示している。この実施形態において、遅延合成器320は複数の遅延線を含み、各遅延線は、異なるタイプの回路構成要素から構成されている。
遅延合成器320内では、パルス発生器310からのDin信号は遅延線410の入力に与えられ、遅延線410は、K個の直列接続された論理セル412a乃至412k(例えば、K=32)から構成されている。各論理セル412は、HVTデバイスで形成されている論理ゲートおよび/またはインバータで実施され得る。K個の論理セル412a乃至412kの出力は、マルチプレクサ(multiplexer, Mux)418のK個の入力に与えられる。マルチプレクサ418は、Mux1Selの制御に基づいて、K個の入力の1つをマルチプレクサの出力として与える。
マルチプレクサ418の出力は、遅延線420の入力に与えられ、遅延線420は、L個の直列接続された論理セル422a乃至422l(例えば、L=32)から構成されている。各論理セル422は、LVTデバイスで形成されている論理ゲートおよび/またはインバータで実施され得る。L個の論理セル422a乃至422kの出力は、マルチプレクサ428のL個の入力に与えられる。マルチプレクサ428は、Mux2 Selの制御に基づいて、L個の入力の1つをマルチプレクサの出力として与える。
マルチプレクサ428の出力は、遅延線430の入力に与えられ、遅延線430は、M個の直列接続されたダイナミックセル432a乃至432m(例えば、M=32)から構成されている。ダイナミックセル432は、拡散容量をモデル化するのに使用される。拡散容量は、ドレインからウェルへの逆バイアス接合の容量効果の結果であり、これは、遅延線410および420によってモデル化されたゲート容量とは異なる。各ダイナミックセルは、別途記載されるように実施され得る。M個のダイナミックセル432a乃至432mの出力は、マルチプレクサ438のM個の入力に与えられる。マルチプレクサ438は、Mux3 Selの制御に基づいて、M個の入力の1つをマルチプレクサの出力として与える。
マルチプレクサ438の出力は、遅延線440の入力に与えられ、遅延線440は、N個の直列接続されたビット線セル442a乃至442n(例えば、N=4)から構成されている。ビット線セル442は、メモリアクセス遅延を追跡するのに使用され、別途記載されるように実施され得る。N個のビット線セル442a乃至442kの出力は、マルチプレクサ448のN個の入力に与えられる。マルチプレクサ448は、Mux4 Selの制御に基づいて、N個の入力の1つをマルチプレクサの出力(DSint)として与える。
図4Bを参照すると、マルチプレクサ448の出力(DSint)は、4つの遅延線450、460、470、および480の入力に与えられている。遅延線450、460、470、および480の各々は、P個の直列接続されたワイヤセルから構成されている(例えば、P=8)。各ワイヤセルは、ドライバおよびワイヤを含んでいる。遅延線450において、ドライバ452a乃至452pは、HVTデバイスで実施され、FOa(例えば、FOa=8)のファンアウトをもつ。遅延線460において、ドライバ462a乃至462pは、HVTデバイスで実施され、FOb(例えば、FOb=16)のファンアウトをもつ。遅延線470において、ドライバ472a乃至472pは、LVTデバイスで実施され、FOaのファンアウトをもつ。遅延線480において、ドライバ482a乃至482pは、LVTデバイスで実施され、FObのファンアウトをもつ。各ワイヤは、ワイヤの長さ、幅、および厚さによって決定される直列抵抗および寄生容量をもつ。遅延線450、460、470、および480のワイヤは、同じ長さ(例えば、1mmの同じ長さ)または異なる長さをもつように設計され得る。
遅延線450において、ドライバ452a乃至452pは、それぞれワイヤ454a乃至454pを駆動し、ワイヤ454a乃至454pは、マルチプレクサ458のP個の入力にさらに連結する。マルチプレクサ458は、Mux5 Selの制御に基づいて、P個の入力の1つをマルチプレクサの出力として与える。遅延線460において、ドライバ462a乃至462pは、それぞれワイヤ464a乃至464pを駆動し、ワイヤ464a乃至464pは、マルチプレクサ468のP個の入力にさらに連結する。マルチプレクサ468は、Mux5 Selの制御に基づいて、P個の入力の1つをマルチプレクサ出力として与える。遅延線470において、ドライバ472a乃至474pは、それぞれワイヤ474a乃至472pを駆動し、ワイヤ474a乃至472pは、マルチプレクサ478のP個の入力にさらに連結する。マルチプレクサ478は、Mux5 Selの制御に基づいて、P個の入力の1つをマルチプレクサの出力として与える。遅延線480において、ドライバ482a乃至482pは、それぞれワイヤ484a乃至484pを駆動し、ワイヤ484a乃至484pは、マルチプレクサ488のP個の入力にさらに連結する。マルチプレクサ488は、Mux5 Selの制御に基づいて、P個の入力の1つをマルチプレクサの出力として与える。マルチプレクサ498は、マルチプレクサ458、468、478、および488の出力を受信し、Mux6 Selの制御に基づいて、これらの4つのマルチプレクサの1つの出力を遅延合成器の出力(DSout)として与える。
図4Aおよび4Bに示されている実施形態において、Din信号は、各遅延線内の少なくとも1個のセルを通る。別の実施形態において、各遅延線に対する入力信号は、その遅延線に対するマルチプレクサの1つの入力に与えられ得る。この実施形態において、Din信号は、マルチプレクサを直接に通り、遅延線内のセルの全てをバイパスすることができる。
図4Aおよび4Bに示されている遅延合成器構造において、遅延線410は、HVTデバイスに対する論理遅延をエミュレートし、遅延線420は、LVTデバイスに対する論理遅延をエミュレートし、遅延線430は、拡散遅延をエミュレートし、遅延線440は、メモリアクセス遅延をエミュレートし、遅延線450は、FOaのファンアウトをもつHVTドライバを伴うワイヤの遅延をエミュレートし、遅延線460は、FObのファンアウトをもつHVTドライバを伴うワイヤの遅延をエミュレートし、遅延線470は、FOaのファンアウトをもつLVTドライバを伴うワイヤの遅延をエミュレートし、遅延線480は、FObのファンアウトをもつLVTドライバを伴うワイヤの遅延をエミュレートする。
図4Aおよび4Bに示されている遅延合成器構造は、回路構成要素の所望の混合を用いてクリティカルパスを柔軟に複製することができる。各遅延線は、異なるタイプの回路構成要素に対して多数の直列接続されたセルから構成されている。各遅延線に対するマルチプレクサは、複製のクリティカルパス内にその遅延線に対する選択可能な数のセルを含むことができる。同じ遅延合成器構造が、コア130a乃至130dに対するAVSユニット230a乃至230dにおいてそれぞれ使用され得る。各コアに対する複製のクリティカルパスは、そのコアに対する遅延合成器内のマルチプレクサを適切に制御することによって、個々に柔軟に形成され得る。さらに、複製のクリティカルパスは、関連するコア内の実際のクリティカルパスの性能に整合するように、容易に変えることができる。
一般に、遅延合成器構造は、任意の数の遅延線を含み、各遅延線は、任意のタイプの回路をエミュレートし、任意の数のセルを含むことができる。このような構造は、クリティカルパスを複製する際に大きな柔軟性を与える。別の実施形態において、遅延合成器構造は、複数の仮定の(hypothesized)クリティカルパスを含むことができ、各仮定のクリティカルパスは、回路構成要素の異なる混合を含んでいる。仮定のクリティカルパスの1つは、複製のクリティカルパスとして選択され得る。
図5Aは、論理セル412xの実施形態を示しており、これは、図4Aにおける論理セル412a乃至412kおよび422a乃至422lの各々に使用され得る。この実施形態において、論理セル412xは、Q個の直接接続されたインバータ512a乃至512qから構成されている(なお、Q≧1)。論理セル412xがICの処理、温度、および電圧の変化の全体にわたって所望の量の遅延を与えることができるように、Qは選択され得る。各インバータ512は、HVTまたはLVTのデバイスで実施され得る。図4Aの遅延線410に対する論理セル412a乃至412kは、同数または異なる数のインバータを含み得る。遅延線420に対する論理セル422a乃至422lも、同数または異なる数のインバータを含み得る。各論理セルは、他の論理ゲート(例えば、AND、NAND、OR、NOR、排他的OR、または何か他の論理ゲート)あるいは論理ゲートの任意の組合せで実施することもできる。
図5Bは、ダイナミックセル432xの実施形態を示しており、これは、図4Aにおけるダイナミックセル432a乃至432mの各々に使用され得る。この実施形態において、ダイナミックセル432xは、P−FET530および538、R個の並列接続されたN−FET532a乃至532r、N−FET534、並びにインバータ536から構成され、なお、R≧1である。P−FET530は、供給電圧に連結されたソース、ダイナミックセルの入力を形成するゲート、およびN−FET532a乃至532rのドレインに連結されたドレインをもつ。N−FET532aのゲートは、供給電圧に連結され、N−FET532b乃至532rのゲートは、回路の接地に連結される。N−FET534は、回路の接地に連結されたソース、ダイナミックセルの入力に連結されたゲート、およびN−FET532a乃至532rのソースに連結されたドレインをもつ。P−FET538は、供給電圧に連結されたソース、インバータ536の出力に連結されたゲート、およびN−FET532a乃至532rのドレインに連結されたドレインをもつ。N−FET532a乃至532rが全てオフにされたとき、P−FET538は、それらの電荷漏れを回復するためにフィードバックを行う。
Din信号は、遅延線430内のダイナミックセル432a乃至432mを通って伝搬する。ダイナミックセル432xの入力におけるDin信号が論理ロー(logic low)であるとき、P−FET530はオンにされ、ノードAを論理ハイ(logic high)にプリチャージし、N−FET534はオフにされ、インバータ536の出力は論理ローである。パルスがDin信号上に現われるとき、P−FET530はオフにされ、N−FET534はオンにされ、ノードAをN−FET532aを介して論理ローにプルし(pull)、インバータ536の出力は論理ハイに遷移する。N−FET532aは評価され、N−FET532b乃至532rは評価されない。ダイナミックセル432xによる遅延は、N−FET532a乃至532rの拡散容量によって決定される。
図5Cは、ビット線セル442xの実施形態を示しており、これは、図4Aにおけるビット線セル442a乃至442nの各々に使用され得る。この実施形態において、ビット線セル442xは、プリチャージ回路540、ダミーの列(column)542、S個のメモリセル544a乃至544s(なお、S≧1)、およびセンス増幅器546を含む。ビット線セルの入力においてDin信号上のパルスを受信すると、プリチャージ回路540は、ビット線(BL)および補足的なビット線(BLb)の両者をプリチャージし、ダミーの列542は、センス増幅器546に対するイネーブル信号を発生する。さらに、Dinのパルスは、短い遅延の後でメモリセル544aを選択し、これは簡潔にするために図5Cに示されていない。メモリセル544aは、論理ハイ( ‘1’)を記憶し、イネーブルにされると、BLb線を論理ローにプルする。センス増幅器546は、BL線とBLb線との間の電圧差を感知し、BLb線の放電率によって決定される短い遅延の後で、マルチプレクサ448の1つの入力と、(もしあれば)次のビット線セルの入力とに論理ハイを与える。ビット線セル442xは、例えば、SRAM、キャッシュ、および他のメモリに対するメモリアクセス遅延を追跡することができる。
図6は、図4Aおよび4Bに示されている遅延合成器320の各遅延線において最少数のセルから構成されている複製のクリティカルパスを示している。この複製のクリティカルパスにおいて、Din信号は、6つのマルチプレクサ418、428、438、448、458、および498を通る。各マルチプレクサは、通常、追加の遅延を取り込む複数レベルの論理ゲートを含む。したがって、複製のクリティカルパスに対するDin信号によって観察(observe)される総遅延は、(1)実際のクリティカルパスをエミュレートするのに使用されるセルによって取り込まれる遅延と、(2)複製のクリティカルパスを形成するのに使用されるマルチプレクサによって取り込まれる遅延とから成る。マルチプレクサ遅延は、マルチプレクサ数と各マルチプレクサの入力数との両者に伴って増加する。マルチプレクサ遅延は、とくに、例えば、1GHz以上のような高速度では、複製のクリティカルパスに対する総遅延の相当に大きい部分を示し得る。
マルチプレクサ遅延は、種々のやり方で処理され得る。実施形態において、マルチプレクサ遅延は、論理遅延の一部として扱われる。他の回路タイプ(例えば、ワイヤ、拡散、等)からの遅延は、遅延の所望の混合(例えば、20%の論理遅延と80%のワイヤ遅延)を得るのに十分に長いものであるべきである。この実施形態において、マルチプレクサは、関連するコア内の論理のほとんどと同じデバイスのタイプで実施され得る。例えば、関連するコアがほとんどLVTデバイスで実施されているとき、マルチプレクサもLVTデバイスで実施され得る。他の回路タイプの遅延は、必要であれば延ばされ、遅延の所望の混合を得る。
別の実施形態では、遅延整合回路330を使用して、マルチプレクサ遅延を推定する。その後で、推定されたマルチプレクサ遅延を遅延合成器320の総遅延から減算し、遅延合成器内の複製のクリティカルパスの“純粋な”遅延を得ることができる。
図7は、図3のAVSユニット230x内の遅延整合回路330の実施形態を示している。この実施形態において、遅延整合回路330は、遅延合成器320と同数の遅延線と同数のマルチプレクサとを含む。
遅延整合回路330内で、パルス発生器310からのDin信号は、2つの直列接続された論理セル712aおよび712bから構成されている遅延線の入力に与えられる。論理セル712bは、論理セル712aの負荷をシミュレートし、図7に示されているように遅延整合回路330内に含まれるか、または省かれることもある。論理セル712aの出力は、部分的なマルチプレクサ(partial multiplexer)718の入力に与えられ、これは、マルチプレクサ418の1つの入力と出力との間の信号パスをモデル化している。マルチプレクサ718は、K’個の直列接続されたNANDゲート716a乃至716k'を含み、なお、
Figure 2013211022
であり、Kは、マルチプレクサ418に対する入力数である。
マルチプレクサ718の出力は、2つの直列接続された論理セル722aおよび722bから構成されている遅延線の入力に与えられる。部分的なマルチプレクサ728は、論理セル722aの出力を受信し、その出力を、2つの直列接続されたダイナミックセル732aおよび732bから構成されている遅延線の入力に与える。部分的なマルチプレクサ738は、ダイナミックセル732aの出力を受信し、その出力を、2つの直列接続されたビット線セル742aおよび742bから構成されている遅延線の入力に与える。部分的なマルチプレクサ748は、ビット線セル742aの出力を受信し、その出力を、4本のワイヤ遅延線の入力に与える。第1のワイヤ遅延線は、ドライバ752aおよびワイヤ754aから構成されている完全なワイヤセルと、ドライバ752bから構成されている部分的なワイヤセルとを含む。第2のワイヤ遅延線は、ドライバ762aおよびワイヤ764aから構成されている完全なワイヤセルと、ドライバ762bから構成されている部分的なワイヤセルとを含む。第3のワイヤ遅延線は、ドライバ772aおよびワイヤ774aから構成されている完全なワイヤセルと、ドライバ772bから構成されている部分的なワイヤセルとを含む。第4のワイヤ遅延線は、ドライバ782aおよびワイヤ784aから構成されている完全なワイヤセルと、ドライバ782bから構成されている部分的なワイヤセルとを含む。ワイヤ754a、764a、774a、および784aの他方の端部は、部分的なマルチプレクサ758、768、778、および788の入力にそれぞれ連結し、これらは、その出力をマルチプレクサ798の4つの入力に与える。マルチプレクサ798は、Mux6 Selの制御をさらに受信し、遅延整合回路の出力(delay matching circuit output, DMout)としてマルチプレクサ758、768、778、および788の1つの出力を与える。
論理セル712a、712b、722a、および722bは、図4Aの遅延合成器320内の論理セル412a、412b、422a、および422bと同じやり方でそれぞれ実施され得る。ダイナミックセル732aおよび732bは、ダイナミックセル432aおよび432bと同じやり方でそれぞれ実施され得る。ビット線セル742aおよび742bは、ビット線セル442aおよび442bと同じやり方でそれぞれ実施され得る。ドライバ752a、762a、772a、および782aは、ドライバ452a、462a、472a、および482aと同じやり方でそれぞれ実施され、ワイヤ754a、764a、774a、および784aは、ワイヤ454a、464a、474a、および484aと同じやり方でそれぞれ実施され得る。部分的なマルチプレクサ718、728、738、748、758、768、778、および788は、マルチプレクサ418、428、438、448、458、468、478、および488の1つの入力と出力との間の信号パスをそれぞれモデル化している。マルチプレクサ798は、マルチプレクサ498と同じやり方で実施され得る。
遅延整合330は、遅延合成器320内のマルチプレクサの遅延を吸収するのに使用され得る。これは、AVSユニット230xが高周波においてクリティカルパスを正確にモデル化することを可能にする。
図8は、図3におけるAVSユニット230x内の制御ユニット340の実施形態を示している。この実施形態において、遅延合成器320からのDSout信号は、Dフリップフロップ814aのデータ(data, D)入力と遅延セル812aの入力とに与えられる。遅延セル812aの出力は、Dフリップフロップ814bのデータ入力と遅延セル812bの入力とに連結する。遅延セル812bの出力は、Dフリップフロップ814cのデータ入力に連結する。遅延整合回路330からのDMout信号は、Dフリップフロップ814a、814b、および814cのクロック入力に与えられる。各Dフリップフロップ814は、DMout信号に基づいてそのデータ入力をラッチし、それを符号器816への出力(Q)に与える。符号器816は、フリップフロップ814a、814b、および814cの出力と、場合によっては温度センサ370からの温度測定とに基づいて、電力管理ユニット180に対する電圧制御Vctrlを発生する。
遅延セル812aおよび812bの各々は、所定量の遅延、例えば、最高クロック周波数におけるクロック期間の5%を与えるように設計され得る。各フリップフロップ814は、そのデータ入力におけるパルスがそのクロック入力におけるパルスよりも先に到達すると、論理ハイを与え、そうでないときは、論理ローを与える。フリップフロップ814aは、DSout信号におけるパルスがDMout信号におけるパルスの前に到達すると、論理ハイを与える。遅延セル812aからの遅延パルスがDMout信号におけるパルスの前に到達すると、フリップフロップ814bは論理ハイを与える。遅延セル812bからの遅延パルスがDMout信号におけるパルスの前に到達すると、フリップフロップ814cは論理ハイを与える。供給電圧が低過ぎるときは、複製のクリティカルパスの総遅延は長く、3つのフリップフロップの全ては論理ローを与え得る。次に、符号器816は電圧制御を発生し、供給電圧を増加する。逆に、供給電圧が高過ぎるときは、複製のクリティカルパスの総遅延は目標周波数よりも小さく、3つのフリップフロップの全ては論理ハイを与え得る。次に、符号器816は電圧制御を発生し、供給電圧を低減する。
制御ユニット340は、電圧制御を発生し、測定されたクリティカルパス遅延に基づいて供給電圧を調節する。クリティカルパス遅延は、図8に示されている3つのフリップフロップまたは3つ以上のフリップフロップを用いて測定され、より大きな遅延分解能を達成し得る。電圧制御は、現在の供給電圧を維持するか、供給電圧を所定量分、増加または低減するかを示す2ビットの制御であり得る。電圧制御は、増加または低減する電圧量を示すマルチビット制御でもあり得る。温度測定が公称の温度の範囲外であるとき、制御ユニット340は、フリップフロップ814a、814b、および814cの出力を無視して、所定の電圧制御を与えることもできる。制御ユニット340は、温度測定を別のやり方で使用して、電圧制御を発生することもできる。
温度は、ICダイの全体にわたるアクティブデバイスおよびパッシブデバイスの異なる構成のために、ICダイの全体にわたって異なり得る。ICダイの全体にわたる温度勾配は、ICダイ全体に複数の遅延合成器を置くことによって説明され得る。例えば、複数(例えば、4つ)の遅延合成器が、処理コアの異なるコーナ(corner)に置かれ得る。その処理コアに対するAVSユニットは、全ての遅延合成器から出力を受信し、最も遅い遅延合成器に基づいて供給電圧を調節し得る。
異なる回路構成要素(例えば、論理およびワイヤ)に対する遅延は、一般に、ICの処理の変化に依存する。例えば、速いIC処理のコーナは、より速い論理、したがってより少ない論理遅延になるが、遅いIC処理のコーナは、より遅い論理、したがってより大きい論理遅延になる。ワイヤの寄生抵抗および容量も、ICの処理の変化により変わり、したがって、異なるワイヤ遅延なる。ASIC120に対する論理セルおよびワイヤの遅延は特徴付けられ、電圧スケーリングに使用され得る。
図9は、図3におけるAVSユニット230x内のIC処理モニタユニット350の実施形態を示している。この実施形態において、リング発振器910は、T個の遅延ユニット912a乃至912tとNANDゲート940とを用いて形成され、なお、T≧1である。各遅延ユニット912内において、デマルチプレクサ(demultiplexer, Demux)920は、NANDゲート940または前の遅延ユニットの出力に連結された入力と、緩衝器922および932の入力に連結された2つの出力とをもつ。緩衝器922はワイヤ924を駆動し、ワイヤ924は緩衝器926の入力にさらに連結する。緩衝器932は緩衝器936を駆動する。マルチプレクサ938は、その2つの入力において緩衝器926および936の出力を受信し、2つの入力の一方を遅延ユニットの出力として与える。各遅延ユニット912において、緩衝器922および926とワイヤ924とは、論理とワイヤとから構成されている第1の信号パスを形成し、緩衝器932および936は、論理のみから構成されている第2の信号パスを形成する。第2の信号パスにおける緩衝器932および936は、第1の信号パスにおける緩衝器922および926と同じやり方で実施されることができ、したがって、ワイヤ924が、2本の信号パス間の唯一の違いである。適切なMux/Demux制御をデマルチプレクサ920およびマルチプレクサ938に与えることによって、第1または第2の何れかの信号パスが選択され得る。
NANDゲート940は、一方の入力において最後の遅延ユニット912tの出力を受信し、他方の入力において制御ユニット950からイネーブル(enable, Enb)信号を受信する。NANDゲート940の出力は、第1の遅延ユニット912aの入力に与えられる。リング発振器910は、(1)遅延ユニット912a乃至912t内の選択された信号パスと、(2)ICの処理に依存して、選択された信号パス内の回路構成要素の特徴(characteristic)とによって決定される周波数をもつ発振器信号を与える。カウンタ960は発振器信号を受信し、制御ユニット950からの第1の制御に基づいて発振器のサイクル数を数える。レジスタ970は、制御ユニット950からの第2の制御に基づいてカウンタ960の出力をラッチし、周波数カウントを与える。制御ユニット950は、クロックを受信して、遅延ユニット912a乃至912t、NANDゲート940、カウンタ960、およびレジスタ970に対する制御を発生する。制御ユニット950は、さらに、レジスタ970から周波数カウントを受信し、AVS特徴付けユニット360に論理速度出力およびワイヤ速度出力を与える。
論理速度およびワイヤ速度は、次のように決定され得る。リング発振器910は、最初に、Mux/Demux制御を論理ハイに設定することによって、全ての遅延ユニット912a乃至912tにおいて第2の信号パスを用いて動作するように構成される。次に、カウンタ960は、第1の時間ウィンドウにおける発振器のサイクル数を数えることによって、リング発振器910の周波数をサンプリングする。レジスタ970は、第1の時間ウィンドウの最後にカウンタの出力をラッチし、論理速度を示す第1の周波数カウントを与える。次に、リング発振器910は、Mux/Demux制御を論理ローに設定することによって、全ての遅延ユニット912a乃至912tにおいて第1の信号パスを用いて動作するように構成される。次に、カウンタ960は、第1の時間ウィンドウと同じ持続期間の第2の時間ウィンドウにおいて、リング発振器910の周波数をサンプリングする。レジスタ970は、第2の時間ウィンドウの最後にカウンタの出力をラッチし、論理およびワイヤ速度を示す第2の周波数カウントを与える。第1の周波数カウントと第2の周波数カウントとの間の差は、ワイヤ速度を示す。
制御ユニット950によって与えられる論理速度とワイヤ速度とは、ICの処理に依存する。実施形態において、IC処理モニタユニット350は、(例えば、無線デバイス100の較正中に)一度動作して、所定の供給電圧における論理速度とワイヤ速度とを得る。他の実施形態において、IC処理モニタユニット350は、必要に応じて、および場合によっては、異なる供給電圧および/または温度に対して動作して、異なる動作条件に対する論理速度およびワイヤ速度を得ることができる。別途記載されるように、論理速度およびワイヤ速度は、複製のクリティカルパスを形成するのに使用される。
図10Aは、図3におけるAVSユニット230x内のAVS特徴付けユニット360の実施形態を示している。この実施形態において、ルックアップテーブル(look-up table, LUT) 1010は、異なる論理の特徴付けに対して1組の公称の論理速度値を記憶し、ルックアップテーブル1020は、異なるワイヤの特徴付けに対して1組の公称のワイヤ速度値を記憶する。一般に、公称の論理速度および公称のワイヤ速度は、任意の数の論理およびワイヤの特徴付けに対してそれぞれ記憶され、特徴付けは一般にICの処理の変化(例えば、速い、公称、遅い、等)に依存する。ルックアップテーブル1010および1020に記憶される値は、コンピュータシミュレーション、経験的な測定(empirical measurement)、等によって決定され得る。論理速度およびワイヤ速度を別々に特徴付けることによって、2つのみのルックアップテーブル1010および1020を使用して、異なる特徴付けに対して公称の論理速度および公称のワイヤ速度を記憶することができる。
比較ユニット1012は、IC処理モニタユニット350から、測定された論理速度を受信し、測定された論理速度を、ルックアップテーブル1010に記憶されている値と比較し、処理コア130xに対する論理の特徴付けを決定する。同様に、比較ユニット1022は、IC処理モニタユニット350から、測定されたワイヤ速度を受信し、測定されたワイヤ速度を、ルックアップテーブル1020に記憶されている値と比較し、処理コア130xに対するワイヤの特徴付けを決定する。例えば、ルックアップテーブル1010は、速い、公称、および遅いの3つの論理の特徴付けのためにxおよびyの値を記憶し得る(なお、x>y)。比較ユニット1012は、測定された論理速度sを記憶されている値と比較し、s≧xであるときは、速いプロセスを示し、x>s≧yであるときは、公称のプロセスを示し、s<yであるときは、遅いプロセスを示し得る。
メモリ1030は、Mux制御ルックアップテーブル1040aa乃至1040yxの行列を記憶する。行列の各行は、ルックアップテーブル1010に記憶されている異なる論理の特徴付けのためのものである。行列の各列は、ルックアップテーブル1020に記憶されている異なるワイヤの特徴付けのためのものである。各Mux制御ルックアップテーブル1040は、図4Aおよび4Bにおける遅延合成器320内のマルチプレクサ418、428、438、448、458、468、478、488、および498に対するMux Selの制御の値を記憶する。これらのMux Selの制御は、処理コア130xに適用可能な特徴付けに対する実際のクリティカルパスによく似た複製のクリティカルパスを定義する。各Mux制御ルックアップテーブル1040に記憶される値は、コンピュータシミュレーション、経験的な測定、等によって決定され得る。比較ユニット1012によって示される行と、比較ユニット1022によって示される列とのMux制御ルックアップテーブルが、使用するために選択される。
図10Bは、メモリ1030内のMux制御ルックアップテーブル1040ijの1つの実施形態を示している。ルックアップテーブル1040ijは、V個の異なるクロック周波数に対して、遅延合成器320内のマルチプレクサ418、428、438、448、458、468、478、488、および498のためのV組のMux Selの制御値を記憶している。処理コア130xの目標周波数に対応するMux Selの制御値の組は、ルックアップテーブル1040ijから検索され、遅延合成器320内のマルチプレクサに与えられる。
図11は、処理コア内の2つの例示的な信号パスの性能のグラフ(plot)を示している。各信号パスの遅延が、供給電圧に対してグラフにされている。図11に示されている例において、信号パス1は、Vxボルトより下でより長い遅延をもち、クリティカルパスであり、信号パス2は、Vxボルトより上でより長い遅延をもち、クリティカルパスである。図11に示されているように、異なる信号パスは、異なる条件でクリティカルパスになることができる。これは、各信号パスが、電圧、温度、およびICの処理の変化の全体にわたって異なって変化し得る回路構成要素の異なる混合から構成され得るからである。クリティカルパスの遅延が、そのパスに対する最も高いクロック周波数を決定し、したがって周波数に逆比例する。所与の目標周波数において、その周波数に対するクリティカルパスが複製され、AVSユニット230は供給電圧を調節して、目標周波数に対する望ましい性能を達成できるようにする。例えば、目標周波数が周波数2であるとき、信号パス2が選択され、AVSユニットは供給電圧をVzボルトに調節する。
図12は、処理コアに対する適応電圧スケーリングを行うプロセス1200の実施形態を示している。処理コアに対する論理速度およびワイヤ速度が特徴付けられる(ブロック1210)。この特徴付けは、例えば、無線デバイスの較正中に、1回行われ、図9において既に説明したとおりである。処理コアに対する目標クロック周波数が決定される(ブロック1212)。目標クロック周波数は、例えば、処理コアに対する計算要件に基づいて、動的に変化し得る。複製のクリティカルパスは、例えば、図10Aおよび10Bに関して既に説明したように、特徴付けられた論理速度およびワイヤ速度と目標クロック周波数とに基づいて形成される(ブロック1214)。複製のクリティカルパスは、HVT論理、LVT論理、ダイナミックセル、ビット線セル、ワイヤ、異なる閾値電圧および/またはファンアウトをもつドライバ、等のような異なるタイプの回路構成要素を含み得る。次に、処理コアに対する供給電圧および複製のクリティカルパスは、両者が所望の性能を達成するように調節される(ブロック1216)。次に、プロセス1200は、ブロック1212に戻り、目標クロック周波数を定期的に決定し得る。
本明細書に説明されている複製のクリティカルパスは、回路構成要素の混合を使用して、実際のクリティカルパスをエミュレートする。この複製のクリティカルパスは、通常、全て論理か、またはほとんど論理ゲートから構成されている遅延線あるいはリング発振器で実施される従来の複製のクリティカルパスよりも正確である。さらに、本明細書に説明されている複製のクリティカルパスは、異なる条件に対して異なるクリティカルパスを柔軟にモデル化するようにマルチプレクサをプログラムすることによって、容易に変えられ得る。
本明細書に説明されている適応電圧スケーリング技術は、次の望ましい特性をもつ。
・変化するクリティカルパスを追跡する遅延線のシームレスなプログラミング(図4Aおよび4B)。
・IC処理モニタユニット350を使用して、オンチップの論理およびワイヤを結合して、高い効率の追跡を可能にすること(図9)。
・異なる場所に複数のAVSユニットを置くことによって温度勾配を追跡すること。
・多閾値論理の遅延線(図4A)。
・ワイヤ遅延線に対する多閾値で複数のファンアウトのドライバ(図4B)。
・ダイナミックセルを使用して、拡散で占められているパス(diffusion dominated path)を追跡すること(図4Aおよび5B)。
・ビット線セルを使用して、メモリアクセス遅延を追跡すること(図4Aおよび5C)。
・マルチプレクサ遅延を総論理遅延の一部と見なして、(例えば、ワイヤおよび拡散に対する)他のタイプの遅延を延ばし、マルチプレクサ遅延に適合させること。
・マルチプレクサ遅延を吸収して、高速動作を可能にする遅延整合回路。
本明細書に説明されている適応電圧スケーリング技術は、種々の手段によって実施され得る。例えば、これらの技術は、ハードウェア、ファームウェア、ソフトウェア、またはその組合せにおいて実施され得る。ハードウェアの実施では、適応電圧スケーリングは、ASIC、DSP、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書において説明された機能を実行するように設計された他の電子ユニット、またはその組合せの中で実施され得る。
適応電圧スケーリングの特定の部分は、本明細書に説明されている機能を行うソフトウェアモジュール(例えば、手続き、機能、等)で実施され得る。ソフトウェアコードは、メモリ(例えば、図1のメモリ150、190、または192)に記憶され、プロセッサ(例えば、プロセッサコア130cまたは130d)によって実行され得る。メモリは、プロセッサ内で実施されても、またはプロセッサの外部で実施されてもよい。
開示された実施形態の上述の説明は、当業者が本発明を作成または使用するのを可能にするために与えられている。これらの実施形態に対する種々の変更は、当業者には容易に明らかになり、本明細書に定められている一般的な原理は、本発明の意図および範囲から逸脱することなく、他の実施形態に適用され得る。したがって、本発明は、本明細書に示されている実施形態に制限されることを意図されず、本明細書に開示されている原理および斬新な特徴に矛盾しない最も幅広い範囲にしたがうことを意図されている。
開示された実施形態の上述の説明は、当業者が本発明を作成または使用するのを可能にするために与えられている。これらの実施形態に対する種々の変更は、当業者には容易に明らかになり、本明細書に定められている一般的な原理は、本発明の意図および範囲から逸脱することなく、他の実施形態に適用され得る。したがって、本発明は、本明細書に示されている実施形態に制限されることを意図されず、本明細書に開示されている原理および斬新な特徴に矛盾しない最も幅広い範囲にしたがうことを意図されている。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[付記]
[1]処理コア内の信号パスをエミュレートするように構成され、少なくとも2つの閾値電圧をもつトランジスタデバイスを含む遅延合成器と、
遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
[2]制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている[1]記載の集積回路。
[3]遅延合成器は、少なくとも2つの閾値電圧の各々に対して選択可能な数のトランジスタデバイスを含む[1]記載の集積回路。
[4]少なくとも2つの閾値電圧は、高い閾値電圧(high threshold voltage, HVT)と低い閾値電圧(low threshold voltage, LVT)とを含む[1]記載の集積回路。
[5]遅延合成器は、選択可能な数のHVTトランジスタデバイスと、選択可能な数のLVTトランジスタデバイスとを含む[4]記載の集積回路。
[6]遅延合成器は、少なくとも2つの閾値電圧をもつトランジスタデバイスによって形成される論理セルを含む[1]記載の集積回路。
[7]遅延合成器は、少なくとも2つの閾値電圧をもつトランジスタデバイスによって形成されるドライバを含む[1]記載の集積回路。
[8]処理コア内の信号パスをエミュレートするように構成され、少なくとも1つの論理セルと、少なくとも1つのワイヤと、異なる電気的特性をもつ少なくとも2つのドライバから選択される少なくとも1つのドライバとを含む遅延合成器、および、
遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットを含む集積回路。
[9]少なくとも2つのドライバは、異なる閾値電圧をもつ[8]記載の集積回路。
[10]少なくとも2つのドライバは、異なるファンアウトをもつ[8]記載の集積回路。
[11]遅延合成器は、選択可能な数の論理セルと選択可能な数のワイヤとを含む[8]記載の集積回路。
[12]少なくとも1つの論理セルは、異なる閾値電圧をもつ少なくとも2つの論理セルから選択される[8]記載の集積回路。
[13]制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている[8]記載の集積回路。
[14]処理コア内の信号パスをエミュレートするように構成され、処理コア内の拡散容量をモデル化するのに使用される少なくとも1つのダイナミックセルを含む遅延合成器と、
遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
[15]遅延合成器は、選択可能な数のダイナミックセルを含む[14]記載の集積回路。
[16]各ダイナミックセルは、拡散容量をモデル化する少なくとも1つのトランジスタと、少なくとも1つのトランジスタを充電および放電するように構成された第1および第2のトランジスタとを含む[14]記載の集積回路。
[17]処理コア内の信号パスをエミュレートするように構成され、メモリアクセス遅延をモデル化するのに使用される少なくとも1つのビット線セルを含む遅延合成器と、
遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
[18]遅延合成器は、選択可能な数のビット線セルを含む[17]記載の集積回路。
[19]各ビット線セルは、少なくとも1つのメモリセルと、少なくとも1つのメモリセルに連結されたセンス増幅器とを含む[17]記載の集積回路。
[20]処理コア内の信号パスをエミュレートするように構成され、遅延合成器をプログラムする少なくとも1つのマルチプレクサを含む遅延合成器と、
遅延合成器内の少なくとも1つのマルチプレクサの遅延を推定するように構成された遅延整合回路と、
遅延合成器および遅延整合回路に連結され、遅延合成器および遅延整合回路の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
[21]制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている[20]記載の集積回路。
[22]遅延合成器は少なくとも1本の遅延線を含み、各遅延線は、少なくとも1つのセルを含み、遅延線内の構成可能な数のセルを選択するように動作するマルチプレクサに連結される[20]記載の集積回路。
[23]各遅延線に対するマルチプレクサは、遅延線内の少なくとも1つのセルを選択するように動作する[22]記載の集積回路。
[24]遅延整合回路は、遅延合成器内の少なくとも1つのマルチプレクサに対して少なくとも1つの部分的なマルチプレクサを含み、各部分的なマルチプレクサは、関連するマルチプレクサの1つの入力と出力との間の信号パスを含む[20]記載の集積回路。
[25]処理コアに対して異なる位置に置かれた少なくとも2つの遅延合成器であって、各遅延合成器は処理コア内のクリティカル信号パスをエミュレートするように構成されている、少なくとも2つの遅延合成器と、
少なくとも2つの遅延合成器に連結され、少なくとも2つの遅延合成器の出力を受信して、処理コアに対する供給電圧を調節する制御を与えるように構成された制御ユニットとを含む集積回路。
[26]少なくとも2つの遅延合成器は、処理コアの異なるコーナに置かれる[25]記載の集積回路。
[27]論理か、または論理およびワイヤの両者かに基づいて、発振器信号を発生するように構成された発振器と、
発振器信号に基づいて第1および第2の出力を与えるように構成された制御ユニットであって、第1の出力は論理速度を示し、第2の出力は、ワイヤ速度か、または論理およびワイヤ速度の両者かを示す、制御ユニットとを含む集積回路。
[28]発振器は、少なくとも1つの遅延ユニットを含み、各遅延ユニットは、論理から構成されている第1の信号パスと、論理およびワイヤの両者から構成されている第2の信号パスとを含む[27]記載の集積回路。
[29]制御ユニットは、論理に対する第1の周波数カウントと、論理およびワイヤの両者に対する第2の周波数カウントとを得て、第1および第2の周波数カウントに基づいて第1および第2の出力を発生するように構成されている[27]記載の集積回路。
[30]処理コア内のクリティカル信号パスを確認するように構成された特徴付けユニットと、
特徴付けユニットに連結され、特徴付けユニットによって確認されたクリティカル信号パスをエミュレートするように構成された遅延合成器であって、異なる閾値電圧をもつ論理、ワイヤ、異なるファンアウトをもつドライバ、またはその組合せを含む遅延合成器とを含む装置。
[31]処理コアに対する論理速度およびワイヤ速度を決定するように構成されたモニタユニットをさらに含む[30]記載の装置。
[32]特徴付けユニットは、処理コアに対する目標クロック周波数を受信し、目標クロック周波数に基づいてクリティカル信号パスを確認するように構成されている[30]記載の装置。
[33]目標クロック周波数は、処理コアに対する性能要件に基づいて動的に選択される[32]記載の装置。
[34]特徴付けユニットは、処理コアに対する論理速度およびワイヤ速度を受信し、論理速度およびワイヤ速度に基づいてクリティカル信号パスを確認するように構成されている[30]記載の装置。
[35]特徴付けユニットは、論理速度およびワイヤ速度の複数の組合せに対して複数のルックアップテーブルを含み、各ルックアップテーブルは、論理速度およびワイヤ速度の異なる組合せに対するクリティカル信号パスを示す[34]記載の装置。
[36]各ルックアップテーブルは、複数のクロック周波数に対する複数の信号パスを含み、特徴付けユニットは、クリティカル信号パスとして、特徴付けユニットによって受信された論理速度およびワイヤ速度に関連したルックアップテーブルの呼び出しにおいて目標クロック周波数に対する信号パスを与えるように構成されている[35]記載の装置。
[37]遅延合成器に連結され、遅延合成器から出力を受信し、処理コアに対する供給電圧を調節する制御を与えるように構成された制御ユニットをさらに含む[30]記載の装置。
[38]異なる閾値電圧をもつ論理、ワイヤ、異なるファンアウトをもつドライバ、またはその組合せを使用して、処理コアに対するクリティカル信号パスを複製することと、
複製のクリティカル信号パスの遅延に基づいて処理コアに対する供給電圧を調節することと、を含む方法。
[39]処理コアに対する目標クロック周波数を決定することをさらに含む方法であって、複製のクリティカル信号パスは、目標クロック周波数に基づいて形成される[38]記載の方法。
[40]処理コアの論理速度およびワイヤ速度を特徴付けることをさらに含み、複製のクリティカル信号パスは、論理速度およびワイヤ速度に基づいて形成される[38]記載の方法。
[41]複製のクリティカルパス内のマルチプレクサの遅延を推定することをさらに含む方法であって、供給電圧は、マルチプレクサの推定遅延に基づいてさらに調節される[38]記載の方法。
[42]異なる閾値電圧をもつ論理、ワイヤ、ドライバ、異なるファンアウトをもつドライバ、またはその組合せを使用して、処理コアに対するクリティカル信号パスを複製する手段と、
複製のクリティカル信号パスの遅延に基づいて処理コアの供給電圧を調節する手段とを含む装置。
[43]処理コアに対する目標クロック周波数を決定する手段をさらに含む装置であって、複製のクリティカル信号パスは、目標クロック周波数に基づいて形成される[42]記載の装置。
[44]処理コアの論理速度およびワイヤ速度を特徴付ける手段をさらに含む装置であって、複製のクリティカル信号パスが、論理速度およびワイヤ速度に基づいて形成される[42]記載の装置。
[45]複製のクリティカルパス内のマルチプレクサの遅延を推定する手段をさらに含む装置であって、供給電圧は、マルチプレクサの推定遅延に基づいてさらに調節される[42]記載の装置。

Claims (45)

  1. 処理コア内の信号パスをエミュレートするように構成され、少なくとも2つの閾値電圧をもつトランジスタデバイスを含む遅延合成器と、
    遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
  2. 制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている請求項1記載の集積回路。
  3. 遅延合成器は、少なくとも2つの閾値電圧の各々に対して選択可能な数のトランジスタデバイスを含む請求項1記載の集積回路。
  4. 少なくとも2つの閾値電圧は、高い閾値電圧(high threshold voltage, HVT)と低い閾値電圧(low threshold voltage, LVT)とを含む請求項1記載の集積回路。
  5. 遅延合成器は、選択可能な数のHVTトランジスタデバイスと、選択可能な数のLVTトランジスタデバイスとを含む請求項4記載の集積回路。
  6. 遅延合成器は、少なくとも2つの閾値電圧をもつトランジスタデバイスによって形成される論理セルを含む請求項1記載の集積回路。
  7. 遅延合成器は、少なくとも2つの閾値電圧をもつトランジスタデバイスによって形成されるドライバを含む請求項1記載の集積回路。
  8. 処理コア内の信号パスをエミュレートするように構成され、少なくとも1つの論理セルと、少なくとも1つのワイヤと、異なる電気的特性をもつ少なくとも2つのドライバから選択される少なくとも1つのドライバとを含む遅延合成器、および、
    遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットを含む集積回路。
  9. 少なくとも2つのドライバは、異なる閾値電圧をもつ請求項8記載の集積回路。
  10. 少なくとも2つのドライバは、異なるファンアウトをもつ請求項8記載の集積回路。
  11. 遅延合成器は、選択可能な数の論理セルと選択可能な数のワイヤとを含む請求項8記載の集積回路。
  12. 少なくとも1つの論理セルは、異なる閾値電圧をもつ少なくとも2つの論理セルから選択される請求項8記載の集積回路。
  13. 制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている請求項8記載の集積回路。
  14. 処理コア内の信号パスをエミュレートするように構成され、処理コア内の拡散容量をモデル化するのに使用される少なくとも1つのダイナミックセルを含む遅延合成器と、 遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
  15. 遅延合成器は、選択可能な数のダイナミックセルを含む請求項14記載の集積回路。
  16. 各ダイナミックセルは、拡散容量をモデル化する少なくとも1つのトランジスタと、少なくとも1つのトランジスタを充電および放電するように構成された第1および第2のトランジスタとを含む請求項14記載の集積回路。
  17. 処理コア内の信号パスをエミュレートするように構成され、メモリアクセス遅延をモデル化するのに使用される少なくとも1つのビット線セルを含む遅延合成器と、
    遅延合成器に連結され、遅延合成器の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
  18. 遅延合成器は、選択可能な数のビット線セルを含む請求項17記載の集積回路。
  19. 各ビット線セルは、少なくとも1つのメモリセルと、少なくとも1つのメモリセルに連結されたセンス増幅器とを含む請求項17記載の集積回路。
  20. 処理コア内の信号パスをエミュレートするように構成され、遅延合成器をプログラムする少なくとも1つのマルチプレクサを含む遅延合成器と、
    遅延合成器内の少なくとも1つのマルチプレクサの遅延を推定するように構成された遅延整合回路と、
    遅延合成器および遅延整合回路に連結され、遅延合成器および遅延整合回路の出力に基づいて制御を与えるように構成された制御ユニットとを含む集積回路。
  21. 制御ユニットは、処理コアに対する供給電圧を調節する制御を与えるように構成されている請求項20記載の集積回路。
  22. 遅延合成器は少なくとも1本の遅延線を含み、各遅延線は、少なくとも1つのセルを含み、遅延線内の構成可能な数のセルを選択するように動作するマルチプレクサに連結される請求項20記載の集積回路。
  23. 各遅延線に対するマルチプレクサは、遅延線内の少なくとも1つのセルを選択するように動作する請求項22記載の集積回路。
  24. 遅延整合回路は、遅延合成器内の少なくとも1つのマルチプレクサに対して少なくとも1つの部分的なマルチプレクサを含み、各部分的なマルチプレクサは、関連するマルチプレクサの1つの入力と出力との間の信号パスを含む請求項20記載の集積回路。
  25. 処理コアに対して異なる位置に置かれた少なくとも2つの遅延合成器であって、各遅延合成器は処理コア内のクリティカル信号パスをエミュレートするように構成されている、少なくとも2つの遅延合成器と、
    少なくとも2つの遅延合成器に連結され、少なくとも2つの遅延合成器の出力を受信して、処理コアに対する供給電圧を調節する制御を与えるように構成された制御ユニットとを含む集積回路。
  26. 少なくとも2つの遅延合成器は、処理コアの異なるコーナに置かれる請求項25記載の集積回路。
  27. 論理か、または論理およびワイヤの両者かに基づいて、発振器信号を発生するように構成された発振器と、
    発振器信号に基づいて第1および第2の出力を与えるように構成された制御ユニットであって、第1の出力は論理速度を示し、第2の出力は、ワイヤ速度か、または論理およびワイヤ速度の両者かを示す、制御ユニットとを含む集積回路。
  28. 発振器は、少なくとも1つの遅延ユニットを含み、各遅延ユニットは、論理から構成されている第1の信号パスと、論理およびワイヤの両者から構成されている第2の信号パスとを含む請求項27記載の集積回路。
  29. 制御ユニットは、論理に対する第1の周波数カウントと、論理およびワイヤの両者に対する第2の周波数カウントとを得て、第1および第2の周波数カウントに基づいて第1および第2の出力を発生するように構成されている請求項27記載の集積回路。
  30. 処理コア内のクリティカル信号パスを確認するように構成された特徴付けユニットと、
    特徴付けユニットに連結され、特徴付けユニットによって確認されたクリティカル信号パスをエミュレートするように構成された遅延合成器であって、異なる閾値電圧をもつ論理、ワイヤ、異なるファンアウトをもつドライバ、またはその組合せを含む遅延合成器とを含む装置。
  31. 処理コアに対する論理速度およびワイヤ速度を決定するように構成されたモニタユニットをさらに含む請求項30記載の装置。
  32. 特徴付けユニットは、処理コアに対する目標クロック周波数を受信し、目標クロック周波数に基づいてクリティカル信号パスを確認するように構成されている請求項30記載の装置。
  33. 目標クロック周波数は、処理コアに対する性能要件に基づいて動的に選択される請求項32記載の装置。
  34. 特徴付けユニットは、処理コアに対する論理速度およびワイヤ速度を受信し、論理速度およびワイヤ速度に基づいてクリティカル信号パスを確認するように構成されている請求項30記載の装置。
  35. 特徴付けユニットは、論理速度およびワイヤ速度の複数の組合せに対して複数のルックアップテーブルを含み、各ルックアップテーブルは、論理速度およびワイヤ速度の異なる組合せに対するクリティカル信号パスを示す請求項34記載の装置。
  36. 各ルックアップテーブルは、複数のクロック周波数に対する複数の信号パスを含み、特徴付けユニットは、クリティカル信号パスとして、特徴付けユニットによって受信された論理速度およびワイヤ速度に関連したルックアップテーブルの呼び出しにおいて目標クロック周波数に対する信号パスを与えるように構成されている請求項35記載の装置。
  37. 遅延合成器に連結され、遅延合成器から出力を受信し、処理コアに対する供給電圧を調節する制御を与えるように構成された制御ユニットをさらに含む請求項30記載の装置。
  38. 異なる閾値電圧をもつ論理、ワイヤ、異なるファンアウトをもつドライバ、またはその組合せを使用して、処理コアに対するクリティカル信号パスを複製することと、
    複製のクリティカル信号パスの遅延に基づいて処理コアに対する供給電圧を調節することとを含む方法。
  39. 処理コアに対する目標クロック周波数を決定することをさらに含む方法であって、複製のクリティカル信号パスは、目標クロック周波数に基づいて形成される請求項38記載の方法。
  40. 処理コアの論理速度およびワイヤ速度を特徴付けることをさらに含み、複製のクリティカル信号パスは、論理速度およびワイヤ速度に基づいて形成される請求項38記載の方法。
  41. 複製のクリティカルパス内のマルチプレクサの遅延を推定することをさらに含む方法であって、供給電圧は、マルチプレクサの推定遅延に基づいてさらに調節される請求項38記載の方法。
  42. 異なる閾値電圧をもつ論理、ワイヤ、ドライバ、異なるファンアウトをもつドライバ、またはその組合せを使用して、処理コアに対するクリティカル信号パスを複製する手段と、
    複製のクリティカル信号パスの遅延に基づいて処理コアの供給電圧を調節する手段とを含む装置。
  43. 処理コアに対する目標クロック周波数を決定する手段をさらに含む装置であって、複製のクリティカル信号パスは、目標クロック周波数に基づいて形成される請求項42記載の装置。
  44. 処理コアの論理速度およびワイヤ速度を特徴付ける手段をさらに含む装置であって、複製のクリティカル信号パスが、論理速度およびワイヤ速度に基づいて形成される請求項42記載の装置。
  45. 複製のクリティカルパス内のマルチプレクサの遅延を推定する手段をさらに含む装置であって、供給電圧は、マルチプレクサの推定遅延に基づいてさらに調節される請求項42記載の装置。
JP2013093504A 2005-10-31 2013-04-26 電子デバイスのための適応電圧スケーリング Active JP5539571B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US73222805P 2005-10-31 2005-10-31
US60/732,228 2005-10-31
US11/286,087 US7417482B2 (en) 2005-10-31 2005-11-22 Adaptive voltage scaling for an electronics device
US11/286,087 2005-11-22

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008539145A Division JP5301278B2 (ja) 2005-10-31 2006-10-31 電子デバイスのための適応電圧スケーリング

Publications (2)

Publication Number Publication Date
JP2013211022A true JP2013211022A (ja) 2013-10-10
JP5539571B2 JP5539571B2 (ja) 2014-07-02

Family

ID=37995460

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008539145A Active JP5301278B2 (ja) 2005-10-31 2006-10-31 電子デバイスのための適応電圧スケーリング
JP2013093504A Active JP5539571B2 (ja) 2005-10-31 2013-04-26 電子デバイスのための適応電圧スケーリング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008539145A Active JP5301278B2 (ja) 2005-10-31 2006-10-31 電子デバイスのための適応電圧スケーリング

Country Status (6)

Country Link
US (1) US7417482B2 (ja)
EP (1) EP1964258B1 (ja)
JP (2) JP5301278B2 (ja)
KR (1) KR100998451B1 (ja)
CN (1) CN101689071B (ja)
WO (1) WO2007053839A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928003B2 (en) 2019-11-19 2024-03-12 Sony Semiconductor Solutions Corporation Voltage control device

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100806284B1 (ko) * 2005-12-08 2008-02-22 한국전자통신연구원 동적 전압 스케일링을 적용한 고효율 프로세서
US8892979B2 (en) 2006-10-26 2014-11-18 Qualcomm Incorporated Coding schemes for wireless communication transmissions
JP2010508728A (ja) * 2006-10-26 2010-03-18 クゥアルコム・インコーポレイテッド 無線通信送信のための符合化スキーム
US7714635B2 (en) * 2007-02-06 2010-05-11 International Business Machines Corporation Digital adaptive voltage supply
JP4753895B2 (ja) * 2007-02-20 2011-08-24 ルネサスエレクトロニクス株式会社 遅延調整回路を有するアレイ型プロセッサ
US20080290924A1 (en) * 2007-05-21 2008-11-27 Qualcomm Incorporated Method and apparatus for programmable delay having fine delay resolution
US8085082B2 (en) * 2007-05-30 2011-12-27 Broadcom Corporation High speed multiplexer
JP5084372B2 (ja) * 2007-07-03 2012-11-28 キヤノン株式会社 データ処理装置およびデータ処理装置の制御方法
US8725488B2 (en) 2007-07-26 2014-05-13 Qualcomm Incorporated Method and apparatus for adaptive voltage scaling based on instruction usage
US9026821B2 (en) * 2008-02-01 2015-05-05 Cochlear Limited Optimizing power consumption of a digital circuit
US8010935B2 (en) * 2008-05-07 2011-08-30 Lsi Corporation Electronic design automation tool and method for optimizing the placement of process monitors in an integrated circuit
US8051312B2 (en) * 2008-05-20 2011-11-01 Advanced Micro Devices, Inc. Apparatus and method for reducing power consumption by an integrated circuit
US8255196B2 (en) * 2008-08-25 2012-08-28 Fujitsu Limited Constructing a replica-based clock tree
KR101312978B1 (ko) 2009-01-27 2013-10-01 에이저 시스템즈 엘엘시 성능 모니터링을 위한 임계―경로 회로
US8370654B1 (en) 2009-03-26 2013-02-05 Marvell Israel (M.I.S.L) Ltd. AVS-adaptive voltage scaling
EP2414908B1 (en) 2009-03-30 2020-08-12 QUALCOMM Incorporated Adaptive voltage scaling
KR101115474B1 (ko) * 2009-03-30 2012-02-27 주식회사 하이닉스반도체 지연회로
US8661274B2 (en) * 2009-07-02 2014-02-25 Qualcomm Incorporated Temperature compensating adaptive voltage scalers (AVSs), systems, and methods
US8239805B2 (en) 2009-07-27 2012-08-07 Lsi Corporation Method for designing integrated circuits employing a partitioned hierarchical design flow and an apparatus employing the method
TW201122753A (en) * 2009-12-29 2011-07-01 Ind Tech Res Inst Voltage scaling systems
US8924902B2 (en) * 2010-01-06 2014-12-30 Qualcomm Incorporated Methods and circuits for optimizing performance and power consumption in a design and circuit employing lower threshold voltage (LVT) devices
US8760136B2 (en) * 2010-03-08 2014-06-24 Freescale Semiconductor, Inc. Dynamic voltage scaling interface
US8760217B2 (en) 2011-02-25 2014-06-24 Qualcomm Incorporated Semiconductor device having on-chip voltage regulator
JP5799645B2 (ja) * 2011-08-05 2015-10-28 株式会社ソシオネクスト 電源電圧設定方法及び電源電圧設定プログラム
US10169500B2 (en) 2011-08-08 2019-01-01 International Business Machines Corporation Critical path delay prediction
US8954017B2 (en) 2011-08-17 2015-02-10 Broadcom Corporation Clock signal multiplication to reduce noise coupled onto a transmission communication signal of a communications device
US8659972B2 (en) * 2011-09-12 2014-02-25 Qualcomm Incorporated Adaptive read wordline voltage boosting apparatus and method for multi-port SRAM
US20130117589A1 (en) * 2011-11-04 2013-05-09 Anand Satyamoorthy Stability control in a voltage scaling system
US9292025B2 (en) 2011-12-19 2016-03-22 Mediatek Singapore Pte. Ltd. Performance, thermal and power management system associated with an integrated circuit and related method
TWI582561B (zh) * 2012-05-01 2017-05-11 馬維爾以色列股份有限公司 適應性電壓調整主從之積體電路、方法及系統
US8464199B1 (en) 2012-05-16 2013-06-11 International Business Machines Corporation Circuit design using design variable function slope sensitivity
US9000809B2 (en) * 2012-05-30 2015-04-07 Infineon Technologies Austria Ag Method and device for sampling an input signal
CN102880275A (zh) * 2012-09-07 2013-01-16 北京航空航天大学 一种针对周期性关键任务的电源管理装置及其方法
US20140136177A1 (en) * 2012-11-09 2014-05-15 Mediatek Inc. Critical path emulating apparatus using hybrid architecture
US9223327B1 (en) * 2012-11-26 2015-12-29 Marvell International Ltd. Universal adaptive voltage scaling system
US20140159800A1 (en) * 2012-12-12 2014-06-12 Texas Instruments Incorporated Simplified Adaptive Voltage Scaling Using Lookup-Table and Analog Temperature Sensor to Improve Performance Prediction Across Temperature
US9939883B2 (en) 2012-12-27 2018-04-10 Nvidia Corporation Supply-voltage control for device power management
US8975954B2 (en) * 2013-01-08 2015-03-10 Qualcomm Incorporated Method for performing adaptive voltage scaling (AVS) and integrated circuit configured to perform AVS
US9087168B2 (en) 2013-06-19 2015-07-21 International Business Machines Corporation Optimizing operating range of an electronic circuit
US9602083B2 (en) 2013-07-03 2017-03-21 Nvidia Corporation Clock generation circuit that tracks critical path across process, voltage and temperature variation
US9766649B2 (en) 2013-07-22 2017-09-19 Nvidia Corporation Closed loop dynamic voltage and frequency scaling
US10103719B2 (en) 2013-07-22 2018-10-16 Nvidia Corporation Integrated voltage regulator with in-built process, temperature and aging compensation
KR102154191B1 (ko) 2013-09-02 2020-09-10 삼성전자 주식회사 프로세서 내에 집적되는 온도 센서, 이의 동작 방법 및 상기 온도 센서를 포함하는 장치
US9158319B2 (en) 2013-10-23 2015-10-13 Avago Technologies General Ip (Singapore) Pte. Ltd. Closed-loop adaptive voltage scaling for integrated circuits
US20150149800A1 (en) * 2013-11-27 2015-05-28 Alexander Gendler Performing an operating frequency change using a dynamic clock control technique
CN105745593A (zh) * 2013-12-23 2016-07-06 马维尔以色列(M.I.S.L.)有限公司 用于对供电电压的变化作出反应的装置和方法
TWI528723B (zh) 2013-12-27 2016-04-01 財團法人工業技術研究院 應用特徵化路徑電路的動態調整電路及產生特徵化路徑電路的方法
US20150220128A1 (en) * 2014-02-04 2015-08-06 Infineon Technologies Ag Method and Apparatus for Use in a Data Processing System
US9810585B2 (en) 2014-03-28 2017-11-07 Darryl G. Walker Semiconductor device having a temperature circuit that provides a plurality of temperature operating ranges
US9552447B2 (en) 2015-04-24 2017-01-24 Globalfoundries Inc. Systems and methods for controlling integrated circuit chip temperature using timing closure-based adaptive frequency scaling
US9543936B1 (en) 2015-06-22 2017-01-10 International Business Machines Corporation Reconfigurable voltage desensitization circuit to emulate system critical paths
US9651969B2 (en) * 2015-07-30 2017-05-16 Qualcomm Incorporated Adaptive voltage scaling using analytical models for interconnect delay
CN104976783B (zh) * 2015-07-31 2017-12-15 泰兴市城东绿化工程有限公司 一种电源自学习可标定热水器
JP6545564B2 (ja) * 2015-08-06 2019-07-17 ルネサスエレクトロニクス株式会社 半導体装置
US10156882B2 (en) * 2015-10-09 2018-12-18 International Business Machines Corporation Multi-core dynamic frequency control system
KR20170124017A (ko) 2016-04-29 2017-11-09 삼성전자주식회사 동작 전압을 조절하는 메모리 장치, 메모리 장치를 제어하는 어플리케이션 프로세서 및 메모리 장치의 동작방법
US10236043B2 (en) 2016-06-06 2019-03-19 Altera Corporation Emulated multiport memory element circuitry with exclusive-OR based control circuitry
US9858217B1 (en) * 2016-06-29 2018-01-02 Qualcomm Incorporated Within-die special oscillator for tracking SRAM memory performance with global process variation, voltage and temperature
DE102018107089A1 (de) * 2017-05-12 2018-11-15 Taiwan Semiconductor Manufacturing Co., Ltd. Multiplexierer-Schaltkreis, Halbleitervorrichtung zum Multiplexieren von Spannungen, und Verfahren für seinen Betrieb
US11150295B1 (en) * 2018-10-02 2021-10-19 Marvell Asia Pte, Ltd. Relay circuit for reducing a voltage glitch during device testing
US10587253B1 (en) * 2018-11-29 2020-03-10 Qualcomm Incorporated Ring oscillator-based programmable delay line
KR102611722B1 (ko) 2019-01-07 2023-12-07 삼성전자주식회사 이미지 처리 장치 및 이미지 처리 방법
US10839865B1 (en) * 2019-04-29 2020-11-17 Arm Limited Self-timed memory with adaptive voltage scaling
KR20220107048A (ko) * 2019-12-04 2022-08-01 후아웨이 테크놀러지 컴퍼니 리미티드 칩 프로세스 변화 인식 전력 효율 최적화
KR20220033248A (ko) 2020-09-09 2022-03-16 삼성전자주식회사 무선 전력 중계 장치 및 무선 전력 중계 방법
FR3114188B1 (fr) * 2020-09-11 2024-01-12 Dolphin Design Polarisation adaptative de substrat utilisant des détecteurs de marge
CN114363132A (zh) 2020-10-13 2022-04-15 三星电子株式会社 通信方法
TWI811128B (zh) * 2022-10-05 2023-08-01 國立中山大學 抑制製程、電壓、溫度變異之振盪器
US20240118740A1 (en) * 2022-10-06 2024-04-11 Google Llc Workload-Aware Voltage Regulator Tuning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02184908A (ja) * 1989-01-11 1990-07-19 Nec Corp 情報処理装置
JPH04119008A (ja) * 1990-09-10 1992-04-20 Seiko Epson Corp ディジタル遅延回路
JP2002100967A (ja) * 2000-03-17 2002-04-05 Sony Corp 電源電圧制御装置、半導体装置およびその駆動方法
JP2006004338A (ja) * 2004-06-21 2006-01-05 Fujitsu Ltd 半導体集積回路

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451894A (en) * 1993-02-24 1995-09-19 Advanced Micro Devices, Inc. Digital full range rotating phase shifter
US5519344A (en) * 1994-06-30 1996-05-21 Proebsting; Robert J. Fast propagation technique in CMOS integrated circuits
JP3596969B2 (ja) * 1996-02-05 2004-12-02 沖電気工業株式会社 遅延回路およびパルス発生回路
US6046606A (en) * 1998-01-21 2000-04-04 International Business Machines Corporation Soft error protected dynamic circuit
KR100286099B1 (ko) * 1998-05-29 2001-04-16 윤종용 클럭모니터회로및이를이용한동기식반도체메모리장치
JP2004253880A (ja) * 2003-02-18 2004-09-09 Nec Electronics Corp 半導体集積回路装置
JP4501352B2 (ja) * 2003-03-31 2010-07-14 ソニー株式会社 半導体装置
US7036029B2 (en) 2003-06-27 2006-04-25 Sigmatel, Inc. Conserving power of a system on a chip using speed sensing
US7129763B1 (en) * 2004-11-08 2006-10-31 Western Digital Technologies, Inc. Adjusting power consumption of digital circuitry by generating frequency error representing error in propagation delay
US7167035B2 (en) * 2005-02-22 2007-01-23 Freescale Semiconductor, Inc. Delay circuitry and method therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02184908A (ja) * 1989-01-11 1990-07-19 Nec Corp 情報処理装置
JPH04119008A (ja) * 1990-09-10 1992-04-20 Seiko Epson Corp ディジタル遅延回路
JP2002100967A (ja) * 2000-03-17 2002-04-05 Sony Corp 電源電圧制御装置、半導体装置およびその駆動方法
JP2006004338A (ja) * 2004-06-21 2006-01-05 Fujitsu Ltd 半導体集積回路

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928003B2 (en) 2019-11-19 2024-03-12 Sony Semiconductor Solutions Corporation Voltage control device

Also Published As

Publication number Publication date
WO2007053839A3 (en) 2010-01-07
US20070096775A1 (en) 2007-05-03
WO2007053839A2 (en) 2007-05-10
CN101689071B (zh) 2013-06-12
US7417482B2 (en) 2008-08-26
CN101689071A (zh) 2010-03-31
JP2009519620A (ja) 2009-05-14
KR100998451B1 (ko) 2010-12-06
EP1964258B1 (en) 2017-03-15
JP5539571B2 (ja) 2014-07-02
EP1964258A2 (en) 2008-09-03
KR20080091092A (ko) 2008-10-09
JP5301278B2 (ja) 2013-09-25

Similar Documents

Publication Publication Date Title
JP5539571B2 (ja) 電子デバイスのための適応電圧スケーリング
US9939839B2 (en) Low power automatic calibration method for high frequency oscillators
Kim et al. Variation-tolerant, ultra-low-voltage microprocessor with a low-overhead, within-a-cycle in-situ timing-error detection and correction technique
US8161431B2 (en) Integrated circuit performance enhancement using on-chip adaptive voltage scaling
JP5706007B2 (ja) オンチップ電圧調整器を有する半導体デバイス
JP4894014B2 (ja) 集積回路のための電源の適応制御
US8578319B2 (en) Method and apparatus for designing and manufacturing electronic circuits subject to process variations
US7911221B2 (en) Semiconductor device with speed performance measurement
EP3164780B1 (en) Multi-domain heterogeneous process-voltage-temperature tracking for integrated circuit power reduction
US20180013432A1 (en) Power Saving with Dual-rail Supply Voltage Scheme
US11418173B2 (en) Hybrid pulse/two-stage data latch
US10650112B1 (en) Multi-bit clock gating cell to reduce clock power
US10394471B2 (en) Adaptive power regulation methods and systems
EP1583009A1 (en) Method and apparatus for designing and manufacturing electronic circuits subject to process variations
US8527935B1 (en) System for reducing power consumption of electronic circuit
Sanmukh Design of variability compensation architectures of digital circuits with adaptive body bias
Hanyang et al. A FPGA prototype design emphasis on low power technique
Llanos Voltage scaling interfaces for multi-voltage digital systems
Lam Design and Analysis of CMOS Full Adders for Low Power and Low Frequency of Operation for Scavenged-Power Wireless Sensor Networks
Tu Continuous voltage-frequency scaling (CVFS)
Nain et al. Emerging applications and challenges in low-power device designs in flexible and stretchable low-power devices and strategies
Srivastav Variation Aware Energy-Efficient Methodologies for Homogeneous Many-Core Designs

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

R150 Certificate of patent or registration of utility model

Ref document number: 5539571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140430

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250