JP5771327B2 - プロセッサの非コア回路の消費電力の低減 - Google Patents

プロセッサの非コア回路の消費電力の低減 Download PDF

Info

Publication number
JP5771327B2
JP5771327B2 JP2014513499A JP2014513499A JP5771327B2 JP 5771327 B2 JP5771327 B2 JP 5771327B2 JP 2014513499 A JP2014513499 A JP 2014513499A JP 2014513499 A JP2014513499 A JP 2014513499A JP 5771327 B2 JP5771327 B2 JP 5771327B2
Authority
JP
Japan
Prior art keywords
core
state
period
clock gating
clock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014513499A
Other languages
English (en)
Other versions
JP2014517401A (ja
Inventor
バラサブラマニアン、スリカンス
トーマス、テッシル
シュリマリ、サティシュ
ガネサン、バスカラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2014517401A publication Critical patent/JP2014517401A/ja
Application granted granted Critical
Publication of JP5771327B2 publication Critical patent/JP5771327B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3293Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3237Power saving characterised by the action undertaken by disabling clock generation or distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Power Sources (AREA)
  • Microcomputers (AREA)

Description

従来のプロセッサの多くは、複数の独立したコアと、「非コア」と呼ばれることが多い追加の論理回路を含むマルチコアの形態で実装される。非コアは、共有キャッシュメモリ、コントローラ、入出力(I/O)回路、電力制御回路などを含む。一般的にプロセッサが任意のレベルの低電力モードに移行すると、1以上のコアの回路は無効化され得、コアが有用な動作をする必要がないときに電力消費を低減する。しかし、Advanced Configuration and Power Interface(ACPI)規格(例えば2006年10月10日に発行されたRev.3.0b)のいわゆるC状態などこれらのモードにおいて、非コアは完全に電力が供給されたままである。
このように非コアに電力が供給されるという特徴があることの結果として、プロセッサソケット全体の所望されない大きさの電力消費が、低電力モードでも依然として起こり得る。このことは、マルチソケットプラットフォームなどのサーバプロセッサなど特定のプロセッサにおいて特に起こり得る。なぜなら、これらのデバイスは典型的には、ラストレベルキャッシュバンク、キャッシュコントローラ、オフチップリンク、メモリコントローラなどの非コアユニットの数に関して、多くの要求を満たす必要があるからである。このような機能性を満たすべく、かなりの数の論理回路が非コアに存在し得る。そしてこのことにより、動的消費電力は、ソケットがアイドル状態にある場合でもかなりの量となる。
サーバーのアイドル状態時の消費電力の大幅な低減を消費者も規格化団体も要望しているので、このことは解決すべき課題である。
本願発明の一実施形態に係るプロセッサのブロック図である。 本願発明の一実施形態に係るマルチプロセッサシステムのブロック図である。 本願発明の一実施形態に係るマクロクロックゲーティング状態に移行する方法のフロー図である。 本願発明の一実施形態に係るマクロクロックゲーティング移行フローのフロー図である。 本願発明の一実施形態に係るマクロクロックゲーティング終了フローのフロー図である。 本願発明の一実施形態に係るプロセッサコアのブロック図である。 本願発明の一実施形態に係るシステムのブロック図である。
実施形態によると、プロセッサソケットのアイドル状態時の非コアの動的電力を低減することにより、サーバーのアイドル状態時の全体的な電力の低減が可能となる。より詳細には実施形態により、「マクロクロックゲーティング(MCG)」を可能とすることにより、非コア自体の多くが例えばクロックゲーティングを介して無効化され得る低電力状態にソケットの非コアが移行可能になる。いくつかの実施形態において、非コアを含むソケットが低電力状態にあるだけでなく、マルチソケットシステムの追加のソケットも低電力状態にあると判断された場合に、このMCG動作に移行し得る。
一実施形態において、MCG動作は、インフライトトランザクションを失うことなく、非コア内の論理回路の大部分のクロックをゲーティングすることを含み得る。非コアに残っているインフライトトランザクションが存在しないときに、MCG移行フローの終わりにMCG状態に移行し得る。加えて、MCG終了フローによると、MCG動作は、外部のリクエスト、若しくは内部または外部のイベントが発生しないとき、最小の遅延で非コアの論理回路のクロックをアンゲーティングすることを含み得る。
図1は、本願発明の一実施形態に係るプロセッサのブロック図を示す。詳細には、図1は、マルチコアプロセッサであり、サーバーベースのアプリケーションに適切であり得るプロセッサ100を示す。示されるようにプロセッサ100は、複数のコア110〜11011を含む。図1の実施形態においては特定数のコアが示されているが、本願発明の態様はこの点に関して限定されない。各コアは、例えば1以上のレベルのキャッシュメモリなどプライベート記憶装置などと関連付けられ得る。加えて各コアは、対応するキャッシュバンクコントローラ115〜11511を介して、例えば複数のスライス120〜12011から形成されるラストレベルキャッシュ(LLC)など、共有キャッシュメモリのスライスに結合されている。
示されるように、異なる複数のコアおよびキャッシュを介した通信が、双方向性の拡張可能なリング相互接続160a−bであり得るリングベースの相互接続を介して行われ得る。オフチップ通信を行うべく、様々な異なる複数のポートとエージェントとが存在し得る。詳細には、示されるように、例えば、拡張可能メモリ相互接続(scalable memory interconnect。SMI)を介してソケットに結合されたダイナミックランダムアクセスメモリ(DRAM)などシステムメモリのローカル部分へソケットを結合するメモリI/Oポート175に加えて、複数のポイントツーポイント(PtP)入出力(I/O)ポート170が存在し得る。プロセッサの様々なエージェントを用いて、キャッシュコヒーレンスプロトコルが実装され得る。一実施形態において、PtPリンクにより、物理層、リンク層、およびプロトコル層を含む複数の層を有するキャッシュコヒーレンスプロトコルであるIntel(登録商標)Quick Path Interconnect(QPI)プロトコルに準拠した通信が可能となる。このプロトコルを用いることにより、複数のキャッシュエージェントを含むシステム内で、コヒーレントな通信が行われ得る。本願発明の一実施形態によると、「キャッシュエージェント」は、メモリデータのコピーをリクエストし、キャッシュし得る(および当該データを変更し得る)キャッシュ論理回路を一般的に表し得る。そのようなキャッシュエージェントは、メモリのリクエストをルーティングするキャッシュコントローラを含み得る。プロトコルにより、PtPリンクを介して互いに結合されたデバイス間の通信を可能とする低遅延リンクに沿った、複数のチャネルおよび仮想ネットワーク上での様々な通信が可能となる。当然ながら、本願発明の態様はこの点に関して限定されず、他の実施形態においては、PtPリンクは他の通信プロトコルに準拠してもよい。
図1に示されるように、ルータ130は、ホームエージェント140、140のペアに結合し、そしてホームエージェント140、140は対応するメモリコントローラ145〜145と通信を行い得る。そしてこれらのメモリコントローラ145は、例えばメモリI/Oポート175を介したSMI相互接続を介し、例えばプロセッサに結合された1以上のデュアルインラインメモリモジュール(DIMM)などシステムメモリのローカル部分に結合され得る。
図1の実施形態において、非コアは、ルータ130、LLC120、キャッシュバンクコントローラ115、ホームエージェント140、システムリングインタフェース160、メモリコントローラ145、および電力制御ユニット(PCU)150により一般的に構成されている。これらのユニットのそれぞれは、非コアクロックと呼ぶ共通のクロック信号によりクロックされ得る。図示を分かりやすくするべく示されてはいないが、非コアクロックは、非コアのクロック生成回路により生成され得る。MCG動作によると、非コアの特定のユニットにおける非コアクロックのゲーティングにより、低い動的電力が実質的に実現され得る。一実施形態において、非コアのいくつかのユニットは、MCGモードの間、電力が供給され(アクティブなクロック信号により)アクティブなままであってもよい。つまり他の実施形態においては、ルータ130およびPCU150に電力が供給されたままであってもよく、追加の、または異なるユニットのクロックゲーティングが行われてもよい。一般的にルータ130は、入力されるQPIリンクパケットを適切なオンチップの宛て先へルーティングしてもよい。加えてルータ130は、オンチップユニット間で送信されるパケットをルーティングしてもよい。よって、外部のソケットおよびI/Oハブから入力されるパケットは、ルータ130の入力ポートに提供される。電力制御ユニット150は、コア(およびパッケージ)のC状態への移行およびC状態の終了など他の電力管理タスクの対応に加えて、MCGへの移行およびMCGの終了プロセスを順番付けし制御するマイクロコントローラおよび他の制御論理回路を含み得る。図1の実施形態においてはこの特定の実施例が示されているが、本願発明はこの点に関して限定されず、他の実施形態においてマルチコアプロセッサは異なる構成を有し得る。
「デバイス」または「エージェント」などの用語は一般的に用いられており、リンクに結合されるいかなる電気部材をも指し得る。「リンク」または「相互接続」という用語は、メッセージ、つまり所定の形式の情報のための通信経路を確立する情報伝達媒体として一般的に定義される。リンクまたは相互接続は、有線の物理媒体(例えば、バス、1以上の電気配線、トレース、ケーブルなど)、または無線媒体(例えば、無線の信号伝達技術と組み合わせての空気)であってもよい。
実施形態は、多くの異なるシステムタイプで用いられ得る。特定の実施例において、システムは、非一様なメモリアーキテクチャ(non−uniform memory architecture。NUMA)を有するマルチプロセッササーバなどマルチソケットシステムであり得る。図2は、本願発明の一実施形態に係るシステムのブロック図である。図2に示されるように、システム200は、複数のソケット210〜210を含む。各ソケットは、図1に関連して説明したものなどマルチコアプロセッサを含み得るが、当然ながら他の実装も可能である。各ソケットは、PtPリンクを介して他のソケットへ結合され得る。
図2に示されるように、各プロセッサ210は中央処理装置(CPU)と一般的に呼ばれ得る。さらに示されるように、図1の実施形態などのマルチコアソケットまたはパッケージに対応する各プロセッサ210は、メモリ相互接続を介してシステムメモリ230のローカル部分とインタフェース接続する統合型メモリコントローラ(integrated memory controller)を含む。示されるように、各プロセッサ210は、メモリ相互接続を介して、様々な実施形態においてDRAMとして実装され得るシステムメモリの対応する部分230と通信を行い得る。様々な周辺デバイスなどシステムの他の部材とのインタフェースを設けるべく、プロセッサ210のそれぞれは、少なくとも1つのI/Oハブに結合され得る。詳細には、プロセッサ210、210は、I/Oハブ220に結合され得、同様にプロセッサ210、210は、I/Oハブ220に結合され得る。図2の実施形態においてはこの基本的な高レベルの構成を示しているが、本願発明の態様はこの点に関して限定されない。
一般的に、MCG移行プロセスは、非コアが位置付けられているソケットだけでなく、マルチソケットシステム内の他の全てのソケットが任意の低電力状態にあると判断されたときに開始され得る。このようにするのは、あるソケットが低電力状態にあるときのみMCGへ移行され得るとなると、他のソケットからトランザクションが入力される可能性が高く、MCGへの移行フローを完了することが出来ない、若しくは、MCGへ移行することによって生じるコストは、非コアがMCG状態にあり得る小さなウィンドウに見合わないからである。
より詳細には、一実施形態において、MCG移行フローに従ったMCG状態への移行の開始が許可される前に、様々な前提条件がまず設定され得る。最初に、任意のソケットに関し、全てのコアが、例えばACPI規格のC3またはC6スリープ状態などの所定の低電力状態にある。限定ではなく例示を目的とし、本明細書においては、C3およびC6のスリープ状態に関して実施形態を説明するが、他のスリープ状態も採用され得る。全てのコアがC6またはC3状態になると、非コアの電力制御ユニットは「パッケージC6」(コアがC6にある場合)、または「パッケージC3」(コアがC3にある場合)と呼ばれるソケット全体の低電力アイドル状態に実質的に移行しようとする。
パッケージC3およびパッケージC6移行プロセスの延長としてMCG状態に移行し得る。よってMCG状態は実質的に、パッケージC6またはパッケージC3状態にあるときの、非コアのアイドル状態時の電力低減状態である。しかし、現行のACPI規格はこの状態をサポートしていないので、MCG状態はACPI規格とは独立していてもよい。異なる低電力状態に用いられる他の実施形態において、オペレーティングシステム(OS)の電力制御とは独立してMCG状態に移行し、MCG状態を終了してもよく、代わりに、非コアPCUなどプロセッサのマイクロコントローラにより制御されてもよい。
MCG状態への移行の他の前提条件として、プラットフォーム内の全ての他のソケットがパッケージC3またはパッケージC6状態にある(または移行しようとしている)。共通の低電力状態が存在するこの状態を可能とするべく、パッケージC6および/またはパッケージC3への移行が調整され、当該移行が全てのソケット、並びにI/Oハブの間で合意されるように、様々なソケットの間で交渉プロセスが起こり得る。
このことにより、全てのソケットが共にパッケージC6またはパッケージC3へ移行するようになり、MCG状態である期間が最大化される。MCG状態のためのさらに他の前提条件として、メモリサブシステムも、SMIリンクがアクティブでないことを示す、一実施形態においては「SMIキル」状態と呼ぶ低電力状態に移行していてもよい。この低電力状態により、メモリコントローラおよびホームエージェントの論理回路がクロックゲーティングされ得る。これらの前提条件が満たされると、各非コアをMCG状態に移行させようとするべく、様々なソケットの非コアにおいてMCG移行フローが開始され得る。
一実施形態において、MCG状態で、キャッシュバンクコントローラ、ホームエージェント、メモリコントローラ、およびシステムリングインタフェースユニットなどの非コアユニットを含む非コアの様々な回路が全てゲーティングされ得る。このゲーティングは領域毎のクロックバッファレベルで行われ得、これにより、細粒度のゲーティング方式の複雑さを避けることが出来る。
これらの前提条件が満たされると、MCGへの移行が進められ得る。なお、非コアの物理的大きさが故に、異なる複数の実施形態において、クロックゲーティングプロセス自体が、異なる数の非コアクロックサイクル(例えば、およそ10〜20サイクル)を要し得る。これは、ゲーティングされる全てのユニットにクロックゲーティング信号が到達出来るようにするためである。クロックゲーティングプロセスが問題なく行われるようにするため、様々なメカニズムが設けられ得る。一例として、非コアの各ユニットは、空き状況を示す、空き状態インジケータ、または「空き状態」信号を生成してもよい。よってこの状況は、対応するユニットが内部にインフライトトランザクションを有さないことを示す。全ての非コアユニットの空き状態は、合わせて論理的にAND処理を行われ、非コア全体としての空き状況が判断され得る。一実施形態において、論理的なAND処理は、PCUで実行され得るが、本願発明の態様はこの点に関して限定されない。
加えて、MCG移行フローは入力トランザクションのフローを制御するメカニズムを用い得る。つまり、クロックゲーティングを行うという判断がされると、新たなトランザクションはクロックゲーティングされるユニットに送信されてはならない。このフロー制御は、入力トランザクションの全てを、クロックゲーティングされるユニットに入れないようにブロックすることにより実施することが出来る。一実施形態において、このフロー制御メカニズムは非コアのルータ内に位置付けられ、クロックゲーティングが問題なく行われるまで、様々なPtP相互接続などオフチップインタフェースから他のソケット(またはI/Oハブ)への全てのトランザクションをブロックしてもよい。一例としてルータは、ソケットへのトランザクションの送信を制限すべく、他のソケット/I/Oハブへのオフチップの相互接続を介してフロー制御信号を送信してもよい。
帯域外(OOB)インタフェースから入ってくるトランザクションがクロックゲーティングにより失われることがないよう、さらに他のメカニズムがMCG移行フローにおいて用いられ得る。この機能性を可能とすべく、一実施形態において、クロックゲーティングされた論理回路へアクセスしようとする新たな入力OOBトランザクションは実質的に受信確認されない(NACK応答される)ので、後の時間に再試行される。なお、クロックゲーティングされた論理回路へアクセスする必要のないOOBトランザクションの処理は通常通りに進められ、完了され得る。そのようなトランザクションの一例は、ダイ温度に関するPCUへの問い合わせである。
図3は、本願発明の一実施形態に係るMCG状態に移行する際に実施される様々な動作を示すフロー図である。図3に示されるように、方法250は、例えば、いくつかの実施形態においては非コアのPCUの一部であってもよい、非コアの制御論理回路で実施され得る。一般的に、方法250は、MCG状態への移行を試みることが適切だと判断し、様々なタイマーのタイムアウトに対応し得る、複数の決定された期間の間、非コアが空き状態であると判断された場合にMCG状態に移行するための動作を行うことにより進められ得る。図3に示されるように、方法250は、全てのソケットが、例えばC3またはC6パッケージ状態などの任意のC状態である低電力ソケット状態にある、または当該任意のC状態へ移行しようとしていると判断することにより開始され得る(ブロック255)。この判断は、プラットフォームのソケット間の交渉の結果に基づいてもよい。次に、非コアが空き状態にあると判断され得る(ブロック260)。つまりこの判断は、非コアの様々なユニット内にペンディング中のトランザクションがないことを意味し、このことは、非コアの全ての論理ユニットからの空き状態信号の論理的なAND処理によって識別され得る。次に、OOBチャネル上のトランザクションが防止し得る(ブロック265)。MCGイベントの間、そのようなトランザクションが受信されるのを防止する様々なメカニズムについては以下に説明する。続いて、非コアがまだ空き状態にあるかどうか判断され得るブロック270の制御が行われる。
この判断の結果が肯定的な場合、ソケットに接続された様々なPtP相互接続などオフソケットチャネルから、入力トランザクションが入ってくるのを防止するブロック275の制御が行われる。さらに再びブロック280において、非コアがまだ空き状態にあると判断され得る。よってこのことは、ペンディング中のトランザクションがないということを示しており、MCG状態に移行するのが適切であるということを示している。したがって、様々な非コアユニットがクロックゲーティングされ得るブロック285の制御が行われる。このクロックゲーティングを実行するための異なる複数のメカニズムについては以下に説明する。最終的にブロック290において、非コアがMCG状態にあることを示すよう非コアクロックゲーティング状況が更新され、さらにこの時点において、OOBチャネル上のトランザクションが有効化され得る。つまり、非コアはこの時点でクロックゲーティングされた状態にあるので、そのようなトランザクションが有効化され、非コア論理回路がOOBトランザクションを扱う必要がある場合には、MCG状態を終了することが出来る。図3の実施例ではこの高レベルの構成が示されているが、本願発明の態様はこの点に関して限定されない。例えば、直線的なフローが示されたが、フローの様々な時点で非コアの空き状態を判断することにより、MCG移行フローが再開され得、または特定の動作が再試行され得る。
図4は、本願発明の一実施形態に係るMCG移行フローに従う動作のフロー図である。図4に示すように方法300は、例えば非コアのPCU内のMCG論理回路によって実施され得る。なおMCG状態に移行する前提条件として、ブロック310において、パッケージ内の全てのコアが選択された低電力状態にあり(または、選択された低電力状態に移行するプロセスにあり)、同じことが全てのプロセッサソケットに関しても当てはまることが判断され得る。加えて、プロセッサに結合されたメモリも、低電力メモリ相互接続状態(例えば、アクティブSMIキル信号)により示されるように例えばセルフリフレッシュ状態などの低電力状態にあると判断され得る。
この判断の結果が肯定的である場合、MCG状態に移行する条件が満たされたことになる。したがって、MCGへの移行の第1段階が実行され得る。最初にひし形315において、非コアが空き状態にあるかどうか判断される。もし判断の結果が肯定的であれば、OOBインタフェースがドレインされ、タイマーの初期化と共に様々な制御信号が設定され得るブロック320の制御が行われる(ブロック320)。より詳細には、この第1段階において、OOBインタフェースに、クロックゲーティングされることになる論理回路にアクセスしようとする全てのトランザクションに対しNACK応答を開始させる「NACK Enable」ビットが設定され、そのようなアクセスを試みる全てのインフライトOOBトランザクションが(例えば、トランザクションを適切に扱うことにより)ドレインされる。一実施形態において、OOBインタフェースは、アサートされた場合にMCGを終了させ得る「NACK Request」信号を有する。この信号のアサートは、この時点において無効化される。その後、非コアの空き状態が、空き状態継続期間と呼ばれるプログラム可能な特定の期間の間、継続的にサンプリングされ、非コアが継続的に空き状態にあることを確認する。この期間は、このブロック320において初期化される継続期間タイマーと呼ばれるタイマーによってトラッキングされ得る。継続期間タイマーの長さはプログラム可能であり得、一実施形態においては、およそ50〜1000サイクルの間であり得る。一実施形態において、このタイマーおよび説明される他のタイマーはPCU内に存在し得る。
この期間が終わり、空き状態継続期間の全体に亘り(1つの非コアクロックサイクルの間においても)ディアサートイベントが起こることなく非コア空き状態信号がアサートされたままであるとの判断がひし形325において行われ、MCG移行フローの第2段階がトリガされる。なお、この非コア空き状態信号が第1段階のいずれかの時間においてサンプリングされディアサートされた場合、(ひし形330およびブロック335で示されるフローで)移行プロセスが中止され、OOB NACKEnableが再設定される。
この第2段階において、ひし形340において非コアがまだ空き状態にあると判断されたものと仮定すると、フロー制御メカニズムが有効化され得るブロック350の制御が行われる。より詳細には、QPIリンクのフロー制御が行われ、ルータ入力ポートを超える新たなパケットの送信を防止する。この段階においても、「ドレイン期間」と呼ばれるプログラム可能な特定の期間の間、非コア空き状態信号が継続的にサンプリングされる。この期間は、「ドレインタイマー」と呼ばれるタイマーによりトラッキングされ得る。このドレインタイマーの長さはプログラム可能であり得、一実施形態においては、およそ50〜1000サイクルの間であり得る。この第2段階は、フロー制御信号がアサートされる直前に到着したインフライトトランザクションの処理が問題なく進められ、最終的に非コア空き状態信号をディアサートすることを実質的に可能とする。なお、この入力信号は、非コア空き状態信号のディアサートを引き起こし、よって、MCG移行フロー全体の再開を引き起こす。(ひし形360および375における判断の結果が肯定的であり)この期間が終わり、「ドレイン期間」の全体に亘り1つの非コアクロックサイクルの間もディアサートイベントが起こることなく非コア空き状態信号がアサートされたままである場合、第3段階がトリガされる。(ひし形365または375の判断により)非コア空き状態信号が第2段階のいずれかの時間においてサンプリングされディアサートされた場合、移行プロセスが中止され、(ひし形370および335において)NACK Enableが再設定され、QPIリンクフロー制御がディアサートされる。
MCG移行フローのこの最終段階である第3の段階において、ブロック380で実際のクロックゲーティング信号がアサートされる。加えて、クロックゲーティング信号の生成位置から比較的遠く離れたユニットに到達するクロックゲーティング信号の伝搬遅延に対応すべく、「クロックゲーティング」タイマーが開始され、このタイマーの期限が切れると、クロックゲーティングが完了したと見なされる。クロックゲーティングタイマーの長さはプログラム可能であってよく、一実施形態においては、10〜30サイクルの範囲内であり得る。(ひし形385の判断により)このタイマーの期限が切れるとMCGへの移行が行われたものと見なされ、「Uncore Clock Gated」状態信号がブロック390において設定される。この状態信号が設定されると、OOBインタフェースは「CLK Req」信号をアサートすることによりMCGの終了を指示出来る(よって、システムをクロックアンゲーティング状態に戻す)。なお、「CLK Req」信号は「Uncore Clock Gated」状態信号が設定されているとき(つまりクロックがゲーティングされているとき)のみ有効である。またブロック390において、「NACK Enable」信号もディアサートされる。よってこの時点において、非コアは、ルータおよびPCUを除く全ての非コアユニットがクロックゲーティングされたMCG低電力状態にあり、動的消費電力が低減される。非コアは、任意のイベントまたは出来事によって終了がトリガされるまでこの状態のままである。
一般的にクロックゲーティングまたはMCG状態の終了は、複数の条件のうち1つに応じて起こり得る。一実施形態において、第1条件は、QPIリンクの1つを介してルータ入力ポートから新たなトランザクションが受信され、非コア空き状態信号がディアサートされるということである。第2条件は、非コアクロックを有さないユニットを用いる新たなOOBトランザクションが受信され、「OOB Clk Req」信号のアサートが起こるということである。
図5は、本願発明の一実施形態に係るMCG終了フローのフロー図である。図5に示されるように、一実施形態において終了フロー400は同様に、PCUのMCG制御論理回路を介して実施され得る。図5に示されるように方法400は、MCG状態がアクティブである、言い換えると、Uncore Clock Gated状態信号がアクティブであるときに開始される(ブロック410)。ひし形420において、非コアが空き状態にあり、クロックリクエストがアサートされていないかが判断される。判断の結果が肯定的であれば、非コアはMCG状態のままである。そうでなければ、ブロック430の制御が行われる。ブロック430において、クロックゲーティング有効化信号がディアサートされ、クロックアンゲーティングタイマーが開始される。加えて、Uncore Clock Gated状態信号が非アクティブ化され得る。なお、クロックアンゲーティングプロセスは、ある程度の回数のサイクルの実行を要し得る。このアンゲーティング期間は、「クロックアンゲーティング」期間と呼ばれ得る。一実施形態においてこの期間は、「クロックアンゲーティング」タイマーを用いてトラッキングされ得る。クロックアンゲーティングタイマーの長さはプログラム可能であってよく、一実施形態において、およそ10〜30サイクルの範囲であり得る。本願発明の態様はこの点に関して限定されないが、(ひし形440の判断において)このタイマーの期限が切れると、(ブロック450において)リンクフロー制御信号がディアサートされ得、「Uncore Clock Gated」信号が再設定される。このことにより、この時点でOOBインタフェースは制限なく非コアの全てのユニットへアクセス出来るので、Clk Req信号の必要性がなくなる。図5の実施形態においてはこの特定の実施例が示されているが、本願発明の態様はこの点に関して限定されない。
実施形態は、異なるコアアーキテクチャを有するマルチコアプロセッサに用いられ得る。図6は、本願発明の一実施形態に係るプロセッサコアのブロック図である。図6に示されるように、プロセッサコア500はマルチステージパイプラインアウトオブオーダープロセッサであり得、関連する非コアがMCU移行フローを開始する前に低電力状態(例えば、C3またはC6状態)であり得る存在する複数のコアのうち1つであり得る。
図6に示されるように、コア500は、実行される命令をフェッチし、それら命令を後にプロセッサで用いられ得るようにするフロントエンドユニット510を含む。例えばフロントエンドユニット510は、フェッチユニット501、命令キャッシュ503、および、命令デコーダ505を含み得る。いくつかの実施例において、フロントエンドユニット510はさらに、マイクロコード記憶装置、およびマイクロオペレーション記憶装置と併せてトレースキャッシュを含み得る。フェッチユニット50は、例えばメモリまたは命令キャッシュ503からマクロ命令をフェッチし、当該マクロ命令を基本命令、つまりプロセッサにより実行されるマイクロオペレーションにデコードすべく命令デコーダ505に供給する。
フロントエンドユニット510と実行ユニット520との間には、マイクロ命令を受信しそれらを実行され得るようにするアウトオブオーダー(OOO)エンジン515が結合される。より詳細にはOOOエンジン515は、マイクロ命令フローを再度順序付け、実行のために必要な様々なリソースを割り当て、レジスタファイル530および拡張レジスタファイル535などの様々なレジスタファイル内の格納位置へ論理レジスタの名前を変更する様々なバッファを含み得る。レジスタファイル530は、整数および浮動小数点操作のための別個のレジスタファイルを含み得る。拡張レジスタファイル535は、例えばレジスタあたり256または512ビットなどのベクトルサイズの単位での格納部を実現する。
例えば様々な整数、浮動小数点、および単一命令複数データ(SIMD)論理ユニット、およびその他専用のハードウェアを含む様々なリソースが実行ユニット520に存在し得る。例えば、そのような実行ユニットは、1以上の算術論理演算ユニット(ALU)522およびその他の実行ユニットを含み得る。
実行ユニットからの結果は、リタイア論理回路、つまり、リオーダーバッファ(ROB)540に提供され得る。より詳細には、ROB540は、実行される命令に関する情報を受信する様々なアレイおよび論理回路を含み得る。その後この情報は、ROB540によって検証され、命令が正当にリタイアされ得、プロセッサのアーキテクチャ状況にコミットしたデータを生じさせるか、または、命令の適切なリタイアを防止する1以上の例外状況が発生したかどうかの判断が行われる。当然ながら、ROB540はリタイアに関する他の動作も扱い得る。
図6に示されるように、ROB540はキャッシュ550に結合され、キャッシュ550は一実施形態において、低レベルキャッシュ(例えばL1キャッシュ)であり得るが、本願発明の態様はこの点に関して限定されない。また、実行ユニット520は直接キャッシュ550に結合され得る。キャッシュ550から、高レベルキャッシュ、システムメモリなどとのデータ通信が行われ得る。図6においてはこの高レベルの構成が示されているが、本願発明の態様はこの点に関して限定されない。例えば、図6の実装例は、いわゆるx86命令セットアーキテクチャ(ISA)などのアウトオブオーダーマシンに関するが、本願発明の態様はこの点に関して限定されない。代わりにコアは、インオーダープロセッサ、ARMベースプロセッサなど縮小命令セットコンピューティング(RISC)プロセッサ、または、エミュレーションエンジンおよび関連付けられた論理回路を介して異なるISAの命令および動作をエミュレート出来る他のタイプのISAのプロセッサとして実装され得る。
実施形態は、多くの異なるタイプのシステムにおいて実装され得る。図7は、本願発明の一実施形態に係るシステムのブロック図である。図7に示すようにマルチプロセッサシステム600は、ポイントツーポイント相互接続システムであり、ポイントツーポイント相互接続650を介して互いに結合された第1プロセッサ670と第2プロセッサ680とを含む。図7に示されるように、プロセッサ670、680のそれぞれは、第1および第2プロセッサコア(つまり、プロセッサコア674a、674b、およびプロセッサコア684a、684b)を含む多数のコアを有するプロセッサであり得る。なお、より多くのコアがプロセッサ内に存在していてもよい。加えて各プロセッサは、本願発明の一実施形態に係るMCGフローを実施する非コア675、685を含み得る。
続けて図7を参照すると、第1プロセッサ670はさらに、メモリコントローラハブ(MCH)672と、ポイントツーポイント(P−P)インタフェース676、678とを含む。同様に、第2プロセッサ680はMCH682とP−Pインタフェース686、688とを含む。図7に示されるように、MCH672、682はプロセッサを、各プロセッサにローカルに取り付けられたシステムメモリ(例えばDRAM)の一部であってもよい各メモリ、つまり、メモリ632およびメモリ634に結合する。第1プロセッサ670および第2プロセッサ680は、P−P相互接続652、654を介してチップセット690に結合されてもよい。図7に示されるようにチップセット690は、P−Pインタフェース694、698を含む。
さらに、チップセット690は、P−P相互接続639によりチップセット690を高性能グラフィクスエンジン638に結合するインタフェース692を含む。そしてチップセット690は、インタフェース696を介して第1バスに結合され得る。図7に示されるように、第1バス616を第2バス620に結合するバスブリッジ618と併せて、様々な入出力(I/O)デバイス614が、第1バス616に結合され得る。例えばキーボード/マウス622、通信デバイス626、および、データ記憶ユニット628を含む様々なデバイスが第2バス620に結合され得る。一実施形態においてデータ記憶ユニット628は、コード630を含み得るディスクドライブ、または他の大容量記憶デバイスであり得る。さらに、オーディオI/O624が第2バス620に結合され得る。実施形態は、スマートセルラーフォン、タブレットコンピュータ、ネットブックなどのモバイルデバイスを含む他のタイプのシステムに組み込まれ得る。
実施形態はコードを用いて実装されてもよく、当該コードは、命令を格納した記憶媒体に格納され得、当該記憶媒体を用いて、システムが当該命令を実行するようプログラムされ得る。記憶媒体には、フロッピー(登録商標)ディスク、光ディスク、半導体ドライブ(SSD)、CD−ROM、CD−RW、および光磁気ディスクを含むディスクなどの何らかのタイプの非一時的記憶媒体、読取専用メモリ(ROM)などの半導体デバイス、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、消去可能プログラム可能読取専用メモリ(EPROM)、フラッシュメモリ、電気的消去可能プログラム可能読取専用メモリ(EEPROM)などのランダムアクセスメモリ(RAM)、磁気カードまたは光カード、若しくは、電子命令を格納するのに適した他の何らかのタイプの媒体が含まれ得るが、これらに限定されない。
本願発明について限られた数の実施形態に関して説明してきたが、当業者であれば、様々な修正例および変形例が実施可能であることを理解されよう。以下の請求項は、そのような修正例および変形例の全てを本願発明の思想および態様に含まれるものとして包含するよう意図されている。

Claims (16)

  1. 複数のコアと1つの非コアとを含むマルチコアプロセッサであって
    前記1つの非コアは、少なくとも1つのキャッシュメモリと、ルータを含む複数の論理ユニットと、電力制御ユニット(PCU)と、少なくとも1つの他の論理ユニットとを有し、
    前記マルチコアプロセッサが低電力状態にあり、前記複数の論理ユニットが継続してトランザクションの空き状態にあり、前記複数の論理ユニットにインフライトトランザクションがない複数の期間が発生した後、前記PCUは、前記複数の論理ユニットのうち少なくとも1つの論理ユニット、および、前記少なくとも1つのキャッシュメモリのクロックゲーティングを行
    前記PCUは、それぞれが前記複数の期間のうち一の期間のトラッキングを行う複数のタイマーを含み、
    前記クロックゲーティングは、前記複数の期間の少なくともそれぞれの間、前記1つの非コアが継続して空き状態にある場合に行われる、マルチコアプロセッサ
  2. 前記マルチコアプロセッサを含むマルチプロセッサシステムの他のマルチコアプロセッサが前記低電力状態にあるとき、前記PCUは前記クロックゲーティングを行う、請求項1記載のマルチコアプロセッサ
  3. 複数の期間、前記複数の論理ユニットが継続して空き状態にない場合、前記PCUは、前記複数の期間の2回目の反復の間、前記複数の論理ユニットが継続して空き状態にあるかどうかを判断し、前記2回目の反復の間、前記複数の論理ユニットが継続して空き状態にある場合、前記クロックゲーティングを行う、請求項1または2に記載のマルチコアプロセッサ
  4. 前記少なくとも1つの論理ユニットがクロックゲーティングされているとき、前記PCUおよび前記ルータはクロックされたままである、請求項1からのいずれか1項に記載のマルチコアプロセッサ
  5. 前記1つの非コアが空き状態にない、または、帯域外インタフェース(OOBインタフェース)を介して、入力トランザクションが受信されたとき、前記PCUは前記クロックゲーティングを終了する、請求項1からのいずれか1項に記載のマルチコアプロセッサ
  6. 前記PCUは、入力トランザクションの前記マルチコアプロセッサによる受信を防止する、前記クロックゲーティングされた状態への移行フローを実行する、請求項1からのいずれか1項に記載のマルチコアプロセッサ
  7. 前記移行フローの後、および前記クロックゲーティングされた状態の間、前記PCUは前記入力トランザクションを有効化する、請求項に記載のマルチコアプロセッサ
  8. 複数のプロセッサソケットがソケット低電力状態に移行することを交渉したか判断し、前記複数のプロセッサソケットの第1プロセッサソケットの非コアが空き状態にあることを判断する段階と、
    前記空き状態にある場合、前記非コアに結合された帯域外チャネル(OOBチャネル)からのトランザクションを防止し、前記非コアが第1期間の後、まだ前記空き状態にあるかどうか判断する段階と、
    まだ前記空き状態にある場合、前記非コアに結合された1以上のオフソケットチャネルから入力トランザクションを防止し、前記非コアが第2期間の後、まだ前記空き状態にあるかどうか判断する段階と、
    前記非コアが前記第2期間の後、まだ前記空き状態にあるとの判断に応答して前記非コアの複数のユニットのクロックゲーティングを行う段階と
    を備える方法。
  9. 前記クロックゲーティングに応答して、前記非コアがクロックゲーティングされた状態にあることを示すよう非コアクロックゲーティング状態信号を更新し、前記OOBチャネル上の入力トランザクションに応答して前記クロックゲーティングを無効化出来るよう前記OOBチャネル上のトランザクションを有効化する段階をさらに備える、請求項に記載の方法。
  10. 前記第1期間をカウントする継続期間タイマーを開始し、前記第1期間の間、前記非コアが継続して前記空き状態にあったかどうか、前記第1期間の後、判断する段階をさらに備える、請求項またはに記載の方法。
  11. 前記第1期間の間、前記非コアが継続して前記空き状態になかった場合、前記OOBチャネルのトランザクションを有効化する段階をさらに備える、請求項10に記載の方法。
  12. 前記第2期間をカウントするドレインタイマーを開始し、前記第2期間の間、前記非コアが継続して前記空き状態にあったかどうか、前記第2期間の後、判断する段階をさらに備える、請求項10または11に記載の方法。
  13. 前記第2期間の間、前記非コアが継続して前記空き状態になかった場合、前記1以上のオフソケットチャネルからの前記入力トランザクションを有効化し、前記OOBチャネル上のトランザクションを有効化する段階をさらに備える、請求項12に記載の方法。
  14. クロックゲーティング有効化信号をアサートし、クロックゲーティングタイマーを開始し、前記クロックゲーティングタイマーの期限切れに応答して前記クロックゲーティングを指示するよう状態インジケータを設定する段階をさらに備える、請求項12または13に記載の方法。
  15. 前記非コアが前記空き状態のままであり、前記OOBチャネルを介してリクエスト信号が受信されない間、前記クロックゲーティングを継続し、そうでなければ、前記状態インジケータおよび前記クロックゲーティング有効化信号をディアサートする段階と、
    前記ディアサートに応答してクロックアンゲーティングタイマーを開始し、前記クロックアンゲーティングタイマーの期限切れに応じて、前記1以上のオフソケットチャネルからの前記入力トランザクションを防止するフロー制御信号をディアサートする段階と
    をさらに備える、請求項14に記載の方法。
  16. 第1の複数のコアおよび第1の非コアを有する第1マルチコアプロセッサと、
    第2の複数のコアおよび第2非コアを有する第2マルチコアプロセッサと、
    前記第1マルチコアプロセッサおよび前記第2マルチコアプロセッサに結合されたダイナミックランダムアクセスメモリ(DRAM)と
    を備え、
    前記第1マルチコアプロセッサおよび前記第2マルチコアプロセッサがパッケージ低電力状態に移行することを交渉したとき、前記第2非コアは、少なくとも前記第2非コアの一部のクロックゲーティングを行
    前記第2非コアは、前記第2非コアが継続してトランザクションの空き状態にある複数の期間が発生した後、前記クロックゲーティングを行う電力制御ユニット(PCU)を含み、
    前記PCUは、それぞれが前記複数の期間のうち1つのトラッキングを行う複数のタイマーを含み、
    前記第2非コアは、前記第2マルチコアプロセッサに結合された帯域外チャネル(OOBチャネル)からのトランザクションを防止し、その後、前記複数のタイマーのうち第1期間をカウントする第1タイマーを開始し、前記第1期間の後、前記第2マルチコアプロセッサに結合された1以上のオフソケットチャネルからの入力トランザクションを防止し、その後、前記複数のタイマーのうち第2期間をカウントする第2タイマーを開始し、前記第2期間の後、前記クロックゲーティングを行わせる、システム。
JP2014513499A 2011-05-31 2011-12-29 プロセッサの非コア回路の消費電力の低減 Expired - Fee Related JP5771327B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/118,757 US8892924B2 (en) 2011-05-31 2011-05-31 Reducing power consumption of uncore circuitry of a processor
US13/118,757 2011-05-31
PCT/US2011/067984 WO2012166207A1 (en) 2011-05-31 2011-12-29 Reducing power consumption of uncore circuitry of a processor

Publications (2)

Publication Number Publication Date
JP2014517401A JP2014517401A (ja) 2014-07-17
JP5771327B2 true JP5771327B2 (ja) 2015-08-26

Family

ID=47259707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014513499A Expired - Fee Related JP5771327B2 (ja) 2011-05-31 2011-12-29 プロセッサの非コア回路の消費電力の低減

Country Status (9)

Country Link
US (3) US8892924B2 (ja)
JP (1) JP5771327B2 (ja)
KR (2) KR20150023905A (ja)
CN (1) CN103562819B (ja)
BR (1) BR112013030276A2 (ja)
DE (1) DE112011105298B4 (ja)
GB (1) GB2506286B (ja)
TW (1) TWI470413B (ja)
WO (1) WO2012166207A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9052899B2 (en) 2011-08-10 2015-06-09 Intel Corporation Idle power reduction for memory subsystems
US9910807B2 (en) * 2011-11-29 2018-03-06 Intel Corporation Ring protocol for low latency interconnect switch
WO2013081579A1 (en) * 2011-11-29 2013-06-06 Intel Corporation Ring protocol for low latency interconnect switch
US9575543B2 (en) * 2012-11-27 2017-02-21 Intel Corporation Providing an inter-arrival access timer in a processor
US9417873B2 (en) 2012-12-28 2016-08-16 Intel Corporation Apparatus and method for a hybrid latency-throughput processor
US9542193B2 (en) 2012-12-28 2017-01-10 Intel Corporation Memory address collision detection of ordered parallel threads with bloom filters
US9361116B2 (en) 2012-12-28 2016-06-07 Intel Corporation Apparatus and method for low-latency invocation of accelerators
US10140129B2 (en) 2012-12-28 2018-11-27 Intel Corporation Processing core having shared front end unit
US10346195B2 (en) 2012-12-29 2019-07-09 Intel Corporation Apparatus and method for invocation of a multi threaded accelerator
US9026820B2 (en) * 2012-12-29 2015-05-05 Intel Corporation Communication link and network connectivity management in low power mode
JP6130750B2 (ja) * 2013-07-16 2017-05-17 株式会社東芝 メモリ制御回路およびプロセッサ
US10001993B2 (en) 2013-08-08 2018-06-19 Linear Algebra Technologies Limited Variable-length instruction buffer management
US9934043B2 (en) * 2013-08-08 2018-04-03 Linear Algebra Technologies Limited Apparatus, systems, and methods for providing computational imaging pipeline
US9910675B2 (en) 2013-08-08 2018-03-06 Linear Algebra Technologies Limited Apparatus, systems, and methods for low power computational imaging
US11768689B2 (en) 2013-08-08 2023-09-26 Movidius Limited Apparatus, systems, and methods for low power computational imaging
US9727113B2 (en) 2013-08-08 2017-08-08 Linear Algebra Technologies Limited Low power computational imaging
US9297559B2 (en) * 2013-09-25 2016-03-29 Intel Corporation Adaptive thermoelectric cooling in a processor
CA2928801A1 (en) 2013-12-24 2015-07-02 Intel Corporation Cloud compute scheduling using a heuristic contention model
WO2015099802A1 (en) 2013-12-28 2015-07-02 Intel Corporation Techniques for increasing energy efficiency of sensor controllers
US10108241B2 (en) * 2014-09-15 2018-10-23 Intel Corporation Method and apparatus for saving power of a processor socket in a multi-socket computer system
CN105740164B (zh) 2014-12-10 2020-03-17 阿里巴巴集团控股有限公司 支持缓存一致性的多核处理器、读写方法、装置及设备
WO2016099567A1 (en) 2014-12-19 2016-06-23 Hewlett Packard Enterprise Development Lp Flushing data content in response to a power loss event to a processor
US10345882B2 (en) * 2015-03-30 2019-07-09 Mediatek Inc. Dynamic power meter with improved accuracy and single cycle resolution
US10193826B2 (en) 2015-07-15 2019-01-29 Intel Corporation Shared mesh
US9710041B2 (en) * 2015-07-29 2017-07-18 Intel Corporation Masking a power state of a core of a processor
CN105353865B (zh) * 2015-10-28 2019-03-26 上海大学 基于多处理器的动态调频方法
US9870039B2 (en) 2015-12-15 2018-01-16 International Business Machines Corporation Reducing power consumption in a multi-slice computer processor
KR102576707B1 (ko) * 2016-12-26 2023-09-08 삼성전자주식회사 전자 시스템 및 그 동작 방법
CN109388494A (zh) * 2018-10-29 2019-02-26 济南浪潮高新科技投资发展有限公司 一种多核心网络控制器动态能耗调节的方法
US11137809B2 (en) * 2018-12-20 2021-10-05 Advanced Micro Devices, Inc. Runtime localized cooling of high-performance processors
CN112559049A (zh) * 2019-09-25 2021-03-26 阿里巴巴集团控股有限公司 用于指令高速缓存的路预测方法、访问控制单元以及指令处理装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5943507A (en) * 1994-12-22 1999-08-24 Texas Instruments Incorporated Interrupt routing circuits, systems and methods
US5708656A (en) * 1996-09-11 1998-01-13 Nokia Mobile Phones Limited Method and apparatus for packet data transmission
US7434073B2 (en) 2004-11-29 2008-10-07 Intel Corporation Frequency and voltage scaling architecture
US7689849B2 (en) * 2006-08-28 2010-03-30 Ati Technologies Ulc Reduction of power consumption by throttling processor requests
US7949887B2 (en) * 2006-11-01 2011-05-24 Intel Corporation Independent power control of processing cores
US8171321B2 (en) * 2007-12-26 2012-05-01 Intel Corporation Method and apparatus for cost and power efficient, scalable operating system independent services
US7902878B2 (en) * 2008-04-29 2011-03-08 Qualcomm Incorporated Clock gating system and method
CN101303620A (zh) * 2008-06-27 2008-11-12 北京中星微电子有限公司 一种低功耗多通道控制系统
CN101329589B (zh) * 2008-07-28 2011-04-27 北京中星微电子有限公司 一种低功耗读写寄存器的控制系统及方法
JP5293289B2 (ja) 2009-03-11 2013-09-18 富士通株式会社 マルチコアプロセッサ及びその制御方法
US8566628B2 (en) * 2009-05-06 2013-10-22 Advanced Micro Devices, Inc. North-bridge to south-bridge protocol for placing processor in low power state
US8578138B2 (en) * 2009-08-31 2013-11-05 Intel Corporation Enabling storage of active state in internal storage of processor rather than in SMRAM upon entry to system management mode
US20110289332A1 (en) * 2010-05-24 2011-11-24 Advanced Micro Devices, Inc. Method and apparatus for power management in a multi-processor system

Also Published As

Publication number Publication date
GB201320320D0 (en) 2014-01-01
US20120311360A1 (en) 2012-12-06
KR20150023905A (ko) 2015-03-05
BR112013030276A2 (pt) 2018-07-24
TW201248389A (en) 2012-12-01
DE112011105298T5 (de) 2014-02-20
JP2014517401A (ja) 2014-07-17
US8892929B2 (en) 2014-11-18
KR101516109B1 (ko) 2015-04-29
US8892924B2 (en) 2014-11-18
GB2506286B (en) 2020-01-29
US20130179713A1 (en) 2013-07-11
GB2506286A (en) 2014-03-26
KR20140008442A (ko) 2014-01-21
US20150039920A1 (en) 2015-02-05
CN103562819A (zh) 2014-02-05
WO2012166207A1 (en) 2012-12-06
DE112011105298B4 (de) 2017-06-29
TWI470413B (zh) 2015-01-21
CN103562819B (zh) 2016-10-12
US9405358B2 (en) 2016-08-02

Similar Documents

Publication Publication Date Title
JP5771327B2 (ja) プロセッサの非コア回路の消費電力の低減
JP5932044B2 (ja) 消費電力を低減する優先度に基づくアプリケーションイベント制御(paec)
KR101320791B1 (ko) 인터럽트 분산 스킴
US7761696B1 (en) Quiescing and de-quiescing point-to-point links
KR101365370B1 (ko) 동적 시스템 재구성
CN107924219B (zh) 遮蔽处理器的核的功率状态
US8943343B2 (en) Controlling an asymmetrical processor
US9552308B2 (en) Early wake-warn for clock gating control
EP2437138A2 (en) Hardware dynamic cache power management
JP6293933B2 (ja) 高速再開を伴うシステム待機状態のエミュレーション
US9026829B2 (en) Package level power state optimization
US10599335B2 (en) Supporting hierarchical ordering points in a microprocessor system
CN112906326A (zh) 用于时延监视和响应的系统、装置和方法
US9285865B2 (en) Dynamic link scaling based on bandwidth utilization
CN113366458A (zh) 用于自适应互连路由的系统、装置和方法
JP7495422B2 (ja) 適応的な相互接続ルーティングのためのシステム、装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150626

R150 Certificate of patent or registration of utility model

Ref document number: 5771327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees