JP6876105B2 - Pcieトポロジによるファン速度制御 - Google Patents
Pcieトポロジによるファン速度制御 Download PDFInfo
- Publication number
- JP6876105B2 JP6876105B2 JP2019152473A JP2019152473A JP6876105B2 JP 6876105 B2 JP6876105 B2 JP 6876105B2 JP 2019152473 A JP2019152473 A JP 2019152473A JP 2019152473 A JP2019152473 A JP 2019152473A JP 6876105 B2 JP6876105 B2 JP 6876105B2
- Authority
- JP
- Japan
- Prior art keywords
- pcie
- gpu
- information
- busid
- card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4204—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
- G06F13/4221—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F04—POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
- F04D—NON-POSITIVE-DISPLACEMENT PUMPS
- F04D27/00—Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
- F04D27/004—Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/042—Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/20—Modifications to facilitate cooling, ventilating, or heating
- H05K7/20709—Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
- H05K7/20718—Forced ventilation of a gaseous coolant
- H05K7/20727—Forced ventilation of a gaseous coolant within server blades for removing heat from heat source
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/20—Modifications to facilitate cooling, ventilating, or heating
- H05K7/20709—Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
- H05K7/20836—Thermal management, e.g. server temperature control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F05—INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
- F05D—INDEXING SCHEME FOR ASPECTS RELATING TO NON-POSITIVE-DISPLACEMENT MACHINES OR ENGINES, GAS-TURBINES OR JET-PROPULSION PLANTS
- F05D2270/00—Control
- F05D2270/30—Control parameters, e.g. input parameters
- F05D2270/303—Temperature
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/21—Pc I-O input output
- G05B2219/21156—Over temperature protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0026—PCI express
Description
101…電源
102…電源ユニット(PSU)
103…管理デバイス
104…プロセッサ
104−1,104−2…CPU
104−3…ウルトラパスインターコネクト(UPI)
105…BIOS
106…ノースブリッジ(NB)ロジック
107…周辺機器相互接続(PCI)バス
108…SBロジック
109…ストレージデバイス
110…冷却モジュール
110−1,110−2…冷却ファン
111…メインメモリ(MEM)
112…GPU
113…PCIeスイッチ
113−1,113−2,113−3…PCIeスイッチ
114…NVML
115…リタイマカード
115−1,1153−2…リタイマカード
116…OSエージェント
117…ファン制御サービス
118…PCIeトポロジツリー
119…BMCホストボード
120…アウトバンドI2C接続
121…CUDAドライバ
122…センサ群
150,151…ISAスロット
160,161…PCIeスロット
170,171…PCIスロット
200…方法
202,204,206,208,210,212,214,216,218,210…ステップ
Claims (7)
- 周辺機器相互接続エクスプレス(PCIe)トポロジを介してサーバシステムの冷却ファンのファン速度を制御するコンピュータ実行方法であって、
前記サーバシステムの前記PCIeトポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従って前記GPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンド集積回路間(I2C)接続を介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がPCIeスイッチに対応する場合に、前記PCIe BusID情報に従って、前記PCIeスイッチに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
少なくとも前記GPUの温度情報及びCPUの温度情報に基づいて、前記インバンドI 2 C接続を介して、前記PCIeスイッチに関連付けられた冷却ファンのファン速度を管理するステップと、を含むコンピュータ実行方法。 - 周辺機器相互接続エクスプレス(PCIe)トポロジを介してサーバシステムの冷却ファンのファン速度を制御するコンピュータ実行方法であって、
前記サーバシステムの前記PCIeトポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従って前記GPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンド集積回路間(I 2 C)接続を介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がリタイマカードに対応する場合に、前記PCIe BusID情報に従って、前記リタイマカードに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
前記GPUの温度情報に基づいて、アウトバンドI2C接続を介して、前記リタイマカードに関連付けられた複数の冷却ファンのファン速度を管理するステップと、を含む、コンピュータ実行方法。 - プロセッサと、
管理コントローラと、
前記プロセッサによって実行されると、サーバシステムに動作を実行させる命令を記憶するコンピュータ可読記憶媒体と、を備えるサーバシステムであって、
前記動作は、
前記サーバシステムの周辺機器相互接続エクスプレス(PCIe)トポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従ってGPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンドI2Cを介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がPCIeスイッチに対応する場合に、前記PCIe BusID情報に従って、前記PCIeスイッチに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
少なくとも前記GPUの温度情報及びCPUの温度情報に基づいて、前記インバンドI 2 C接続を介して、前記PCIeスイッチに関連付けられた冷却ファンのファン速度を管理するステップと、を含む、サーバシステム。 - プロセッサと、
管理コントローラと、
前記プロセッサによって実行されると、サーバシステムに動作を実行させる命令を記憶するコンピュータ可読記憶媒体と、を備えるサーバシステムであって、
前記動作は、
前記サーバシステムの周辺機器相互接続エクスプレス(PCIe)トポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従ってGPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンドI 2 Cを介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がリタイマカードに対応する場合に、前記PCIe BusID情報に従って、前記リタイマカードに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
少なくとも前記GPUの温度情報に基づいて、アウトバンドI2C接続を介して、前記リタイマカードに関連付けられた複数の冷却ファンのファン速度を管理するステップと、を含む、サーバシステム。 - 前記サーバシステムの前記PCIeトポロジは、PCIeトポロジツリーを用いて判別され、前記PCIeトポロジツリーは、前記OSエージェントを介して前記PCIe BusID情報を前記管理コントローラに送信する、請求項3又は4に記載のサーバシステム。
- サーバシステムの少なくとも1つのプロセッサによって実行されると、前記サーバシステムに動作を実行させる命令を記憶するコンピュータ可読記憶媒体であって、
前記動作は、
前記サーバシステムのPCIeトポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従ってGPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンドI2Cを介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がPCIeスイッチに対応する場合に、前記PCIe BusID情報に従って、前記PCIeスイッチに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
少なくとも前記GPUの温度情報及びCPUの温度情報に基づいて、前記インバンドI 2 C接続を介して、前記PCIeスイッチに関連付けられた冷却ファンのファン速度を管理するステップと、を含む、コンピュータ可読記憶媒体。 - サーバシステムの少なくとも1つのプロセッサによって実行されると、前記サーバシステムに動作を実行させる命令を記憶するコンピュータ可読記憶媒体であって、
前記動作は、
前記サーバシステムのPCIeトポロジを判別するステップと、
オペレーティングシステム(OS)エージェントを介してPCIe BusID情報を送信するステップと、
前記PCIe BusID情報がGPUカードに対応する場合に、前記PCIe BusID情報に従ってGPUカードの温度情報をGPUライブラリから取得するステップと、
少なくとも前記GPUカードの前記温度情報に基づいて、インバンドI 2 Cを介して、前記GPUカードに関連付けられた冷却ファンのファン速度を管理するステップと、
前記PCIe BusID情報がリタイマカードに対応する場合に、前記PCIe BusID情報に従って、前記リタイマカードに関連付けられたGPUの温度情報を前記GPUライブラリから取得するステップと、
前記GPUの温度情報に基づいて、アウトバンドI2C接続を介して、前記リタイマカードに関連付けられた複数の冷却ファンのファン速度を管理するステップと、を含む、コンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/138,260 | 2018-09-21 | ||
US16/138,260 US10776304B2 (en) | 2018-09-21 | 2018-09-21 | Fan speed control via PCIE topology |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020053032A JP2020053032A (ja) | 2020-04-02 |
JP6876105B2 true JP6876105B2 (ja) | 2021-05-26 |
Family
ID=66397123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019152473A Active JP6876105B2 (ja) | 2018-09-21 | 2019-08-23 | Pcieトポロジによるファン速度制御 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10776304B2 (ja) |
EP (1) | EP3627283B1 (ja) |
JP (1) | JP6876105B2 (ja) |
CN (1) | CN110941313B (ja) |
TW (1) | TWI684866B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI710953B (zh) * | 2019-05-31 | 2020-11-21 | 緯創資通股份有限公司 | 韌體更新裝置以及韌體更新方法 |
CN114579385A (zh) * | 2020-11-18 | 2022-06-03 | 英业达科技有限公司 | 服务器的PCIe芯片的温度预测系统及方法 |
US11509751B2 (en) * | 2020-12-23 | 2022-11-22 | Dell Products L.P. | Self-describing system using single-source/multi-destination cable |
JP7174281B2 (ja) * | 2021-02-17 | 2022-11-17 | 富士通クライアントコンピューティング株式会社 | 情報処理装置、情報処理システムおよびプログラム |
TWI786829B (zh) * | 2021-09-16 | 2022-12-11 | 英業達股份有限公司 | 具人工智慧的效能調節系統及其調節方法 |
CN114035662B (zh) * | 2021-10-15 | 2023-07-14 | 苏州浪潮智能科技有限公司 | Ai服务器散热调控方法、系统、终端及存储介质 |
WO2023075750A1 (en) * | 2021-10-25 | 2023-05-04 | Hewlett-Packard Development Company, L.P. | Temperature settings for temperature control circuits |
CN114253897B (zh) * | 2021-12-16 | 2023-07-14 | 苏州浪潮智能科技有限公司 | 一种系统PCIe拓扑动态切换系统与方法 |
CN114356057A (zh) * | 2021-12-30 | 2022-04-15 | 浙江大华技术股份有限公司 | 控制PCIe卡散热的方法、装置、设备及存储介质 |
US20230213999A1 (en) * | 2022-01-06 | 2023-07-06 | Nvidia Corporation | Techniques for controlling computing performance for power-constrained multi-processor computing systems |
CN117591378B (zh) * | 2024-01-17 | 2024-04-05 | 苏州元脑智能科技有限公司 | 一种服务器的温度控制方法、系统、设备及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102253918B (zh) * | 2010-05-05 | 2014-04-23 | 英业达股份有限公司 | 计算机系统 |
CN202183065U (zh) * | 2011-07-25 | 2012-04-04 | 华美科技(苏州)有限公司 | 塔式4gpu计算机装置 |
US20130342989A1 (en) * | 2012-06-21 | 2013-12-26 | Gregory L. Singleton | Disk drive carrier apparatus for a computer system |
US9244872B2 (en) * | 2012-12-21 | 2016-01-26 | Ati Technologies Ulc | Configurable communications controller |
US9213379B2 (en) * | 2013-10-17 | 2015-12-15 | Nvidia Corporation | Distributed fan control |
US20150212755A1 (en) * | 2014-01-30 | 2015-07-30 | Avalanche Technology, Inc. | Method of managing throughput of redundant array of independent disks (raid) groups in a solid state disk array |
CN104202194B (zh) * | 2014-09-10 | 2018-05-29 | 华为技术有限公司 | PCIe拓扑的配置方法和装置 |
US10127055B2 (en) * | 2015-10-16 | 2018-11-13 | Quanta Computer Inc. | iSCSI based bare metal OS image deployment and diskless boot |
CN105808499A (zh) * | 2016-04-01 | 2016-07-27 | 浪潮电子信息产业股份有限公司 | 一种cpu互联装置以及多路服务器cpu互联拓扑结构 |
CN106640721B (zh) * | 2016-12-28 | 2017-11-10 | 郑州云海信息技术有限公司 | 一种改善服务器噪声的风扇控制方法及系统 |
CN106815156A (zh) * | 2017-01-22 | 2017-06-09 | 联想(北京)有限公司 | 一种实现固态硬盘交互的装置、方法和和电子设备 |
CN107819834A (zh) * | 2017-10-27 | 2018-03-20 | 郑州云海信息技术有限公司 | Linux下快速确认服务器PCIe设备的状态及位置的方法和系统 |
CN108196999A (zh) | 2018-01-02 | 2018-06-22 | 郑州云海信息技术有限公司 | 服务器bmc获取gpu温度的方法及装置 |
-
2018
- 2018-09-21 US US16/138,260 patent/US10776304B2/en active Active
- 2018-12-28 TW TW107147587A patent/TWI684866B/zh active
-
2019
- 2019-01-09 CN CN201910018571.0A patent/CN110941313B/zh active Active
- 2019-05-03 EP EP19172527.4A patent/EP3627283B1/en active Active
- 2019-08-23 JP JP2019152473A patent/JP6876105B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US10776304B2 (en) | 2020-09-15 |
TWI684866B (zh) | 2020-02-11 |
US20200097431A1 (en) | 2020-03-26 |
CN110941313B (zh) | 2022-03-15 |
TW202013198A (zh) | 2020-04-01 |
EP3627283B1 (en) | 2022-04-06 |
CN110941313A (zh) | 2020-03-31 |
EP3627283A1 (en) | 2020-03-25 |
JP2020053032A (ja) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6876105B2 (ja) | Pcieトポロジによるファン速度制御 | |
EP3261420A1 (en) | Virtual chassis management controller | |
TWI582585B (zh) | 機櫃的監控系統 | |
US8948000B2 (en) | Switch fabric management | |
US10127170B2 (en) | High density serial over LAN management system | |
US20160179734A1 (en) | Method and system for hot-plug functions | |
CN106814826B (zh) | 控制服务器机柜中气流的系统及方法 | |
US10127095B2 (en) | Seamless automatic recovery of a switch device | |
JP2021022382A (ja) | コネクターを介して装置に電力を供給するための方法及びシステム | |
US10862900B2 (en) | System and method for detecting rogue devices on a device management bus | |
TWI559148B (zh) | 自動硬體恢復方法及自動硬體恢復系統 | |
WO2013048943A1 (en) | Active state power management (aspm) to reduce power consumption by pci express components | |
TWI791913B (zh) | 經由邊帶介面恢復場域可程式閘陣列韌體之系統及方法 | |
US10606784B1 (en) | Software filtering of redundant sideband device management bus communications | |
US20170155579A1 (en) | Centralized server switch management | |
US10852792B2 (en) | System and method for recovery of sideband interfaces for controllers | |
US10853204B2 (en) | System and method to detect and recover from inoperable device management bus | |
CN117041184B (zh) | Io拓展装置及io交换机 | |
US10489328B2 (en) | Universal sleds server architecture | |
US20200314172A1 (en) | Server system and management method thereto | |
US10146720B2 (en) | Flexible configuration server system | |
CN106059782B (zh) | 网络配置管理方法、服务器系统以及计算机可读储存媒体 | |
RU211039U1 (ru) | Серверная платформа, выполненная с возможностью обнаружения подключения/отключения сетевых карт и/или твердотельных накопителей и реализованная с функциями network appliance | |
TWI704463B (zh) | 伺服器系統與管理方法 | |
US10409940B1 (en) | System and method to proxy networking statistics for FPGA cards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6876105 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |