TWI431555B - 監測管理裝置、資料中心的監測管理系統以及監測管理方法 - Google Patents

監測管理裝置、資料中心的監測管理系統以及監測管理方法 Download PDF

Info

Publication number
TWI431555B
TWI431555B TW100149123A TW100149123A TWI431555B TW I431555 B TWI431555 B TW I431555B TW 100149123 A TW100149123 A TW 100149123A TW 100149123 A TW100149123 A TW 100149123A TW I431555 B TWI431555 B TW I431555B
Authority
TW
Taiwan
Prior art keywords
image
data center
visible light
light image
unit
Prior art date
Application number
TW100149123A
Other languages
English (en)
Other versions
TW201327488A (zh
Inventor
Jhen Jia Hu
Hung Ming Tai
Hui Chieh Li
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW100149123A priority Critical patent/TWI431555B/zh
Priority to CN201210040643XA priority patent/CN103188108A/zh
Publication of TW201327488A publication Critical patent/TW201327488A/zh
Application granted granted Critical
Publication of TWI431555B publication Critical patent/TWI431555B/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Alarm Systems (AREA)

Description

監測管理裝置、資料中心的監測管理系統以及監測管理方法
本發明係有關於資料中心,且特別有關於資料中心的監控與管理技術。
隨著雲端技術的發展,資料中心內的機房規劃、電力配置、網路傳輸架構與流量管理等皆較以往的需求來得複雜。現行資料中心的趨勢是用貨櫃的方式以將資料中心的設備緊密地配置在一起,而此種資料中心的管理主要面臨以下四種課題:
(一)、熱分佈監控不易
由於貨櫃式資料中心內的設備配置得很緊密,因此資料中心內的熱密度也越來越高,因此也越來越難監測資料中心中可能發生的熱點區域。除此之外,一般資料中心的熱分佈監控多藉由單一熱影像配合管理人員肉眼判讀以判斷資料中心內的哪個設備過熱,然而不同管理人員的判讀往往會產生差異,且更緊密地配置設備也會增加肉眼判讀的難度。
(二)、控制面板燈號與網路埠狀態辨識不易
由於設備皆緊密地配置於貨櫃當中,管理人員並不方便經常出入貨櫃,因此無法藉由人力監控現場各設備的控制面板燈號有沒有亮或是網路埠的接線是否有接好。
(三)、負載管理不易
資料中心藉由其特有的作業系統進行虛擬機器與負載機器的動態配置與管理,但隨著資料中心內的設備越來越多,如何動態進行虛擬機器與實體機器的負載管理以最佳化資料中心的效能成為一個重要的課題。
(四)、如何提昇監測可靠度
習知在資料中心內部配置例如溫度感測器等的點感測器,然而受限於點感測器的有限涵蓋範圍,必須藉由大量配置點感測器以取得大範圍的資訊,因此成本上升。除此之外,由於點感測器無法連續配置,因此在沒有配置點感測器的地方必須藉由鄰近點感測器來判斷其狀態,降低監測的可靠度,另外,單點配置點感測器使得監控管理不具彈性,有可能會因為當中某幾個設備的移動而使得監控軟體必須全面重新設定,因此必須提昇監測的可靠度。
有鑑於此,本發明提供一種智慧型的資料中心監測與管理系統,用以解決上述問題並更有效率地管理資料中心。
本發明一實施例提供一種監測管理裝置,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:至少一第一可見光影像擷取單元,擷取該等機櫃的面板側的影像,產生至少一第一可見光影像;至少一非可見光影像擷取單元,擷取該等機櫃的散熱側的影像,產生至少一非可見光影像;一影像辨識單元,利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;一影像資料庫;一控制單元,接收該至少一第一可見光影像、該至少一非可見光影像與該至少一狀態資訊,將該至少一第一可見光影像與該至少一非可見光影像儲存至該影像資料庫;一警示單元,透過該控制單元接收該至少一非可見光影像、該至少一第一可見光影像與該至少一狀態資訊,透過一網路管理協定從該資料中心的作業系統接收該資料中心的設定檔,並根據該至少一非可見光影像、該至少一狀態資訊與該設定檔判斷該資料中心是否有異常事件;一網路單元,耦接至一網際網路,其中耦接至該網際網路的至少一遠端經由該網際網路並透過該網路單元存取該至少一非可見光影像與該至少一狀態資訊;以及一輸出入介面,耦接至至少一輸出裝置,其中該至少一輸出裝置透過該輸出入介面存取並輸出該至少一非可見光影像與該至少一狀態資訊。
本發明另一實施例提供一種資料中心的監測管理系統,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:至少一第一可見光影像擷取單元,擷取該等機櫃的面板側的影像,產生至少一第一可見光影像;至少一非可見光影像擷取單元,擷取該等機櫃的散熱側的影像,產生至少一非可見光影像;一影像辨識單元,利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;一影像資料庫;一控制單元,接收該至少一第一可見光影像、該至少一非可見光影像與該至少一狀態資訊,將該至少一第一可見光影像與該至少一非可見光影像儲存至該影像資料庫;以及一警示單元,透過該控制單元接收該至少一非可見光影像、該至少一第一可見光影像與該至少一狀態資訊,透過一網路管理協定從該資料中心的作業系統接收該資料中心的設定檔,並根據該至少一非可見光影像、該至少一狀態資訊與該設定檔判斷該資料中心是否有異常事件。
本發明再一實施例提供一種資料中心的監測管理方法,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:擷取該等機櫃的散熱側的影像以產生至少一非可見光影像;擷取該等機櫃的面板側的影像以產生至少一第一可見光影像;利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;儲存該至少一第一可見光影像與該至少一非可見光影像;以及根據該至少一非可見光影像、該至少一狀態資訊與該資料中心的設定檔判斷該資料中心是否有異常事件。
以下說明為本發明的實施例。其目的是要舉例說明本發明一般性的原則,不應視為本發明之限制,本發明之範圍當以申請專利範圍所界定者為準。
第1圖所示為根據本發明一實施例之監測管理系統100的示意圖。監測管理系統100適用於監測管理貨櫃式資料中心(container data center)150。貨櫃式資料中心150包括複數個機櫃(rack)152,每個機櫃152包括複數個電子設備,例如伺服單元(server node)、計算單元(capturing node)、儲存單元(storage node)或交換器(switch)。
第2a圖所示為根據本發明一實施例之機櫃152的面板側(front panel side)的示意圖。機櫃152的面板側可以看到各電子設備的燈號,例如燈號152-1、152-2、152-3與152-4。機櫃152的面板側還可以看到各電子設備的網路埠,例如網路埠152-5、152-6與152-7。
第2b圖所示為根據本發明一實施例之機櫃152的散熱側的示意圖。機櫃152中各電子設備的散熱孔或散熱鰭片皆配置於散熱側。
在第1圖中,資料中心150安裝有資料中心專屬的作業系統160,資料中心使用者170可透過管理介面162(例如圖形介面)操作管理資料中心150,例如控制要將幾個虛擬機器(virtual machine)安裝至哪個實體設備(physical machine)也就是電子設備上,而資料中心使用者170在管理介面162上的設定會儲存為作業系統160的設定檔,設定檔代表資料中心150的運作情況,包括負載配置等,例如記錄虛擬機器對應實體機器的配置情形。
監測管理系統100包括監測管理裝置110、可見光影像擷取單元120、非可見光影像擷取單元122以及可見光影像擷取單元124。監測管理裝置110包括控制單元111、警示單元112、影像融合單元113、影像辨識單元114、影像資料庫115、網路單元116與輸出入介面117。其中警示單元112與作業系統160之間藉由網路管理協定130進行訊號與資訊傳輸。
可見光影像擷取單元124對準機櫃152的面板側,如第2a圖所示,可見光影像擷取單元124擷取機櫃152的面板側的面板影像,並將面板影像傳送至影像辨識單元114。影像辨識單元114利用影像辨識技術分析面板影像以判別機櫃152的各電子設備的燈號狀態,例如電子設備的燈是正在運行的綠色或不正常運作的橘色。另外,影像辨識單元114也利用影像辨識技術分析面板影像以判別機櫃152的各電子設備的網路埠連線狀態,例如網路埠有沒有接上網路線或是網路線是否有脫落的現象。影像辨識單元114根據燈號狀態與網路連線狀態的辨識結果產生資料中心150的狀態資訊,記錄資料中心150的各電子設備的燈號狀態與網路埠連線狀態。
可見光影像擷取單元120與非可見光影像擷取單元122對準機櫃152的散熱側,如第2b圖所示。可見光影像擷取單元120擷取機櫃152的散熱側的機構影像,藉以得知機櫃中各電子設備的相對位置。非可見光影像擷取單元122擷取機櫃152的散熱側的熱影像,藉以了解機櫃中各電子設備的溫度狀況。可見光影像擷取單元120將機櫃152的散熱側的機構影像傳送至影像融合單元113,非可見光影像擷取單元122將機櫃152的散熱側的熱影像傳送至影像融合單元113,影像融合單元113融合機構影像與熱影像以產生融合影像,藉由融合影像可以判斷機櫃152的溫度分佈情況。在一個例子中,非可見光影像擷取單元122為遠紅外線影像擷取單元。
可見光影像擷取單元120、非可見光影像擷取單元122與可見光影像擷取單元124可以設置不只一個,端視資料中心的大小而定。舉例而言,若可見光影像擷取單元124不只一個,可以將所有可見光影像擷取單元124的影像依照對應位置合併成一大張面板影像,或是對應可見光影像擷取單元124相對於機櫃的位置儲存所有可見光影像擷取單元124的影像。
在一例子中,可見光影像擷取單元120與非可見光影像擷取單元122可整合在一個部件當中。
須注意的是,第2a圖與第2b圖的面板側示意與散熱側示意圖僅為例示,並不用於限制本發明,所屬技術領域具有通常知識者能隨著資料中心的配置不同而改變面板側和散熱側的配置,例如有些資料中心可能將面板與散熱放在同一側,或是網路埠和燈號可能在不同側,因此因應資料中心的配置可能會減少或增加影像擷取單元。
第3a至3c圖所示為根據本發明一實施例之融合影像的示意圖。融合影像300融合機櫃的散熱側的機構影像310與熱影像320。機構影像310呈現至少包含電子設備360-1、360-2、360-3與360-4的機櫃350的影像,由可見光擷取單元120所擷取的機構影像可以判別機櫃中各電子設備的配置,例如判別伺服單元放在機櫃的哪個位置。若僅是單獨看熱影像320無法判斷溫度是對應至機櫃的哪一個電子設備,但從融合影像300就可以判斷機櫃的哪一個電子設備的溫度最高,如第3c圖所示,可以判斷出電子設備360-3的溫度最高,因此電子設備360-3可能負載過重。但在其他實施例中,若擷取熱影像320的設備的規格較高階,也可單就熱影像320來判斷機櫃的溫度資訊。
控制單元111從影像辨識單元114接收狀態資訊並從影像融合單元113接收融合影像。控制單元111將面板影像、機構影像與熱影像對應其機櫃編號(位置)與拍攝時間儲存至影像資料庫115。
控制單元111更將狀態資訊與融合影像傳送至警示單元112。警示單元112透過網路管理協定接收資料中心150的作業系統160的設定檔。警示單元112根據融合影像產生資料中心150的溫度資訊,例如溫度資訊記錄對應各電子設備的溫度。警示單元112根據溫度資訊、狀態資訊與設定檔,判斷是否符合複數個警示條件其中之一。舉例而言,例如警示條件一是電子設備溫度超過攝氏80度,警示條件二是應有負載但燈號未亮,警示條件三是網路線應連接但未連接。例如,若根據溫度資訊發現有一電子設備溫度超過攝氏80度時,則警示條件一符合,若根據設定檔某一電子設備應處於運作的狀態,但根據溫度資訊或/和狀態資訊該某一電子設備並未運作(該電子設備的溫度偏低或/和燈號未亮),則警示條件二符合。因此若任何一個警示條件符合就代表資料中心150有異常事件。
警示單元112更可對溫度資訊與狀態資訊進行與設定檔的比對,例如根據溫度資訊與狀態資訊判斷是否與設定檔的配置有差異,若差異大於一預訂值則代表資料中心150有異常事件。例如按照設定檔應該有10個電子設備正在運作,然而根據溫度資訊與狀態資訊可以得知實際上只有8個電子設備在運作,因此資料中心150有異常事件。異常事件可能是燈號狀態異常、溫度異常、作業系統設定錯誤等。
警示單元112除了根據當前的溫度資訊與狀態資訊判斷資料中心是否也異常事件,也可透過控制單元111存取儲存在影像資料庫115的先前面板影像、先前機構影像與先前熱影像並取得對應的先前溫度資訊與先前狀態資訊,或者是資料中心其他地方例如其他機櫃的溫度資訊與狀態資訊。舉例而言,警示單元112可根據同一時間不同機櫃部位的溫度資訊與狀態資訊判斷是否有異常事件,也可以根據不同時間相同機櫃部位的溫度資訊與狀態資訊判斷是否有異常事件,更可以根據不同時間不同機櫃部位的溫度資訊與狀態資訊判斷是否有異常事件。
若警示單元112判斷出資料中心150有異常事件,則警示單元112透過網路管理協定130傳送警示訊號至作業系統160使作業系統160進行負載管理。舉例而言,作業系統160結合應用作業系統160所配備之模組,例如實體資源管理(Physical Resource Management,PRM)模組、靜態資源預測管理(Static Resource Provisioning Management,PRM)模組、動態運行虛擬機器管理(Dynamic runtime Virtual Machine Management,DVMM)模組、分散式主儲存管理(Distributed Main Storage Management,DMS)模組、分散式次儲存管理(Distributed Secondary Storage Management,DSS)模組或可適性負載平衡(Scalable Load Balancer,SLB)模組等進行資料中心150的負載管理。
當警示單元112根據溫度資訊以及警示條件判斷出其中一電子設備的溫度超過警示條件的預設溫度時,警示單元112透過網路管理協定130傳送一負載遷移指令至作業系統160,使作業系統160根據負載遷移指令將安裝於電子設備的複數個虛擬機器的其中至少之一遷移至其他電子設備。舉例而言,根據作業系統160的設定檔,一伺服單元SN1上配置有虛擬機器VM1、VM2、VM3與VM4。在經過如上所述之可見光影像擷取單元120、非可見光影像擷取單元122以及可見光影像擷取單元124分別擷取機構影像、熱影像與面板影像後,警示單元112根據融合機構影像與熱影像所得的融合影像取得溫度資訊,並從影像辨識單元114取得狀態資訊,當警示單元112根據溫度資訊得知伺服單元SN1的溫度超過警示條件設定的攝氏80度時,警示單元112透過網路管理協定130傳送一伺服單元SN1的負載遷移指令至作業系統160,作業系統160根據伺服單元SN1的負載遷移指令,從伺服單元SN1上配置的虛擬機器VM1、VM2、VM3與VM4的一虛擬機器或是一部份(例如百分之十)的虛擬機器遷移至其他伺服單元SN2,以達到負載管理的效果。在遷移虛擬機器時,也可以根據各虛擬機器的負載大小決定要遷移哪個虛擬機器,例如先遷移走負載最大的虛擬機器。
當警示單元112根據溫度資訊、狀態資訊以及設定檔判斷出其中一電子設備故障(fail)時,則警示單元112透過網路管理協定130傳送一故障指令至該作業系統160,使作業系統160根據故障指令將安裝於該電子設備的全部虛擬機器遷移至其他電子設備。舉例而言,根據作業系統160的設定檔,一計算單元CN1上配置有虛擬機器VM5、VM6、VM7與VM8,因此計算單元CN1的狀態應為運作中。在經過如上所述之可見光影像擷取單元120、非可見光影像擷取單元122以及可見光影像擷取單元124分別擷取機構影像、熱影像與面板影像後,警示單元112根據融合機構影像與熱影像所得的融合影像取得溫度資訊,並從影像辨識單元114取得狀態資訊,當警示單元112根據溫度資訊得知計算單元CN1的溫度低於攝氏30度時,則判定整個計算單元CN1並未正常運作,或者是當警示單元112根據狀態資訊得知計算單元CN1的燈號並不是代表正常運作中的綠色而是代表未正常運作的橘色時,則判定整個計算單元CN1並未正常運作。當警示單元112判定整個計算單元CN1並未正常運作時,警示單元112透過網路管理協定130傳送計算單元CN1的故障指令至該作業系統160,使作業系統160根據計算單元CN1的故障指令將計算單元CN1的全部虛擬機器VM5、VM6、VM7與VM8遷移至其他計算單元CN2。
當作業系統160進行上列所述之虛擬機器遷移時,作業系統160可隨時透過網路管理協定130、警示單元112去存取狀態資訊與溫度資訊以確認遷移動作是否已排除異常事件,若沒有成功排除則進行下一階段的遷移。
上述虛擬機器對應實體機器的配置情形以一圖表記錄,此圖表上記載各實體機器的中央處理單元(Central Processing Unit,CPU)與記憶體的使用率,也記錄對應各實體機器上的由虛擬機器模組所創造的各虛擬機器。例如實體機器PM1的CPU使用率為0%,記憶體使用率為27%,實體機器PM1的虛擬機器清單記錄了4個虛擬機器的名字。
當資料中心使用者從圖表上得知一實體機器,例如實體機器PM4的CPU使用率或記憶體使用率太高(超過一預設值)時,或是接收到警示單元所傳送之警示訊息而查看圖表發現實體機器PM4的CPU使用率或記憶體使用率太高時,資料中心使用者可將實體機器PM4下的一虛擬機器至其他任意一個並未負載過重的實體機器。或著資料中心使用者也可根據融合影像或熱影像調整虛擬機器的配置。除此之外,資料中心使用者也可因為其他特別考慮條件,例如CPU的速度等,根據圖表、融合影像或熱影像隨意配置虛擬機器,以輕鬆管理負載。而負載管理程式可使用圖形介面來呈現圖表,並讓資料中心使用者藉由滑鼠將虛擬機器的名稱拖曳至圖表中其他實體機器下的虛擬機器清單來簡單地達成配置虛擬機器的任務。
除此之外,當警示單元112判斷出資料中心150有異常事件時,警示單元112透過控制單元111傳送一警告訊號至輸出入介面117與網路單元116,然後輸出入介面117再將警告訊號傳送至輸出設備140,網路單元116透過網際網路132將警告訊號傳送至遠端管理者終端172。例如若輸出設備140為具有音響的顯示裝置則警告訊號使輸出設備140發出警鈴聲,藉以提醒近端管理者174能馬上察覺資料中心的異常事件並進行異常排除。
遠端管理者終端172也可隨時經由網際網路132與網路單元,透過控制單元111存取融合影像與狀態資訊,藉以監控資料中心的狀態。類似地,近端管理者174也可隨時藉由輸出設備140經由輸出入介面117,透過控制單元111存取融合影像與狀態資訊,藉以監控資料中心的狀態。
另一方面,資料中心使用者170也可透過作業系統160、網路管理協定130、警示單元112與控制單元111存取融合影像與狀態資訊,藉以監控資料中心的狀態。當然資料中心使用者170、遠端管理者終端172與近端管理者174也可存取儲存在影像資料庫的先前影像。另外也可指定不同的存取權限給資料中心使用者170、遠端管理者終端172與近端管理者174,使資料中心使用者170、遠端管理者終端172與近端管理者174根據權限進行不同程度的資料中心管理。
在另一個例子中,控制單元111也可以先作一些初步判斷,再決定是否要將溫度資訊與狀態資訊傳送給警示單元112。舉例而言,控制單元111經由警示單元112以及網路管理協定130取得作業系統160的設定檔,並比對溫度資訊、狀態資訊與設定檔。若溫度資訊或/和狀態資訊與設定檔相同或其之間的差異小於一預定值,代表資料中心運作正常,則控制單元111將面板影像、機構影像與熱影像對應其機櫃編號(位置)與拍攝時間儲存至影像資料庫115,而不進一步將融合影像與狀態資訊傳送至警示單元112。若溫度資訊或/和狀態資訊與設定檔之間的差異大於該預定值,代表資料中新有異常事件,則控制單元111將融合影像與狀態資訊傳送至警示單元112,使警示單元112作進一步判斷並使警示單元112傳送訊號至作業系統116以使作業系統116進行負載平衡等處理。上述之預定值可為一警示條件的閾值,例如安全溫度為攝氏70度,但上下攝氏2度為可容許的差異。
另一方面,除了資料中心使用者170在透過管理介面162操作管理資料中心150的同時設定警示條件外,遠端管理者終端172也可透過網際網路162與網路單元116設定警示條件,近端管理者174也可透過輸入裝置142與輸出入介面117設定警示條件。警示條件可儲存於設定檔、控制單元111或警示單元112中。
以上說明雖以資料中心的機櫃為主,但根據資料中心的配置與影像擷取單元的解係度也可以一次擷取數個機櫃的影像或是一次只擷取一個機櫃的一部分影像。此外,雖然上述實施例中僅擷取機櫃的散熱側的熱影像,但根據管理需求的不同,也可擷取面板側的熱影像。
上述之控制單元111、警示單元112、影像融合單元113、影像辨識單元114、網路單元116與輸出入介面117為具有一般處理器功能之處理單元。
第4圖所示為根據本發明一實施例之監測管理方法400的步驟圖。監測管理方法400適用於貨櫃式資料中心150,資料中心150包括複數個機櫃152,每個機櫃152包括複數個電子設備。以下步驟說明中與上述第1圖的元件相同的部件沿用第1圖的元件標號。
在步驟S401中,可見光影像擷取單元120擷取該等機櫃的散熱側的影像以產生機構影像,非可見光影像擷取單元122擷取該等機櫃的散熱側的影像以產生熱影像。在步驟S402中,可見光影像擷取單元124擷取該等機櫃的面板側的影像以產生面板影像。接著在步驟S403中,影像融合單元113融合機構影像與熱影像以產生融合影像。在步驟S404中,影像辨識單元114利用影像辨識,根據面板影像判斷該等機櫃之電子設備的燈號狀態以及網路埠連接狀態,並產生狀態資訊。
在步驟S405中,控制單元111將面板影像、機構影像與熱影像對應其機櫃編號(位置)與拍攝時間儲存在影像資料庫115中。在步驟S406中,警示單元112根據融合影像、狀態資訊與資料中心的設定檔判斷資料中心是否有異常事件。警示單元112根據融合影像產生資料中心150的溫度資訊,警示單元112根據溫度資訊、狀態資訊與設定檔,判斷是否符合複數個警示條件其中之一,若是,則判斷資料中心150有異常事件。
若沒有異常事件,則在步驟S407中判斷監測管理方法是否結束,若否,則在步驟S408中經過一段時間T(例如1到10分鐘)後回到步驟S401,若是,則監測管理方法結束。
若在步驟S406中警示單元112判斷有異常事件,則在步驟S409中,警示單元112傳送一警示訊號至作業系統160,使作業系統160根據警示訊號進行資料中心150的負載管理。若電子設備其中之一電子設備的溫度超過警示條件的預設溫度,則警示單元112傳送該電子設備的負載遷移指令至作業系統160,使作業系統160根據該電子設備的負載遷移指令將安裝於該電子設備的複數個虛擬機器的其中之一虛擬機器或一部分的虛擬機器遷移至其他電子設備。若異常事件為其中之一電子設備故障;則警示單元112傳送該電子設備的故障指令至作業系統160,使作業系統160根據該電子設備的故障指令將安裝於該電子設備的全部虛擬機器遷移至其他電子設備。除上述負載管理動作外,本發明尚可進行備份、失敗復原、甚至直接關閉電子設備的動作。
上述之監測管理裝置與方法也可應用於監視資料中心以外的電子系統,例如大型主機或超級電腦等。
綜上所述,本發明藉由結合熱影與機構影像的融合影像可快速得知各電子設備的對應溫度,且不用大量配置點感測器,因此即使資料中心內部的電子設備配置有變動也不會影響本發明判別對應溫度的運算。除此之外,由於影像擷取單元是擷取一整面的連續資訊,不像點感測器所擷取的資訊在空間上並不連續,因此本發明的可靠性增加。另外,藉由面板影像與影像辨識可以辨識面板上的燈號以及網路埠的狀態。藉由融合影像與面板影像所得的溫度資訊與狀態資訊可使警示單元更有效且可靠地判斷資料中心的負載狀況與操作狀況,當警示單元偵測到異常事件時會回饋給資料中新的作業系統,使作業系統即時根據可告的景視訊號進行負載管理等處理,因此本發明可更有效率且更可靠地監測管理資料中心。
本發明之方法,或特定型態或其部份,可以以程式碼的型態存在。程式碼可以包含於實體媒體,如軟碟、光碟片、硬碟、或是任何其他電子設備或機器可讀取(如電腦可讀取)儲存媒體,亦或不限於外在形式之電腦程式產品,其中,當程式碼被機器,如電腦載入且執行時,此機器變成用以參與本發明之裝置或系統,且可執行本發明之方法步驟。程式碼也可以透過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態進行傳送,其中,當程式碼被電子設備或機器,如電腦接收、載入且執行時,此機器變成用以參與本發明之系統或裝置。當在一般用途處理單元實作時,程式碼結合處理單元提供一操作類似於應用特定邏輯電路之獨特裝置。
以上所述為實施例的概述特徵。所屬技術領域中具有通常知識者應可以輕而易舉地利用本發明為基礎設計或調整以實行相同的目的和/或達成此處介紹的實施例的相同優點。所屬技術領域中具有通常知識者也應了解相同的配置不應背離本創作的精神與範圍,在不背離本創作的精神與範圍下他們可做出各種改變、取代和交替。說明性的方法僅表示示範性的步驟,但這些步驟並不一定要以所表示的順序執行。可另外加入、取代、改變順序和/或消除步驟以視情況而作調整,並與所揭露的實施例精神和範圍一致。
100...監測管理系統
110...監測管理裝置
111...控制單元
112...警示單元
113...影像融合單元
114...影像辨識單元
115...影像資料庫
116...網路單元
117...輸出入介面
120...可見光影像擷取單元
122...非可見光影像擷取單元
124...可見光影像擷取單元
130...網路管理協定
132...網際網路
140...輸出裝置
142...輸入裝置
150...資料中心
152、350...機櫃
152-1、152-2、152-3、152-4...燈號
152-5、152-6、152-7...網路埠
160...作業系統
162...管理介面
170...資料中心使用者
172...遠端管理者終端
174...近端管理者
30...0融合影像
310...機構影像
320...熱影像
360-1、360-2、360-3、360-4...電子設備
S401、S402...、S408...步驟
第1圖所示為根據本發明一實施例之監測管理系統的示意圖;
第2a圖所示為根據本發明一實施例之機櫃的面板側的示意圖;
第2b圖所示為根據本發明一實施例之機櫃的散熱側的示意圖;
第3a至3c圖所示為根據本發明一實施例之融合影像的示意圖;
第4圖所示為根據本發明一實施例之監測管理方法的步驟圖。
100...監測管理系統
110...監測管理裝置
111...控制單元
112...警示單元
113...影像融合單元
114...影像辨識單元
115...影像資料庫
116...網路單元
117...輸出入介面
120...可見光影像擷取單元
122...非可見光影像擷取單元
124...可見光影像擷取單元
130...網路管理協定
132...網際網路
140...輸出裝置
142...輸入裝置
150...資料中心
160...作業系統
162...管理介面
170...資料中心使用者
172...遠端管理者終端
174...近端管理者

Claims (29)

  1. 一種監測管理裝置,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:至少一第一可見光影像擷取單元,擷取該等機櫃的面板側的影像,產生至少一第一可見光影像;至少一非可見光影像擷取單元,擷取該等機櫃的散熱側的影像,產生至少一非可見光影像;一影像辨識單元,利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;一影像資料庫;一控制單元,接收該至少一第一可見光影像、該至少一非可見光影像與該至少一狀態資訊,將該至少一第一可見光影像與該至少一非可見光影像儲存至該影像資料庫;一警示單元,透過該控制單元接收該至少一非可見光影像、該至少一第一可見光影像與該至少一狀態資訊,透過一網路管理協定從該資料中心的作業系統接收該資料中心的設定檔,並根據該至少一非可見光影像、該至少一狀態資訊與該設定檔判斷該資料中心是否有異常事件;一網路單元,耦接至一網際網路,其中耦接至該網際網路的至少一遠端經由該網際網路並透過該網路單元存取該至少一非可見光影像與該至少一狀態資訊;以及一輸出入介面,耦接至至少一輸出裝置,其中該至少一輸出裝置透過該輸出入介面存取並輸出該至少一非可見光影像與該至少一狀態資訊。
  2. 如申請專利範圍第1項所述之監測管理裝置,其中若該警示單元判斷該資料中心有異常事件,該警示單元透過該網路管理協定傳送一警示訊號至該作業系統,使該作業系統根據該警示訊號進行該資料中心的負載管理。
  3. 如申請專利範圍第2項所述之監測管理裝置,其中該設定檔至少包括該資料中心中該等電子設備與複數個虛擬機器的對應關係。
  4. 如申請專利範圍第3項所述之監測管理裝置,更包括:至少一第二可見光影像擷取單元,擷取該等機櫃的該散熱側的影像,產生至少一第二可見光影像;以及至少一影像融合單元,融合該至少一第二可見光影像與該至少一非可見光影像以產生至少一融合影像。
  5. 如申請專利範圍第4項所述之監測管理裝置,其中該警示單元根據該至少一非可見光影像或該至少一融合影像產生該資料中心的至少一溫度資訊,並根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否符合複數個警示條件其中之一,若是,則該警示單元判斷該資料中心有異常事件。
  6. 如申請專利範圍第5項所述之監測管理裝置,其中該至少一遠端經由該網際網路並透過該網路單元設定該等警示條件,其中該輸出入介面更耦接至至少一輸入裝置,該至少一輸入裝置透過該輸出入介面設定該等警示條件,該控制單元將該等警示條件傳送至該警示單元。
  7. 如申請專利範圍第5項所述之監測管理裝置,其中該作業系統透過該作業系統的管理介面接收指令以設定該等警示條件,該等警示條件透過該網路管理協定傳送至該警示單元。
  8. 如申請專利範圍第5項所述之監測管理裝置,其中該警示單元根據該至少一非可見光影像或該至少一融合影像,判斷每一該等電子設備的溫度,以產生該至少一溫度資訊。
  9. 如申請專利範圍第5項所述之監測管理裝置,其中根據該至少一溫度資訊,若該等電子設備其中之一電子設備的溫度超過該等警示條件的預設溫度,則該警示單元透過該網路管理協定傳送一負載遷移指令至該作業系統,使該作業系統根據該負載遷移指令將安裝於該電子設備的複數個虛擬機器的其中至少之一遷移至其他電子設備。
  10. 如申請專利範圍第5項所述之監測管理裝置,其中該警示單元根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否有該等電子設備其中之一電子設備故障,若是,則該警示單元透過該網路管理協定傳送一故障指令至該作業系統,使該作業系統根據該故障指令將安裝於該電子設備的全部虛擬機器遷移至其他電子設備。
  11. 一種資料中心的監測管理系統,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:至少一第一可見光影像擷取單元,擷取該等機櫃的面板側的影像,產生至少一第一可見光影像;至少一非可見光影像擷取單元,擷取該等機櫃的散熱側的影像,產生至少一非可見光影像;一影像辨識單元,利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;一影像資料庫;一控制單元,接收該至少一第一可見光影像、該至少一非可見光影像與該至少一狀態資訊,將該至少一第一可見光影像與該至少一非可見光影像儲存至該影像資料庫;以及一警示單元,透過該控制單元接收該至少一非可見光影像、該至少一第一可見光影像與該至少一狀態資訊,透過一網路管理協定從該資料中心的作業系統接收該資料中心的設定檔,並根據該至少一非可見光影像、該至少一狀態資訊與該設定檔判斷該資料中心是否有異常事件。
  12. 如申請專利範圍第11項所述之資料中心的監測管理系統,其中若該警示單元判斷該資料中心有異常事件,該警示單元透過該網路管理協定傳送一警示訊號至該作業系統,使該作業系統根據該警示訊號進行該資料中心的負載管理。
  13. 如申請專利範圍第12項所述之資料中心的監測管理系統,其中該設定檔至少包括該資料中心中該等電子設備與複數個虛擬機器的對應關係。
  14. 如申請專利範圍第13所述之資料中心的監測管理系統,更包括:至少一第二可見光影像擷取單元,擷取該等機櫃的該散熱側的影像,產生至少一第二可見光影像;以及至少一影像融合單元,融合該至少一第二可見光影像與該至少一非可見光影像以產生至少一融合影像。
  15. 如申請專利範圍第14項所述之資料中心的監測管理系統,其中該警示單元根據該至少一非可見光影像或該至少一融合影像產生該資料中心的至少一溫度資訊,並根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否符合複數個警示條件其中之一,若是,則該警示單元判斷該資料中心有異常事件。
  16. 如申請專利範圍第15項所述之資料中心的監測管理系統,更包括:一網路單元,耦接至一網際網路,其中耦接至該網際網路的至少一遠端經由該網際網路並透過該網路單元存取該至少一非可見光影像或該至少一融合影像,以及存取該至少一狀態資訊;以及一輸出入介面,耦接至至少一輸出裝置,其中該至少一輸出裝置透過該輸出入介面存取並輸出該至少一非可見光影像或該至少一融合影像,以及存取並輸出該至少一狀態資訊。
  17. 如申請專利範圍第15項所述之資料中心的監測管理系統,其中該至少一遠端經由該網際網路並透過該網路單元設定該等警示條件,其中該輸出入介面更耦接至一輸入裝置,該輸出入介面透過該輸出入介面設定該等警示條件,該控制單元將該等警示條件傳送至該警示單元。
  18. 如申請專利範圍第15項所述之資料中心的監測管理系統,其中該作業系統透過該作業系統的管理介面接收指令以設定該等警示條件,該等警示條件透過該網路管理協定傳送至該警示單元。
  19. 如申請專利範圍第15項所述之資料中心的監測管理系統,其中該警示單元根據該至少一非可見光影像或該至少一融合影像,判斷每一該等電子設備的溫度,以產生該至少一溫度資訊。
  20. 如申請專利範圍第15項所述之資料中心的監測管理系統,其中根據該至少一溫度資訊,若該等電子設備其中之一電子設備的溫度超過該等警示條件的預設溫度,則該警示單元透過該網路管理協定傳送一負載遷移指令至該作業系統,使該作業系統根據該負載遷移指令將安裝於該電子設備的複數個虛擬機器的其中至少之一遷移至其他電子設備。
  21. 如申請專利範圍第15項所述之資料中心的監測管理系統,其中該警示單元根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否有該等電子設備其中之一電子設備故障,若是,則該警示單元透過該網路管理協定傳送一故障指令至該作業系統,使該作業系統根據該故障指令將安裝於該電子設備的全部虛擬機器遷移至其他電子設備。
  22. 一種資料中心的監測管理方法,適用於包括複數個機櫃的一資料中心,其中每一該等機櫃設置有至少一電子設備,包括:擷取該等機櫃的散熱側的影像以產生至少一非可見光影像;擷取該等機櫃的面板側的影像以產生至少一第一可見光影像;利用影像辨識,根據該至少一第一可見光影像判斷該等機櫃之該等電子設備的燈號狀態以及網路埠連接狀態,並產生至少一狀態資訊;儲存該至少一第一可見光影像與該至少一非可見光影像;以及根據該至少一非可見光影像、該至少一狀態資訊與該資料中心的設定檔判斷該資料中心是否有異常事件。
  23. 如申請專利範圍第22項所述之資料中心的監測管理方法,其中若該資料中心有異常事件,則傳送一警示訊號至該作業系統,使該作業系統根據該警示訊號進行該資料中心的負載管理。
  24. 如申請專利範圍第23項所述之資料中心的監測管理方法,其中該設定檔至少包括該資料中心中該等電子設備與複數個虛擬機器的對應關係。
  25. 如申請專利範圍第24項所述之資料中心的監測管理方法,更包括:擷取該等機櫃的該散熱側的影像,產生至少一第二可見光影像;以及融合該至少一第二可見光影像與該至少一非可見光影像以產生至少一融合影像。
  26. 如申請專利範圍第25項所述之資料中心的監測管理方法,更包括:根據該至少一非可見光影像或該至少一融合影像產生該資料中心的至少一溫度資訊;以及根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否符合複數個警示條件其中之一,若是,則判斷該資料中心有異常事件。
  27. 如申請專利範圍第26項所述之資料中心的監測管理方法,更包括:根據該至少一非可見光影像或該至少一融合影像,判斷每一該等電子設備的溫度,以產生該至少一溫度資訊。
  28. 如申請專利範圍第26項所述之資料中心的監測管理方法,更包括:根據該至少一溫度資訊,若該等電子設備其中之一電子設備的溫度超過該等警示條件的預設溫度,則傳送一負載遷移指令至該作業系統,使該作業系統根據該負載遷移指令將安裝於該電子設備的複數個虛擬機器的其中至少之一遷移至其他電子設備。
  29. 如申請專利範圍第26項所述之資料中心的監測管理方法,更包括:根據該至少一溫度資訊、該至少一狀態資訊與該設定檔,判斷是否有該等電子設備其中之一電子設備故障;以及若是,則傳送一故障指令至該作業系統,使該作業系統根據該故障指令將安裝於該電子設備的全部虛擬機器遷移至其他電子設備。
TW100149123A 2011-12-28 2011-12-28 監測管理裝置、資料中心的監測管理系統以及監測管理方法 TWI431555B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW100149123A TWI431555B (zh) 2011-12-28 2011-12-28 監測管理裝置、資料中心的監測管理系統以及監測管理方法
CN201210040643XA CN103188108A (zh) 2011-12-28 2012-02-21 监测管理装置、数据中心的监测管理系统及监测管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW100149123A TWI431555B (zh) 2011-12-28 2011-12-28 監測管理裝置、資料中心的監測管理系統以及監測管理方法

Publications (2)

Publication Number Publication Date
TW201327488A TW201327488A (zh) 2013-07-01
TWI431555B true TWI431555B (zh) 2014-03-21

Family

ID=48679080

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100149123A TWI431555B (zh) 2011-12-28 2011-12-28 監測管理裝置、資料中心的監測管理系統以及監測管理方法

Country Status (2)

Country Link
CN (1) CN103188108A (zh)
TW (1) TWI431555B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098986B2 (en) * 2013-10-17 2015-08-04 Rockwell Automation Technologies, Inc. Indicator light interpretation device and method for indicator lights of an electronic device
TWI603266B (zh) 2014-03-03 2017-10-21 廣達電腦股份有限公司 虛擬機器之資源調整方法及系統
CN110210275B (zh) * 2018-02-28 2023-10-13 广州小兵过河信息科技有限公司 一种资源端口人工智能识别装置及其方法
CN111102966A (zh) * 2018-10-29 2020-05-05 所罗门股份有限公司 自动采集设备状态的方法
CN109509324A (zh) * 2019-01-21 2019-03-22 湖南中铁五新重工有限公司 一种电控柜安全系统及其安全控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW476221B (en) * 2000-05-31 2002-02-11 Ind Tech Res Inst Image monitoring/recognition method by thermal imaging
TWI284863B (en) * 2002-08-30 2007-08-01 Ind Tech Res Inst Image recognition system for smoke and temperature distribution
TWI261110B (en) * 2004-06-25 2006-09-01 Southern Taiwan University Of Fever screening method and system
EP2313831B1 (en) * 2008-06-26 2018-02-21 Google LLC Data center thermal monitoring
CN201690271U (zh) * 2010-03-26 2010-12-29 国网电力科学研究院武汉南瑞有限责任公司 配电网状态监测系统

Also Published As

Publication number Publication date
CN103188108A (zh) 2013-07-03
TW201327488A (zh) 2013-07-01

Similar Documents

Publication Publication Date Title
TWI431555B (zh) 監測管理裝置、資料中心的監測管理系統以及監測管理方法
US20130169816A1 (en) Monitoring and managing device, monitoring and managing system and method of data center
US20210099368A1 (en) Policy controller for distributed virtualization infrastructure element monitoring
JP6248560B2 (ja) 管理プログラム、管理方法、および管理装置
TWI423039B (zh) 伺服器系統與其操作方法
US20130110926A1 (en) Method for Controlling Rack System
US20100088432A1 (en) Apparatus for managing host bus adapter
US8555189B2 (en) Management system and management system control method
US20210233294A1 (en) Augmented reality diagnostic tool for data center nodes
US10439957B1 (en) Tenant-based management system and method for distributed computing environments
US20180109514A1 (en) Authentication-free configuration for service controllers
US20120203393A1 (en) Information handling system server architecture for improved management communication
US8935373B2 (en) Management system and computer system management method
US10027534B1 (en) Log management system and method for distributed computing systems
US11381451B2 (en) Methods, systems, and computer readable mediums for selecting and configuring a computing system to support a replicated application
US10587655B1 (en) Compliance management system and method for an integrated computing system
US11451447B1 (en) Container workload monitoring and topology visualization in data centers
US8943373B1 (en) Keyboard, video and mouse switch identifying and displaying nodes experiencing a problem
JP6380040B2 (ja) ストレージ装置、中継装置、および中継制御プログラム
CN106940676B (zh) 机柜的监控系统
US10885239B2 (en) Generating pseudo heat maps
US9137587B2 (en) System event assisted live keyboard, video and mouse (KVM) capture
KR102137891B1 (ko) Bmc 환경에서의 사용자 특화 운용 메커니즘에 의한 서버 관리 방법, 기록매체, 및 서버
KR20200026628A (ko) 서비스 기능 연결 환경에서의 네트워크 서비스 관리 방법
CN108829570A (zh) 服务器节点信息显示控制方法、装置、系统及存储介质