發布日期:2022-04-26 點擊率:83
當今,越來越多的企業在工作時都依賴可以長期永久使用的IT系統,一旦企業的IT系統出現故障,不僅會給企業帶來經濟損失而且也失去了用戶的信任。2018年,德國企業IT系統故障時間平均為22h,經濟損失估計675000歐元,據戴爾全球數據保護指數稱,數據丟失導致的總體經濟損失大約為100萬歐元。這會造成用戶與合作伙伴之間的信任丟失。這些數據都充分證明了,永久性和預測性的IT環境監控是多么重要的事情。因此,DCIM數據中心基礎架構管理軟件工具就是每個企業IT環境監控的重要工具。對于中小型企業來講,DCIM監控軟件就是他們提高IT環境最理想的工具。監控解決方案是持續性的對服務器機柜、供電電源系統和空調系統的工作情況進行檢查監控的工具,可以及時的發現問題并在問題的“萌芽階段”通知技術人員及早采取措施,保證IT系統和周圍建筑物的安全。
IT經理一開始就要考慮如何降低IT監控系統復雜性的問題。除了要注意DCIM(數據中心基礎設施管理)系統所有可用功能之外,建議還要關注一下有關能源管理、可用性和安全相關參數等關鍵指標。對中小型企業來講,在以ITIL信息技術基礎架構庫為主導的DCIM性能擴展有點要求過高。因此,整個IT系統監控項目應分為幾個子項目逐步展開,一步步的實現不同IT基礎設施的DCIM監控管理的全覆蓋。
提高IT系統工作安全性的一個重要因素就是對直至服務器的全部供電電源裝置進行監控。如果供電電源鏈條中的任何一個環節出現了故障,則服務器都會斷電。因此,像UPS不間斷供電電源類似的供電保障設備不僅僅要在意外斷電時發揮供電功能,而且還要分別安置在主電路和次級電路中,保障在所有的電路在故障中發揮作用。因此,對UPS不間斷供電電源的監控也是非常重要的。另外,還要對IT系統的冷卻、熱量分布以及散熱情況進行監控。沒有有效的冷卻會導致IT系統的設備過熱。
圖1 溫度監控是保證IT系統正常運行的最低要求,圖示監控系統——模塊化結構的CMC III型計算機多控裝置,能夠有效的監控IT系統的工作環境
更重要的是,僅靠軟件是不夠的,企業需要一個能夠將所有需要IT系統不間斷運行的部門和職工都納入到監控之中。除了企業的IT部門之外,還包含了設備管理部門、重要的建筑安全性設施以及根據行業和可用性要求配備的在線生產人員和銷售人員。
如今,企業付出能夠承受的資金費用和工作量來實現跨部門的DCIM系統。系統供應商也能夠為用戶提供通用的、能夠集成到用戶企業現有系統中的監控系統。配置使用非常靈活的通信技術協議轉換器能夠將監控數據轉發到IT控制中心并且統一地顯示在大型的監控屏幕上。
通常情況下,企業的經營理念和責任是隨著企業發展而成長起來的。在引進了新的DCIM方案之后,IT部門的領導人要徹底搞清楚現有IT系統的結構。通過負責部門、班組的重建工作,應該更有意義的分配成本費用的布局,或者實現更有實踐意義的報警機制,例如把建筑物安全直接納入到報警鏈中去。
DCIM解決方案的目的旨在對整個計算中心進行監控,因此其功能范圍非常廣泛。如果企業只有不多的幾個服務器機柜,通常服務器機柜供應商提供的、具有安全保護功能的軟件程序就能完成監控、保護任務了。例如Rittal公司提供的Rizone服務器機柜監控軟件就含有DCIM模塊,可以在小型服務器機柜中快速的安裝、使用,必要時也可以對整個基礎架構進行監控。
引進DCIM解決方案之前對企業現有的IT基礎設施進行仔細核查有助于確定真實的安全監控需求。核查時要解決的關鍵問題是:哪些IT系統對企業的經營管理是至關重要的?有哪些企業管理任務必須始終在IT系統中完成?是否有始終可用的IT專業技術人員?只有一個IT中心還是有若干個?根據這些和其他的一些問題,技術人員可以初步評估IT系統的安全需求并根據安全需求制定出監控方案。監控系統至少要有溫度變化、供電保障、安全通道和安全防火等保護措施。如果在服務器機柜的房間里有水管和暖氣管道時,還需要有安裝放置潮濕的濕度檢測儀。
空調設備、電源保護設備和電力分配設備之間的通信通常都是由管理軟件的網絡通信協議來實現的。另外,許多傳感器,例如濕度傳感器、功耗檢測儀、服務器機柜門的開關狀態傳感器和溫度傳感器等傳感器的檢測參數也應提供給中央控制室。通過標準化的通信接口,例如通過符合建筑安全保護網絡通信協議的Bacnet接口,DCIM監控軟件還能與建筑設施管理系統連接起來。這些數據匯總形成的總體描述能夠清楚地反應IT系統以及IT附屬設備的當前狀況。
圖2 微型數據中心應根據實際需要建立起合適的IT物理防護系統,即滿足F90和IP56的防護要求
利用DCIM軟件還能夠優化計算中心的成本費用,提高成本費用的透明度。這一優勢在IT系統和建筑設施管理系統同時參與到IT運行環境中時是非常有用的。清楚的特性數據、發展趨勢和以消費為主導的成本費用計算有助于IT設備更加經濟的工作運行,并實現跨企業生產基地的成本費用計算。
要優化IT系統運營成本,首先必須要準確地確定IT系統的功耗。高效能源管理的基礎就是服務器和網絡設備所消耗的電量。帶有電力測量功能的PDU配電設備能夠給出服務器機柜內部電力消耗的詳細數據。如果用戶使用的服務器機柜數量不多,也可以利用建筑設施管理系統來測定這些數據,例如利用常規電表測量使用的能源數量。
DCIM軟件系統的負責人常常不確定DCIM軟件工作時是否會對IT系統的運行產生影響。但企業卻能從DCIM平臺的不間斷運行中獲益,保證受監控的IT基礎架構不會突然停止工作。例如,Rittal公司研發生產的DCIM軟件Rizone就是為了保證IT系統正常工作而在Windows服務器上工作的,因此擁有足夠的可用資源。
諸如DSGVO通用數據保護法和basel II協議等法律法規要求企業遵守數據和IT安全的有關規定。這些安全保護要求中就包括了記錄何人、何時訪問了IT系統。IT系統監控方案也應包含打開服務器機柜門的記錄。當IT設備安裝在安全技術非常簡單的技術室內或者安裝在打印機房內時,這一記錄就顯得尤為重要了。為了保障更高的安全可靠性,機柜柜門、房門的電動把手與讀卡器聯網,只允許有資質的人員進出、開啟房門、柜門,并詳細的做好記錄。
使用DCIM系統之后,IT技術經理就將計算技術中心變成了一個全自動運行的自動化IT工廠了。過去,IT技術設備的維護保養、配置和監控常常是人工手動完成的。今天,理想的數據中心預計將會在很大程度上實現自主運行了。IT基礎設施會根據需要為不同的工作量提供所需的IT資源,并根據誰使用誰付款的原則計算不同工作量所消耗的電力能源。這樣,成本費用就會準確的分攤到IT系統運行時的所有使用者那里,而且每一個使用者也都清楚的知道自己應承擔的成本費用。另外,DCIM還有助于保護IT基礎設施的電力供應和恒溫空調,對IT機柜的物理安全性進行監控,并在IT基礎設施和IT系統元器件之間架起了一座相互聯系的橋梁。它所帶來的、很高的自動化程度也為IT技術專家提供了更大的數據中心戰略發展的自由度。