隨著數(shù)據(jù)中心日益成為企業(yè)的業(yè)務(wù)核心,人們對數(shù)據(jù)中心可靠性的要求也越來越來高。但是數(shù)據(jù)中心的設(shè)計(jì)并不是簡單地進(jìn)行基礎(chǔ)設(shè)施冗余。數(shù)據(jù)中心的高層管理人員更加關(guān)注數(shù)據(jù)中心的可靠性和安全性,因此數(shù)據(jù)中心的設(shè)計(jì)比以往任何時(shí)候都更為重要,特別是滿足特定的公司需求的時(shí)候。
在實(shí)際工作中,提高可靠性并不需要更多的冗余配置,也沒有超出預(yù)算的必要。
最近在數(shù)據(jù)中心世界會(huì)議上,做了如何從可用性角度看待數(shù)據(jù)中心設(shè)計(jì)決策的演講報(bào)告。
(1)更多的冗余并不意味著更高的可靠性
表示,重要的不僅僅是數(shù)據(jù)中心設(shè)計(jì),盡可能多滿足IT設(shè)備應(yīng)用程序的實(shí)際需求也很重要,更多的基礎(chǔ)設(shè)施冗余并不會(huì)自動(dòng)使系統(tǒng)更加可靠。事實(shí)上,在冗余組件增加一個(gè)點(diǎn)都會(huì)降低可靠性,因?yàn)檫@使系統(tǒng)變得更加復(fù)雜,更加難以管理。
(2)TierIV數(shù)據(jù)中心的成本是TierII數(shù)據(jù)中心的兩倍
數(shù)據(jù)中心基礎(chǔ)設(shè)施的可靠性水平必須匹配數(shù)據(jù)中心支持的應(yīng)用程序需求。人們都希望設(shè)計(jì)和建設(shè)最可靠的數(shù)據(jù)中心,雖然客戶為此可以負(fù)擔(dān)高昂費(fèi)用,但這種做法并不明智,特別是考慮到冗余的成本。
表示,引用數(shù)據(jù)中心設(shè)施咨詢機(jī)構(gòu)UptimeInstitute的調(diào)查,TierI級數(shù)據(jù)中心和TierII級數(shù)據(jù)中心的成本與TierIII和TierIV級數(shù)據(jù)中心的成本相比,之間差異很小。而數(shù)據(jù)中心的設(shè)計(jì)從TierII級到TierIII級,其費(fèi)用增幅巨大:幾乎是100%。以同樣擁有15000平方英尺空間的數(shù)據(jù)中心為例,TierI級數(shù)據(jù)中心的UPS電源每千瓦成本為10000美元,TierII數(shù)據(jù)中心的UPS電源每千瓦的成本為11000美元。TierIII數(shù)據(jù)中心的UPS電源成本為20000美元,TierIV級的UPS電源成本為22000美元??梢钥吹剑琓ierIII數(shù)據(jù)中心電源成本是TierI級數(shù)據(jù)中心的一倍。
(3)2(N+1)冗余配置UPS系統(tǒng)并不比2N冗余UPS系統(tǒng)更加可靠
更多的冗余并不意味著更高的可靠性,說,2(N+1)UPS冗余配置的設(shè)計(jì)并不比2NUPS冗余配置更加可靠。表示,對于一個(gè)系統(tǒng)來說,2N冗余UPS系統(tǒng)故障的概率與2(N+1)冗余UPS系統(tǒng)故障概率基本相同。
(4)2n冗余發(fā)電機(jī)配置比n+1冗余發(fā)電機(jī)配置更加可靠
表示,2(N+1)發(fā)電機(jī)冗余系統(tǒng)的配置與N+1發(fā)電機(jī)冗余系統(tǒng)配置的差異很小。而2(N+1)冗余的UPS系統(tǒng)中,具備雙路供電配置,一個(gè)備用電源轉(zhuǎn)換開關(guān),以及雙路IT設(shè)備。N+1的UPS冗余系統(tǒng)的失效概率2.94%,2NUPS冗余系統(tǒng)的失效概率約為1.5%,二者的失效概率相差4.41%。
即使在UptimeInstitute的評級系統(tǒng)中的最高級別TierIV數(shù)據(jù)中心,同樣也不需要多余的發(fā)電機(jī)。TierIV數(shù)據(jù)中心只是要求必須有一臺(tái)發(fā)電機(jī)連續(xù)運(yùn)行,即使在維修過程中。說,所有主要的發(fā)電機(jī)制造商都很容易滿足這個(gè)需求,
TierIII和TierIV級數(shù)據(jù)中心也要求這么做,但是,發(fā)電站冗余電源和燃料供應(yīng)基礎(chǔ)設(shè)施需要同時(shí)維護(hù)和容錯(cuò)。
(5)8小時(shí)運(yùn)行發(fā)電機(jī)故障率為15%
發(fā)電機(jī)冗余很重要,因?yàn)榘l(fā)電機(jī)并不可靠。即使一臺(tái)發(fā)電機(jī)啟動(dòng)成功,其IT設(shè)備可以采用這臺(tái)發(fā)電機(jī)的電力,但很難確保不發(fā)生意外,因?yàn)楫?dāng)數(shù)據(jù)中心斷電事故發(fā)生時(shí),發(fā)電機(jī)必須運(yùn)行較長時(shí)間。
紐約遭遇了颶風(fēng)桑迪襲擊,這對于長時(shí)間運(yùn)行的發(fā)電機(jī)的可靠性進(jìn)行了一次罕見的測試,很多發(fā)電機(jī)在這個(gè)測試中失敗。莫里森•赫什菲爾德工程公司的許多客戶數(shù)據(jù)中心設(shè)施在電力中斷之后轉(zhuǎn)換到發(fā)電機(jī)供電。說。數(shù)據(jù)中心電力的故障發(fā)生的原因不盡相同,甚至出現(xiàn)了由于發(fā)電機(jī)組燃料箱底部積累的雜質(zhì)并沒有過濾掉,導(dǎo)致發(fā)電機(jī)最終失效的情況。
他援引愛達(dá)荷國家工程實(shí)驗(yàn)室的一項(xiàng)研究發(fā)現(xiàn),15%的的柴油發(fā)電機(jī)在連續(xù)運(yùn)行8小時(shí)后失效;1%的發(fā)電機(jī)24小時(shí)后失效;5%的柴油發(fā)電機(jī)半小時(shí)后失效;2%的柴油發(fā)沒有啟動(dòng)。
(6)數(shù)據(jù)中心Tier的級別不會(huì)決定可靠性
雖然Uptime Institute定義了數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計(jì)可靠性的級別,但影響數(shù)據(jù)中心設(shè)計(jì)可靠性的因素很多。其中包括數(shù)據(jù)中心的選址,施工建設(shè)的質(zhì)量,設(shè)備的質(zhì)量,設(shè)備的調(diào)試過程,數(shù)據(jù)中心的運(yùn)行年限、數(shù)據(jù)中心維護(hù)與管理、人員培訓(xùn)、維修方法,以及人員技術(shù)水平等。
文章來源:ups維修http://www.rongguina.cn/solve_ups.asp
ot articles