數(shù)十年專注企業(yè)數(shù)字化轉(zhuǎn)型、智能化升級、企業(yè)上云解決方案服務(wù)商
工單提交 實名認證 騰佑科技咨詢熱線咨詢熱線: 400-996-8756
百度云服務(wù)中心騰佑科技公司
云服務(wù)器活動 服務(wù)器租用 服務(wù)器托管 機柜租賃 帶寬租賃
  • 最新資訊
  • 熱門資訊
  • 最熱資訊
智能建站

服務(wù)器知識:如何檢查服務(wù)器主機的內(nèi)部問題

發(fā)布時間:2016-11-14 作者:admin

簡述:在一臺容錯服務(wù)器內(nèi)部有超過500個故障檢測點,隨時都有可能發(fā)出錯誤報警和通知。這些故障中,有處理器、芯片組、內(nèi)存尋址、字節(jié)和電源錯誤,也有內(nèi)部總線協(xié)議、CRC、ECC、系統(tǒng)時鐘、系統(tǒng)服務(wù)和散熱系統(tǒng)錯誤

在一臺容錯服務(wù)器內(nèi)部有超過 500個故障檢測點,隨時都有可能發(fā)出錯誤報警和通知。這些故障中,有處理器、芯片組、內(nèi)存尋址、字節(jié)和電源錯誤,也有內(nèi)部總線協(xié)議、CRC、ECC、系統(tǒng)時鐘、系統(tǒng)服務(wù)和散熱系統(tǒng)錯誤等,對于標準工業(yè)服務(wù)器而言,任何錯誤都可能導(dǎo)致系統(tǒng)癱瘓,更為可怕的是這些錯誤是隨機的,很多屬于臨時性錯誤。如果把系統(tǒng)重新啟動,有些故障就會消失。與故障相比,有些錯誤不容易被察覺,導(dǎo)致錯誤的計算結(jié)果,其危害更大。


工業(yè)標準服務(wù)器所以有如此的問題主要與設(shè)計思想有關(guān),運行時間不是其主要設(shè)計目標,它只具有有限冗余特征,如電源,需要通過集群來提高可靠性。與之相比,小型機具有更高的可靠性設(shè)計,用于保障系統(tǒng)的可靠運行。小型機在故障點檢測上有很多的保障機制。通常小型機的價格比較高。隨著處理器技術(shù)的發(fā)展,特別是Intel Xeon 7500系列處理器的推出,IA處理器在可靠性性能設(shè)計上與小型機所采用的RISC處理器大幅度接近,但在系統(tǒng)上,標準工業(yè)服務(wù)器還是有些差距。


工業(yè)標準服務(wù)器的優(yōu)勢在于價格,小型機的競爭力在于高可靠性,有沒有辦法魚和熊掌兼得呢?就只有在系統(tǒng)結(jié)構(gòu)上想辦法,雙機、集群和容錯都是不錯的方法。


雙機和集群是通過軟件的方法,通過故障機切換來提升可靠性。與之相比,容錯是采用硬件的方法,以及特有故障處理和保障機制提高系統(tǒng)的可靠性。容錯較之單機具有更高的可靠性,其中,容錯還具有糾正臨時性錯誤的能力,可以確保計算的正確性。


小型機也通過雙機和容錯來進一步提升可靠性,但成本代價更高。隨著IA處理器可靠性性能的改善,采用容錯服務(wù)器提高系統(tǒng)可靠性成為了很多明智用戶的選擇。與雙機相比,容錯服務(wù)器硬件成本高于雙機方案,但考慮軟件因素,容錯服務(wù)器具有相當(dāng)競爭力。在這種情況下,以Stratus的ftServer為代表,容錯服務(wù)器的門檻已經(jīng)大大降低,成為關(guān)鍵業(yè)務(wù)應(yīng)用的理想選擇。

點擊展開全文

鄭州騰佑科技有限公司(以下簡稱“騰佑科技”)成立于2009年, 總部位于鄭州,是 一家致力于互聯(lián)網(wǎng)服務(wù)業(yè)的高新技術(shù)企業(yè),公司主營業(yè)務(wù)以互聯(lián)網(wǎng)數(shù)據(jù)中心、云計算、人 工智能、軟件開發(fā)、安全服務(wù)“互聯(lián)網(wǎng)+”行業(yè)解決方案及行業(yè)應(yīng)用等相關(guān)業(yè)務(wù)。

售前咨詢熱線:400-996-8756

備案提交:0371-89913068

售后客服:0371-89913000

熱門活動

百度云服務(wù)中心
  • 熱門資訊
  • 隨便看看