您的位置:軟件測試 > 開源軟件測試 > 開源性能測試工具 >
性能和容量規(guī)劃
作者:網(wǎng)絡轉載 發(fā)布時間:[ 2013/1/15 14:48:59 ] 推薦標簽:

服務器故障切換恢復

前面的部分討論了如何利用網(wǎng)絡負載均衡(NLB)和 Microsoft Cluster Service (MSCS)消除單點故障。 這一部分的目的是要介紹,當您在企業(yè)部署種使用了 NLB 和MSCS 時,MSIB 2.0 是如何從故障種恢復過來的。

ISA 故障切換

在 ISA 服務器因服務器故障而出現(xiàn)故障的時候, NLB 軟件(運行在 ISA 服務器之上)將會把故障服務器從 NLB 群集中刪除掉。 在 ISA 服務器因連接、RPC 或磁盤故障而出現(xiàn)故障的時候,ISA 服務器會將自己從群集中脫離開。 后的結果是,仍然正常的冗余服務器將會把所有的請求接管過來。

 NLB 故障切換

當某一表示層服務器不能發(fā)送或響應心跳消息的時候,其他服務器將會進行收斂。 后的結果是,仍然可對請求作出響應的表示服務器會為故障服務器處理所有的入站請求。 當某臺新的表示服務器試圖加入到該群集的時候,它將會發(fā)出一個意在收斂的心跳消息。 當所有的表示服務器都同意接受該成員的時候,將會對客戶端的工作量重新劃分。

SQL Server MSCS 數(shù)據(jù)庫故障切換

SQL Server 使用了一套共享的磁盤子系統(tǒng),它可以以一個群集服務器的形式工作。 當群集中的某活動 SQL 服務器出現(xiàn)故障的時候,備用的 SQL 服務器將會接管故障服務器的負載,處理客戶請求,從同一共享盤上讀取和寫數(shù)據(jù),如下圖所示。

確定預期的可用性

 這一部分將介紹一個計算實例,MSIB 項目組為本文使用了這種計算方法以確定 MSIB 2.0 企業(yè)部署的可用性,也稱為預期的正常運行時間。 這一實例是根據(jù) Microsoft Technical Report 中的Markov Model of Availability for Server Clusters 中的數(shù)學模型給出的,地址在 http://go.microsoft.com/fwlink/?LinkId=15127.

在這一模型中需要考慮五個 MSIB 2.0 企業(yè)部署的群集。 這五個群集都是由兩個節(jié)點/計算機構成的,它們必需能夠正常運行,令那些考慮要可用的系統(tǒng)真正可用。 出于這一分析的考慮,群集列舉如下:

1.面向 Internet 的防火墻 NLB 群集
 2.Web NLB 群集
 3.搜索 NLB 群集
 4.內部防火墻 NLB 群集
 5.SQL Server 群集

每個群集都有一個可用性,p n 其中,0n <=1。 整個系統(tǒng)的可用性由以下的計算得到:

p1 X p2 X p3 X p4 X p5

群集內每個節(jié)點的可用性可以通過帶入以下三個數(shù)值的平均測量值得到。

    故障切換時間 是指從群集發(fā)現(xiàn)某一節(jié)點停止響應到將其從群集內刪除所花的時間。
    平均恢復時間(MTTR) 是指將該要素重新引入群集所花的平均時間。
    平均無故障時間(MTTF) 是難測量的一個指標。 故障可能會按照一定的頻率發(fā)生,不過也可能是隨機發(fā)生的。 為了進行討論,在計算過程中允許您在可用性計算時對 MTTF 進行變動。 之所以這么做是為了幫助您判斷要確保特定數(shù)量的九的可用性,您的部署必需要滿足或必需要超過的 MTTF 。 這是本文計算可用性的方法與其他方法的根本差別。

MSIB 項目組首先切斷活動-活動群集中來自服務器/節(jié)點的基本網(wǎng)絡連接,然后再重新啟用這些連接,通過這種方法測量了企業(yè)部署的恢復時間和故障切換時間。 對于活動——被動 SQL 群集,項目組從群集管理控制臺執(zhí)行了一個移動組命令。 如需了解關于如何測定恢復時間和故障切換時間的更多信息,參見“附件 C——Collecting Availability Data”。 請注意由 MSIB 項目組為本文所述測試部署的系統(tǒng)是按照 MSIB 2.0 隨帶的 MSIB 2.0 Deployment Guides 中所述的嚴格的設置和配置進行部署的。

ISA NLB 群集

ISA 網(wǎng)絡負載均衡(NLB)群集是一種雙節(jié)點的 NLB Web 服務器群集。 這一系統(tǒng)的可用性是根據(jù)服務器群集可用性的馬爾可夫模型(MMASC)計算的。 這一實例是根據(jù) Microsoft Technical Report 中的Markov Model of Availability for Server Clusters 中的數(shù)學模型給出的,地址在 http://go.microsoft.com/fwlink/?LinkId=15127對這一群集來說,MSIB 項目組發(fā)現(xiàn)其平均故障切換時間為 3 分鐘,MTTR 時間為 9 分鐘 56 秒。

上一頁12345678910111213下一頁
軟件測試工具 | 聯(lián)系我們 | 投訴建議 | 誠聘英才 | 申請使用列表 | 網(wǎng)站地圖
滬ICP備07036474 2003-2017 版權所有 上海澤眾軟件科技有限公司 Shanghai ZeZhong Software Co.,Ltd