2008年4月26日 星期六

HA(High Availability),高可用性

HA(High Availability),高可用性,是指針對軟硬體所可能產生的錯誤發生時,仍能維持正常運作的方式。使用HA的好處是可避免長時間之硬體維修或系統 重設,以快速回復生產,減少損失。而其運作之方式為在錯誤發生時,HA會自動接管資源(Disk、IP Address) ,並且啟動Application。一般而言,HA是錯誤發生時,維持正常運作最直接且最簡單的方式。

至於一般常見使用HA來避免的系統錯誤,有Nodes、Applications、Networks and Network-Adapters以及Disks and Disk-Adapters四種。
簡述如下:

1.Nodes
Nodes所發生錯誤時所產生的Take Over動作可分為Disk與IP兩部分。當系統所使用的是同步存取(Concurrent Access)的方式時,發生錯誤時並不需要Disk Take Over,因為另一個系統持續使用原有的Disk,沒有Take Over的必要。若是使用的是非同步存取(Non-concurrent Access)的方式時,則當發生錯誤時,因為接替的系統並未控制原有的Disk,因此就必須使用到Disk Take Over。
至於IP的Take Over,原有的Node A透過網路卡提供Service A,另外一片網路卡則Standby,標示為Standby A。Node B透過網路卡提供Service B,另外一片網路卡也Standby,標示為Standby B。Client A分別對Node A、B提出Service A、B的請求,Client B亦如是。當Node A發生故障時,Node B的Standby B就會Take Over原有的Service A所使用的IP,繼續提供Service A。此時Client A、B可以繼續提出請求,不會因為發生Take Over而有所不同。當然,如果是由Node B發生故障,則會由Standby A來Take Over Service B之IP,繼續提供Service B。此時Client A、B也可以繼續提出請求,不會因為發生Take Over而有所不同。
2.Applications
相同的道理,Applications的部分也如同上述。當某一主機中的應用程式出錯時,可由另一個主機中的應用程式Take Over。在使用Applications的Take Over的同時,經常搭配使用IP Take Over,因為許多Application經常在使用時候必須設定IP。另外也經常搭配監控軟體使用,使得在應用程式發生錯誤之前,就可以事先啟動 Standby的Applications,將中斷時間減到最小。
3.Networks and Network-Adapters
Network-Adapters的Take Over就是上述Nodes上的IP Take Over,因為Network-Adapters同時身為Node與Network的一部份。當Networks發生錯誤時,可以可以在其他網路通路上以 Re-routing之方式重新連接網路。規劃Network的可用性時,必須考慮避免Node Isolation和Cluster partitioned發生,Node Isolation會造成Take Over無法運作。而Cluster Partitioned則會導致節點誤判必須Take Over,造成更大的錯誤。通常可以使用Serial Network或是使用Global Network來避免Cluster Partitioned。下圖表示Cluster Partitioned的形成與Serial Network

4.Disks and Disk-Adapters
Disk and Disk-Adapters的可用性問題,往往是由Disk Subsystem來擔任,使用雙通道來避免單一通道發生故障時,仍然有另一通道可以傳遞資料。另外提供重新架構的功能,當Disk Subsystem中有Disk發生故障時,可以熱抽拔,自動重新架構,無須手動或關機設定。詳細內容請相關技術文件

沒有留言:

張貼留言