|
論壇說明 |
歡迎您來到『史萊姆論壇』 ^___^ 您目前正以訪客的身份瀏覽本論壇,訪客所擁有的權限將受到限制,您可以瀏覽本論壇大部份的版區與文章,但您將無法參與任何討論或是使用私人訊息與其他會員交流。若您希望擁有完整的使用權限,請註冊成為我們的一份子,註冊的程序十分簡單、快速,而且最重要的是--註冊是完全免費的! 請點擊這裡:『註冊成為我們的一份子!』 |
|
主題工具 | 顯示模式 |
2004-10-15, 07:52 PM | #1 |
註冊會員
|
醫生就在你心裡
醫生就在你心裡
在 Sun Solaris 10 作業系統中「預測式自我修復」技術首次嶄露頭角,大幅減少停機時間與管理的複雜度。 2004 年 9 月 7 日:如同我們身體的健康一樣,網路問題的最佳處方,就是預防醫學。這表示必須隨時得密切注意企業資訊系統的狀態,並且在輕微問題剛剛出現之初隨即能夠予以排除,而不致累積釀成重大危機。不過,傳統上只有複雜而昂貴的額外選購軟體,才具備系統監控與反應的功能。 在 Solaris 10 作業系統 (Solaris OS) 中,Sun 在其核心中加入一個系統「醫生」:預測式自我修復 (Predictive Self-Healing, PSH) 技術。此項創新特色,是 Sun 整個 PSH 架構中的第一個元件。 Solaris 10 OS 中的 PSH 特色,可確實降低風險並增加可用性。PSH 功能可讓 Sun 的系統精準地事先預測出元件的可能錯誤狀況,並進而在系統全面遭逢浩劫前將問題予以緩解,讓您的系統從被迫停機的噩運中能夠全身而退,並能針對系統錯誤予以修復。 連接 Sun.com,一窺 Solaris 10 完整面貌 領先業界、即將發行的 UNIX 平台 -- Solaris 10 OS,整合了威力強大的新功能,能夠締造出整體效能、可用性、以及安全性的極致表現。除了本文所介紹的預測式自我修復功能以外,Solaris 10 還含括了下列革命性的新技術: N1 Grid Containers (N1 網格容器) 技術對於系統的虛擬化而言,它可提供突破性的方法,讓每一個單一建置例項上可支援超過 8,000 個軟體分割區,大幅提昇硬體資源的利用率。 DTrace 是一個全面型的動態追蹤架構,讓所有管理人員、開發人員、以及服務人員能夠簡潔有力地應付來自作業系統、以及使用者程式所可能製造出來、各種捉摸不定的疑難雜症。 Project Janus 是 Solaris 10 的新技術之一,它可以讓您創造出一個能夠以接近原生速度執行多種 Linux 應用程式的環境。 透過 PSH 的功能,您將能夠: 在面對系統錯誤的威脅下將系統與軟體的可用性予以最大化 降低系統維修的複雜度 減少運作成本進而節省時間與金錢 PSH 技術具備可擴充性、可延伸性、以及可攜帶性;且 Sun 將會把此項技術結合到產品之中,以提供一個共通的服務與管理經驗。 「藉由預測式自我修復技術,每一個應用程式、子系統、以及硬體元件,都能整合成一個整體架構,不僅可診斷出錯誤的存在,還能立即採取維持系統可用性的必要措施。」Sun 的 Solaris Kernel 開發小組資深工程師、也是 PSH 技術主要創始人的 Mike Shapiro 做了以上說明。 Solaris 10 作業系統中的預測式自我修復特色 Sun 公司上下所全力推動的自我修復系統,在 Solaris 10 OS 中呈現為兩個主要的元件:Solaris Fault Manager 以及 Solaris Service Manager 軟體。此次推出的第一版 PSH 功能,除了有自動重新啟動應用程式服務的功能,還針對 CPU、記憶體、以及 I/O 匯流排結合元件,實作了預測式自我修復功能。 Solaris 10 OS 的 PSH 特色擁有下列諸多優勢: 透過預測式的診斷與錯誤元件的隔離,進而改善系統與服務的可用性。 在毫秒的時間內即可完成對於軟、硬體元件的自動診斷與重新啟動功能。 簡化的服務管理。 快速而簡易的問題排除,還包括知識庫文章的連結。 對於新出現問題的調適非常快,而且可以在不需停機的狀態下立即完成更新。 事實上,PSH 的功能因為頗具價值,所以 Sun 在創造 Solaris 10 OS 本身的過程便非常廣泛地加以使用,以使開發過程更加順利。 「PSH 在 Solaris Kernel 開發小組的入口機器上偵測到某個故障的 CPU,而該機器是 Solaris OS 程式碼的主要儲存所在。」Shapiro 解釋道,「PSH 馬上將該 CPU 強迫離線,讓它沒有機會因為功能失常而造成伺服器的當機-甚至造成其他 Solaris 10 OS 功能開發工作的延誤。」 Solaris Fault Manager 軟體 如果自我修復系統偵測到某個問題,它便會動態地在造成系統錯誤之前,將 CPU、I/O 設備及 (或) 記憶體區域予以強迫離線。在 Solaris 10 OS 中,Solaris Fault Manager (錯誤管理員) 軟體可將有問題的元件予以隔離並停止其功能,協助您在完全沒有知覺到任何潛在問題的狀況下,確保服務的不中斷。 Solaris Fault Manager 軟體只需要幾秒的時間即可自動偵測出問題,而非透過一流的 IT 人員花上好幾天的時間來處理問題。如果軟體發生錯誤、硬體元件故障、甚至是軟體的組態設定錯誤時,重大的應用程式與基本的系統服務仍然可以不受中斷地持續運行。而且整個系統是開放的,讓管理人員和現場人員都能夠觀察到這個診斷系統的活動。 搭配 PSH 技術的系統會發出容易解讀得診斷訊息,它會連結到 Sun 知識庫中的文章,裡頭會清楚地指導管理人員如何採取必要人為介入。因此,從自動診斷開始,一直到人為介入為止,整個程序所花費的時間比以往大大地減少了許多。 Solaris Service Manager 軟體 Solaris Service Manager (服務管理員) 軟體是 Solaris 10 OS 中 PSH 技術的另外一半。它會將應用程式的服務變成頭等物件,方便管理人員能夠以統一的方式來進行觀察與管理,並且具備了自動重新啟用與管理服務的功能。 如果某些服務不小心被管理人員所終止、或是因為某個軟體程式錯誤而遭到中止、或者只是很無辜地受到基礎硬體設備問題的牽累,Solaris Service Manager 軟體都能夠重新啟用該服務。 此外,Solaris Service Manager 軟體對於共同的管理任務,可以發揮簡單化與安全化的效果,就像是將服務停用或是變更屬性一樣地簡單。Solaris Service Manager 軟體同時也可以根據服務之間的依存關係,以平行方式來啟用服務,進而加快系統開機的速度。而「復原」的功能則提供了簡易的變更還原能力,輕鬆免除人為失誤可能造成的麻煩。 Solaris Service Manager 軟體針對傳統的 Solaris OS 服務,在不需要任何異動的前提下即能提供觀察能力 (observability) 與錯誤隔離功能。開發人員只要在他們的軟體中加入一個簡單的 XML 檔案,便可以讓大部分既有應用程式能夠利用 Solaris Service Manager 軟體的完整功能。 建立更好的反饋機制 當客戶搭配 PSH 技術的網路在收集有關系統問題的資訊時,存在於 Sun 與這些客戶之間的強大反饋機制也隨著快速成長,進而促使持續不斷的改良與精進。 「整個大概念就是,PSH 的功能可以協助 Sun 提供一個量化的方式來檢視企業系統的可用性,如此可進一步促使做出更能掌握狀況的採購決策。」Shapiro 這樣表示。「PSH 技術讓我們在與客戶互動並提供服務的過程中,變得更具先發性 (proactive) 與預測能力 (predictive)。」 PSH 技術的下一步? PSH 技術為 Solaris 10 OS 系統帶來了令人稱奇的、具備更高可用性的新技術。Solaris 10 OS 中的另一個主要元件:ZFS,同樣也涵蓋了自動修復的功能。請造訪 sun.com 參閱 9 月 14 日的專題報導,其中有關於 ZFS 完整功能介紹;它是一個垂直整合的儲存系統,可提供端對端的資料完整性、非常大 (128 位元) 的容量、以及極為簡易的管理動作。 如果要為企業達成更高的可用性,您也可以透過 Sun Cluster (叢集) 軟體,為部署在 Solaris OS 系統上的服務,新增冗餘且跨機器之當機接手 (fail-over) 功能。與 Solaris 10 OS 內 PSH 功能運作極為相似的 Sun Cluster,與受到監控的元件之間可以非常和諧地共處,進而能夠憑藉著與硬體之間的緊密整合,進一步提升可用性。 現在就來試試預測式自我修復技術 您只要到 Software Express for Solaris 10 OS release,即可下載 Solaris Fault Manager 軟體、以及 CPU、記憶體、與針對 UltraSPARC 處理器系統的 I/O 支援。Sun 預計在下一次的發行 Solaris OS 的 Software Express 當中會同時發行 Solaris Service Manager 軟體元件。您也可以加入有關 PSH 技術的討論群組,內容也包括了 Solaris Fault Manager 軟體。 對於 PSH 架構而言,Solaris 10 OS 只是一個開端。未來持續的更新,除了會加入針對其他系統元件的自我修復功能,也會針對 AMD Opteron 的 x86 系統繼續將類似的硬體診斷功能予以涵蓋進來。至於 PSH 架構,則設計為針對升級並允許在加入新的診斷功能時,完全不會造成系統的停機。 「Solaris 10 OS 中的預測式自我修復功能只是邁向未來的第一步。」Shapiro 最後指出,「我們正在做的,就是從最底層的硬體軟體堆疊開始往上,逐步地將自我修復技術建構到我們的系統之中。最後的結果,將會是一個具備可擴充性而且非常有效率的架構,並且能夠非常快速地診斷出問題的發生並立刻做出調適動作,同時並將問題予以隔離,完全不會導致系統停機的現象。」 |
送花文章: 107,
|