2011年4月24日 星期日

[新聞] Amazon機房停擺近一日

Amazon機房停擺近一日 Foursquare等網站遭殃

文/沈經 2011-04-22

Amazon在美國多處有機房以支撐整個雲端服務,照理說僅一處機房故障時,會將工作移轉到其他正常運作的機房。Amazon也因此才敢號稱服務等級為99.95%。此次當機Amazon一方面將必須賠償客戶,亦打擊客戶對其雲端網站服務的信心。

根據Amazon Web Service的服務狀態網頁顯示,美國地區的Amazon雲端服務多個機房服務中斷,影響美國地區數千個網站,包括多個著名網站如Foursquare、Formspring.me、Reddit.com、Netflix、Zynga等。歐洲及亞洲機房則未受影響。

據媒體指出,主要是停電導致此次災難。Amazon的服務狀態網頁顯示,北維吉尼亞的機房在凌晨一點開始出現狀況,連接彈性儲存區塊(EBS,Elastic Block Store)及EC2的錯誤及延遲增高。使用Amazon網站服務的客戶大都採用EBS儲存MySQL資料庫,而大部分的EBS均置於該機房。

隨後該機房一直設法恢復EBS服務,但因重新建立鏡射(Mirror)等各種因素,導致系統無法負荷。一直到八個小時後,EC2雲端服務才陸續得以連結EBS,其客戶網站也陸續開始運作。

Amazon在美國多處有機房以支撐整個雲端服務,照理說僅一處機房故障時,會將工作移轉到其他正常運作的機房。Amazon也因此才敢號稱服務等級為99.95%,這意味一年只會故障262.8分鐘,約4.38小時。

此次當機Amazon一方面將必須賠償客戶,亦打擊客戶對其雲端網站服務的信心。更有媒體與專家指出,這證明企業不能完全依賴雲端服務。(編譯/沈經)

新聞連結:http://www.ithome.com.tw/itadm/article.php?c=67196


前天看到這篇新聞,讓大家討論起雲端強調的可靠度、可用性與安全性的問題,企業能不能完全依賴雲端呢? 許多人根據這次事情抱著不看好雲端的想法。

不過以Amazon如此規模的系統都發生這麼嚴重的事情,更何況是企業內部機房建置的系統,沒這麼多錢、也沒辦法與短時間解決突然其來的風險,還要自行吸收這些錢,充其量就是fire掉IT人員,而交由Amazon至少還可以領到賠償金,也不用花心思去解決這些問題。