2011年4月25日月曜日

EC2のトラブル、もっと知りたい

 クラウドコンピューティングサービスの大御所、Aamazon EC2が複合的トラブルに見舞われている模様です。発生は21日だったようです(ITmedia:HootSuiteやFoursquareがダウン Amazon EC2にトラブルか)。ここで非常に興味深く思ったのが、記載されているHootSuiteやFoursquareなんていう、現代を代表するようなサービスがAmazon EC2上で動いていたんですねーってこと。しかも、なんらかの二重化対策はなしですか?これって、Amazon EC2とかMS Azureなんていうプラットフォームサービス、PaaSとかIaaSとかっていうサービスに依存しすぎだと思うんですけど、どうなんでしょうか。
そもそも論ですが、TwitterやFacebookに代表されるソーシャルネットワークサービスとそれに衛星的に連なっている多くのサービスっていうのは、ここ5年ぐらいで急激に成長した世界的な社会現象です。こういったサービスは、こちらもここ数年で急成長しているクラウド基盤を利用して相互に利益を享受しながら肥大化してきたようです。Twitterにおける一時期の毎晩のようなネットワーク遅延、略して“くじら現象”はそれを象徴していたように思います。要するに、サービスの内容に対しての社会の高い評価と利用の急増に反して、プラットフォームがそれに追いついていけていないということです。
サービスの肥大化に対してプラットフォームがそれに追いつけない問題は、クラウドと呼ばれるサービスを利用すれば解決されるわけではありませんが、さすがにAmazon EC2なんかは安心感があります。それは、日本のメーカー系、商社系や通信系のSIerが時代に取りこぼされないように急いで始めたけど実態が追いついていない「クラウド」を目の当たりにしてしまうと、やっぱり天下のAmazonは磐石だと思います。あくまで個人的な意見ですけど。
それでも今回のような問題が起こってしまっています。私は英語が読めませんので、日本語のソースをいくつか読んでみると、どうもネットワーク障害に起因してハードウェアのおせっかい機能が大量に発生してリソース不足に陥ったようですね(日経新聞:Amazon EC2の障害、外付けストレージの復旧が長引く←日経一番詳しい!)。おそらく巨大なシステム構成で運営されているAmazon EC2だと思うのですが、それぞれの機器は連なっていて独立させることが難解なほど肥大化しているんじゃないでしょうか。どんな構成なのか非常に興味あるところですが、全貌はどうやったって見えないんでしょうね。
23日時点のステータスでは、EC2とデータベースサービスのRDSが動いていないようです。個人的には、このステータス情報ページ見るだけでも、Amazonのサービス基盤に色々な思いを馳せてしまいます。

1 件のコメント:

  1. 詳細出ましたが、詳細すぎて何が何だか・・・
    http://www.atmarkit.co.jp/news/201104/30/aws.html

    返信削除