トップページ > スタッフノート

2010年08月14日

自社サーバ運用のプランニング(止めないサービスを目指して)

前回、「自社サーバの必要条件」でまとめたように、実際にサーバ管理を自社で運用すると多々課題に直面します。

大きな問題としては以下が挙げられます。

1.電源の問題。 2.OS、ソフトのバージョン管理。 3.ヒューマンエラー。


これらの問題を解決し、「止めないサーバ」を実現するため、自社サーバ・NW機器を新規で入れ替ええることとなりました。


止めないサーバのためのシステム構成

○シングルポイントを排除する。
 電源・回線・NW機器・サーバ全てを2重化または多重化する必要があります。


○消費電力は10KVA以内で。
 電源トラブル時に8時間稼働可能な発電機はとても重宝していますが、発電容量が10kVAまという縛りがあります。全ての機器+空調を併せて10KVA以内の消費電力で運用しなくてはなりません。ここ数年サーバが安価になったこともあり、年々購入台数が増加傾向にあります。このままの増加ペースでは近い将来、消費電力が10KVAをオーバーし、サーバを増設できない事態となります。省電力サーバという選択肢もありますが、劇的な効果は期待できないと思います。


○サーバ環境の統一。
 サーバ環境を統一し、自社開発したコンテンツの動作確認を一元的に行えるようにします。サーバ環境の統一とは、ハードウェア・OS・ミドルウェアのバージョンを揃えることです。環境を統一することで人為的ミスを抑止します。


以上を踏まえ、機器選定をし考案したシステム構成は下記となります。


server01.gif

「ISPの2重化」
東北電力系とNTT系の光回線を利用してインタネットプロバイダを2重化。どちらか一方のキャリアで障害が発生してもサーバが通信を継続できる。インタネット接続用のルータも当然キャリア毎に準備します。


「ロードバランサ設置」
回線を2重化するためと、サーバの負荷分散を行うためロードバランサ装置を設置します。今回選定したロードバランサDNSを利用した仕組みで冗長性と負荷分散機能を提供します。また、ロードバランサ装置自体の故障も考慮しActive-Standby構成でもう一台ロードバランサを準備します。HA(High-Availability)構成としました。


「スイッチイング経路の多重化」
スイッチ経路を敢えてループ構成(通常なら輻輳。)にして、STP(スパニングツリープロトコル)を有効にします。万が一、ケーブルやポート障害または、スイッチ故障が発生しても多重化された経路から、別経路を自動的に学習して通信を再開する仕組みです。

◎「ブレードサーバと仮想化システムの導入」
消費電力を10KVA以内で多数のサーバを運用するため、ブレードサーバと仮想化システムを組み合わせて運用することとなりました。


「電源モジュールの共通化」
ブレードサーバはエンクロージャという入れ物となる部分に電源モジュールが設置され、そこでAC/DC変換を行い、各ブレードサーバへ電力供給されます。各サーバの電源でAC/DC変換を行うよりも効率的なため変換ロスを減らし、消費電力を抑制できます。


「サーバの仮想化」
また、仮想化システムと合わせて利用することで、「サーバの台数増加は消費電力の増加」という現状から回避することができます。仮想化システムを利用して、1台の物理サーバで仮想サーバを10台動作させます。ですから、今まで10台分サーバで消費していた消費電力が、1台分のサーバ消費電力しか消費しなくなるのです(単純に10分の1にはなりませんが。)これは大きな効果が期待できます。


「ハードウェア環境の統一によるメリット」
その他、ブレードサーバになることで、サーバのハードウェア環境が統一されます。ハードウェアに対する保守業務・保守部品が統一されることで、作業が簡素化され、単純なヒューマンエラーを減らせます。


「仮想化による恩恵」
また、仮想化システムの基盤となるVmware上で動作する仮想サーバはハードウェアを仮想デバイスとして認識します。「仮想サーバ」−「仮想レイヤ」−「物理サーバ」というレイヤードとなり、「仮想サーバ」の管理を「物理サーバ」から切り離して行えるようになります。動作している「物理サーバ」が変わったとしても常に同一の仮想環境を得られる仕組みとなっています。数年後サーバをリプレイスするときにVmwareが動作する機器ならば異なる機器でも同一の仮想環境で運用できることとなり、サーバ移行のための、動作検証の手間を多く省けるメリットがあります。フリーOSを多く利用している弊社としては非常に有効です。各サーバメーカでフリーOSの動作検証はほとんど実施していないため購入して自社でテストするまでOSが動作するかわからないのが現状です。失敗することも少々あります。Vmwareが動作さえすれば、全ての仮想OSが現状通り動作するとなれば、サーバ選定で迷うことはなくなりますね。

今までの経験やノウハウを基に考案した、止めないサーバ構成について説明させて頂きました。次回はサーバ仮想環境の設計について説明したいと思います。


» 仮想環境の設計のポイント


○サーバ仮想化導入サービス