夏本番のコンピュータシステムの停電対策を考えよう

まだ冬場は電気以外にも灯油、ガスなどの暖房対策が取れます。しかし、夏場の冷房は電気を使わざるを得ません。今現在の東日本の状況を考えると、夏場の電力不足は不可避です。

ということで、考えられる電力不足に伴う停電対策を考えて見ましょう。

-マメな保存を-

これは、システム管理者ができることではありません。ユーザに注意喚起が必要だということです。ノートPCを使っていれば、いきなり電源がシャットダウンしても業務は継続できそうですが、途中にあるHUBや無線アクセスポイントが停電で使えなければ意味がありません。これから暑い季節にやって来るのは計画停電ではありません。2003年の夏に北米東部が連鎖的に大停電に襲われたような、いきなりの東京電源シャットダウンなのです。

とにかく、マメな保存を。これをユーザに呼びかけることが一番重要です。

また、最近のコピーやプリンタ類はスタンバイで電源は食わないのですが、起動時に初期チェックで電源を食うことがあります。帰宅する時「コンセント抜いとけ」という協力をお願いしておくべきでしょう。

-UPSの設定-

仮想ホストマシン、スイッチ、ルータなどにはUPSから電源供給されていることが多いと思います。ルータやスイッチはいきなり電源断されてもそれほどダメージはありませんが、仮想ホストマシンの電源断はダメージを与えることがあります。また、数十秒で復電してしまうと、その状態でシャットダウンを開始してしまってはいけません。やはり3~5分待って、シャットダウンを開始するように設定すべきでしょう。特に仮想ホストではなるべく遮断に恐ろしく時間がかかる Windows のドメインコントローラなどを動作しているサーバを速めに遮断すべきでしょう。

復電した場合もいきなり電源が投入されないように十分充電されてから電源供給されるように設定すべきでしょう。

他にもエアコンや照明などの補機類が稼動しますから、起動にビル全体の必要な電圧が一時的に下がってしまいます。
apcupsd では、ケーブル以外の設定はほとんどデフォルトで十分だと思いますが、商用電源が遮断されたときの delay タイムや充電率が70% 以上になったら復電できるように設定されているか確認してください。これで商用電源が安定してからシステムを起動タイミングをずらします。

APCUPSD User Manual

また、UPSをネットワーク接続して制御している場合、HUBが先にシャットダウンすると正常にシャットダウンできません。この辺の接続は工夫が必要なので、シリアル接続しか信頼していないお客様もいらしゃいます。

-BIOSの設定-

ハイエンドサーバでは、電源復旧の設定を行えるものがあります。Dell の iDRAC や HP のiLO などで確認できる場合があります。デフォルトでは手動でスイッチを押さないとパワーオンにならないものがありますが、やぱり夜中に停電して、始業時にサーバが動いていないのは嫌なものです。
また、UPSが復電して、いきなりサーバ全てが電源投入されるとUPSに一度に負荷がかかるため、パワーオン後の Delay 時間を設定できるサーバもありますので、できるだけランダムなタイミングで起動できるように設定しておくのが良いでしょう。
また、ストレージ機器ではそれぞれのディスクのスピンアップのタイミングを調整できるものがあります。一度に全てのディスクが回り始めると電源ユニットに負荷がかかってしまいます。

これらの遅延設定は普段は起動に時間がかかるため嫌なものですが、無駄な機器の故障でトラブルくらいなら、遅延設定をしておくことは重要です。


-XEN VMの設定-

デフォルトでは
on_poweroff="destroy"
on_reboot="restart"
on_crash="destroy"

となっていますが、次の行を書き加えます。デフォルトでは save するようですが、時々おかしな挙動をすることもあるので、xend が終了するタイミングで仮想マシンもシャットダウンしてしまったほうがよいと思います。

on_xend_stop="shutdown"

How to configure Xen DomU's to shutdown when Dom0 is stopped

夏本番のコンピュータシステムの停電対策を考えよう_a0056607_1574060.gif

再起動してみると、正しくシャットダウンしているようです。

ただし、Windows を仮想化している場合は必ず Novell SUSE 用 VMDP ドライバを導入しておいてください。 VMDP ドライバがインストールされた仮想マシンは xm shutdown で安全に遮断することが出来ます。


仮想マシンはホストが起動した後 /etc/xen/auto に記述された VM ファイルに従って起動します。優先順位を考慮して、シンボリックリンクを作成します。リンクファイルの先頭に起動順序を指定しておくと良いようです。


dom0:/etc/xen/auto # ls -al
total 0
drwxr-xr-x 2 root root 80 Feb 21 00:34 .
drwx------ 7 root root 432 Sep 15 2010 ..
lrwxrwxrwx 1 root root 13 Feb 3 12:25 01winPDC -> ../vm/winPDC
lrwxrwxrwx 1 root root 13 Feb 3 12:25 02oes2lx1 -> ../vm/oes2lx1

たとえば、起動に時間がかかるドメインコントローラやディレクトリサーバ、あるいはネットワークの基幹となる dns/dhcp などを優先して起動し、ファイルサーバやプリントサーバ、アプリケーションサーバなどは後から起動するようにスケジュールします。このあたりも、UPSやBIOSとの絡みがあるので仮想マシンの配置と合わせて検討しておく必要があります。

-起動後のチェック-

起動後は、eDirecrory 同期や時刻同期を確認します。eDirectory ではそれほど問題がないのですが、 Windows の DC などは時刻同期が取れていないと致命的にトラブルを起こします。NTP デーモンのログや w32time の異常がないかをチェックします。

また、バックアップも確認します。おそらくバックアップ中の停電ではクラッシュしていることが多いでしょう。バックアップソフトによっては、シャットダウンを受け付けない場合もあります。いったんジョブを捨てて、システムを停止させて、テープをイジェクトして、テープ、オートローダーをリブートします。オートローダーが安定したら、バックアップサーバを起動して、スケジュールされたバックアップをロードしなおします。

-忘れがちな冷房装置-

冷房装置が壊れたため、コンピュータルームのサーバ類が全滅したというケースがあります。一般にはサーバの動作保証温度は摂氏35度程度までとされていますが、大体お客様の冷房設定は25度とされているところが多い様です。あまり注目されていませんが、PUEの値は大体2.0程度で、1。5クラスになると相当優秀です。さくらインターネットの石狩データセンターはPUE1。1をめざしているそうです。

まず、コンピュータを動かすための電力の半分から1/3は冷房なのですね。

コンピュータを冷やすために扇風機を緊急で用意するのも手段なのですが、室温が35度を越えている場合、コンピュータそのものが35度以下に冷えることはあり得ません。CPU周囲の温度が60度を越えると大抵のシステムはシャットダウンを開始するか、いきなりハングアップします。最悪の場合、コンデンサが割れたり火を吹きます。

もし復電した場合、まず、冷却装置が正常に動作してから、コンピュータシステムが起動を開始するようにスケジュールすることが重要です。冷房電源とコンピュータ電源がどのようにビルから配電されているかを確認しておくことをお勧めします。

サーバ室はデータセンターでもない限り、室温のばらつきがあるので、決して扇風機という原始的な方法が無駄だとは思いません。大抵のコンピュータシステムは裏面に排気するので、排気熱を上に逃して冷たい空気を正面から吸気できるよう、室温の調整ができることが良い様です。

-Keyword-

Novell SUSE Linux SLES XEN プライベートクラウド

islandcenter.jp
by islandcenter | 2011-04-09 02:53 | プライベートクラウド | Comments(0)