UNIXとWindowsの管理上の違い

UNIX(SolarisやLinux等)系とWindowsの管理上の違いの話です。今更のメモですが、復習がてら記録しておきます。

Windowsの場合

 とにかく再起動がよくある。これはOS設計上もそうで、IIS+ASPまわりなどはリソースを食いまくるそうで、再起動すればさっくり直るというのがよくあるそうです。

 これは知人との雑談でもありましたから、やはり普通によくあるのでしょう。再起動しリフレッシュして様子見、うん。ありがち。

 とにかく何でも再起動しがちですが、しかし「再起動で直らない事」にも注意すべし。後述のUNIXの話が関係する事もあるかもしれない。

UNIXの場合

再起動するケース

 UNIX系では「とにかく止めない」事が中心にあります。セキュリティアップデートしても該当サービスを再起動するだけでOKで、システム自体をリブートする事は特殊な場合に限られます。私の経験上は以下の場合です。

ハードウェア異常が原因かもしれない時
ボロいシステムでたまにあります。これは一度電源まで停止し、そして数秒待ってコールド・スタートすると完結する事があります。強いと言われるUNIX系ですが、ハードウェア障害には結構弱いというのが個人的な印象です。やはりそこはx86か。Solarisだってx86はダメで、本当に強靭なのはSPARCという印象です。これは実際私だけの話ではなく、以前UNIX USER誌で類似の発言を見たことがあります。x86が次々落ちるような過酷な環境でもSPARCは踏ん張っている事が多いと。…まぁ最近のものはわかりませんが、少なくとも数年前までのものはそうでした。
大規模なセキュリティアップデートの際
別にlibcを更新しようとシステム自体の再起動はしなくていいものです。だけど「そろそろ時期だしやっとこうか」と再起動に踏み切る事も多い。ノントラブルだと年単位でも放置されがちなUNIXなので、むしろこうした時は積極的に再起動するのもアリと思います。
カーネルを交換したい時
Linuxはモノリシック構造のOSなので、こればっかりは必須と考えています。
大量のゾンビ
再起動のみではリソースの開放しかできず、大抵の場合原因究明はその後です。でも状況により、まず再起動を。

再起動しないケース

 UNIXの不調の大部分はハードウェア・リソース・入出力の異常。これらは原因次第なので忘れないようチェックしよう。

 I/Oならば該当機器を交換する。特定区画ならば、なんとかその区画を切り離せばOKのことも。しかしHDDならばそれは急場でしかないので、早めに交換すべきだ。

 自動的にftpなどをするものが「たまに停止」するのなら、ネットワークの異常か通信障害がどこかで起きている。相手側の逆引きとか、意外なところでひっかかる事も。

 内部の部門サーバ等は軽いからと堅実で遅めのものも使いますが、muninなどの最近の監視システムを使うと結構負荷がかかるようです。要注意ですね。

 例外もあります。たとえばDBのプロセスが大量に残っているケースがあり、誰かのSQLアタックかと思いましたが、DB屋さん・システム屋さんのSQL書法の問題だった事がありました。