orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

何もしていないのにお金がもらえていいねえ、と言われるシステム運用の現場

 

実際に言われたこともある。システム運用で、障害も起こさず安定運用していると、まるで何もしていないのに保守料金でお金をもらえているような絵に見える。

しかし、何も起こさないために現場は汗を流している。具体的には何をやっているかをまとめてみる。

 

日々のアラート確認

システムには必ず監視システムを仕込む。問題が起こったり、問題が起こりそうなときはアラートを出すようにしている。しかし、アラートを人間が無視していたら意味はなくなる。

アラートが必要な不可欠なものだけならいいが、無視していいものも混ざっているので、1つ1つ丁寧に見て行かなければいけない。文脈によって同じアラートでも意味が違ってくる場合もあり、判断もある程度スキルが要求される。

障害ではないものの、対応しておかないと将来的にまずいことが起きるアラートもあり、予兆監視と呼ばれる。予兆監視をきちんとやっているシステムは、障害に強い。

 

権限の管理

システムを使うユーザーや管理者、担当者は、日々の人事異動で揺れ動くので、その度に適切なユーザー登録/削除や、権限変更を行わなければいけない。

権限の管理を怠ると、まるで穴になり、そこから重要な情報が漏れたり、重要な情報が消失するなど、恐ろしいことが起こるきっかけとなる。

いくらデジタルであっても、人の管理はアナログにならざるを得ず、定期的に情報が正しいか、棚卸作業をすることも欠かせない。

 

システム構成情報の保管

システムはそこにあるから、システムのことを知りたければログインして直接設定を見ればいいと思うかもしれない。しかし、例えばシステムが不意に停止したらどうか。設定が見れない。どこかにシステム構成情報を保管していないとわからなくなる。

また、情報を見るためにいちいちログインしていたら、情報採取の際に謝ってシステムを傷つけてしまうかもしれない。

ドキュメント化しておき、ログインしなくても情報が見られることはシステムを守る上で非常に大事である。

 

課題管理、および履歴管理

課題のないシステムがあれば優秀だが、システム利用の状況も日々変わりそれに合わせて対応していかなければいけない。生き物のようなものだ。したがって、どんな課題があり優先順位をつけ、期限を管理し完了したら消していく、いわゆる課題管理はシステムにおいて重要となる。

また、完了したからと言って消していたら、再度同じような課題が生まれた時に「昔同じような変更をしたよな・・」と思い出したりできなくなる。理想は、知識が積み重なり生産性を上げていくシステム運用で、毎回記憶喪失になっていたら、同じ問題を何度も起こしてしまうことになりかねない。

また、システム管理を行う担当者も変わっていくので、人の入れ替わりにも対応できるよう、履歴管理は重要である。

 

システム関係者のコミュニケーション

システムにおいて、管理する人。利用する人。いわゆる関係者がいるが、これらの人々が定期的に会合し、会話をしておくのは良い事だ。何かあった時に協力し合わないといけないのに、誰が誰かわからないようでは心もとない。

大昔は、わざわざユーザーまでベンダーが定期的に出向いて、ご挨拶していたものだが、最近はWeb会議が発達し、簡単に会議ができるようになった。

アナログな話だが、結局のところシステムを保つのは人間の気持ちによる部分が大きい。誰ががんばっているか、人間は人間を見て判断するところがあり、それは昔から変わらない。

 

システム担当者のスキル維持

そして、最後に書くのは、システム担当者がそのシステムにまつわる要素技術についてスキルを維持することだ。何も起きないと何も触らない。触らないとスキルは忘れていく。それでは安定と共にシステム担当者は忘却していく一方となる。

お金をかけて外部研修に行かせたり、資格を取得させたりと、システムに何も起きず安定していて、時間が生まれるからこそその時間を使ってスキル維持に励ませることは重要であると思う。

 

**

 

いくつか思い当たることを書いてみた。システムが安定している=何もしない=楽してお金を儲ける、ではない。だから、何も知らない人から、何もしていないのにお金がもらえるなんて言われると、とんでもない・・と思うが、いちいち反論するのも面倒なので、はいはい、と聞き流している次第である。

ま、そこにお金を出し渋る人は、痛い目に遭えばいいと思うし、日々痛い目に合っているシステムが報道されるたびに、あーあ、と思う次第だ。