orangeitems’s diary

クラウド専任の40代インフラエンジニアが書くブログ。新規事業マネージャー。20世紀末の就職氷河期スタート時にIT業界に文系未経験で入りこみそのまま生き残った人。

障害報告書作成がなぜ意味を無くしているか 止まらない障害の理由

 

障害報告書を一生懸命書いて残業している方々を見ているんだけど。障害を起こした人が報告書を作成し、それを上司が確認し、突き返したりして、延々と時間を重ねている。

皆真剣で、仕事している感は出るんだけど、さて、そのできた報告書って誰が読むんだろう。往々にして、上司の上司は一回読んで終わりでその後は誰も読まない。むしろ頑張って作らせることで、障害を起こした責任を痛感させ、再度起こさないように意識づける効果を狙っているのかもしれない。

ただ・・。やはり繰り返し起こるものは起こる。しかも、簡単に。あんなに詰めて詰めて大変な思いをしたのにまた起こる。しかも、だいたいは「簡単な作業」で起こる。簡単なだけに、上司やその上からすると「なんでまた反省もせず繰り返すんだ」となる。また報告書作成プロセスがリスタートするのだがいつまでやるのだろう。

この話のポイントは、人間が起こすミスの大部分が下記2つにあるということに集約される。

①ケアレスミス

②無知による作業誤り

このうち②については障害報告を書くことで学習が促進されるので意味があるのだが、残念なことにだいたいは仕組みとして新しくなるので、二度と起きない可能性が高い。なのに改めて障害報告書を書くのは当事者にとって二度手間なのである。

それより①のケアレスミスである。これは、私でもしょっちゅうある。すぐに修正できるものならいいが、たまに手戻りできない場面もある。したがって、ケアレスミスしてはいけないような重要な作業の場合は、過度に集中したり複数名体制で作業に臨むのだが、何が重要で何が重要でないかは、経験がなければないほどわからない。

だから、最悪のケースとして、ケアレスミスを誰にでもさせないために、やたら作業ルールが慎重になりすぎる。なんでもかんでも厳しくする。そのおかげで、1行コマンドを打って情報を取得するだけの手順をやるために、数日の手続きが必要になる現場すらある。それによってミスは減るかもしれないが、生鮮性がぐっと落ちる。「ls -l」とやるだけなのにいくらコストをかけてるんだという話もリアルだ。

ケアレスミスに対する障害報告書書きも、禅問答みたいな話になる。当日体調が悪いとか、プライベートで気になることがあったとか、おしゃべりしてたとか、週末のデートのことを考えていたとか、お風呂が壊れて今日どうしようとか、まあ色々であるが、そんなことを報告書に書くか。

最近思うのは、ケアレスミスを起こすことは防げないこと。しかし、ケアレスミスを起こすかもしれない人間が作業に臨むにあたり、どれぐらいの慎重さを持つべきかについて、有識者が判断する必要があるのではないかということだ。この作業は危険度S/A/B/Cくらいのランクを付け、Sランクについては有識者が立ち会う。Aランクは有識者レビュー必須。Bランクは作業者二人必須、Cランクは一人。みたいなランク付けをして、以下に重要な作業に重要な視点をつけるかが大事になってくる。全部の仕事に、すべてのリソースを振り向けることにより、リソースは枯渇し、長時間残業が当たり前になったり、そのために集中力がなくなってまた、ミスが起こるのである。

もっと言えば、障害報告書を当事者がいくら精緻に作ったところで、全体の仕組みを変える人物が対策に寄与しなければ、「作業者本人が無知だ」「作業者本人がケアレスミスをしない超人になる」「全部厳しくしたほうがいい」くらいの話にしかならないし、そうにしかならない報告書もたくさん見た。

世の中にある社外向けの障害報告書も「再発しないように十分気を付けます」しか最近は書いてないし。世の中から障害はなくならないのも当然だ。無知やミスが起こることを前提として、重要な作業を選別しいかに無知やミスを排除するか。この観点こそ重要だ。