orangeitems’s diary

クラウドではたらくエンジニアの日々の感想です。

オペミスして落ち込んでいる運用担当者へ、あなたは悪くない

f:id:orangeitems:20181130224232j:plain

 

オペミス

IT業界の運用の世界において、手順書の読み飛ばしやホストの間違えなどで発生するヒューマンエラーで、作業を失敗するということがたまに発生することがあります。このような状況をオペミス(オペレーションミス)とも言います。自分が作業者だとして、もし失敗して、実際にシステムに問題が起こったり、重大障害につながったりするとかなり精神的に応えますよね。ああこの業界向いてないかも、とか、いろんな人に迷惑をかけてしまってつらい、とか。

では、そのオペミスをした運用担当者が悪くて責められるべきかといえば、これは絶対に違います。自分を責めないで頂きたい。たかが仕事ごときで心を痛めてはいけません。心の健康は仕事よりも大事です。オペミスが起こったことは非常に注目すべき事実ですが、当事者の心を責めても何も出てきません。

 

怒る運用マネージャーは、何もわかっちゃいない

オペミスをした担当者に、怒鳴る、怒りをぶつける、運用マネージャー。これは何の改善にもなりません。担当者で失敗したい人なんて誰一人いないのです。誰が失敗したくて失敗しているでしょう。失敗したくないのに失敗した状況で、その人にいくら怒っても何も前に進まないのです。

人間は必ずエラーをします。100回やって1回失敗する人もいれば、1000回やって1回失敗する人もいます。確率は人それぞれで異なりますが0回と言う人は存在しません。もし0回と言う人がいれば、運用設計を誤っています。必ず失敗するという前提で物事を考えないと失敗した時に大ごとになってしまいます。運用担当者は絶対に失敗するという前提で、失敗しても傷が浅くなるような運用設計こそ大事ですしその観点がないとは言わせません。

さて、人はエラーするという前提があるとして。運用部署の中で失敗をしない人は誰かわかりますでしょうか。なんと失敗しない人がいるのです。それは誰か。「作業をしない人」です。そう、作業を命じる運用マネージャーは決して作業を行って失敗しません。また作業の数が少ない人も失敗しにくいです。平たく言えば、作業する回数が多い人のほうが失敗をしやすいんです。したがって、失敗するということは単純に作業の数が多いということです。組織に貢献している人です!。本番作業は失敗しないために大変な精神力を使います。作業の数が多い人は組織において称えられるべきです。

その作業の多い担当者を、失敗を踏んだからと言って運用マネージャーが怒り、責め立てるのは、百害あって一利なしです。

大事なことですので繰り返します。運用マネージャが失敗した担当者を怒るのは愚の骨頂。そして担当者が自分を責めることもありません。何も悪くありません。

 

まずは、なぜ失敗が起きたかを考えること

一方で、失敗自体は、運用部署として注目すべきです。

なぜ失敗したのだろう。これは部門全員で考えるべきテーマです。失敗した人を罰するのではなく、組織で失敗を客観的に共有しそのロジックをつきつめるのです。

油断だとしたら、なぜ油断したのか。油断しないように二人体制で実施し確認者が機能すれば起きなかったのではないか。

なぜ急いでしまって失敗したのか。作業スケジュールに無理があったのではなかろうか。

作業手順書を読み飛ばしたのであれば、作業手順書が読み飛ばしやすいように書いてあったのではないか。

作業手順書と違うことをやったのであれば、なぜやったのか。確認者は止めなかったのか。なぜエスカレーションをして手を止めなかったのか。

なぜホストを間違えたのか。思い込みなのか。作業前に作業目的を作業者と確認者で共有しなかったのか。

こうやって、いろいろと失敗に対して想像を膨らませ、報告書ができあがっていくわけですが、現場が考えた分析でなければ全く持って意味がありません。関係者を欺くためのウソ報告書です。次に同じ失敗が起きないために、失敗した担当者も含めてみんなで考えて対応策を講じるのです。これは担当者を責めるプロセスではなく、運用部署を改善するためのプロセスです。担当者はたまたま悪いクジを引いただけです。真摯に失敗と向き合う限りは、落ち込むことは全くありません。

 

運用マネージャーが担当者を説教をしている時間こそ、無駄

作業担当者のスキルが低くて、理解不足でおきたオペミスがあるとします。

この場合、運用マネージャーがスキル不足を公然と責めてくるケースは少なくないのではないでしょうか。なぜ、このコマンドを打つのか。こういうメッセージが出ているじゃないか、それでこれを打つのはスキル不足だ。スキル不足だ!。

運用担当者のプロパティーに依存したミスオペは、運用担当者のスキル不足にして済ませようとする運用マネージャーはいそうです。

これは、間違っています。運用マネージャーがスキル不足を事前に察知して、運用担当者に作業をさせてはいかんのです。作業をやらせた運用マネージャーが能力不足を指摘されるべきであり、何を作業をやった運用担当者を責めているのでしょう。責任転嫁も甚だしい。

スキル不足の担当者にスキルアップの施策を実施しつつ、作業ができると判断したら初めて実施させる権利がマネージャーにはありますし、その見切りが失敗したのであれば、担当者のせいにしてはいけません。

説教をしている時間があるくらいなら、メンバーと一緒に徹底的に失敗の原因を追究して妥協を見せないこと。そうするとメンバーたちに真剣さが伝わり、説教よりも多くのメッセージが伝わり、組織がピリッとし失敗も減るでしょう。怒ってもしょうがない。

 

運用マネージャーが叱ってもいいときは

こうなると、運用マネージャーたるもの、全てを忍び耐え感情を押し殺し、罪を憎んで人を憎まず。確かにそうなのですが、叱ってもいいときがあると思います。信頼関係を崩すようなことを担当者がやってしまったときです。過去の失敗の振り返りにて担当者と約束して了解を得たあの努力目標。しれっとやらなくて失敗した時。そのときは約束の重さを軽んじているのかもしれません。そうすると、いくら運用マネージャーが頑張って整理しても、担当者が無視しているのと同じです。守ろうとして守れなかったらその原因をつきとめればいいのですが、単に運用の仕事を甘く見ているだけなのかもしれません。どれだけ失敗によって多くの人が大変な目に合うのか、きちんと説明をしなければいけないですしその際に、改善が見込めると思うのであれば強めに叱ることも、愛情があれば否定はできないと思います。

真剣さは、人に伝わりますから。

それでもマネージャーを裏切る行動を取るのでしたら、後は作業禁止にしたうえで、運用部署から出て行ってもらうしかありません。それもマネジメントです。

 

誠実に仕事をしてオペミスしたら、自分を責めてはいけない

まとめとなります。

運用の仕事は責任を伴う仕事で、責任感の強い人は仕事もどんどん請け負ってしまいがちです。

作業も増えるので、結果として失敗もその分経験してしまいます。

そして責任感の強さが災いして、自分を責めて病んでしまうのです。

失敗からは多くを学びましょう。広く議論して、失敗しない方法を考えて身につけましょう。それがスキルアップです。人の失敗すら教材で、失敗しないように周りを援助できるようになって成長していきます。

この業界に二十年いる私も失敗には遭遇しますが、それは自分で作業するためです。失敗は教材です。スキルや責任が見に付けば、自分の失敗すら自分でリカバリーできるようになります。失敗に強くなり、安全に収束できるようになります。

そうなる前に心を病まないように、決して自分を責めないようにしてください。失敗して、「あーあ、やっちまったなあ」と思う感受性であったり、本番作業の前に震えるようになることは運用者としては大事なことです。しかし一方で、過度にストレスを抱えないようにしなければいけません。

まずは心の健康を保って、成長していきましょう。