orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

どうすれば障害がおきない現場ができるか

f:id:orangeitems:20220114113352j:plain

 

見ましたか?、このニュース。

 

www3.nhk.or.jp

去年、相次いだシステム障害をめぐり、みずほフィナンシャルグループが来週、金融庁に提出する業務改善計画案の全容が明らかになりました。システムの開発や保守に必要な要員を確保するとともに、企業風土の改善に向けた取り組みを継続的に行うなどとしています。

 

まあ、本当の評価は業務改善計画の中身が公表されたらにしましょうか。外から見ているだけだと本当にわからない部分があります。とりあえずこのニュースから読み取れることに対して感想を述べます。

 

現場を軽視した人員の配置転換などによってシステムの運営態勢を弱体化させたと指摘されたことを踏まえ、システムの開発と保守の業務量に応じて安定稼働に必要な要員を確保する

 

いわゆるメンバーシップ型雇用を行っている会社にありがちなのが、専門性を無視した他部署への異動です。幅広く業務を知ることができる反面、専門性を軽視した方法ですが、特にシステムの世界は専門性、経験がものをいう世界です。

人員を確保するというのはいいとしても、工数をもとに人数いればいいでしょ、というような考え方だけはやめてほしいな、と。

アウトソーシングでまかなう、というのもまずい。だって銀行システムですからね。銀行の外部者が基幹システムの中身まで踏み込んできたら、ガバナンスが保てませんから。

実はジョブ型雇用への移行のほうが、こういう大企業には望ましいんじゃないかなと思いますけれども。システム屋はずっとシステム屋やってるに限ると思うんですよね。他銀行も含めて、システム屋のジョブディスクリプション(職務記述書)を共通化し、人材を融通し合えるのが理想でしょう。

ただ、業務量に応じて・・というのが気になっていて、安定稼働したら人減らす気まんまんじゃないのかなと勘繰ってしまいましたけれども。

 

システムの管理態勢を強化するため、持ち株会社と銀行、それにシステム子会社の3社が情報や課題などを共有する仕組みを新たにつくり、緊密に連携する

 

3社情報連携システム、みたいな新システムが構築され、それがまた障害になるようなことがないことをお祈りします・・。

そもそもなんで一体化しないんだというね。

 

さらに、「言うべきことを言わない」などと指摘された企業風土の改善に向けて、部署や世代の垣根を越えたワーキンググループ

 

単なる飲み会のような気がするけど・・。

やってもらったらわかるけど、若い人は、言いたいことの100分の1も言わないからね。相当気を遣って発言するよ。なぜなら、発言に関して安全性がないから。半沢直樹の世界見ればわかるでしょ。何もしゃべれんよ。

 

年に2回、システム障害を集中的に振り返る期間を設け、当事者が語り継ぐ映像を配信するなどの取り組みを継続していくとしています。

 

きっつい。

なんなの、緊張感がないから、危機感がないから障害が起きるとでも?。

 

システムの管理態勢の強化に向けては、現場の部長や支店長から寄せられたアイデアや、ベンダーと呼ばれるシステムの開発・保守を担う外部の企業の専門的な知見を積極的に取り入れる

 

ラジオの投稿番組じゃないんだからさ・・。

なぜシステムの話なのに、人力になっちゃうんだろうか。

 

>>

 

ということで、結構批判的に読めてしまうのですが、本来の業務改善計画は見ていないのでこの通りかわからないことが前提の、個人の条件反射的コメントです。

で、企業文化が例え今日変わったとして、明日の障害が回避できるわけがないのです。システムはシステムを変えないと変わりませんから。人の問題では決してありません。

ただ、早く気づく、早く対応する、とか、予兆を見つけて発生前に原因を見つけ起きなくする、ということは人の問題です。

ですから、明日の問題を解消するのではなく、体質として将来の問題をつぶさに毎日想像していく、という形に変えないといけません。

ところが、「今の業務量に基づいて人を融通する」という考え方だと、将来の問題を想像できるベテランが定着しないことになります。そのベテランの知見をさらにシステム化すればいいのですが、しかしシステムは日々変わりますから、結果的に人間の知見はいつでも必要ということになります。

システム運用、システムを安全に保ち続けることについては、SREと言う考え方が最近用いられるようになりました。

 

www.redhat.com

 

システム運用を、「障害なし、安定しているなら、工数を削減する」という呪縛から解き放つ考え方と言えます。能動的に将来的なリスクを先取りし、能動的に対処していくと言う考え方です。

RedHatが言うように、コンテナやDevOptsに行くかはまた別として、運用エンジニアが監視と障害対応の繰り返しと思われているところから変えないといけません。

 

まあ、運用を上記のようにモダン化したとしてもまだ一部としか言えず、結局は「心理的安全性」の問題に集約されてしまうと思っています。

 

www.recruit-ms.co.jp

「心理的安全性(psychological safety)」とは、組織の中で自分の考えや気持ちを誰に対してでも安心して発言できる状態のことです。

組織行動学を研究するエドモンドソンが1999年に提唱した心理学用語で、「チームの他のメンバーが自分の発言を拒絶したり、罰したりしないと確信できる状態」と定義しています。メンバー同士の関係性で「このチーム内では、メンバーの発言や指摘によって人間関係の悪化を招くことがないという安心感が共有されている」ことが重要なポイントです。

 

今日のNHKのニュースを見る限り、この心理的安全性を確保・担保するような記載は全く見られず。そのまま、単に場だけ作り出しても、だれも発言しませんよっていう話です。

「言うべきことを言わない」のは、言う場が無いからだという幼稚な判断をしているような気がしてなりませんが、これもまた推測なので断定は避けます。

まあ、金融庁も懲罰的態度で銀行に接している気もしないでもないです。

以上、感想でした。