orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

あわせて読みたい 「ポストモーテム みずほ銀行システム障害 事後検証報告」

f:id:orangeitems:20220312143732j:plain

 

もうすぐ話題の本が出るらしい。

 

ポストモーテム みずほ銀行システム障害 事後検証報告 単行本 – 2022/3/17
日経コンピュータ  (著)

 

なぜ繰り返すのか、メガバンクの失敗に学ぶ

みずほ銀行で2021年2月からの12カ月間に11回ものシステム障害が発生した。
2002年、2011年と大規模システム障害を起こし、それを反省して2019年までに勘定系システムを全面刷新したみずほ銀行だったが、トラブルは繰り返された。

システム障害はなぜ起きたのか。みずほ銀行ではなぜシステム障害が繰り返されるのか。
情報システムは人が開発・運用するものでトラブルは避けられないのだから、情報システムを利用する組織には、システム障害が起きても顧客や業務に影響を与えないで済ませられるレジリエンシー(復元性)が必要だ。

情報システムの専門誌「日経コンピュータ」が執筆する本書は、みずほ銀行の失敗を教訓に、組織のレジリエンシーを高めるための方策を探る。

 

<目次>

はじめに

第1章 前代未聞、12カ月で11回のシステム障害

第2章 行内で何が起きたのか、システム障害の真相

第3章 なぜ障害は拡大した、15個の疑問点

・疑問1:なぜデータベースは更新不能になったのか

・疑問2:なぜDBの更新不能がATMのカード取り込みにつながったのか

・疑問3:なぜ「二重エラー」が発生したのか

・疑問4:なぜ一度減ったATMのカード取り込みが急増したのか

・疑問5:なぜ警告やエラーは見逃されたのか

・疑問6:なぜ障害の規模や原因を見誤ったのか

・疑問7:なぜ頭取に情報が届かなかったのか

・疑問8:なぜ営業店での顧客対応が遅れたのか

・疑問9:なぜe-口座への一括切り替え処理を2~3月に実施したのか

・疑問10:なぜインデックスファイルをメモリーに置いたのか

・疑問11:なぜインデックスファイルのリスクを見逃したのか

・疑問12:なぜSOAなのに被害が拡大したのか

・疑問13:2月28日はどの不手際が致命傷になったのか

・疑問14:8月20日はなぜDBをすぐに復旧できなかったのか

・疑問15:なぜハードウエア障害が頻発したのか

第4章 金融庁が分析する「原因」「背景」「真因」

第5章 障害を繰り返すみずほ銀行のシステム、その歴史を紐解く

第6章 なぜみずほ銀行でだけ、何度も障害が起きるのか

第7章 みずほ銀行は立ち直れるのか

おわりに

 

2022年に入ってからも発生しており、おそらく金融庁主導でたくさんの人がなんとかしようとしているのはわかるが、結果がついてこない。

ここしばらくは発生していないようなので、本が出た途端に厄除けのように静まってくれて、今年いっぱい何も起きなければいいと思う。もう誰も一件すらも起こしたくないはずだ。社長交代も行われたので、今は大事な時期である。

そもそもこのシステム、移行には相当コストも気も使った。思い起こしてみれば、9度も移行のためにメンテナンスを行った。

 

business.nikkei.com

 みずほフィナンシャルグループ(FG)は、傘下銀行の新システムへの移行作業のため7月13日午前0時~16日午前8時、ATM(現金自動預払機)やインターネットでの取引を全面的に停止する。移行作業は昨年6月から始めており、9回目となる今回が最後となる見通しだ。作業をするたびにATMが使えなくなり、みずほユーザーから不満が噴出していたが、順調に進めば、システム統合がようやく完了する。とはいえ、みずほFGには過去2回大規模なシステム障害を起こした「古傷」があり、関係者は最後に最悪の事態が起きないかの一抹の不安を募らせている。

 

ただ、いろいろ揶揄されたものの、移行自体はきっちりと済ませた。

 

www.j-cast.com

「関わってないけどSEの端くれとしてみずほ全面稼働を祝福せずにはいられない」
「終わったか...この案件と全くかかわったことがないエンジニアは少ないんじゃないかな...」
「みずほ銀行プロジェクトに関わったエンジニアにリスペクト。スタッフロールとか出して賞賛したい」

 

そう、構築から本番移行まで大変なコストをかけ、そこでは大きな落ち度がなかったことは間違いない。だからこそこんな本も出た。

 

みずほ銀行システム統合、苦闘の19年史 史上最大のITプロジェクト「3度目の正直」 単行本 – 2020/2/14 日経コンピュータ  (著)

 

みずほフィナンシャルグループ(FG)が2011年から進めてきた「勘定系システム」の刷新・統合プロジェクトが2019年7月、ついに完了した。
富士通、日立製作所、日本IBM、NTTデータを筆頭に1000社ものシステムインテグレーターが参加したものの、2度にわたって開発完了が延期になったことから、なかなか完成しないスペイン・バルセロナの教会にちなんで「IT業界のサグラダファミリア」とまで呼ばれた史上最大級のITプロジェクトだ。

みずほFGは完了までに8年もの年月と、35万人月、4000億円台半ばをつぎ込んだ。
1980年代に稼働した「第3次オンラインシステム」の全面刷新は、第一勧業銀行、富士銀行、日本興業銀行の3行が統合したみずほFGにとって、2000年の発足以来の悲願だった。

しかしシステム刷新は何度も挫折し、2002年と2011年には大規模なシステム障害を引き起こした。

80年代の非効率的な事務フローが残ったままになるなど、勘定系システムの老朽化は経営の足かせになっていた。

なぜみずほ銀行のシステム刷新は、これほどまでに長引いたのか。そして今回はどうやって完了に導いたのか。

「メガバンクの勘定系システムとして初となるSOA(サービス指向アーキテクチャー)全面導入」

「AS IS(現状通り)を禁止した要件定義」「1000社のシステムインテグレーターを巻き込んだプロジェクト管理」など、

新勘定系システム「MINORI」開発の全貌と、みずほ銀行がこれから目指す金融デジタル化戦略を、みずほFGにおける19年の苦闘の歴史を追いかけ続けた情報システム専門誌「日経コンピュータ」が解き明かす。

多くの日本企業が直面する情報システムの老朽化問題、「2025年の崖」を乗り越えるヒントがここにある。

 

≪目次≫

はじめに

第一部 IT業界のサグラダファミリア、ついに完成す

第1章 三十五万人月、四千億円台半ば、巨大プロジェクトはこうして始まった

第2章 さらば八〇年代、新システム「MINORI」の全貌

第3章 参加ベンダー千社、驚愕のプロジェクト管理

第4章 緊張と重圧、一年がかりのシステム移行

第5章 次の課題はデジタル変革

第6章 「進退を賭けて指揮した」

みずほフィナンシャルグループ 坂井辰史社長 インタビュー

第二部 震災直後、「またか」の大規模障害

第7章 検証、混迷の十日間

第8章 重なった三十の不手際

第9章 一年をかけた再発防止策

第三部 合併直後、「まさか」の大規模障害

第10章 現場任せが諸悪の根源

第11章 無理なシステム統合計画を立案

第12章 大混乱の二〇〇二年四月

おわりに 

 

面白いよね。同じテーマなのに真逆の論調だ。

こっちの本も売れた記憶。

同じ日経コンピュータが書いてるから、この本で持ち上げて、今回出る本で落とすことになる。

というか、書かざるをえなかったんだろう。乗り越えるヒントがここにある・・・からの障害続発だからね。

 

私は両方とも読んでないので、今回合わせて読んでみたいかなとも思っている。

構築/システム移行の大変さと高揚感、そしてシステム運用/改修の難しさを両方味合いたいなら、セットで読むべきだ。