orangeitems’s diary

クラウドで働くエンジニアの日々の感想です(ほぼ毎日更新)。

システム運用担当者はそろそろ10連休と向き合うべき時期だ

f:id:orangeitems:20190402182338j:plain

 

迫りくる10連休

改元だ令和だと大騒ぎになっておりメディア記事の3割ぐらいはこの話なのですが、仕事がシステム運用なので結構どうでもいい感じです。

もっと問題なのは、今年はゴールデンウィークが10連休だということです。

(1日目)4/27(土)
(2日目)4/28(日)
(3日目)4/29(月)
(4日目)4/30(火)
(5日目)5/1(水)
(6日目)5/2(木)
(7日目)5/3(金)
(8日目)5/4(土)
(9日目)5/5(日)
(10日目)5/6(月)←この日も休みかよ

 

ブレーンストーミング

システムというヤツは目を離すとすぐにスネます。

普通に10日間放っておくとどこかで何かしら起きます。

また起きても何もしないと二次被害の拡大です。

 

しかも、5日目に「改元」なるイベントが待っていますよね。

システムによってはアプリケーションチームが休日出勤して変更作業をやるのでしょう。

このタイミングでインフラ側の障害を放置しておいたりすると、リリース作業に支障が出ますので前日までに正常性確認しといたほうがいいかなと思います。

 

本当はこんな連休の時はシステムはできるだけ触らないほうがいいのです。

変更の少ないシステムは障害も少ないです。

経験的に、変更の多いシステムは障害を作りこむ性質があります。

ある人の変更と、別の人の変更がかみ合っていなくて、いつしか矛盾をトリガーに障害を発生させます。

ただ・・、変更しなくていいシステムなんぞほぼあり得ないので、変更管理は重要だということになります。10連休を踏まえると、4月、特に後半は新規変更作業は凍結すべきだと思います。改元のシステム変更が必要なら、もうそれだけにすべきです。

4月の変更で障害トリガーを作りこみ、5月の連休中に発動して、それで要員が本当に確保できるかというのは大いにリスクです。

いくらシフト制で休日出勤を増やしても平日よりは人数は少ないし、旅行に行く人だっていますからね・・。

私が知っているシステム運用の現場で徳の高い人は、会社の近隣に住んでいて、休みの日もほぼ離れないそうです。私はそうはなりたくないのでクラウドやると言い張ってるのですが・・。オンプレは大変です。

ということで、もう4月に入ってますから、もしあなたが権力者ならシステム変更は4月、前半は最低限に、後半は中止せよというオーダーを現場に出してあげてください。

今日は4月2日ですが、再来週も3週間後もシステム変更作業が予定に入っているとしたら、私の感覚ではセンスがないです。ぎりぎり今週、来週くらいで終わりにしておかないと、変更後の動作確認ができないですね。

特にインフラやってると思うのですが、アプリケーション変更後にデータベースの利用量やファイルシステムの利用量が急増するケースがあり危険です。それを連休に入って気が付くと、アプリケーション担当者がつかまらなくて判断ができづらい。そういう状況の見極めには一週間ぐらいの営業日はせめてほしいところです。だから、10連休前はできるだけ何も変えないのが大事。

 

そういえば、ハードウェアやソフトウェアの保守って、「平日9時5時」というメニューがありこれを選んでいる企業もすごく多いと思うのですが、10連休の1日目とかでディスクが壊れたりしたらあと9日間、保守が受けられないですよね。

RAID1にしろRAID5にしろ、一本がダメになってもいいですが二本目が来たら終了。ホットスペア入れておけばいいのですが、平日保守を選ぶような設計だとそうなっていないケースも多いと思います。

10連休前に電源停止して、開けた後に電源を起動するのが最も安全だと思います。電源を停止していれば機械は静止状態なのでほぼ壊れないと思っていいですから。まあそんなことができるなら、ぜひやってください。

 

あと、セキュリティー的な攻撃もこの10連休は危険ですね。IDSやらIPSやら入れているから大丈夫と踏んでいるところも、この連休中はアラートも見ないのであれば攻撃されていても放置。結局家にカギをかけて旅行に行くけれども、家の鍵に悪いヤツがガンガン攻撃しても誰も気づかないみたいな話です。ブルートフォース攻撃など、力づくで攻撃するならこの10連休は危険だなと思います。

IPAもちょうどこんな通達を出しています。

 

www.ipa.go.jp

ゴールデンウィークまで1ヶ月を切りました。今年は5月1日に平成から令和に改元されることに伴い、10日間の超大型連休が控えています。その前後には、改元に便乗した新たな手口が発生することが懸念されます。そこで、例年より早く「ゴールデンウィークにおける情報セキュリティに関する注意喚起」を行います。

長期休暇中は、「システム管理者が長期間不在になる」、「友人や家族と旅行に出かける」等、いつもと異なる状況になります。例えばウイルス感染や不正アクセス等の被害が発生した場合に対処が遅れてしまったり、SNSへの書き込みから思わぬ被害が発生したり、場合によっては関係者にも被害が及ぶ可能性があります。

そのほか、改元に便乗した新たな手口が発生する可能性もあります。メールやショートメッセージ(SMS)、SNSでの不審なファイルやURLには、より一層の注意が必要です。基本的な心得、対策を(1)組織のシステム管理者、(2)組織の利用者、(3)家庭の利用者、それぞれの対象者別にまとめています。今年は10日間の超大型連休となるため、早めの準備をお勧めします。

 

 

 

ほんと、連休中に全部電気落としとくっていうセキュリティー対策はあらゆる意味で最強です。

 

どうするかなあ

・・・と、いろいろ考えを巡らせたものの、10連休なんて誰しも未経験です。システムのオーナーである企業すら休んでます。でもシステム運用担当者は「よ・ろ・し・く」と肩をたたかれると思います。

チェックポイントは以下かなあ・・。

・10連休中の
 ・システム運用部員の
  ・居場所をまとめておく。
  ・緊急連絡先をまとめておく。
 ・システムオーナー(お客様)の
  ・緊急連絡先をまとめておく。
  ・万が一(重大なシステム障害)のときの対処法について合意しておく。
 ・ハードウェアのベンダー保守体制をまとめる。
 ・ソフトウェアのベンダー保守体制をまとめる。
 ・障害時の担当をアサインする。
 ・休日出勤の必要性を検討する
・10連休に入る前の変更管理をまとめて、不具合発生時に閲覧できるようにする
・重大障害時は、部門長が号令をかけて会社に集まれるようにする
・起こりうる障害をシミュレートし、対処法をある程度決めておく

ああ、書いているだけで憂鬱になってきた・・・。

システム運用と関係ない方は、ぜひ旅行の計画でも立ててリフレッシュしてくださいませ・・・(意味深)。