orangeitems’s diary

クラウドではたらくエンジニアの日々の感想です。

「インフラエンジニアの独り言、ストレージは盲点になりがち」コメントへの感想

f:id:orangeitems:20180709183706j:plain

 

いろいろな意見を頂く

インフラエンジニアの独り言、ストレージは盲点になりがちの記事について、たくさんのコメントを頂いており、楽しく読ませていただいております。タイトルの通り独り言のつもりだったのですが、意外にも同業もしくは隣接の方からいろいろな意見を頂き、勉強になっております。

 

はてなブックマークについたコメントから、いくつか思うところを書いていきたいと思います。

はてなブックマーク - インフラエンジニアの独り言、ストレージは盲点になりがち - orangeitems’s diary

なお、解釈は人それぞれありそれぞれ正しさがあると思います。単なる感想ということでご承知ください。また、時間の関係上一部のコメントだけ取り上げております。

 

感想

ネットワーク屋さんも最近はサーバーいじり始めてるよ すっごい嫌々だけど

 素晴らしいです。後にスーパーエンジニアと呼ばれると思います。

 

学生時代にストレージちょっとだけやってたからいろいろと思うところはある。ネットワークストレージとサーバの接続を行うスイッチの障害が起きるとストレージが壊れるんすよね...(-o;

 ストレージが壊れるというより、OSのファイルシステムが壊れる可能性があるんですよね・・。急に書き込みが止まるわけですから。最近のファイルシステムチェックは優秀なのでOSが起動しなくなることはあまりないですが。チェック中は超不安です。

 

確かに、ストレージはサーバエンジニアが兼任な感じ…。でも、そうそう壊れないから、う~ん

ディスクレベルだとよく壊れるのですが、ストレージごとダウンということは稀ですよね・・。

 

今後はHCIでどうにかなるのかな

 結局HCIの中にも仮想ストレージを支えるソフトウェアが入ってくるので、場所が移動しただけだと思います。ソフトウェアに障害があると、結果ストレージ障害のようなことは起こりえると思います。

 

実際に担当する側から言えば、確かに責務と給与は比例してねぇなぁという実感はある。/ベンダ固有の問題が多過ぎる事、またストレージベンダー側は1000万以下のストレージサポートをほぼやらない事は周知されるべき

 ファームウェアのバグって、致命的なものも含めて多いですよね。しかも環境が限定されているバグにもかかわらず、自社に当てはまって喰らってしまうという罠。

 

ぶっちゃけ使用側からするとそういう面倒なこと考えたくないのでとにかく S3 / GCS に突っ込んであとから Athena なり BigQuery なりで活用できるようにする Amazon や Google の思想は圧倒的に正しいと思った

そうですね。メガパブリッククラウドの最大のメリットだと思います。でも、やらかすときはやらかしますけどね。

 

自分はネットワーク屋さんだけど、次に領域を広げるとしたら、ストレージとバックアップ、あと監視系と思って、それらのスキルを備えるようにしてる。

 正解だと思います。運用設計のど真ん中ですね。

 

フルスタックエンジニアという人がやればいいのでは。なんちゃって

 開発の現場でフルスタックと言う言葉がささやかれるたびに、インフラでは違う意味で存在するよなあと常々思っておりました。

 

ストレージサーバー、と聞いてピンとこないレベルのSEがなりゆきでインフラやってる現場なんかも結構あると思うんですよね。

 おおありです。しかもメンタルつよ子じゃないと、やっていられないという。

 

転送魔神やで

 そうですね。もはや10Gbpsで組まないとアウトの世界。

 

オンプレのHCIを使ってるが、今度はStroageControllerVMを理解する必要が出てくるからなぁ。常に範囲を広げる努力が必要。しかし給料には反映されない所がツラいが。

 ソフトウェア使って仮想化するとあたかも魔法みたいに表現されますが、実際は人が書いたコードがやっているわけで、怖さはありますね。洗練されているものほど落とし穴があり。

 

ストレージ障害って頻繁じゃ無い?定期的に起きるよね?

ストレージの定義によって頻繁とも言えます。ディスクアラートで保守呼んで交換というのもストレージ障害といえばそうですね。

今回の場合は、VMからストレージが切り離されたり接続できなかったりするなどの、深刻な障害を言います。これが頻繁だとすると、システムは使い物にならないと思います・・。

ストレージサーバーって、思い切り冗長に作られています。マザーボードも電源もRAIDカードも全部二重化されていて、同じ筐体でアクティブスタンバイ、もしくはアクティブアクティブになっているものがほとんどです。ですので、ファームウェアをアップしようが部品を交換しようが、ノンストップで運用できるのですが、それでも問題が発生するときは発生するという・・。(こわい)

 

結局上から下まで細分化されて全体を理解できる人がいないんだよな。

レイヤーが増えすぎましたね、仮想化のおかげで。便利にはなっているのですが、障害がいざ発生すると、全体を見る目線が必要ですね。

 

選んだベンダー次第なとこはあるな、、地雷を踏んだらさようなら部門だなぁって、ふと思ったことはあるぞ。

 100回うなづきました。

 

物理サーバ並べたのはVSANってのが数年前からあってですね・・。今回のような障害は詰め込んだから起きたとかじゃないんですよ。HCIもねぇ・・・。この記事といい、インフラエンジニアはまじで絶滅危惧種なのだなぁ。

 原因は不明ですがcephが怪しそうです。ニフクラの件もそうですが、複数のストレージサーバーを1つに抽象化する設計って、トラブると全サービス断。詰め込むことがトリガーになるかどうかは不明ですが。インフラエンジニアの数についてはどれぐらいいるのか私もよくわかりません。あと、VSANでもHCIでも、Software Definedな世界だと思うので、結局ストレージサーバーとやっていることは同じだと思います。Software Definedにしたら、Softwareの専門家が必要になるかと。

 

うーむ。ホスティング事業者にとって死活問題なのは分かるが、そこからすべての会社に高給の専任が必要というのは飛躍していると思う。大体1システム1ストレージ(冗長化)構成にすると思うし、ベンダーの保守は必須

1システム1ストレージ(冗長化)で徹底できるなら、確かに高給ストレージエンジニアは不要かもしれませんね。保守でカバーできるかもしれません。今回のように、情報資産の価値が青天井な1つの大型システムだと必要かと思います。人にお金をかけるか、ハードウェアにお金をかけるかのバランスになるかと思います。高スキルの人が必ず確保できる保証もないので、本来はハードウェアにコストをかけるべきかなあと思います。

 

イーサに流すにしてもiSCSIは使わないかなあ。今まではストレージ屋さん構えてたけどvSANちゃんと入れたらサーバ屋さんだけで完結できそう。

私の周りは猫も杓子もiSCSI。vSANはvSANで、専用のスキルが必要なので、ナレッジの必要量としては変わらないのかあと思います。

 

ストレージ、vnxもetremIOもあまりいい思い出がない…SCSIとかmultipathまわり、ファーム更新でいろいろ踏んだ…

 わかりみの2乗です。

 

最近この手の話をよくする、クラウド利用料金にはストレージとNWとバックアップの面倒をほぼ見なくていいお手軽さが含まれてる

はい、あと電気代とインターネット代もですね。オンプレと比べられても困るのに、オンプレと値段張り合って安くし過ぎて、悲劇が起こることがあると思います。

 

よって弊社は現在HCIに仮想基盤を移行中です。移行のPLは私ですが手数が全く足りておりません……つら……

お疲れ様です。スーパーエンジニア育成コースへようこそ。

 

ストレージ守る=データ守る。

平常運用だと、守りに給与がリンクしないのがつらいですよね。

守っているのになあ、と。

 

セキュリティも同様かな。→"ストレージエンジニアという名前は一般的ではありません。原因としては、問題が発生しない間はやることがないからです"

ですね。ただ、脆弱性検査やWAF/IPSなどアウトソーシングしやすい分野なので、戦略は立てやすそうです。経営者は平常時こそコストをかけてほしいですね。

 

「バックエンドのシステムを組む時,予算の半分(人件費含む)はストレージに割くべき」というのは割と常識かと思ってたけど,そうでもないのかな?永続性(persistence)の担保にお金をケチってはいけない

素晴らしい考え方です。データが何もないときは軽々しく設計しちゃうので、気を付けないといけない。

 

やれオープン化だベンダーロックイン反対だなんだと言って適正な給料もらってたであろうお高いベンダーから仕事切り出した報いとかじゃないの?

オープンソースの落とし穴、必要な保守の削減、このあたりは最近叫ばれるようになりましたね。今回のケースがどうかは不明ですが、人もハードウェアもコストを削ったらそこに穴が開くという感覚は大事だと思います。

 

まとめ

時間の関係上、全てのコメントには感想を入れられませんでしたが、全て読ませていただいております。どこの現場も大きな責任がつきまとい大変かと思いますが、ストレージを含め”守って”行きましょう。私の独り言にたくさん共感頂き、勇気がでました。

 

 

新人エンジニアのためのインフラ入門 ThinkIT Books