orangeitems’s diary

クラウドではたらくエンジニアの日々の感想です。

ディスク大容量化時代、ファイルサーバーと情報システム部門の憂鬱

f:id:orangeitems:20181128223000j:plain

 

ハードディスクの容量がどんどん大きくなる

たまにはITインフラエンジニアっぽいことを書いてみます。

今、ハードディスクって1本どれぐらい保管できるかご存知でしょうか。

答えは・・・。

 

akiba-pc.watch.impress.co.jp

続いて11月には、NAS向けの10~14TBが出回り始めた。回転数は7,200rpm、バッファサイズは256MiB(メビバイト)で、12TBおよび14TBはヘリウム充填技術を採用。価格(最安値)は10TBの「MN06ACA10T」が税込38,858円、12TBの「MN07ACA12T」が税込46,480円、14TBの「MN07ACA14T」が税込64,778円となっている。

 

14TBです。あの3.5インチのディスクに14TBも入るようになったんですね。

一昔前だとついに1TB到達などと驚いたのですが・・。最近の加速が速い。

 

さて、一気に時を巻き戻して、1999年の時代に戻ります。

同じAKIBA PC Hotline!より、ハードディスク情報の記事。

 

お買い得価格情報(1999年7月24日)

ソフマップ1号店"Chicago"
(5F)Maxtor 91024D4(IDE-HDD,10GB,7200rpm) 17,799円
(5F)Maxtor 91280D5(IDE-HDD,12GB,7200rpm) 18,799円
(5F)Maxtor 91536D6(IDE-HDD,15GB,7200rpm) 19,999円
(5F)Maxtor 91792D7(IDE-HDD,17GB,7200rpm) 22,999円
(5F)Maxtor 92720U8(IDE-HDD,27GB) 35,499円

 

30GBというと、ざっくり言って0.03TBくらいです。これが14TBとなると、467倍です。同じ3.5インチディスクの玉に、467倍の情報が入るようになったのがこの20年の進歩ということになりますね。

そりゃあ動画も音楽もデジタル化されるわ・・と。

 

でもパフォーマンスは上がっていない

でもでも、注目すべきことが一つ。

 

f:id:orangeitems:20181128212426j:plain

[画像] NAS向けの14TB HDDが東芝製からも登場、4TB~8TB HDDは特価終了などにより小幅な上昇傾向(4/4) - AKIBA PC Hotline!

 

ハードディスクのパフォーマンスの基礎となる回転数は、7200rpmからずっと頭打ちということです。キャッシュなどの利用で速くなりますから回転数だけでは割り切れるものではないですが、基本的に容量だけがっつり増えて、読み取り・書き込みのパフォーマンスは容量ほどは劇的に上がっていないのです。速さが2倍になる間に、容量が467倍になっているということです。

「1本のディスクのすべてのファイルを読み取る/書き込むまでの時間が、年々急上昇している」ということが言えると思います。

つまり、バックアップを取ること/リストア(戻し)することの難度がどんどん上がっているということです。

例えば、14TBのディスクに、14TB分のデータが保管されているとします。フルバックアップを取ろうとするとかなり大変です。普通にOSレベルでコピーするとおそらく三日ぐらいかかってしまいます。伝統的な差分/増分バックアップならば良いかと言うとこれも良策ではなく、14TB分の現在の情報と過去のフルバックアップの差分/増分を見つけ出すのが長期化しています。バックアップのコマンドを叩いても差分/増分の計算が終わらずなかなか始まらない、というのもあるあるです。

個人利用で、かつ動画保管等、消えても差し支えないものであれば大容量ディスクは利用してもいいと思いますが、ビジネス利用で普通のNASなどファイルサーバーとして使うのであれば、14TBディスク一本というのは非常に扱いにくい・・と思います。

今では、SSDが安くなってきましたので、私なら10本ぐらい並べてRAID5などで大きなボリュームを作りますかね。

情シス担当の人がパソコンに少々詳しい偉い人から、「最近は14TBぐらいのディスクがもう売っていて、これを使えば安い大容量のファイルサーバーが作れるんじゃないか?」 なんて言ってこられる困りますよね。「どうやってバックアップ取るんじゃい、しかも遅いぞ」と反射的に問い詰めたくもなるでしょう(相手がどんなに偉くとも)。

 

RAID1(ミラーリング)はバックアップにならない

あまりハードディスクの使いまわしの経験が無い方は、RAID1(ミラーリング)にすればバックアップを取っていると思われる方がいらっしゃいます。

RAIDコントローラーから両方のディスクに書き込み信号を送るので、2つのディスクは同じ内容です。同じ内容の2本のディスクがあれば、片方はバックアップになるのでは?と思う方もいらっしゃるかもしれません。

しかし。

ハードディスクのハードウェアは壊れていなくても、ソフトウェア的に壊れることがあるのです。例えばパソコンの起動中に停電になるとします。書き込みを行っている途中に停止したとします。そうすると、ファイルシステムのインデックス情報とファイルの中身が矛盾します。そういった状況はOS起動時に確認され問題があった場合はインデックスを矛盾の無い状態に戻そうとします。その結果、ファイルが消失したりします。最終的にはOSが起動できない状態になったりします。

このような状態のとき、ディスクAとディスクBからRAID1が成り立っているとして、両方とも同じ状態ですから、両方とも壊れてしまいます。つまり、ソフトウェア的に壊れると、両方のディスクが同時に壊れてしまうのです。

ハードディスクが物理的に壊れた時のスペアとしてRAID1は機能しますが、バックアップはRAID1のディスク群とは別のディスクか、もしくは別のコンピュータのディスクに取るべき・・というのが鉄則です。

RAID1(ミラーリング)は決してバックアップではない、というのがこの世界の常識となっています。

 

いびつなストレージまわりのアーキテクチャー

ハードディスクが、振動に弱く壊れやすく読み取り・書き込み性能に大きな問題を抱えながら容量だけは巨大になっていく。

SSDは、大容量化と低価格化が進み、ハードディスクをいずれ置き換えるかと思ったらハードディスクの容量の拡大のペースの方が上でなかなか代替とはならない。しかも、耐用年数がハードディスクより短い。

その状況で、不摘発性メモリーという電源が停止しても消えないという、ハードディスクとメモリーの間の記憶装置の開発が進んでいます。ストレージの未来形はこれなのかな‥と思いますが、これもまた進化には長い時間がかかるのかもしれません。

決め手を欠く中、個々人が扱うデータの容量はどんどん肥大化し、それを保管するファイルサーバーは非常に醜いシステムになっていると、見てて思います。クラウド型ストレージがあるじゃないか、と考えるのは早計で、インターネット経由で使うストレージはダウンロード/アップロードスピードが遅く、生産性に大きな影響が出ます。きっとローカルで保存をしてそれを同期を取って使うのが主流でしょう。しかし、それは企業のファイルサーバーの一般的な使い方ではないのです。Drop BoxやOne Drive、Google DriveやBOXで、企業活動が最適化できるかと言えばいろいろと解決しなければいけない問題が多々あります。

やはり、LANで、オンプレで・・・大半の企業のファイルサーバーはそんな状況です。そしてクラウドに持っていくのはインターネットがボトルネックになってできません。

 

本件、私の中では答えが出ていません。なのにファイルサーバーは必要で・・。クラウド化したいと山のように要望はいただくけれども、思い切ってそれは今ではありません。クラウドはバックアップ用途に使うのが今のところベストプラクティスです、と。

5G時代になれば少しは変わるんですか・・ねえ・・(困)。