orangeitems’s diary

クラウドではたらくエンジニアの日々の感想です。

インターネットサービスにおけるデジタルデータの寿命は思いのほか短いのではなかろうか

f:id:orangeitems:20181005000505j:plain

 

デジタルデータの寿命と保管場所

今週、Yahoo!ジオシティーズの閉鎖とともにデータが削除されることが話題になりました。一方で、はてなダイアリーははてなブログに自動移行されるとのこと。

一般の皆様は、インターネット上にあるデータはどのように保管されていると想像されているでしょうか。ハードディスクもしくはSSDに保管されているのだろう。それは正解なのですが、もっと正確に答えようとするのならば不完全です。

具体的には、

・物理サーバー内のローカルハードディスク。普通はRAIDを組んで冗長化している。

・ストレージサーバーのローカルハードディスク。物理サーバーからはネットワーク経由でアクセスする。ネットワークプロトコルは様々。

・オブジェクトストレージ。大容量保管のための分散ストレージで、複数のコンピュータを使ってデータを格納する。

この3つのどれかです。サーバー向けということで個人で用意できる金額ではありません。運用エンジニアであれば、サーバーホスティングサービスやクラウドサービスを営んでいる会社が、データセンターを借りてお客様へ提供しているということで馴染みが深いと思います。個人でもこのサービスを利用し少額で一部を借りるということは最近特に利用されていますし、クラウドサービスはその一部です。

個人からすると、どのようにインターネット上で保管されているかは全く意識しません。一方でシステムトラブルが起こるとどうなっているかわからないのでかなりストレスがたまります。このときはシステム提供会社がいかにバックアップ体制を持ち、迅速に復旧できるかがポイントとなります。

 

機械の寿命

ところで、物理サーバーのローカル保管にしろストレージサーバーにしろ、オブジェクトストレージにしろ最後はハードディスク(もしくはSSD)に存在することになります。このディスクですが、絶対壊れないディスクはありません。壊れてもいいようにRAIDという技術を用いて、1本(RAIDの種類により2本以上)が同時に壊れてもデータが壊れないようにします。そして壊れた場合は、サーバー保守を締結しているベンダーが変わりのディスクを持ってきたり郵送したりして、このディスクを交換します。そうやって、我々のデジタルデータはインターネット越しに保管されています。

そうやってハードディスクに保管されているデータを守れているうちはよいのですが、さて、このハードディスクは永遠に破損したら交換できるでしょうか。答えは「いいえ」です。サーバーのハードディスクは一般のハードディスクと違って、そのベンダーの指定の部品を使わないと保守が結べなくなります。他社のディスクを使っても動きはするのですが、保守部品の交換を断られますし契約の締結ができません。保守契約ありきで部品をいつも健康な状態に保つのですが、この保守契約が短くて5年、長くても7年程度で交換部品をベンダーが製造しなくなってしまうのです。そうすると、いくらお金があっても年間保守が結べなくなります。スポット(臨時)で交換を頼んだ時に、余りの部品があれば受けてくれる程度になります。

つまり、ハードディスクの代わりの部品が用意できる間は保守契約を結べる。生産中止とともに交換ができなくなる。それが5年~7年スパンだ、ということが大事です。もちろんハードディスクだけではなく、物理サーバー・ストレージサーバーも同様です。すべては寿命があるということを覚えておいてください。

 

5年から10年以内に、必ず移し替えなければいけないと考えた方がいい

そうすると、インターネットに預けているデータを保管している箱は、案外もろいものだと思いませんか?。始めた当初はビジネスが立ち上がり投資と売上のバランスを見ながらサーバーを増やし、運用部隊が保守サービスをベンダーと締結しつつデータを守ります。しかし、ビジネスはピークアウトします。そうすると運用にかかる費用と保守費用が重荷になってきます。売り上げは大したことないのに、保守ベンダーは保守費用をもちろん請求してきます。お金を払わないなら、ハードディスクが壊れても放置するしかなくなります。最終的にはデータが吹っ飛びます。

ジオシティーズ然り、長年サービスを続けたサーバーは「老朽化」しています。だからと言って新規投資をしてデータ移行するメリットが感じられない場合、保守が締結できる間は締結して、ひたすら放置というのが定石です。そして経営者が終了を決断し、サーバーは停止し廃棄することとなり、データは失われていきます。

また、そのデータに価値がありビジネス継続したい場合は、お金をかけて新しいサーバーに移し替えます。今回のはてなダイアリーをはてなブログに自動的に移す判断は、新規投資するだけの価値があったという判断でしょう。

このように、運営者の懐とビジネス状況によって、インターネット上にあるデータなど急に無くなってしまうということを皆が知る必要があります。率直に言って、データの寿命は世の中が思っているほど長くはありません。クラウドサービスの永遠に保管してくれそうな雰囲気はポーズであり、中の人はどう定期的にデータを移行しながら保全するかは大事な仕事になります。

古参のサービスを動かしている物理サーバーやその部品が、本当にもう世界に部品が無くなり、壊れたらも壊れたままにしておくしかない。そういった状況まで追い込まれサービス中止を判断するといったことが、インターネット普及から20年経った日本において頻発しているのではないかと思います。

 

本当に残したいデータはどこへ?

クラウドサービスに預けたら残せるというのは幻想です。運営者のビジネス理由により削除を迫られる場合があります。バックアップ用途が関の山です。

ポータブルハードディスクはどうでしょうか。ハードディスクの寿命は数年です。壊れたら終わりなので、複数個所に保管しておくと少しの気の休まりにはなります。

DVDやBLUERAYディスクはどうでしょう。これは今となってはサイズが小さすぎます。また、それでもよろしければ寿命の長いメディアだと思います。懸念点は、プレーヤーが絶滅する可能性です。

ということで、2か所の場所、かつ複数のメディアにできるだけ保管すること。1個のメディアが破損した場合は速やかに交換し、新しい保管ポイントに保管することが求められるでしょう。

ストレージの仕組みと、かかるコストを知っているからこそ、ジオシティーズの終了などはとても良くわかるし歴史的な一コマだと思います。もし他のクラウドサービスを利用していて、データを手元に複製していないのであれば、これはぜひ複製してくべきだと思います。それぐらい、デジタルデータは人々が思っているより脆いものだと思います。

 

 

インフラ/ネットワークエンジニアのためのネットワーク技術&設計入門