このspacewalker.jpを管理しているサーバ(Linux, ウェブ・DB・メールサーバー等)は、Intel SSD 510シリーズ(120GB)で運用していました。この度、そのSSDに故障(エラーが多発)し、新しいSSDに入れ替えてサーバーを再構築致しました。
壊れたSSD : Intel SSD 510 Series SSDSC2MH120A2 : 120GB
今回新しく採用したSSD : Intel SSD DC S3500 Series SSDSC2BB120G4 : 120GB
このブログの記事「Core i3-2100T + SSD + Scientific Linux6サーバに変更」 @ 2011/5/25に書きましたように、今回故障したSSDは、2011年5月導入ですから、2年5ヶ月(毎日稼働)でエラーを出すようになりました。今回はCentOS 6.4に変更。
/var/log/messageには、大量のREADエラーのログが残っていました。ある一秒の記録を以下のリンクにアップしました。
20130929_message.log
このIntel 510シリーズは、3年保証なので一応修理に出してみようと思います。現行の520/530の新品SSDに交換対応になるのでしょうか。
デスクトップPCなども含め、Intel製のSSDを、12本近く使ってきていますが故障は初めてのケースです。個人的には5年くらい余裕で壊れないだろうと思っていましたので少々意外でした。LinuxのSMARTチェックソフトウェアで調べても明確なエラーは検出されず、テスト(short)も問題なく終了します。しかし上記の通り/var/log/messageには大量のエラーが出ました。。過去記事にも書いたようにRAID1などを組まずに、朝3時にセカンドSSDにバックアップをcronで実行する仕組みにしていましたので、セカンドSSDは無事で、データ欠損なく復旧できました。しかし故障SSDからデータを読んでみると特定の箇所で読込エラーが出てやはりReadに難ありという感じです。
新しく選んだSSDは、DCシリーズ(Data Center)シリーズで、サーバー用途のSSDです。実際には上位モデルのS3700にすべきだったのかもしれませんが、個人サーバですし、同様に二本体制でバックアップを取るので安価なS3500シリーズにしました。どちらにしても消費電力がメインストリームの520, 530, 335シリーズなどに比べて10倍近く大きいSSDです。フラッシュの電圧を上げて閾値を厳しく設定することによりデータの耐久性を上げているのでしょうか?(消費電力も上がる)。少なくとも壊れた510の後継の520/530を選ぶよりは、サーバー用途なのでS3500/S3700を選んだ方が良さそうです。510シリーズは保証3年だったものが、現行530, S3500, S3700などは保証5年なので近年のSSD技術の成熟で更なる耐久性アップになっていると信じたいです。
アクセスのできない日があったので、心配しておりました。
SSDが故障したのですね。私の個人デスクトップのSSD(Intel X25-M)はかれこれ5年使っておりますが、まだ余裕があるようです。
今回は運が悪かったのでしょうか。データ等無事でよかったですね(>_<)
驚きました。SSDとはいえ安心できないですね。