「データが静かに腐る」——ビットロット(bit rot)という現象を知ったとき、背筋が凍った。HDDに保存したデータが、時間経過とともに自然に壊れていく。通常のファイルシステムはこれを検出すらできない。
ZFSはこれを根本から解決する。Sun Microsystemsが開発した最強のファイルシステム。チェックサムでデータの整合性を常に検証し、壊れてたら自動修復する。スナップショット、圧縮、重複排除、全部入り。
ZFSの中核概念:
- プール(zpool) — 物理ディスクを束ねたストレージの単位。ここにデータセットを作る。
- データセット — ファイルシステムの単位。用途別に分ける(例:tank/media、tank/documents)。
- スナップショット — 瞬間の状態を保存。容量をほぼ食わない。`zfs snapshot tank/media@backup-2024-01-01` で即取得。
- スクラブ(scrub) — 全データのチェックサムを検証する処理。毎月1回走らせてる。
RAID-Z構成:
- RAID-Z1 — 1台まで故障OK。3台以上必要。
- RAID-Z2 — 2台までOK。4台以上。僕はこれ。安心感が違う。
- RAID-Z3 — 3台までOK。5台以上。やりすぎ感あるけどデータが命の人向け。
ZFSの注意点。メモリをすごく食う。1TBあたり1GBのARCキャッシュが目安。16GBメモリならデータ容量は16TBくらいまでが現実的。あと拡張が面倒。一度作ったvdevにディスクを追加できない(vdevを追加する形になる)。最初に計画をしっかり立てよう。
参考:OpenZFS