说句实在话,很多人第一次真正面对几十 T、上百 T 数据的时候,都会有一个错觉:
“我们不是早就做了 RAID、做了备份吗?还能出什么事?”
然后,事故真的发生一次,你就再也不敢这么想了。
我见过的数据中心事故里,真正致命的,从来不是硬盘坏了,而是:
- 误删
- 脚本写错
- 勒索软件
- 备份在,但恢复不了
- 恢复得太慢,业务等不起
而这些问题,恰恰都是在数据规模上来之后,才集中爆发的。
RAID 不是备份,这个坑还有人在反复踩
这个话题说烂了,但现实是——每年还是有人掉进去。
RAID、EC、双控、冗余电源,这些东西解决什么问题?
解决的是:硬件会坏,而且一定会坏。
但它们解决不了:
- 人把数据删了
- 程序把数据写乱了
- 病毒把文件全加密了
你用