2

【服务器数据恢复】raid损坏导致戴尔某型号服务器崩溃的数据恢复案例

 1 year ago
source link: https://blog.51cto.com/sun510/5447049
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

【服务器数据恢复】raid损坏导致戴尔某型号服务器崩溃的数据恢复案例

原创

宋国建 2022-07-06 12:01:27 ©著作权

文章标签 数据恢复 服务器数据恢复 文章分类 其它 服务器 阅读数179

服务器故障:

戴尔某型号服务器由于raid损坏而崩溃,由于服务器数据涉密,管理员联系我们数据恢复中心上门进行数据恢复。

【服务器数据恢复】raid损坏导致戴尔某型号服务器崩溃的数据恢复案例_数据恢复

服务器故障检测:

数据恢复工程师携带相关设备到现场对服务器进行检测,发现导致服务器崩溃的原因是raid阵列中某些硬盘掉线。硬件工程师对所有磁盘进行物理检测后没有发现物理故障和坏道。随后数据恢复工程师借助数据恢复软件将故障服务器中的所有磁盘镜像到准备好的数据恢复服务平台上。

服务器数据恢复过程:

1、分析故障服务器RAID结构。

该故障服务器的LUN全部基于RAID阵列组,所以要恢复服务器数据首先要分析服务器底层RAID信息,然后根据分析获取到的信息重构原始的RAID组。服务器数据恢复工程师对raid阵列进行分析后发现服务器中有两块硬盘离线。由于6号盘和10号盘都属于Hot Spare,但在服务器发生故障时6号Hot Spare替换了掉线的5号硬盘,可10号盘由于未知原因未启用。服务器虽然成功激活了6号盘Hot Spare,但RAID中仍缺失一块硬盘,数据没有成功同步到6号硬盘。服务器数据恢复工程师继续分析其他硬盘,获取数据在硬盘中的分布规律,RAID条带的大小,每块磁盘的顺序等信息。

2、重组raid分析掉线盘顺序。

根据获取到的raid信息,数据恢复工程师使用北亚自主开发的RAID虚拟程序虚拟重组故障服务器raid。重组完成后分析服务器中两块掉线硬盘的掉线顺序。通过排查,服务器数据恢复工程师发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一致,初步判断此硬盘可能是最先掉线的。通过北亚自主开发的RAID校验程序对这个条带做校验,最终确定最先掉线的硬盘。

3、分析RAID组中的LUN信息。

基于获取到的raid信息,掉盘顺序,根据分析结果重组raid。分析LUN在RAID组中的分配信息和LUN分配的数据块MAP。然后根据这些信息使用北亚自主开发的raid数据恢复程序,解释LUN的数据MAP并导出LUN的所有数据。

4、解释ZFS文件系统并修复。

使用北亚自主开发的ZFS文件系统解释程序对生成的LUN做文件系统解释,解析所有文件节点及目录结构。

服务器数据恢复结果:

由服务器管理员亲自对数据进行验证,一切数据正常、完整,本次数据恢复成功。

  • 打赏
  • 收藏
  • 评论
  • 分享
  • 举报

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK