【raid数据恢复故障描述】
需要进行数据恢复的是北京一家公司的IBM X3850服务器,服务器挂载了5块73G SAS硬盘组成raid5磁盘阵列,4 盘为热备盘(Hot-Spare),由于未知原因2 盘离线后未能成功激活热备盘rebuild,后3 盘离线,RAID崩溃。
用户服务器的操作系统为linux redhat 5.3,服务器存储有oracle数据库,因oracle已经不再对基于数据库上的oa系统提供后续支持,用户要求尽可能数据恢复+操作系统复原。
【数据恢复初检结情况】
Raid阵列中硬盘无明显物理故障,raid无同步表现。
【raid阵列数据恢复方案】
1、关闭服务器并确保数据恢复过程中保持服务器关闭状态以保护故障服务器原始状态。
2、将故障硬盘标好序 ,确保在拿出槽位后可以完全复原。
3、将需要进行数据恢复的硬盘挂载至北亚数据恢复中心只读环境中,对所有故障硬盘做完全镜像(参考)。用于数据恢复操作使用。
4、分析备份磁盘的raid结构,得到原raid阵列的RAID级别,条带规则,条带大小,校验方向,META区域等必要信息并根据这些信息搭建虚拟raid5环境。
5、解释虚拟磁盘及文件系统,然后检测虚拟结构的正确性,如果虚拟结构不正确则重复上述步骤,直到成功为止。
6、数据检测正常后进行数据回迁,原则上不再使用原盘,如确实经客户认可需要使用原盘则需要确认原盘已经完整备份后再重建raid、回迁数据。可以使用linux livecd或win pe(通常不支持)等进行,也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。
【恢复周期】
备份时间,约2小时。
解释及导出数据时间,约4小时。
回迁操作系统,约4小时。
【数据恢复实施过程】
1、对用户服务器进行镜像后发现除2 盘有坏扇区存在,其他盘均无坏道,坏道数量悦游20个左右。
2、分析结构:得到的最佳结构为0,1,2,3盘序,缺3 盘,块大小512扇区,backward parity(Adaptec),结构如下图:
图一:

根据提示,在系统中发现有多个节点共用同样的数据块。按此提示进行底层分析,发现,因3 盘早掉线,帮存在节点信息的新旧交集。
按节点所属的文件进行区别,清除错误节点后,再次执行fsck -fn /dev/sda5,依然有 错信息,但已经很少。根据提示,发现这些节点多位于doc目录下,不影响系统启动,于是直接fsck -fy /dev/sda5强行修复。
修复后,重启系统,成功进入桌面。
启动数据库服务,启动应用软件,一切正常,无 错。
到此,数据恢复及系统回迁工作完成。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!