找回密码
 注册
快捷导航
查看: 2308|回复: 0

【转帖】RAID技术详解(4)

[复制链接] |自动提醒
阅读字号:

54

回帖

0

积分

239

资产值

入门会员 Rank: 1

注册时间
2012-9-6
发表于 2012-9-27 16:28:13| 字数 4,022| - 上海市 电信 | 显示全部楼层 |阅读模式
1.8
RAID-5ERAID-5EE技术详解


RAID-5ERAID-5EE都是由IBM公司提出的一种私有RAID级别,没有成为国际标准,所以在商业应用上并不是十分普及。
1.8.1
RAID-5E数据组织原理这种RAID级别是从RAID-5的基础上发展而来的,它与RAID-5不同的地方是将数据校验信息平均分布在每一个物理盘中的同时,还要在每个物理盘都要预留一定的空间,这部分空间称为热备空间(简写为HS)。当一个物理盘出现故障时,这个物理盘上的数据将被写入到其他物理盘预留的热备空间内,达到数据保护的作用,而这时候的RAID级别则从RAID-5E转换成了特殊结构的RAID-5,继续保护磁盘数据。

RAID-5E允许两个磁盘出错,但不能是同一时间出错。构建RAID-5E最少需要4个磁盘才能实现,构建成的逻辑盘容量为全部物理盘总容量减去两块物理盘的容量,因为一块物理盘的容量用来存放校验信息,一块物理盘的容量用来作为热备空间。

RAID-5E的结构如图1-37所示。





图1-37
RAID-5E数据分布图
RAID-5E现在几乎没有商业应用,所以本书省略对该结构的故障原因分析和数据恢复思路的讲解。
1.8.2
RAID-5EE数据组织原理RAID-5EE的工作原理与RAID-5E基本相同,它也是在每个磁盘中预留一部分空间作为分布的热备空间,但这部分热备空间也像数据一样进行了条带化,分布在每个条带组中。当一个硬盘出现故障时,这个磁盘上的数据将被同步到分布的热备空间,达到数据的保护作用。

不过与RAID-5E不同的是RAID-5EE内增加了一些优化技术,使RAID-5EE的工作效率更高,同步数据的速度也更快。

RAID-5EE也允许两个磁盘不在同一时间出错,构建RAID-5EE最少需要4个磁盘才能实现,其数据分布情况如图1-38所示。






图1-38
RAID-5EE数据分布图

1-38中“HS0HS1HS2HS3就是一些热备空间,用于备份存储离线物理盘同一条带中的数据。
1.8.3
RAID-5EE故障原因分析这里说的RAID-5EE故障,是指RAID-5EE逻辑盘丢失或不可访问。导致RAID-5EE故障的原因主要有以下几种:
1RAID控制器出现物理故障

RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-5EE中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

2RAID信息出错

RAID控制器将物理盘配置为RAID-5EE后,会生成一些参数,包括该RAID-5EE的盘序、条带大小、左右结构情况、同步异步情况、RAID-5EE在每块物理盘中的起始地址等,还会记录有关该RAID-5EE的相关信息,包括组成该RAID-5EE的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-5EE的成员盘中。

RAID信息出错就是指该RAID-5EE的配置信息和参数出现错误,导致RAID程序不能正确地组织管理RAID-5EE中的成员盘,从而导致RAID-5EE逻辑盘丢失或不能访问。

3RAID-5EE成员盘出现物理故障

RAID-5EE中一块成员盘离线后,剩下的成员盘会计算生成离线成员盘的数据并写入热备空间内,如果在这个过程还没有完成的情况下又有一块成员盘离线,RAID-5EE就会崩溃。

4)人为误操作

如果误将RAID-5EE中两块以上成员盘同时拔出、或者给RAID-5EE除尘时将成员盘拔出后忘了原来的顺序、以及不小心删除了RAID-5EE的配置信息等,都会造成RAID-5EE崩溃。

5RAID控制器的稳定性
RAID-5EE的数据分布结构中有校验块和热备块的存在,当RAID-5EE中有成员盘离线时,算法将变得非常复杂,RAID控制器将会工作在一个比较吃力的状态。而RAID控制器的负载太重便会极大地增加数据读写时出现I/O滞留的可能性,从而导致更多成员盘离线,或者导致RAID信息出错
1.8.4
RAID-5EE数据恢复思路RAID-5EE中数据的分布与RAID-5相比,每个条带组中多出一个热备块,如图1-39中的“HS0HS1HS2HS3就是热备块




图1-39
RAID-5EE的结构图

RAID-5EE的数据进行重组,也需要先把物理盘去RAID化,作为单盘进行分析,如图1-39中的四块物理盘,把四块物理盘中的数据按照“ABCDEFGH……”的顺序拼接好,就是RAID-5EE逻辑盘中完整的数据。

因为RAID-5EE的每块物理盘中都有校验块和热备块,所以分析RAID-5EE就需要比RAID-5多一个因素,即热备块的位置。另外,RAID-5EERAID-5一样,也有左异步、左同步、右异步、右同步之分,也就是说,RAID-5EE 有五个因素需要分析,第一个是RAID中每个条带的大小,也就是
A”或“B
这些数据块所占用的扇区数;第二个因素是RAID中硬盘的排列顺序,也就是盘序;第三个因素是校验块的循环方向;第四个因素是数据块的走向;第五个因素是热备块的位置。

以图1-39中四块物理盘组成的RAID-5EE为例,假设条带的大小为32个扇区,物理盘的顺序就按照图中的排列顺序,那么只要到硬盘0中取0-31扇区的信息,再到硬盘1中取0-31扇区的信息,硬盘20-31扇区是热备块,跳过不取,硬盘30-31扇区的信息是校验块,跳过不取。接下来再回到硬盘0中取32-63扇区的信息,就这样依次按顺序取下去,把所有取出来的数据按照顺序衔接成一个镜像文件或者是镜像盘,这就成为完整的原RAID-5EE逻辑盘的结构了,直接访问这个重组出来的镜像文件或镜像盘,就得到了原RAID-5EE逻辑盘中的数据。

如果RAID-5EE的一块成员盘事先已经离线,那么这块成员盘中的数据会被同步到热备块中,剩下的成员盘依然是一个完整的、结构特殊的RAID-5,这个特殊的RAID-5出现故障后,数据恢复的思路变化比较大,读者可以自行画出图来分析一下。

1.9
HP
双循环技术详解

HP双循环原来是有康柏公司开发的一种RAID-5的阵列形式,后来惠普收购了康柏,又被惠普所采用,所以一般称为“HP双循环”。
1.9.1
HP双循环数据组织原理HP双循环的数据组织结构大致如图1-40所示:




图1-40
HP双循环RAID-5
图中的“123……”表示数据块,“P1P2P3……”表示校验块,从图中可以看出此阵列为内外双循环阵列,其存储结构的特点如下:

1)阵列的起始扇区位于每块物理盘的1088扇区(大多数情况下起始于1088扇区,但不是所有情况);

2)大结构是一个RAID-5阵列,条带大小是512个扇区(大多数情况下是512个扇区,但不是所有情况);

3)在每一个512扇区单元内,每块物理盘又组成条带大小为32个扇区(大多数情况下是32个扇区,但不是所有情况)的RAID-4

1.9.2
HP双循环故障原因分析这里说的HP双循环故障,是指HP双循环逻辑盘丢失或不可访问。导致HP双循环故障的原因主要有以下几种:
1RAID控制器出现物理故障

RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对HP双循环中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

2RAID信息出错

RAID控制器将物理盘配置为HP双循环后,会生成一些参数,包括该HP双循环的盘序、条带大小、RAID在每块物理盘中的起始地址等,还会记录有关该HP双循环的相关信息,包括组成该HP双循环的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到HP双循环的成员盘中。

RAID信息出错就是指该HP双循环的配置信息和参数出现错误,导致RAID程序不能正确地组织管理HP双循环中的成员盘,从而导致HP双循环逻辑盘丢失或不能访问。

3HP双循环成员盘出现物理故障

HP双循环可以允许其中一块成员盘离线而不影响数据的完整性,如果HP双循环中的某一块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,该成员盘就不能正常使用,但剩下的成员盘可以利用异或运算计算出离线成员盘中的数据,所以HP双循环还不会崩溃。

如果系统管理员没有及时替换出现故障的成员盘,当再有一块成员盘再出现故障离线后,HP双循环将彻底崩溃。

4)人为误操作

如果误将HP双循环中两块以上成员盘同时拔出、或者给HP双循环除尘时将成员盘拔出后忘了原来的顺序、以及不小心删除了HP双循环的配置信息等,都会造成HP双循环崩溃。

5RAID控制器的稳定性
HP双循环的数据分布结构中有校验块的存在,当HP双循环中有成员盘离线时,算法将变得更加复杂,RAID控制器将会工作在一个比较吃力的状态。而RAID控制器的负载太重便会极大地增加数据读写时出现I/O滞留的可能性,从而导致更多成员盘离线,或者导致RAID信息出错

1.9.3
HP双循环数据恢复思路HP双循环是由RAID-5结构的外循环和RAID-4结构的内循环结合而成,所以在重组HP双循环的数据时,需要分析盘序、RAID-4结构内循环的条带大小、RAID-5结构外循环的条带大小等参数。
在分析完HP双循环的数据结构后,对于RAID-4结构的内循环,可以不理会校验所在成员盘,只对其他成员盘按照RAID-0的方式读取数据;然后再将读取出来的各个RAID-4结构内循环的数据按照RAID-5的方式衔接起来,做成一个镜像文件或者是镜像盘,这就成为完整的原HP双循环逻辑盘的结构了,直接访问这个重组出来的镜像文件或镜像盘,就得到了原HP双循环逻辑盘中的数据。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2024-6-7 06:11 , Processed in 0.076276 second(s), 25 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|联系我们|专门网

返回顶部