ALLSTARS_ORACLE 发表于 2017-4-16 09:32:03

卷组中的VGDA属性带来的系统可靠性问题

From:http://zhaolinjnu.blog.sohu.com/62160449.html
为了保证系统的可靠性,我们常常要对rootvg做镜相(mirrorvg),或对其它重要的卷组做镜相.并不是说只要做了镜相,我们的系统就已经足够的 安全。如果volumn group的参数设置不当,例如vg的重要特性参数QUORUM是否关闭,如果出现硬盘损坏时,将直接影响着整个卷组的状态。下面以rootvg为例来说 明quorum参数:
1.首先来查看当前rootvg的quorum参数设置:smit chvg=>输入rootvg即可
                                                       Change a Volume Group   
                                                                                
Type or select values in entry fields.                                          
Press Enter AFTER making all desired changes.                                   
                                                                                
                                                                 
* VOLUME GROUP name                                   rootvg                    
* Activate volume group AUTOMATICALLY                 yes                       
    at system restart?                                                         
* A QUORUM of disks required to keep the volume       no                        
   group on-line ?                                                              
其它信息省略

当然也可以通过lsvg root查看此参数值:
test_stb:/home/oracle>$lsvg rootvg|grep QUORUM
OPEN LVs:           10                       QUORUM:         1
对于一个卷组来说,quorum只有两个值:一个是YES(数字值为3),另外一个值是NO(数字值 为1).与卷组quorum参数相关的物理结构是卷组中物理卷PV头部的VGDA部份,而且每个物理卷上此部份的信息的个数随着vg里面pv的个数而有所 不同,下面用图示表示为:


如果一个卷组中只有一个磁盘PV1,那么将会在PV1上出现两个VGDA;如果一个VG里有两个 PV(PV1,PV2),那么在PV1将会有两个VGDA,PV2上只有一个VGDA;如果一个VG里有三个或三个以上的PV,那么每个PV上将会只有一 个VGDA。至于每个盘上有几个VGDA,可以通过命令查看:
test_stb:/home/oracle>$lspv hdisk0|grep "VG DESCRIPTORS"
TOTAL PPs:          546 (69888 megabytes)    VG DESCRIPTORS:   2
test_stb:/home/oracle>$lspv hdisk3|grep "VG DESCRIPTORS"
TOTAL PPs:          546 (69888 megabytes)    VG DESCRIPTORS:   1
VGDA储存这个vg上包括哪些PV,分布有哪些lv,有哪些文件系统。从上面的图可以看出,如果其中的盘pv损坏,可以计算出丢失的比率。那quorum参数与vgda到底有什么关系呢?
假设rootvg 里只有两块硬盘hdisk0(2个VGDA),hdisk3(1个VGDA),我们实际的情况通常也是这样。
当quorum=yes 的时候,如果hdisk0损坏,那么只有33%的VGDA可用,而这个比例<=50%,此时AIX操作系统会自动把此rootvg varyoff下来.如果不是hdisk0损坏,而是hdisk3损坏,那么rootvg里还有66%的VGDA个数可用>50%,那么 rootvg状态不变,系统正常运行。
当quorum=no 的时候,不管你是hdisk0,还是hdisk3损坏,rootvg都不会因为一个磁盘损坏而把整个vg varyoff下来,系统照样正常运行,及AIX操作系统不会以50%的阀值来check当前可用VGDA数的比率。这种参数设置下,只要及时更换损坏的 硬盘,就可以保证系统的可靠性。AIX5305安装好后,rootvg QUORUM参数的值默认为No.如果没有及时更换坏掉的硬盘,而系统又在这个时候需要重新启动,那么rootvg将需要强行varyonvg -f rootvg
上面只是以rootvg为例,其它vg也是这样,但AIX操作系统对其它VG的QUORUM参数的默 认配置为YES的,通常情况下,其它vg的盘也比较多,所以通常情况下,坏掉一个硬盘,也不会将有效的VGDA比例拉到50%以下。况且其它vg的pv很 多时候都是使用存储上的lun了,底层的一个硬盘的损坏,对于操作系统来说是看不到的,所以可用的VGDA的比率保持在100%。
偶原来都没有注意到这个问题,这两天参加2007 IBM SYSTEM P6经验交流会时听到的,接下来还有其它的会议内容(个人觉得值得讲的)也会写在blog上,与大家一起分享.
体验新版博客
页: [1]
查看完整版本: 卷组中的VGDA属性带来的系统可靠性问题