我想我不够好 发表于 2014-4-17 14:26:27

diagwait参数修改的疑问


当前环境:AIX6.1   10.2.0.5.11RAC

oracle有建议对于11gR2前的版本呢修改diagwait参数,但是并不能查到修改该参数步骤中涉及到的oprocd进程,修改步骤如下:
更改 diagwait 时务必关闭所有节点上的 clusterware 软件。下面是设置 diagwait 的分步说明。
1.以root用户的身份执行
#crsctl stop crs
#<CRS_HOME>/bin/oprocd stop    ---这个进程在我的系统上是没有的

2.执行以下命令,确保关闭所有节点上的 Clusterware 软件
#ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"

这步应该不会返回任何进程。如果在 clusterware 运行时继续执行下一步骤,可能会损坏 OCR。在关闭群集所有节点上的 clusterware 软件前,不要继续操作。

3.在群集的一个节点上,通过root用户发出以下命令,可将“diagwait”参数的值改为 13 秒:
#crsctl set css diagwait 13 -force

4.执行以下命令,检查是否已成功设置 diagwait。该命令应返回 13。如果未设置 diagwait,将返回消息“Configuration parameter diagwait is not defined”。
#crsctl get css diagwait

5.在集群所有的节点上执行以下命令,重新启动Clusterware 软件:
#crsctl start crs

6.在所有节点执行以下命令,验证Clusterware 是否正常运行:
#crsctl check crs

如果我想修改当前系统的diagwait参数,第1步中 #<CRS_HOME>/bin/oprocd stop   我可以省略执行?


另:
查看文档发现:在 11.2 之前的 AIX 系统(没有其他供应商集群管理软件)上,OPROCD 默认不在 AIX 全局运行队列运行 (Bug 13623902),这可能会导致 OPROCD 错误地重启节点。此问题的更正操作是修改 /etc/init.cssd 文件,如下所示:
注意: 以下步骤以滚动(rolling)的方式执行,以避免数据库完全停止。

1. 停止本地节点上的 Clusterware 。
2. 如下修改 /etc/init.cssd:
从:

   # Run oprocd synchronously and look for its status code
    cd $OPROCDIR

   # startup the some diagnostic collection scripts if any
    StartDiagCollect;

   $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
       $OPROCD_DEFAULT_HISTOGRAM $FATALARG
    RC=$?

到:

   # Run oprocd synchronously and look for its status code
    cd $OPROCDIR

   # startup the some diagnostic collection scripts if any
    StartDiagCollect;

   RT_GRQ=ON
    export RT_GRQ

   $OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
       $OPROCD_DEFAULT_HISTOGRAM $FATALARG
    RC=$?

我想我不够好 发表于 2014-4-17 14:34:56

这种情况应该是不用修改,刚才有人帮忙解惑了。

他的想法:
要改diagwait在以下条件下
1 没有厂家的机群软件,这时候oprocd会控制是否因节点负载高而导致重启,如果重启的太快,会没有日志写进去,那么修改diagwait,也就是修改了oprocd重启前等待的时间。
2 对于有其他厂家软件的时候,根本就没有oprocd进程,也不存在主机过快启动的问题,所以根本就不需要修改diagwait,或者要修改也是修改其他参数


1  保持 RAC 群集环境稳定当前必须要做的 11 件事 (文档 ID 1525819.1)

原因:  在 10gR2 (10.2.x) 和 11gR1 (11.1.x) 中,OPROCD 守护进程的默认容差仅设置为 500 毫秒(0.5 秒)。对于非常繁忙的系统,此容差可能过小,因此负载繁重的系统可能会出现错误重启的情况。将 diagwait 设置更改为 13 后,OPROCD 的容差变成 10,000 毫秒(10 秒),为繁忙的系统提供了更长容差,可避免出现错误重启的情况。另外,如果出现节点重启的情况,设置diagwait 能够提供更多的时间将诊断信息刷新到跟踪文件中,以供进一步诊断使用

以上是为什么要修改diagwait参数的原因

2  http://docs.oracle.com/cd/B19306 ... sary.htm#sthref1812

OPROCD

A UNIX-based process monitor for a cluster. Note that this process will only appear on platforms that do not use vendor clusterware with Oracle Clusterware.

页: [1]
查看完整版本: diagwait参数修改的疑问