diagwait参数修改的疑问
当前环境:AIX6.1 10.2.0.5.11RAC
oracle有建议对于11gR2前的版本呢修改diagwait参数,但是并不能查到修改该参数步骤中涉及到的oprocd进程,修改步骤如下:
更改 diagwait 时务必关闭所有节点上的 clusterware 软件。下面是设置 diagwait 的分步说明。
1.以root用户的身份执行
#crsctl stop crs
#<CRS_HOME>/bin/oprocd stop ---这个进程在我的系统上是没有的
2.执行以下命令,确保关闭所有节点上的 Clusterware 软件
#ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"
这步应该不会返回任何进程。如果在 clusterware 运行时继续执行下一步骤,可能会损坏 OCR。在关闭群集所有节点上的 clusterware 软件前,不要继续操作。
3.在群集的一个节点上,通过root用户发出以下命令,可将“diagwait”参数的值改为 13 秒:
#crsctl set css diagwait 13 -force
4.执行以下命令,检查是否已成功设置 diagwait。该命令应返回 13。如果未设置 diagwait,将返回消息“Configuration parameter diagwait is not defined”。
#crsctl get css diagwait
5.在集群所有的节点上执行以下命令,重新启动Clusterware 软件:
#crsctl start crs
6.在所有节点执行以下命令,验证Clusterware 是否正常运行:
#crsctl check crs
如果我想修改当前系统的diagwait参数,第1步中 #<CRS_HOME>/bin/oprocd stop 我可以省略执行?
另:
查看文档发现:在 11.2 之前的 AIX 系统(没有其他供应商集群管理软件)上,OPROCD 默认不在 AIX 全局运行队列运行 (Bug 13623902),这可能会导致 OPROCD 错误地重启节点。此问题的更正操作是修改 /etc/init.cssd 文件,如下所示:
注意: 以下步骤以滚动(rolling)的方式执行,以避免数据库完全停止。
1. 停止本地节点上的 Clusterware 。
2. 如下修改 /etc/init.cssd:
从:
# Run oprocd synchronously and look for its status code
cd $OPROCDIR
# startup the some diagnostic collection scripts if any
StartDiagCollect;
$OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
$OPROCD_DEFAULT_HISTOGRAM $FATALARG
RC=$?
到:
# Run oprocd synchronously and look for its status code
cd $OPROCDIR
# startup the some diagnostic collection scripts if any
StartDiagCollect;
RT_GRQ=ON
export RT_GRQ
$OPROCD run -t $OPROCD_DEFAULT_TIMEOUT -m $OPROCD_DEFAULT_MARGIN \
$OPROCD_DEFAULT_HISTOGRAM $FATALARG
RC=$?
这种情况应该是不用修改,刚才有人帮忙解惑了。
他的想法:
要改diagwait在以下条件下
1 没有厂家的机群软件,这时候oprocd会控制是否因节点负载高而导致重启,如果重启的太快,会没有日志写进去,那么修改diagwait,也就是修改了oprocd重启前等待的时间。
2 对于有其他厂家软件的时候,根本就没有oprocd进程,也不存在主机过快启动的问题,所以根本就不需要修改diagwait,或者要修改也是修改其他参数
1 保持 RAC 群集环境稳定当前必须要做的 11 件事 (文档 ID 1525819.1)
原因: 在 10gR2 (10.2.x) 和 11gR1 (11.1.x) 中,OPROCD 守护进程的默认容差仅设置为 500 毫秒(0.5 秒)。对于非常繁忙的系统,此容差可能过小,因此负载繁重的系统可能会出现错误重启的情况。将 diagwait 设置更改为 13 后,OPROCD 的容差变成 10,000 毫秒(10 秒),为繁忙的系统提供了更长容差,可避免出现错误重启的情况。另外,如果出现节点重启的情况,设置diagwait 能够提供更多的时间将诊断信息刷新到跟踪文件中,以供进一步诊断使用
以上是为什么要修改diagwait参数的原因
2 http://docs.oracle.com/cd/B19306 ... sary.htm#sthref1812
OPROCD
A UNIX-based process monitor for a cluster. Note that this process will only appear on platforms that do not use vendor clusterware with Oracle Clusterware.
页:
[1]