- 最后登录
- 2013-11-17
- 在线时间
- 24 小时
- 威望
- 53
- 金钱
- 364
- 注册时间
- 2012-3-14
- 阅读权限
- 50
- 帖子
- 37
- 精华
- 0
- 积分
- 53
- UID
- 297
|
1#
发表于 2013-9-2 14:32:45
|
查看: 5160 |
回复: 7
有一套两节点的RAC ,使用ASM,基本信息如下:
OS VERSION:AIX 6.1.06 SP8
GRID VERSION:11.2.0.3.5
DB VERSION:11.2.0.3.5
每个节点上的两个网卡,没有绑定,一个publi(en0),一个private(en1)。
我在测试private 网卡意外down的时候(时间:2013-08-30 17:36:00 左右),发现通过ifconfig en1 down 停掉网卡后,二节点被驱逐,但是一节点的数据库连接时报错:ORA-12537:TNS:connect closed。
查看alert日志中有大量如下错误:
ORA-00603: ORACLE server session terminated by fatal error
ORA-27504: IPC error creating OSD context
ORA-27300: OS system dependent operation:mtu select abnormal return failed with status: 0
ORA-27301: OS failure message: Error 0
ORA-27302: failure occurred at: skgxpvfymtu
Process J000 died, see its trace file
kkjcre1p: unable to spawn jobq slave process
Errors in file /oracle/db/diag/rdbms/orcldb/orcldb_1/trace/orcldb_1_cjq0_12583228.trc:
Fri Aug 30 19:16:33 2013
opidrv aborting process W000 ospid (14090402) as a result of ORA-603
正常情况下,1节点应该正常提供服务的,不知道我的测试为什么会有这样的情况。
在mos上查了下,上面说的一些情况,基本上排除了,包括:
1.$ORACLE_HOME权限不对。
2.$ORACLE_HOME/bin/oracle 权限不对。
3./oracle文件系统不支持suid设置,此处在AIX暂未发现。
4.内存严重不足,通过topas看了,内存总共64G,comp 36%,nocomp 36%,SWAP空间均未使用。
在把所有日志都保存下来后,通过ifcofnig en1 up 恢复private网卡后,数据库连接正常。
前两天通过网络部门停掉private网卡测试时,连接是正常的。
日志见附件。
请各位帮忙看下什么原因,非常感谢。
|
|