Oracle数据库数据恢复、性能优化

找回密码
注册
搜索
热搜: 活动 交友 discuz
发新帖

53

积分

0

好友

3

主题
1#
发表于 2013-9-2 14:32:45 | 查看: 5161| 回复: 7
有一套两节点的RAC ,使用ASM,基本信息如下:
OS VERSION:AIX 6.1.06 SP8
GRID VERSION:11.2.0.3.5
DB VERSION:11.2.0.3.5

每个节点上的两个网卡,没有绑定,一个publi(en0),一个private(en1)。

我在测试private 网卡意外down的时候(时间:2013-08-30 17:36:00 左右),发现通过ifconfig en1 down 停掉网卡后,二节点被驱逐,但是一节点的数据库连接时报错:ORA-12537:TNS:connect closed。
查看alert日志中有大量如下错误:
ORA-00603: ORACLE server session terminated by fatal error
ORA-27504: IPC error creating OSD context
ORA-27300: OS system dependent operation:mtu select abnormal return failed with status: 0
ORA-27301: OS failure message: Error 0
ORA-27302: failure occurred at: skgxpvfymtu

Process J000 died, see its trace file
kkjcre1p: unable to spawn jobq slave process
Errors in file /oracle/db/diag/rdbms/orcldb/orcldb_1/trace/orcldb_1_cjq0_12583228.trc:
Fri Aug 30 19:16:33 2013
opidrv aborting process W000 ospid (14090402) as a result of ORA-603

正常情况下,1节点应该正常提供服务的,不知道我的测试为什么会有这样的情况。
在mos上查了下,上面说的一些情况,基本上排除了,包括:
1.$ORACLE_HOME权限不对。
2.$ORACLE_HOME/bin/oracle 权限不对。
3./oracle文件系统不支持suid设置,此处在AIX暂未发现。
4.内存严重不足,通过topas看了,内存总共64G,comp 36%,nocomp 36%,SWAP空间均未使用。

在把所有日志都保存下来后,通过ifcofnig en1 up 恢复private网卡后,数据库连接正常。

前两天通过网络部门停掉private网卡测试时,连接是正常的。

日志见附件。
请各位帮忙看下什么原因,非常感谢。

alert_orcldb_1.txt

406.3 KB, 下载次数: 901

alert log

alert_ ASM1.txt

74.36 KB, 下载次数: 936

ASM alert log

crsd-rac01.rar

101.9 KB, 下载次数: 1186

crs log

listener.txt

431.17 KB, 下载次数: 908

listener log

orcldb_1_cjq0_12583228.txt

67.78 KB, 下载次数: 960

trace

orcldb_1_q000_12059084.txt

16.57 KB, 下载次数: 930

trace

orcldb_1_q000_12059084_i96001.rar

365.56 KB, 下载次数: 1034

trace

2#
发表于 2013-9-2 16:18:20
通过ifconfig en1 down 关闭节点1的心跳网卡后,附属在 节点1的心跳网卡地址丢失了么???

若只是通过网络交换机层面断开了网络连接,此时私有网卡还是有IP地址的。

回复 只看该作者 道具 举报

3#
发表于 2013-9-2 21:16:06
harryzhang 发表于 2013-9-2 16:18
通过ifconfig en1 down 关闭节点1的心跳网卡后,附属在 节点1的心跳网卡地址丢失了么???

若只是通过网 ...

感谢您的关注!
这个我倒是没太注意,我明天再测一次,注意观察下私有网卡地址。
今天在第二个节点测试私有网卡断网的情况下,CRS的表现,和预期的是一致的。
这次是1节点被驱逐,但是二节点依然可以使用,数据库连接都是正常的。

回复 只看该作者 道具 举报

4#
发表于 2013-9-3 14:49:14
刚才测试了下,通过ifconfig命令down掉心跳网卡,依然是1节点获得控制权,private ip没有丢失,二节点上的private ip 没有了。还是和上次一样的错误,无法连接数据库。

回复 只看该作者 道具 举报

5#
发表于 2013-9-4 22:10:55

2个节点上互ping private network 并给出输出
ping -s 1500 -c  10  rac-priv

回复 只看该作者 道具 举报

6#
发表于 2013-9-4 22:15:37
Maclean Liu(刘相兵 发表于 2013-9-4 22:10
2个节点上互ping private network 并给出输出
ping -s 1500 -c  10  rac-priv

好的刘大,我明天再去试试,然后贴下结果。
感谢刘大的回复!

回复 只看该作者 道具 举报

7#
发表于 2013-9-11 16:33:56
刚才在VM上测试(没得交换机),在节点2的priv 网卡down了。haip服务失效
ASM和DB均无法正常访问。

你在测试时  priv网卡的haip是否还存在?

回复 只看该作者 道具 举报

8#
发表于 2013-9-16 19:12:37
应该是因为ifconfig down掉网卡后,网卡上面的169的ip地址被清除导致的。

请问你最新的测试结果出来了吗?

回复 只看该作者 道具 举报

您需要登录后才可以回帖 登录 | 注册

QQ|手机版|Archiver|Oracle数据库数据恢复、性能优化

GMT+8, 2025-1-4 07:18 , Processed in 0.051104 second(s), 24 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部
TEL/電話+86 13764045638
Email service@parnassusdata.com
QQ 47079569