ALLSTARS_ORACLE 发表于 2017-4-16 15:44:02

生产数据库这几天乱死了

先是出现ORA-00600错误,数据库会不定期的崩溃,需要重启数据库,然后一切正常,再过段时间又崩溃了。
看了网上无数篇文章后,认为原因是回滚段的问题。
于是新建了一个UNDO表空间,并切换到新的UNDO表空间。
这个错误倒是没有了。
但出现了ORA-00600的错误,据说解决方案还是需要重建UNDO表空间了。
已经重建了无数个UNDO表空间了,故障依旧。
此故障使用应用系统时好时坏,在更新数据时会此报错。

急啊!


版本如下:
Oracle9i Enterprise Edition Release 9.2.0.3.0 - 64bit Production
With the Partitioning, OLAP and Oracle Data Mining options
JServer Release 9.2.0.3.0 - Production
ORACLE_HOME = /index/zjprod/zjproddb/9.2.0
System name:        AIX
Node name:        erp1
Release:        2
Version:        5


是的。AIX操作系统的ROOTVG的一个镜像硬盘坏了,供应商的工程师说不要取消镜像,等他第二天来换,结果造成了数据库崩溃,后来就变成现在这样了。
太大了,有100G的数据。


昨天晚上恢复到ORA-00600出错时的状态,采用我自己想的解决方案,到今天为此没报错了,不知道会不会成功。

直接删除undo$表中的一条记录。
UNDO表空间中的这一段空间可能是永远地报废了,不知道还会有什么后遗症。


ORA-00600错误提示后面有三个数字,我查了下,正好是回滚表空间、文件号和块号,属于_SYSSMU110$回滚段的。
DUMP该块,显示交易状态全为9,数据库中也没有待定交易。
觉得直接删除UNDO$也是一种方法,就试了试,到现在已有三天,系统运行正常,无任何报错。
我也想问问高手能否解释为什么这样做就好了呢?
页: [1]
查看完整版本: 生产数据库这几天乱死了