renjie_41 发表于 2013-12-4 18:21:11

awr dbtime异常,警告日志出现minact-scn error 12751

操作系统版本:aix 6100-08-03-1339
数据库版本:11.2.0.3.7 单实例。
目前无负载,但马上要投入生产,发现了异常而奇怪的问题,数据库安装过程无报错。
警告日志报错截取如下:
minact-scn: useg scan erroring out with error e:12751
Thu Nov 28 17:17:37 2013
Time drift detected. Please check VKTM trace file for more details.
minact-scn: useg scan erroring out with error e:12751
Fri Nov 29 03:38:56 2013
Suspending MMON slave action kewfmadsa_ for 82800 seconds
awr报告截取如下:
Begin Snap: 1049 04-Dec-13 17:00:23 35 .7
End Snap: 1050 04-Dec-13 17:30:24 35 .7
Elapsed:   30.02 (mins)     
DB Time:   6,657,454,706.53 (mins)     

可以看到半小时内db time达到惊人的数量级,CPUs为32
求各位达人老师的帮忙

ALLSTARS_ORACLE 发表于 2013-12-4 19:13:09

上传 alert.log 和AWR 压缩打包

lunar 发表于 2013-12-4 20:31:34

Suspending MMON slave action kewfmadsa_ for 82800 seconds
这个信息表示MMON slave进程异常了,82800是受下面隐含参数控制的:

SYS@bb>select ksppinm, ksppstvl, KSPPDESC
  2  from x$ksppi pi, x$ksppcv cv
  3  where cv.indx=pi.indx and pi.ksppinm like '\_%' escape '\'
  4   and pi.ksppinm like '%kebm_suspension%';

KSPPINM                        KSPPSTVL        KSPPDESC
------------------------------ --------------- -------------------------------------------------------
_kebm_suspension_time          82800           kebm auto suspension time in seconds

SYS@bb>

1,你可以kill掉mmon和mxxx进程(mmon slave进程)
2,你可以trave mmon和snapshot flush的相关活动,从而具体定位哪一类问题或者bug导致的方法如下:
开启:
alter session set "_swrf_test_action" = 28;
alter session set "_swrf_test_action" = 10;

关闭:
alter session set "_swrf_test_action" = 29;
alter session set "_swrf_test_action" = 11;




renjie_41 发表于 2013-12-5 00:56:51

警告日志上传如下

renjie_41 发表于 2013-12-5 01:02:11

awr上传如下

renjie_41 发表于 2013-12-5 01:04:31

mmon trace

renjie_41 发表于 2013-12-5 01:07:27

m00 process trace

renjie_41 发表于 2013-12-5 01:09:10

需要recreate awr功能吗?如果kill掉mmon进程是否会对数据库有影响。谢谢

renjie_41 发表于 2013-12-5 11:29:14

Instance     DB Name        Snap Id    Snap Started    Level
------------ ------------ --------- ------------------ -----
xjdss        XJDSS             1063 05 Dec 2013 00:00      1
                               1064 05 Dec 2013 00:30      1
                               1065 05 Dec 2013 01:00      1
                               1066 05 Dec 2013 01:30      1
                               1067 05 Dec 2013 02:00      1
                               1068 05 Dec 2013 02:30      1
                               1069 05 Dec 2013 03:00      1
                               1070 05 Dec 2013 03:30      1
                               1071 05 Dec 2013 04:00      1
                               1072 05 Dec 2013 04:30      1
                               1074 05 Dec 2013 05:30      1
                               1076 05 Dec 2013 06:30      1
                               1077 05 Dec 2013 07:00      1
                               1079 05 Dec 2013 08:00      1
                               1080 05 Dec 2013 08:30      1
                               1081 05 Dec 2013 09:00      1
                               1082 05 Dec 2013 09:30      1
                               1083 05 Dec 2013 10:00      1
                               1085 05 Dec 2013 11:00      1
awr的快照收集时间我改的是每半小时收集一次,但执行awr时却发现快照时间有些间隔却在1个小时,并不统一,是mmon的问题造成了awr快照收集的延迟?
后台日志还有minact-scn: useg scan erroring out with error e:12751报错,是否也和awr里dbtime异常有关呢?谢谢各位达人老师了

lunar 发表于 2013-12-5 22:47:38

renjie_41 发表于 2013-12-5 01:09 static/image/common/back.gif
需要recreate awr功能吗?如果kill掉mmon进程是否会对数据库有影响。谢谢

kill吧,awr的进程都可以被kill

renjie_41 发表于 2013-12-6 13:34:13

lunar 发表于 2013-12-5 22:47 static/image/common/back.gif
kill吧,awr的进程都可以被kill

把库重启了,问题还是继续出现了
页: [1]
查看完整版本: awr dbtime异常,警告日志出现minact-scn error 12751