luoluo 发表于 2013-11-11 19:45:17

发现实例重启alte日志0600错误

本帖最后由 luoluo 于 2013-11-11 19:45 编辑

生存环境:rac 节点2
SQL> select * from v$version;

BANNER
----------------------------------------------------------------
Oracle Database 10g Enterprise Edition Release 10.2.0.4.0 - 64bi
PL/SQL Release 10.2.0.4.0 - Production
CORE        10.2.0.4.0        Production

TNS for IBM/AIX RISC System/6000: Version 10.2.0.4.0 - Productio
NLSRTL Version 10.2.0.4.0 - Production
SQL> select * from v$instance;

INSTANCE_NUMBER INSTANCE_NAME    HOST_NAME                                                        VERSION           STARTUP_TIME STATUS       PARALLEL    THREAD# ARCHIVER LOG_SWITCH_WAIT LOGINS     SHUTDOWN_PENDING DATABASE_STATUS   INSTANCE_ROLE      ACTIVE_STATE BLOCKED
--------------- ---------------- ---------------------------------------------------------------- ----------------- ------------ ------------ -------- ---------- -------- --------------- ---------- ---------------- ----------------- ------------------ ------------ -------
              2 orcl2            rac02                                                            10.2.0.4.0        2013-11-11 1 OPEN         YES               2 STARTED                  ALLOWED    NO               ACTIVE            PRIMARY_INSTANCE   NORMAL       NO



alert日志如下:
Mon Nov 11 16:01:05 2013
Errors in file /u01/app/oracle/admin/orcl/bdump/orcl2_lms0_327978.trc:
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
Mon Nov 11 16:01:07 2013
Trace dumping is performing id=
Mon Nov 11 16:01:07 2013
Errors in file /u01/app/oracle/admin/orcl/bdump/orcl2_lms0_327978.trc:
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
Mon Nov 11 16:01:08 2013
Errors in file /u01/app/oracle/admin/orcl/bdump/orcl2_lms0_327978.trc:
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
Mon Nov 11 16:01:13 2013
Errors in file /u01/app/oracle/admin/orcl/bdump/orcl2_lms0_327978.trc:
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
ORA-00600: internal error code, arguments: , , , [], [], [], [], []


crsd.log里面如下:
2013-11-11 16:01:14.086: [  CRSRES]32In stateChanged, ora.orcl.orcl2.inst target is ONLINE
2013-11-11 16:01:14.088: [  CRSRES]32ora.orcl.orcl2.inst on rac02 went OFFLINE unexpectedly
2013-11-11 16:01:14.088: [  CRSRES]32StopResource: setting CLI values
2013-11-11 16:01:14.093: [  CRSRES]32Attempting to stop `ora.orcl.orcl2.inst` on member `rac02`
2013-11-11 16:01:32.374: [  CRSRES]32Stop of `ora.orcl.orcl2.inst` on member `rac02` succeeded.
2013-11-11 16:01:32.377: [  CRSRES]32ora.orcl.orcl2.inst RESTART_COUNT=0 RESTART_ATTEMPTS=5
2013-11-11 16:01:32.383: [  CRSRES]32Restarting ora.orcl.orcl2.inst on rac02
2013-11-11 16:01:32.389: [  CRSRES]32startRunnable: setting CLI values
2013-11-11 16:01:32.390: [  CRSRES]32Attempting to start `ora.orcl.orcl2.inst` on member `rac02`
2013-11-11 16:06:40.775: [  CRSRES]32Start of `ora.orcl.orcl2.inst` on member `rac02` succeeded.
2013-11-11 16:06:40.776: [  CRSRES]32Successfully restarted ora.orcl.orcl2.inst on rac02, RESTART_COUNT=1
2013-11-11 16:06:40.801: [  CRSRES]32ora.orcl.orcl2.inst Updated LAST_RESTART time in ocr

orcl2_lms0_327978.trc 内容截取如下:
*** 2013-11-11 16:01:05.311
ksedmp: internal or fatal error
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
----- Call Stack Trace -----
calling              call     entry                argument values in hex      
location             type     point                (? means dubious value)     
-------------------- -------- -------------------- ----------------------------
ksedst+001c          bl       ksedst1              000000000 ? 000000000 ?
ksedmp+0290          bl       ksedst               104A2CDB0 ?
ksfdmp+0018          bl       03F2735C            
kgerinv+00dc         bl       _ptrgl               
kgeasnmierr+004c     bl       kgerinv              000000000 ? 70000015D053B00 ?
                                                   70000015D053B38 ?
                                                   700000010018078 ? 104CBCB74 ?
kclnloc+0180         bl       kgeasnmierr          110195490 ? 1105A0750 ?
                                                   104CBCB74 ? 200000002 ?
                                                   000000000 ? 00000000D ?
                                                   000000000 ? 00000000C ?
kclnfnd+0058         bl       kclnloc              70000014A0F4018 ? 11022A3E0 ?
kclgrantlk+01ec      bl       kclnfnd              700000378AAA158 ?
kclcrrf+00b0         bl       kclgrantlk           AF9073344A15CC ? 110DE65E0 ?
                                                   FFFFFFFFFFFCAA0 ? 11022A3E0 ?
                                                   000000000 ? 000000001 ?
kjblcrcbk+01c8       bl       _ptrgl               
kjblpcr+05d8         bl       kjblcrcbk            104ABAF00 ? 000000760 ?
                                                   000000000 ? 000000004 ?
                                                   000000000 ? 110C81EE0 ?
                                                   00002DA9A ? 700000010018078 ?
kjbmpbast+0628       bl       kjblpcr              000000002 ? 000000001 ?
                                                   000000000 ? 000000000 ?
                                                   000000001 ? 000000000 ?
                                                   7000003756233E0 ? 000000024 ?
kjmxmpm+0270         bl       _ptrgl               
kjmpbmsg+092c        bl       kjmxmpm              2000000000000000 ?
                                                   110000770 ? 000000000 ?
                                                   104CBBDD8 ?
kjmsm+1900           bl       kjmpbmsg             110C81520 ? 7000003756233E0 ?
                                                   1FFFFD720 ? 100000000 ?
                                                   000000001 ? 000000000 ?
                                                   000000000 ?
ksbrdp+04b4          bl       _ptrgl               
opirip+03fc          bl       03F274EC            
opidrv+0458          bl       opirip               1102806D0 ? 410282010 ?
                                                   FFFFFFFFFFFF2C0 ?
sou2o+0090           bl       opidrv               3202D9A29C ? 4A0076254 ?
                                                   FFFFFFFFFFFF2C0 ?
opimai_real+0150     bl       01F939B4            
main+0098            bl       opimai_real          000000000 ? 000000000 ?
__start+0070         bl       main                 000000000 ? 000000000 ?

luoluo 发表于 2013-11-11 21:05:46

附节点一alert

Maclean Liu(刘相兵 发表于 2013-11-11 23:51:23

kjdrvalidRMno: msg type 34 from node 0 dropped
   FUSION MSG 11084b4f0,34 from ver ln 128 sq
        CLOSE shadow seq 0x2 act 1
          client reqid 1451 ordered 0
          grant 1 convert 0 role 0
          pi flags 0x0 state 0x20
          disk scn 0x0.0 writereq scn 0x0.0 rreqid 0
          msgRM# 1858 bkt# 14712 drmbkt# 6520
     pkey 1843375, stat 5, masters, reminc 8, RM# 1857 flg 0x0
     hv 23
     kjga st 0x4, step 0.32.0, cinc 8, rmno 1858, flags 0x20
     lb 4096, hb 8191, myb 14712, drmb 6520, apifrz 1
kjmvalidate: drm drop a message RMno 1858 from 0 type 34
  mver 8 myver 8 seq 0.722380295 rseq 0.722380294 flag x6d
*** 2013-11-11 16:01:05.308

** 2013-11-11 16:01:05.311
ksedmp: internal or fatal error
ORA-00600: internal error code, arguments: , , , [], [], [], [], []
----- Call Stack Trace -----
calling              call     entry                argument values in hex      
location             type     point                (? means dubious value)     
-------------------- -------- -------------------- ----------------------------
ksedst+001c          bl       ksedst1              000000000 ? 000000000 ?
ksedmp+0290          bl       ksedst               104A2CDB0 ?
ksfdmp+0018          bl       03F2735C            
kgerinv+00dc         bl       _ptrgl               
kgeasnmierr+004c     bl       kgerinv              000000000 ? 70000015D053B00 ?
                                                   70000015D053B38 ?
                                                   700000010018078 ? 104CBCB74 ?
kclnloc+0180         bl       kgeasnmierr          110195490 ? 1105A0750 ?
                                                   104CBCB74 ? 200000002 ?
                                                   000000000 ? 00000000D ?
                                                   000000000 ? 00000000C ?
kclnfnd+0058         bl       kclnloc              70000014A0F4018 ? 11022A3E0 ?
kclgrantlk+01ec      bl       kclnfnd              700000378AAA158 ?
kclcrrf+00b0         bl       kclgrantlk           AF9073344A15CC ? 110DE65E0 ?
                                                   FFFFFFFFFFFCAA0 ? 11022A3E0 ?
                                                   000000000 ? 000000001 ?

Maclean Liu(刘相兵 发表于 2013-11-11 23:52:15

stack call kclcrrf=>kclgrantlk=>kclnfnd=>kclnloc=>报错

kclnloc - use Name to LOCate an le

Maclean Liu(刘相兵 发表于 2013-11-11 23:56:13

BUG     here is 1 bug listed.

    NB        Bug        Fixed        Description
            6733655         10.2.0.4.1, 10.2.0.5, 11.1.0.6         OERI / crash in RAC

Under certain circumstances in RAC an internal lock chain may
get corrupted resulting in a variety of symptoms including
ORA-600 , ORA-600 and/or
dumps in/under kclnloc and kclnrembg.


建议升级到 10.2.0.4 最新的PSU

WMLM 发表于 2014-12-10 14:18:34

这个BUG我也碰到了,等待LATCH DUMPING 超时,LMON : TERMINATING INSTANCE. 越来越觉得ASKMACLEAN 牛X。
页: [1]
查看完整版本: 发现实例重启alte日志0600错误