Oracle数据库数据恢复、性能优化

找回密码
注册
搜索
热搜: 活动 交友 discuz
发新帖

0

积分

1

好友

7

主题
1#
发表于 2013-2-7 10:10:53 | 查看: 4302| 回复: 9
两个节点的数据库,其中一个hang住,通过sqlplus  / as sysdba 不能登录,另外一个节点正常。

AIX Version 6.1


Oracle Database 10g Enterprise Edition Release 10.2.0.5.0 - 64bit Production
With the Partitioning, Real Application Clusters, OLAP, Data Mining
and Real Application Testing options

在alert日志看到写入bdump下的追踪文件中有大量的以下信息:

SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
SKGXPSEGRCV: MESSAGE TRUNCATED user data 56 bytes payload 1688 bytes
SKGXPSEGRCV: trucated message buffer data skgxpmsg meta data header 0xfffffffffffb460 len 56 bytes
2#
发表于 2013-2-7 10:53:23

netstat -in
netstat -s

给出结果

回复 只看该作者 道具 举报

3#
发表于 2013-2-7 11:02:54
  1. zyk1:[/]#netstat -in
  2. Name  Mtu   Network     Address            Ipkts Ierrs    Opkts Oerrs  Coll
  3. en0   1500  link#2      0.14.5e.75.ee.44 464159901     0 289918866     3     0
  4. en0   1500  10.106.112  10.106.112.6     464159901     0 289918866     3     0
  5. en0   1500  10.106.112  10.106.112.7     464159901     0 289918866     3     0
  6. en2   1500  link#3      0.14.5e.75.ee.6a 1034652173     0 322470303     3     0
  7. en2   1500  200.200.200 200.200.200.1    1034652173     0 322470303     3     0
  8. lo0   16896 link#1                       11560146     0 11560165     0     0
  9. lo0   16896 127         127.0.0.1        11560146     0 11560165     0     0
  10. lo0   16896 ::1%1                        11560146     0 11560165     0     0
复制代码

回复 只看该作者 道具 举报

4#
发表于 2013-2-7 11:07:00
文件字数太多,只有上传附件

net.txt

10.78 KB, 下载次数: 875

回复 只看该作者 道具 举报

5#
发表于 2013-2-7 11:12:41
做一个问题时段的AWR并上传

回复 只看该作者 道具 举报

6#
发表于 2013-2-7 11:39:27
最近的只有8点到9点的

awror1.html

404.9 KB, 下载次数: 655

回复 只看该作者 道具 举报

7#
发表于 2013-2-7 11:44:00
就netstat 看 udp 有一些丢包, 但似乎不严重,而之前的AWR显示没有 明确的 gc lost

SKGXPSEGRCV: MESSAGE TRUNCATED==>一般说明有 丢包

需要更多信息 errpt,osw 主机负载信息

udp:
        2266259868 datagrams received
        0 incomplete headers
        0 bad data length fields
        0 bad checksums
        2404496 dropped due to no socket
        2020319 broadcast/multicast datagrams dropped due to no socket
        0 socket buffer overflows
        2261835053 delivered
        2158018952 datagrams output

回复 只看该作者 道具 举报

8#
发表于 2013-2-7 12:33:19
  1. errpt
  2. IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
  3. A6DF45AA   0114002013 I O RMCdaemon      The daemon is started.
  4. 2BFA76F6   0114001713 T S SYSPROC        SYSTEM SHUTDOWN BY USER
  5. 9DBCFDEE   0114001913 T O errdemon       ERROR LOGGING TURNED ON
复制代码
目前已经用crsctl stop crs 和crsctl start crs 命令将数据库重启 另附上全部的alert日志供大家参考:


感谢刘大的热心帮助!

全部的alert.txt.txt

32.75 KB, 下载次数: 894

回复 只看该作者 道具 举报

9#
发表于 2013-2-7 14:02:19

全部的alert.txt.txt===> 这不是全部的alert.log !!!!!!!!!!!!!!
  1. Thu Feb 07 09:27:13 GMT+08:00 2013IPC Send timeout detected.Sender: ospid 30212128
  2. Receiver: inst 2 binc 88 ospid 6488144
  3. Thu Feb 07 09:30:30 GMT+08:00 2013IPC Send timeout detected.Sender: ospid 36504226
  4. Receiver: inst 2 binc 88 ospid 6029574
  5. Thu Feb 07 09:45:16 GMT+08:00 2013IPC Send timeout detected. Receiver ospid 30212128
  6. Thu Feb 07 09:45:16 GMT+08:00 2013Errors in file /oracle/admin/orcl/bdump/orcl1_pz98_30212128.trc:
  7. Thu Feb 07 09:48:15 GMT+08:00 2013IPC Send timeout detected.Sender: ospid 22216938
  8. Receiver: inst 2 binc 88 ospid 1311382
  9. Thu Feb 07 09:50:26 GMT+08:00 2013IPC Send timeout detected. Receiver ospid 30212128
  10. Thu Feb 07 09:50:26 GMT+08:00 2013Errors in file /oracle/admin/orcl/bdump/orcl1_pz98_30212128.trc:
  11. Thu Feb 07 10:05:15 GMT+08:00 2013IPC Send timeout detected. Receiver ospid 22216938
  12. Thu Feb 07 10:05:15 GMT+08:00 2013Errors in file /oracle/admin/orcl/bdump/orcl1_pz95_22216938.trc:
  13. Thu Feb 07 10:10:12 GMT+08:00 2013>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=1472
  14. System State dumped to trace file /oracle/admin/orcl/udump/orcl1_ora_3605026.trc
  15. Thu Feb 07 10:10:25 GMT+08:00 2013IPC Send timeout detected. Receiver ospid 22216938
  16. Thu Feb 07 10:10:25 GMT+08:00 2013Errors in file /oracle/admin/orcl/bdump/orcl1_pz95_22216938.trc:
  17. Thu Feb 07 10:10:43 GMT+08:00 2013>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=1436
  18. Thu Feb 07 10:10:48 GMT+08:00 2013>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=1456
  19. Thu Feb 07 10:11:12 GMT+08:00 2013>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=1474
复制代码
ipc send timeout 后伴随 ROW CACHE ENQUEUE LOCK, 这个问题 还是需要从OS角度进一步分析

回复 只看该作者 道具 举报

10#
发表于 2013-2-14 19:28:34
设置instance_groups和parallel_instance_group,试试看

回复 只看该作者 道具 举报

您需要登录后才可以回帖 登录 | 注册

QQ|手机版|Archiver|Oracle数据库数据恢复、性能优化

GMT+8, 2024-11-16 06:38 , Processed in 0.052419 second(s), 23 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部
TEL/電話+86 13764045638
Email service@parnassusdata.com
QQ 47079569