houryin 发表于 2014-8-15 09:26:44

单块读会话hang住

刘大您好:

       环境:oracle rac 10203+aix5.3_64  和 oracle rac 10205+aix5.3_64

       问题描述:
              以上两个环境常出现某个会话长时间等待db file sequential read事件,其file#,block#一直不变,
              即长时间等待单个块的读取(已排查坏块的可能)。mos上也未查到相关信息,oracle原厂工程师
             也未查到具体原因。烦请刘大帮忙分析,多谢。
               
        

harryzhang 发表于 2014-8-15 12:46:46

10204下有这个bug Bug 6859515 - Diagnostic collection may hang or crash the instance (Doc ID 6859515.8)

Maclean Liu(刘相兵 发表于 2014-8-15 13:32:00

此类问题 至少需要10046 trace,否则都是瞎猜

houryin 发表于 2014-8-18 09:07:03

Maclean Liu(刘相兵 发表于 2014-8-15 13:32 static/image/common/back.gif
此类问题 至少需要10046 trace,否则都是瞎猜

之前已经试过,orabug event 10046该会话时,同样hang住(执行oradebug的会话等待事件为:ksdxexeother)。  dump该会话同样也会hang起。
现有的一种解决方法: 手动在os执行:truss -p spid ,即可顺利通过该块的读取。

houryin 发表于 2014-8-18 09:45:37

harryzhang 发表于 2014-8-15 12:46 static/image/common/back.gif
10204下有这个bug Bug 6859515 - Diagnostic collection may hang or crash the instance (Doc ID 6859515. ...

多谢, 我遇到的这个问题是前台应用发起的,不定期的出现。

harryzhang 发表于 2014-8-18 10:41:52

houryin 发表于 2014-8-18 09:45 static/image/common/back.gif
多谢, 我遇到的这个问题是前台应用发起的,不定期的出现。

这个bug是这样的:
假如2个回话,回话1 TX锁住了会话2,假如持续很久,可能diag在收集会话1的进程dump的时候,将这个进程搞hang。当然业务系统TX锁大部分是前台业务滴。。

Maclean Liu(刘相兵 发表于 2014-8-18 23:05:14

不管你描述多少,对于没有任何trace 或 无法重现的案例, 我们都无法诊断下去。
页: [1]
查看完整版本: 单块读会话hang住