- 最后登录
- 2015-5-20
- 在线时间
- 1 小时
- 威望
- 0
- 金钱
- 15
- 注册时间
- 2015-5-17
- 阅读权限
- 10
- 帖子
- 3
- 精华
- 0
- 积分
- 0
- UID
- 2415
|
1#
发表于 2015-5-20 16:20:21
|
查看: 3627 |
回复: 1
Hi,Maclean:
近期碰到一个实例重启的案例,故障实例(2)因为LMS2进程与对方实例无消息活动的情况:
alert2:
LMS2 (ospid: 20285) has detected no messaging activity from instance 1
LMS2 (ospid: 20285) issues an IMR to resolve the situation
在分析lmsn2.trc时,对里面的部分内容不是很明白,希望刘大给解释一下,如下:
*** 2015-05-17 05:30:29.983
2015-05-17 05:30:29.983124 : GSIPC:PING: rcv'd PINGREQ[1] from 1.3 (seq 0.809398013) stm 0x6e8fb6de
2015-05-17 05:30:29.983291 : GSIPC:PING: send PINGACK[1] to 1.3 (seq 0.809398832)
*** 2015-05-17 05:30:59.001
===== Idle Connection Overview =====
Idle connections [0xea0ed]: 1
IdleConn List: 1[r:0.1361757535,t:0xea0ed]
GSIPC:IKILL: ping to inst 1 start 958701 now 958859 icktm 140 psm 1
: Pending Send Queue:
: OMSG type 65518 dest 1.3 waited 330699375 usec
: OMSG type 34 dest 1.3 waited 330699375 usec
: OMSG type 65518 dest 1.3 waited 330679381 usec
: OMSG type 65522 dest 1.3 waited 158366725 usec
: OMSG type 65522 dest 1.3 waited 29028130 usec
...
Reporting Communication error with instance 1
问题:
1.GSIPC:PING 可不可以理解为是后台PING 进程.
2.怎么理解 Idle Connection ,因为感觉这次实例重启,这个里的信息是最关键的信息
3.GSIPC:IKILL: ping to inst 1 start 958701 now 958859 icktm 140 psm 1 里,这个IKILL是个什么信号?statrt和now的差值是什么单位?
4.这个Pending Send Queue 怎么理解,是发送完成还是未发送的,这类OMSG 可以理解为私网之间的消息类型吗?另外后面的
29028130 usec ,是等待了这么长时间,还未发送成功吗?
Thanks
lxjweb
|
|