lxjweb 发表于 2015-5-20 16:20:21

关于lmsN进程trc里GSIPC:IKILL的咨询

Hi,Maclean:

近期碰到一个实例重启的案例,故障实例(2)因为LMS2进程与对方实例无消息活动的情况:
alert2:
    LMS2 (ospid: 20285) has detected no messaging activity from instance 1
   LMS2 (ospid: 20285) issues an IMR to resolve the situation

在分析lmsn2.trc时,对里面的部分内容不是很明白,希望刘大给解释一下,如下:

*** 2015-05-17 05:30:29.983
2015-05-17 05:30:29.983124 : GSIPC:PING: rcv'd PINGREQ from 1.3 (seq 0.809398013) stm 0x6e8fb6de
2015-05-17 05:30:29.983291 : GSIPC:PING: send PINGACK to 1.3 (seq 0.809398832)

*** 2015-05-17 05:30:59.001
===== Idle Connection Overview =====
Idle connections : 1
IdleConn List: 1
GSIPC:IKILL: ping to inst 1 start 958701 now 958859 icktm 140 psm 1  
  : Pending Send Queue:
  :  OMSG type 65518 dest 1.3 waited 330699375 usec
  :  OMSG type 34 dest 1.3 waited 330699375 usec
  :  OMSG type 65518 dest 1.3 waited 330679381 usec
  
  :  OMSG type 65522 dest 1.3 waited 158366725 usec
  :  OMSG type 65522 dest 1.3 waited 29028130 usec
  ...
Reporting Communication error with instance 1

问题:
1.GSIPC:PING 可不可以理解为是后台PING 进程.
2.怎么理解 Idle Connection ,因为感觉这次实例重启,这个里的信息是最关键的信息
3.GSIPC:IKILL: ping to inst 1 start 958701 now 958859 icktm 140 psm 1  里,这个IKILL是个什么信号?statrt和now的差值是什么单位?
4.这个Pending Send Queue 怎么理解,是发送完成还是未发送的,这类OMSG 可以理解为私网之间的消息类型吗?另外后面的
29028130 usec ,是等待了这么长时间,还未发送成功吗?

Thanks
lxjweb

Maclean Liu(刘相兵 发表于 2015-5-20 21:12:10

odm finding :

.GSIPC:PING  
GSIPC Global Enqueue /cache service IPC

这里的Ping 我认为并非是ping进程
页: [1]
查看完整版本: 关于lmsN进程trc里GSIPC:IKILL的咨询