环境: 系统环境:
oracle 10.2.0.4 RAC 64bit+ IBM AIX 6.1 +OLTP系统
节点一:该节点是主节点,现在没有做负载均衡,基本就是用节点一作为主节点。
Oracle Database 10g Enterprise EditionRelease 10.2.0.4.0 - 64bit Production With the Partitioning, Real ApplicationClusters, OLAP, Data Mining and Real Application Testing options ORACLE_HOME =/oracle/app/oracle/product/10.2/db System name: AIX Node name: RESDB1 Release: 1 Version: 6 Machine: 00CD21164C00 Instance name: nrms1
昨晚18:40开始数据库有问题,hang住,一直到20点hang住不行,只有重启了主机。
-----以下是今早分析过程------------------
alert报错如下:
SQL> showparameter process
NAME TYPE VALUE ----------------------------------------------- ------------------------------ aq_tm_processes integer 0 db_writer_processes integer 6 gcs_server_processes integer 12 job_queue_processes integer 10 log_archive_max_processes integer 2 processes integer 2500
分析过程: google结果是:可以看到m000进程创建失败,PMON进程无法启动该进程。一般情况下, PMON无法启动进程原因有3个:1、Oracle连接数超过进程数限制。2、进程死锁。3、bug
我初步怀疑是1,因为我在listen.log里面看到大量报错如下:
16-JUL-201221:18:39 * (CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=nrms)(CID=(PROGRAM=oracle)(HOST=NGCRM595A)(USER=oracle)))* (ADDRESS=(PROTOCOL=tcp)(HOST=135.32.9.1 39)(PORT=59094)) *establish * nrms * 12528 TNS-12528:TNS:listener: all appropriate instances are blocking new connections 监听程序: 所有适用例程都无法建立新连接
16-JUL-201220:00:55 *(CONNECT_DATA=(SID=nrms1)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=weblogic))) *(ADDRESS=(PROTOCOL=tcp)(HOST=135.32.21.24)(PORT=57990)) * establish * nrms1 * 12518 TNS-12518:TNS:listener could not hand off client connection TNS-12540:TNS:internal limit restriction exceeded
问题是:
刘大你说找资料,会分析是一种能力,我现在想要跟你学习学习,我找了这些东西出来,应该怎么过滤成自己有用的呢?乱了~~
我现在就是怀疑到达最大的process的限制,所以系统hang住,不能建立M000进程。 根据是:监听日志的内容。
为什么会达到最大限制:就是因为tnslsnr的异常进程产生了很多。
另外就找不到有用的资料了。还请刘大帮忙指点一二,谢谢啊~~ 现在我还没有找到源头的什么啊,就是为什么会产生这么多的tnslsnr进程,导致达到了最大操作系统限制。 racle@RESDB1[/oracle/app/oracle/admin/nrms/bdump]$ls *pmon*
pmon.rar
(213.99 KB, 下载次数: 1555)
nrms1_pmon_2490858.trc nrms1_pmon_3670294.trc nrms1_pmon_37224998.trc nrms1_pmon_38076824.trc nrms1_pmon_5767290.trc
|