查看: 3250|回复: 3

客户业务系统不定时中断

[复制链接]
发表于 2014-9-24 13:06:17 | 显示全部楼层 |阅读模式
本帖最后由 liuzc 于 2014-9-24 21:43 编辑

故障描述:    最近两个月,客户的其中一个业务系统总是出现在不同科室、不确定时间的情况下出现业务系统中断,但是PING网络网关和服务器是正常的,其中10.122为客户端,100.200地址是服务器

数据是在在客户端上抓包,(见附件)发现客户机同服务器交互过程中,有大量的ACK重复确认包,而且中间时间较长。但是如何通过此现象来确认最终的问题呢?

整个网络的架构是客户端---接入交换机---汇聚交换机--核心交换机--服务器

希望各位大神能够帮忙查看一下,看能否找到问题,或者提供一下后面进一步的排查思路,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?CSNA会员注册

×
回复

使用道具 举报

 楼主| 发表于 2014-9-25 13:49:42 | 显示全部楼层
有没有哪位大神给点建议啊?或者是有哪里不清楚的地方,我可以在提供。
回复

使用道具 举报

发表于 2014-9-29 19:04:58 | 显示全部楼层
本帖最后由 czhf 于 2014-9-29 19:14 编辑

哥们,下载后看了你的数据包,需要有两个问题要分析清楚:

第一、你图中所说的“有大量的ACK重复确认包”,其实那些不是真正的ack重复确认包,实际是SQL服务器与客户端之间的keep-alive,即TCP保活报文。

并且可以分析出,每隔30秒,SQL服务器就与客户端互相keep-alive一次,探测对方是否存活在线。这估计是为了保证业务的高可靠性吧。但这并不是业务中断的原因。

第二、在客户端上,执行SQL batch命令后,客户端与服务器开始进行数据交互。问题来了:它们两者数据交互过程中,无论是客户端发给SQL服务器的数据,还是SQL服务器回送给客户端的数据,都会出现部分数据丢失的情况。即丢的数据包是双向的。可见,必定有中间设备丢包。
回复

使用道具 举报

 楼主| 发表于 2014-10-15 12:50:29 | 显示全部楼层
3# czhf
多谢你的建议,812450933方不方便加个QQ,私聊一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | CSNA会员注册

本版积分规则

快速回复 返回顶部 返回列表