查看: 9770|回复: 0

服务器性能造成某公安110接警平台异常

[复制链接]
发表于 2016-3-21 16:38:45 | 显示全部楼层 |阅读模式
一、问题描述科来服务器部署在某公安局保障机房的核心和汇聚交换机上,用于监控重要业务的网络通讯情况。
某110接警平台主备服务器发生多次切换。该服务器平台建设较早,已有10年之久,期间没有发生过异常切换。服务器运维人员通过ping包记录发现服务器切换时,有丢包现象,丢包率在1-5‰左右。所以服务器运维人员认为是网络异常波动导致丢包发现从而导致切换发生。但是网络运维人员通过网络测试并没有发现任何异常...
如果110接警平台宕机,后果不堪设想…..
                             
图1-网络拓扑结构
二、[size=1em]分析过程
科来在接到公安局IT运维民警电话后,迅速到达公安局信息中心。通过科来网络回溯分析系统快速找到了110接警平台异常切换原因。

图-2 故障分析_ACK-RST报文
我们可以看到,在切换发生时段,服务器对客户端的SYN请求直接发送了ACK-RST,在连续3次请求都被RST后,客户端就放弃了连接请求。
在切换发生时段,我们看到并不是所有的服务请求都失败,失败和成功的比例大概是1:2左右:

图3-故障分析_成功的请求

同时我们看到,有些客户端的请求在失败两次后,在第三次成功建立了TCP连接。
[local]4[/local]

图4-故障分析_失败后能成功建立TCP连接的请求

由此说明,服务器在切换时段性能明显不足,导致了大量请求失败。

三、结论及验证综合以上分析,同时结合公安局IT运维人员的网络测试结果,我们可以知道:
造成公安局110接警平台主备服务器异常切换的原因是110接警平台服务器性能不足,导致大量访问请求失败,从而触发了切换策略。
结论验证:
在我们将分析结论告知公安局IT运维人员后,他们将服务器进行了升级处理。升级完成后,没有再发生主备切换。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?CSNA会员注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | CSNA会员注册

本版积分规则

快速回复 返回顶部 返回列表