一、故障背景
某省政府下属机关单位门户网站不定期出现服务不可用的问题,而省信息中心部署了
对下属单位网站服务进行检测的工具,定期通报该单位网站问题…
该单位领导急于找出网站不可用的原因,其内部网络设备服务商互相推诿责任,导致
问题排查进展缓慢。
二、设备部署
科来技术人员在了解情况后,在该单位网络部署了科来网络回溯分析系统进行分析。

三、故障现象分析
根据通报的时间,我们找出故障发生时的数据:

1、故障产生的原因是由于服务器对客户端的请求不响应导致的
2、故障发生时间点,服务器还通过8080等其他端口进行通信,而且通信正常
由以上两点可以说明是服务器的80端口对外界TCP请求不再响应导致访问失败,
但是由于从客户端到服务器网络设备众多,需要对各段数据对比分析确定原因。
由于用户之前调整过WAF,所以一直怀疑WAF有问题,我们对比分析故障时段WAF两侧的数据:

可以看出,在WAF设备前后的数据完全一样,说明问题并非有WAF引起。
四、分析总结
1、通过科来回溯分析设备可以将不可见的故障现象进行可视化分析,进而快速明确产生故障的责任主体,提高故障分析效率!
2、科来网络回溯分析系统是分析间歇性故障的利器!
|