呵呵,故障本身没有什么难度,就是自己碰到了就写下来了。
故障环境
网络拓扑如下图:
说明:
1.软路由内网口地址为192.168.10.1/32,腾达路由器内网口地址为192.168.11.1/32.
2.网络内部所有的PC机所属网段为192.168.10.0/24,通过软路由NAT转换成wan口地址192.168.11.200与腾达路由器相连。
3.软路由与腾达路由器相连属网段192.168.11.0/24,通过腾达路由器路由器NAT地址转换成外网地址,访问互联网。
故障现象:
故障现象表现为所有内部的PC机不能访问互联网,用户在做简单常规PING测试时,可以PING通软路由内网网关和外网口的地址。但不没有办法PING通到腾达路由器路由器以及外部的网络。出现故障时间为更换了软路由器之后发生的。
3.故障分析
3.1常规分析
通过用户对故障现象的描述,我们在PC机上做了一个故障现象的验证,确实如用户的描述一致,由于,故障现是在用户在更换了路由器后,故障现象才出现,由此,我们可以判断出现故障现象的原因可能是软路由器自身的问题引起。那么们猜测可能的原因有以下几个
1.
软路由自身的配置问导致或硬件故障产生导致的链路不通。
2.
腾达路由器路由器故障。
3.
软路由器连接腾达路由器的线路问题。
3.2分析思路
通过在客户端做常规PING 腾达路由器内网地址192.168.11.1 时,在软路由的出口处做抓包通过ICMP的四元组关联它们的数据包。在出口处做对比分析,观察在客户端发送的ICMP请求数据包是否被软路由的外网口转发,以判断产生联通性的故障,具体定位产生故障的类型。
抓包部署如下图:
3.3数据包分析
软路由外网口处抓包,通过IP数据包的源地址、目的地址以及ICMP中每个ICMP请求的唯一序列号关联起来。我们发现内网口的ICMP请求转发到了外网口TTL=63,外网也转发了这个ICMP报文,但是没有收到来自腾达路由器的回应包。如下图所示:
但是从上图我们发现一点异常,外网口是直接转发PC机的ICMP请求数据包,并没有对地址进行NAT转换。源地址还是192.168.10.13,由此,我们可以确定为什么腾达路由器路由器没有回应PC机的ICMP请求数据包。因为腾达路由器在发送回应包时没有192.168.10.0网段的路由。
ROS自带抓包图一样如下:
综合以上数据包的分析我们可以确定故障问题的根源是由于软路由未做NAT地址转换造成的。于是,我们登陆软路由查看NAT配置。发现如下图:
源地址只做192.168.10.0这一个单地址的转换。把源地址改为192.168.10.0/24。问题解决。
|