城域网割接及割接引起业务中断的案例整理分析

2009-12-17     作者:   中国软件网     编辑:乐乐   点击进入论坛
关键词:城域网  路由器

  11.重复步骤10的操作,改为使用其他的软件版本。一共尝试了3个软件版本。软件版本分别是:c7200-p-mz.122-11.T1.bin,c7200-p-mz.120-17.ST1.bin,c7200-p-mz.120-23.S1.bin

  12.在城市A的骨干路由器r2上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。发现标签堆栈里只有一级标签。这个标签是城市B的PE路由器分发的关于城市B某用户路由的标签。但是缺少了和城市A PE直连的P路由器分发的mpls标签。这会导致城市A的PE不懂如何转发mpls数据帧到mpls骨干,也就是P路由器。最终的结果是导致某用户在城市A和城市B的vpn不通。

  13.在城市A的r2上使用命令clear ip bgp *,稍后再使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。发现标签堆栈里仍然只有一级标签。

  14.重复13的操作接近10次,在这过程中也曾经使用show tech命令去检查r2的各种状态信息,但是没有任何异常。在大概15点00分,突然发现show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X的输出显示城市B某用户路由的标签堆栈里有了两级标签。在r2上使用命令ping vrf vpn9:XXX.VPN X.X.X.X。测试城市BPE到城市APE的联通性。测试结果是ping不通。

  15.在城市A的骨干路由器r2上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。同时在城市B的PE路由器上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail。发现问题所在,城市B的PE路由器对城市B某用户的路由的标签在分发到城市A的PE路由器上后标签值不一致。导致城市A PE分发的MPLS数据包到达城市BPE路由器时,城市BPE路由器不知道该怎么处理,因为城市A传输过来的数据的标签并不是城市BPE分发的。所以城市BPE路由器只能把它丢弃。导致网络不通。R>16.在城市B的PE路由器上使用命令clear ip bgp *,稍后在城市A的骨干路由器r2上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。同时在城市B的PE路由器上使用命令show tag forwarding-table vrf vpn9:XXX.VPN *.*.*.* detail。发现标签仍然不匹配。

  17.在城市B的PE路由器上某用户的子端口上使用命令no ip address,稍后重新配置原来的ip地址。稍后在城市A的骨干路由器r2上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。同时在城市B的PE路由器上使用命令show tag forwarding-table vrf vpn9:XXX.VPN 210.5.2.129detail。发现标签仍然不匹配。

  18.重复16的操作。但是结果仍然是标签不匹配。

  认为应该是CISCO IOS的软件BUG引起的问题。但是不能通过象clear ip bgp * ,no ip address 等手段解决。在CISCO寻求帮助。

  19. Cisco负责支持项目的工程师,也说不出所以然的理由;在跟Cisco工程师的电话沟通的同时,我们仍旧在做尝试,在城市A的骨干路由器r2上某用户的子端口上使用命令去掉此vpn的配置命令。使用原来的命令重新在城市A的骨干路由器r1配置。配置完毕在r1上使用命令show tag forwarding-table vrf vpn9:XXX.VPN X.X.X.X detail和命令show ip cef vrf vpn9:XXX.VPN X.X.X.X检查城市B某用户路由的标签。同时在城市B的PE路由器上使用命令show tag forwarding-table vrf vpn9:XXX.VPN *.*.*.* detail。发现标签是匹配的。在r1上使用命令ping vrf vpn9:XXX.VPN X.X.X.X。测试城市BPE到城市APE的联通性。测试结果是ping通。

  20. 全面的网络测试, 类似问题没有产生!

  四、故障的具体技术分析

  在发生故障的当时我们分别检查了城市A和城市B PE路由器上的路由表。在城市A的PE路由器上发现某用户VPN的路由是正确的。同时在城市B的PE上也发现某用户VPN的路由是正确的。也就是说城市A城市B某用户两端的路由都是正确的。

  MPLS VPN的路由正确都是不能PING通,问题出现在底层的MPLS的交换过程。这个也是CISCO早期实现MPLS VPN技术时发生的软件BUG。具体表现为:一个MPLS VPN在正常的使用过程中,突然发现不通,但是从MPLS VPN路由表上看不到任何的异常。这些现象和某用户VPN的故障完全一致。

  经过进一步检查,发现导致某用户VPN城市A和城市B不通的直接原因是因为城市A的省骨干PE路由器(Cisco 7206VXR),和PE直接连接的省骨干P路由器(Cisco GSR 12016),城市B的省骨干PE路由器(Cisco GSR12016)这三者间的MPLS标签的分发出现了问题。因为MPLS VPN的IP包在MPLS骨干网中传输需要在IP包头加上两级的MPLS标签,依次为IP V4标签和VPN V4标签。

  IP V4标签是由和城市A PE直接连接的P路由器分发的,VPN V4标签是由城市B PE路由器分发的。如果这两级标签任一不正确,都可以导致VPN不通。

  当时就发现发生故障的PE路由器上的MPLS标签不正确。刚开始是只收到一级的标签,即只收到VPN V4的标签,没有收到IP V4的标签。努力解决了IP V4标签的问题后又发现VPN V4的标签不正确,即由城市B PE路由器分发的标签经过传输后在城市A PE路由器上显示为另一标签。以上MPLS 标签的不正确是导致城市A和城市B某用户VPN路由正确但是不通的原因。

寻找产品:
姓       名: 电   话:
公       司: E-mail:
描       述: