有两台ZTE的T64G之间跑OSPF,做上行链路的互备(下面的用户设备是单链路上来的,所以没法做到设备的互备)。昨天出现了一个奇怪的现象,有用户报障碍说一个网段里有些地址能通,有些地址不通,于是查了一下,发现T64G的上联设备们大概是根据IP来做均衡的,因此下行流量是分担在两台T64G上的,只有上行流量才是固定走某条上联链路的。出现的问题就是两台T64G之间的OSPF挂了,相互看不到邻居,自然也没有路由,因此挂在这台T64G下的用户,如果下行流量是在另一台T64G上,就不通了。
查看两台T64G的日志,发现都有告警,说上联口上有too many igmp packets进来,下面某一用户的防火墙上有异常流量大约100到200M左右。
T64G的CPU占用并不高,大约40%左右。
第一个想到的就是先加静态路由取代OSPF,但转念一想,做静态路由临时搞通的话,到底是不是因为IGMP的问题就得不到验证了,于是先做ACL,在两个T64G的上联口上把IGMP给挡了,几乎立刻就OK了,做好ACL,再看OSPF的邻居关系起来了,路由也有了,交换机日志里的告警也没了,一切恢复正常。
没有条件做再现,根据上述的现象和处理过程,姑且只能认为国产设备……
现在有两条罪状了,ICMP处理能力严重不够,IGMP也能严重影响设备,还不知道将会发现些啥问题。

订阅我的BLOG(RSS)