本文主要针对高端交换机等价路由及链路聚合出口流量负载不均问题进行排查,以下是具体的排查思路和步骤:

1)首先需要判断设备是否为PE设备的等价路由出口,并查看隧道策略的情况。如果存在多条LSP,可以通过配置tunnel-el-policy来实现LSP的等价。同时,开启隧道策略并调整LSP负载分担数目,以实现双上行ECMP负载分担。

2)其次,需要判断流量出口是否分步在IRF系统的不同框上。由于高端交换机具有本地优先转发的情况,从本框进入的流量,如果本框有出口,不管出口是链路聚合出口或者ECMP出口,都只会从本框优先转发,不会跨框转发。因此在这种情况下会出现出口流量不均的情况。

3)再次,需要判断是否为设备间二次hash情况,如有需要则调整上下级设备的hash因子错开;或者判断是否为本设备的二次hash,尝试升级或者直接联系800寻求帮助;或者仅针对普通的等价路由或者链路聚合情况,调整hash因子观察效果。

4)如果经过以上调整后效果仍不好,可以通过抓包确定是否是由于现网流量自身特点导致的分担不均。

5)最后,如果上述所有步骤都做了但效果仍不理想,可以收集相关信息并联系800寻求帮助。

根据现场情况,我们首先确认设备为PE设备的等价路由出口。可以看到私网路由已经等价,但是在设备转发表中这条路由并未形成等价。这导致流量无法负载均衡。为了解决这个问题,我们需要开启隧道策略并调整LSP负载分担数目,才能实现负载均衡。

此外,我们还需要判断流量出口是否分担到IRF系统的不同框上的出口。因为高端交换机具有本地优先转发的情况,从本框进入的流量,如果本框有出口,不管出口是链路聚合出口或者ECMP出口,都只会从本框优先转发,不会跨框转发。这种现象可能导致出口流量不均。因此,我们需要让进入IRF系统的流量分布到不同框上。

在配置IRF系统之前,请首先调整流量走向,以便将流量分配到不同的框上进行转发。需要注意的是,有一种特殊情况例外,即本框链路聚合(ECMP)的方式。在这种情况下,IRF系统中的每个出口都是本框链路聚合出口,因此不会优先转发至本框。这种情况会导致跨框负载,如上图所示。如果遇到这种情况,请继续排查问题。

此外,还需要检查设备间是否存在二次hash的问题。二次hash是指在上级设备进行了ECMP或者链路聚合后,到达本设备时再次进行ECMP或者链路聚合。在某些情况下,可能会出现两个等价路由链路出口,导致某一方向上的流量负载不均衡。解决方法包括:

a. 将上下级设备的hash因子错开。例如,第一级使用源地址、源端口,第二级使用目的地址、目的端口等。

b. 检查是否为本设备的二次hash问题。在本设备中,如果存在ecmp出口,并且每个出口都是链路聚合出口,那么也可能会出现流量负载不均衡的情况。对于这种情况,可以尝试以下解决方法:

* 对于V5版本(1828之前版本),可以尝试升级到最新版本(最新版本针对聚合组内成员端口数小于等于6的情况做了一定优化)。

* 对于V7版本(7328之前版本),可以尝试升级到最新版本。

最新版本的聚合组在处理成员端口数小于等于6的情况时,进行了一定的优化。如果你已经升级到这个版本,那么这些优化可能会对你的使用产生积极影响。具体的优化措施可能包括性能提升、错误修复或者新功能的增加等。然而,需要注意的是,具体的优化内容和效果可能会因不同的应用场景和系统配置而有所不同。因此,在使用新版本时,建议根据实际情况进行测试和评估,以确保其能够满足你的需求并带来实际的好处。