DMIT 发布 LAX 节点网络故障技术分析,披露本次异常源于一次内部网络变更。在太平洋时间约 19:35,工程团队在洛杉矶 Metro 网络中引入 IPv6 over MPLS 与 IS-IS,用于优化路由架构,但过程中出现配置问题。
根据说明,DMIT 在 iBGP 体系中使用环回地址进行路由,但在 IPv6 路由反射器(RR)配置中,未对从接入交换机接收的 IPv6 路由进行 Next-Hop 标准化处理,导致下一跳仍指向接口地址而非对等地址。同时,由于内部网络不传播端口地址(为避免用户使用保留地址造成冲突),边缘路由器无法解析这些下一跳。
在这种情况下,无法识别下一跳的路由被回退至 Transit 路由表,并重新注入客户路由表,最终形成异常路径。结果是客户 IPv6 流量在单个路由器的多个 VRF 中不断循环,直到 TTL(128)耗尽才终止。
该路由环路迅速消耗设备背板带宽,导致路由反射器(RR)中断。当 RR 中断后,客户路由被切断,循环流量下降,网络短暂恢复,但在问题未彻底修复前存在反复波动。
本次事件最终造成约 3 分钟完全中断,以及累计约 13 分钟的服务质量下降。DMIT 对此表示致歉。
整体来看,这是一次典型的网络配置失误引发的路由环路问题,属于高复杂度网络环境中的风险点。建议用户关注 IPv6 连接表现,后续类似问题通常会通过配置修正避免再次发生。
信息来源:DMIT 官方邮件通知
官方网站:https://www.dmit.io/







