我亲自进行了华为CloudEngine 6860体系交换机(具备专门的V200R021C10版本)的测试,经历过关乎核心交换机光模块与跳线发生错综插设从而致使端口出现大面积err-disable状……
我亲自进行了华为CloudEngine 6860体系交换机(具备专门的V200R021C10版本)的测试,经历过关乎核心交换机光模块与跳线发生错综插设从而致使端口出现大面积err-disable状况的陷阱,刚开始接触的新手只要依照步骤逐个去开展操作程序,方可轻易躲避掉此类常见的问题情况。
1 第一优先级 光模块型号必须精确匹配
操作的路径是,在交换机命令行的环境之下,去执行display interface transceiver verbose这个指令,以此来核对“Vendor PN”这个字段与华为兼容性的列表究竟是不是完全一致的。臂如一个情况是,25G SR模块必然要呈现出SFP-25G-SR这种样式,若是差了哪怕仅仅一个字母,那都是不行的。对参数进行设定之际,运用undo port transceiver auto – check将自动协商予以关闭,随后以手动方式强制速率为speed 25000。
对新手而言的避坑提示:报错信息“Transceiver mismatch”老是频繁地刷屏显示。其核心缘由在于采购了第三方模块从而却没有刷写华为编码 ,又或者是误用了10G SR模块插在了25G端口上。提供的快速解决办法为:登录华为企业业务官网 ,同时在“产品支持 – 兼容性查询”里导入模块编码 ,对于不兼容的依照一律退货并进行更换。
2 第二优先级 光纤跳线类型与传输距离
当进行操作时,其路径具体是,要对物理方面进行检查,检查的对象是光纤跳线,针对该光纤跳线需查看其颜色与标识情况。其中,多模的光纤跳线,其颜色呈现为水青色亦或是紫色,并且要与 SR 模块一同配合使用,这种情况下它的传输距离不容易超过 100 米;而单模的光纤跳线,其在这点上来看颜色是黄色,针对这单模光纤跳线需要与 LR 模块进行配合使用,如此这般它的传输距离能够达到 10 公里。执行port alarmerror-down disable,这一操作是在配置端口时,针对长距离场景所必要进行的,其目的在于防止信号衰减致使端口反复出现振荡现象。
初涉者需留意避免入坑:端口会频繁出现UP/DOWN的情况,日志中会报告“link flapping”。其核心原因是采用了多模光纤去连接单模光模块,又或者是传输距离大于了光模块标称的值。快速解决的法子是:用光功率计去测试光接收与发射,若接收光功率比-14dBm低(此为关键参数的最优推荐数值),那就必须更换成对应类型的光纤或者加装光衰减器。
3 第三优先级 端口分组与带宽预留机制
操作的路径是,进入名为system-view的系统视图,去创建一个被称作port-group 1的端口组,然后批量添加接口,这些接口分别是从group-member 25ge 1/0/1到1/0/24。对bandwidth 25000进行执行,将那儿的预留带宽予以设定,并且把flow-control开启,去进行流量控制的配置。假如是要上联核心,那必然得设置priority-flow-control,把deadlock-detect time 50开启,以此启用PFC死锁检测。
新手需避坑:网络出现拥塞状况时,关键业务丢包情形严重。其核心原因在于没有进行优先级流控,这致使普通业务抢占了数据库集群的带宽。现对比两种实操方案:方案A开启全局流控,此方式简单然而所有流量一同被限速;方案B是基于802.1p优先级的PFC流控,其配置复杂不过能够精准保障存储业务。核心场景必须得选择方案B。
4 完整报错解决流程
凭借高频报错“因回环检测致使端口已被禁用”的一站式搞定办法:首先,借助display loopback-detection把环路瞅一瞅;接着,将错误检测设置抹掉,执行undo loopback-detection enable;然后,手动对端口进行重置,先shutdown随后再undo shutdown;最后,再度配置loopback-detection per-vlan enable,并且把loopback-detection action shutdown给设好要把阈值调成三秒内检测三次才开始动静,防止误判。
该方法对老旧思科设备以及非数据中心级交换机并不适用,这是由于私有协议存在差异,进而可能致使命令出现报错的现象。替换之时能够应用光模块衰减法,也就是于物理链路里串入5dB光衰,通过牺牲一部分传输余量以此来换取端口稳定,这种方法适合预算有限的改造项目。你在实际割接工作当中,是否碰到过因跳线过于杂乱从而造成模块被烧毁的情形呢?于评论区分享你的“血泪史”,共同规避风险防范错误有问题而造成损失!
微信扫一扫