2023年03月23日
2023/03/23 11:19 早上接到保障,有服务器连接不上了。原以为是服务器问题,接着发现很多8网段的服务器都连接不上了。而且很诡异的是,第一个Ping包可以通,后面的就都不通了。 定位到网络问题,但是都在一个私网段里,应该不是3层及以上的问题,估计是ARP的问题。虽然找了工维部的小伙子来帮忙一起看,但是这个问题他估计是解决不了的。是二层ARP上的问题。 结合所说的昨天下午开始的问题,应该就是昨天上线的OpenWRT导致的,搜索了ARP相关的。发现br-lan口上有arp-proxy配置在上面。 然后把这个配置给关掉了,发现能够基本正常,虽然最开始报障的测试数据库还是没有恢复,也走了机房申请单,下午有空过去调试一下,顺便看看能不能做一部分设备的升级工作。 但是这个OpenWRT貌似会自动把arp-proxy的这个配置自动改回来,后续还要继续检查一下是什么服务导致的,彻底的解决一下这个问题。 通过grep -r proxy_arp /etc/rc.d/*查找到是ocserv这个服务又把这个配置改过来了,准备停用这个服务。 最后通过调整sysctl服务的优先级解决了这个问题。但是还是有隐患。后期根据情况再看吧。 2023/03/23 18:25 下午去了趟机房,原来8.73那台服务器应该是太长时间没有重启,然后网卡那里碰到了问题,就没有办法自动恢复正常导致的。重启后,问题解决。 另外,拿着配置线,把4楼的那台交换机给配置好了,一边搜索一遍配置,还算好,在下班之前完成了!