NSX controller syslog 没有轮询切换归档而且/var/log被日志一直写满
发布日期:2021-05-15 02:32:24 浏览次数:19 分类:精选文章

本文共 883 字,大约阅读时间需要 2 分钟。

问题描述

环境:NSXControllers版本为6.3.6或6.4.1。

故障现象:NSXControllers中的/var/log分区被写满,导致系统资源占用异常增加,甚至可能导致集群失去活性。

问题分析

在对问题进行深入调查后发现,问题主要源于rsyslog日志处理机制在该版本下的特殊行为:
  • 日志轮转机制异常:在某些情况下,当日志文件达到轮转大小限制后,rsyslogd仍继续将日志输出写入当前文件,而不是新建一个新文件。这种行为可能导致日志文件迅速膨胀,导致/var/log分区被占满。

  • 日志文件管理问题:当日志文件轮转后,某些文件名(如/var/log/syslog.1)可能逐步增长,直到占满整个分区。

  • 性能影响:当var/log分区占满后,NSXControllers的内存使用率会急剧上升,导致系统响应延迟增加。严重时可能甚至导致集群无法正常进行仲裁和选举,进而导致整个控制器集群失效。

  • 故障原因详解

    问题的根本原因在于rsyslogd的日志轮转机制在该NSX版本下的异常表现。具体来说:
    • 当rsyslogd接收到大量日志数据时,如果轮转点未及时触发,会导致日志文件迅速膨胀。
    • 此外,部分日志文件(如syslog.1)可能在轮转后频繁生成和增长,直到磁盘空间被耗尽。

    这些问题最终导致了var/log分区被占满,进而影响了NSXControladores的正常运行。

    解决方案

    针对这一问题,有以下两种解决方案可供选择:
  • 升级NSX版本:官方已确认该问题已在NSX6.3.7及NSX6.4.2版本中得以修复。如果设备尚未升级,建议优先进行系统升级以享受到修复后的稳定版本。

  • 定期清理日志文件:如果无法立即升级,可以通过定期清理和管理日志文件来缓解问题。例如,可以设置组orphic日志清理工具或手动删除过期日志文件,以防止分区被占满。

  • 对于各类技术问题,及时发现并采取相应措施是关键。通过升级系统或执行日志清理操作,可以有效避免var/log分区被写满而引发的潜在故障。建议根据实际环境需求选择最适合的解决方案,确保NSX控制器集群的持续稳定运行。

    上一篇:VMware NSX环境EAM故障指导手册
    下一篇:windows硬件信息查询

    发表评论

    最新留言

    路过按个爪印,很不错,赞一个!
    [***.219.124.196]2025年04月20日 17时11分12秒