某局點MSR2600-X1設備運行中重啟,重啟后保存診斷查看上次重啟原因為內存耗盡。
H3C Comware Software, Version 7.1.064, Release 0809P33
Copyright (c) 2004-2020 New H3C Technologies Co., Ltd. All rights reserved.
H3C MSR2600 uptime is 0 weeks, 0 days, 1 hour, 16 minutes
Last reboot reason : Memory exhausted
查看設備日志,重啟前有大量嘗試登陸設備日志、登陸設備失敗日志,及用戶線占滿日志。懷疑內存異常與登陸設備用戶太多有關。
查看設備flash中的文件,lauth.dat文件占了約390M,該文件多用于存儲認證相關信息,內容不應該有這么多。該文件大說明設備認證有異常信息。
===============dir /all /all-filesystems===============
Directory of flash: (YAFFS2)
……
7 -rw- 396870 Jul 08 2022 13:03:01 lauth.dat
查看診斷中的密碼控制黑名單,發現存在大量表項,該表項用于記錄客戶端嘗試登陸設備次數。按照password-control功能配置,客戶端登陸設備失敗3次后會被加入黑名單鎖定,如失敗2次后不再繼續嘗試,按照設備當前實現,該表項會長時間記錄于設備上,導致內存占用持續增長。現網設備暴露于公網環境,受到來自很多客戶端的登陸嘗試,因此該表項內容持續增長,最終導致內存耗盡,設備重啟。
解決方法
1. 可以對ssh/telnet用戶配置acl,限制能夠登陸設備的源ip,避免產生大量黑名單表項;
2. 如設備已產生大量黑名單表項,可通過reset password-control blacklist暫時清除,釋放內存。