
[故障公告]14:40-15:00博客站点web服务器雪崩似的CPU 100%
发布日期:2021-05-09 01:35:36
浏览次数:16
分类:博客文章
本文共 484 字,大约阅读时间需要 1 分钟。
非常抱歉,今天下午14:40-15:00左右,web服务器突然雪崩似的出现CPU 100%问题,造成博客站点无法访问(503)。由此给您带来很大的麻烦,请您谅解。
在问题出现之前,博客站点运行着5台web服务器,4台4核8G的阿里云-计算型(原独享)sn1系列II-服务器,1台8核8G的阿里云c1型系列I服务器。本来今天下午并不是一周的访问最高峰,这5台服务器绰绰有余。但14:40左右开始,某种未知的情况引起这5台服务器雪崩似的接连地出现CPU 100%。雪上加霜的是,倒下去的服务器没能很快地站起来,被负载均衡拉黑,剩下的服务器在更高的负载下更加无喘息之机,也一台接一台的倒下、被拉黑。。。
虽然我们发现后很快通过阿里云弹性伸缩增加服务器,但无济于事,弹性伸缩从开始增加服务器到服务器正常工作,大约需要5分钟左右。等弹性伸缩的服务器起来后,已有服务器已基本都倒下,它们根本顶不住,上去就倒下。。。加了2台,倒下2台。
15:00左右,引发CPU 100%问题的未知情况消失,这7台服务器的CPU也很快都恢复了正常。
就这样,一场暴风雨在炎热的周五下午袭击了园子。
发表评论
最新留言
第一次来,支持一个
[***.219.124.196]2025年04月13日 14时39分55秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Jenkins - 部署在Tomcat容器里的Jenkins,提示“反向代理设置有误”
2019-03-06
wxWidgets源码分析(3) - 消息映射表
2019-03-06
wxWidgets源码分析(9) - wxString
2019-03-06
[源码解析] 消息队列 Kombu 之 基本架构
2019-03-06
[源码分析] 消息队列 Kombu 之 启动过程
2019-03-06
wx.NET CLI wrapper for wxWidgets
2019-03-06
Powershell中禁止执行脚本解决办法
2019-03-06
OO_Unit2 多线程电梯总结
2019-03-06
04_Mysql配置文件(重要参数)
2019-03-06
JavaSE总结
2019-03-06
Python IO编程
2019-03-06
使用 TortoiseGit 时,报 Access denied 错误
2019-03-06
基于 HTML5 WebGL 的污水处理厂泵站自控系统
2019-03-06
c++之程序流程控制
2019-03-06
李笑来必读书籍整理
2019-03-06
Hadoop(十六)之使用Combiner优化MapReduce
2019-03-06
《机器学习Python实现_10_06_集成学习_boosting_gbdt分类实现》
2019-03-06
C语言编译错误列表
2019-03-07