人工智能时代前沿技术社区

首页 > 热点

微博又双叒叕瘫痪了!鹿晗:这锅我是不背

尽管目前自动化运维与智能运维有了一定的发展,但由于一些技术、软件方面的天花板原因,运维工作的发展还有很大的发展空间。相信随着人工智能技术、算法技术的不断成熟,运维工作也会有很大进步。但在真正成熟的智能运维实现之前,运维工程师们是不是可以考虑先从监控系统和告警系统着手,尽量在故障发生前就提前知晓,提前准备呢?

作者:谭盼雨 | 2017-10-09 16:47:55 | 来源:飞马网

就在昨天,2017年10月8日,对,就是双节假期的最后一天,也是鹿晗与关晓彤公布恋情的一天,就在这天,新浪微博又双叒叕......瘫痪了!

对此,不少人都表示:

1.png

尽管如此,我们还是先来回顾一下整个事件的过程:

10月8日12:00---鹿晗在微博公布了与关晓彤的恋情:

2.png

3.png

短时间内迅速登上了当天热搜榜:

4.png

12月8日12:32---新浪微博客服发布公告,告知微博客户端功能异常;

5.png

12月8日14:00---新浪微博客服告知微博功能相继恢复;

6.png

12月8日17:42---新浪数据助手公布了当天微博瘫痪的元凶:

7.png

于是乎,大家在“甜蜜暴击”之余,纷纷把本次微博瘫痪的原因归咎于鹿晗:

8.png

就连被迫在结婚当天加班的微博工程师也戏称“怪”鹿晗:

9.png

在大家纷纷将微博瘫痪的锅甩给鹿晗的高人气的时候,小编想说:

10.png

11.png

12.png

这已经不是新浪微博出现的第一次瘫痪了,作为主流的社交软件,新浪微博有着数亿用户量。回顾之前微博宕机的历次事件,我们不难发现,大多都是由于超高流量的冲击压力,导致服务器撑不住才出现问题。这也正是大家对微博瘫痪见怪不怪的原因。

但让人奇怪的是,微博为什么会一而再、再而三地出现类似的问题呢?难道真如搜狗CEO王小川曾预言的新浪微博陷入死循环中?

有业内人士对此表示:新浪微博采用的混合云架构,而混合云存在一个大问题就是:两个云之之间的调度是受到天然的限制的。在遇到超高流量的冲击时,两个云服务器之间的顺利调度、衔接稍微一出现问题,就会导致功能异常。

在大数据、高流量的今天,系统、服务器的高并发能力一直是老生常谈谈。但瘫痪、故障、宕机的情况依然会时不时地出现,这是为什么呢?

有技术人分析,在云计算中有一个动态负载均衡,从技术角度看,软件层面的优化和调试是有天花板的,目前在超高流量冲击的情况下只能靠增加硬件资源。另外从管理角度来说的话,就是预警监控和应急预案。

也就是说,如果你的云计算架构只能提供50W台服务器的运算资源,而在某个时间段,流量可能会达到1个亿,这时需要需要1个亿的计算资源,当流量大于服务器的承载能力时,故障就出现了。

对于高并发处理,无外乎会聊到这几点:集群缓存、排队控制、服务器资源合理分配、代码的优化。本次微博瘫痪,显然再一次说明,在高并发处理方面,新浪的后台架构设计并不完全合理,底层硬件配置不充分,没有对极端情况产生预警处理。

也有人说,微博自动化运维做的很不错了,但是由于项目部署肯定涉及到方方面面,再加上微博拥有如此庞大的用户群及数据量,遇到突然情况很难做提前准备。

影响系统高并发的因素有:单位时间数据吞吐量、响应时间、每秒查询率QPS、并发用户数等,当多种因素同时具备时,会对系统造成及大的冲击力,本次微博瘫痪就是因为短时间内访问量过大造成的。

尽管目前自动化运维与智能运维有了一定的发展,但由于一些技术、软件方面的天花板原因,运维工作的发展还有很大的发展空间。相信随着人工智能技术、算法技术的不断成熟,运维工作也会有很大进步。但在真正成熟的智能运维实现之前,运维工程师们是不是可以考虑先从监控系统告警系统着手,尽量在故障发生前就提前知晓,提前准备呢?

最后,安慰一下所有失恋的妹子:无论发生什么,还好有我党永远在你身边!

13.png

14.png