“今年的盘点来的有点早,是因为截至目前媒体公开报道的宕机事件已经足够多了,我们甄选了16件宕机事件,来为您一一还原2016”
1
事件:汇丰银行网站无法登入
影响评级:★★★
时间:2016.1.6
原因:未公开
持续时间:24小时+
影响范围:1700万名个人及商业客户
新闻来源:金评媒 http://www.jpm.cn/article-5578-1.html
2
事件:Github全球服务中断
影响评级:★★★
时间:2016.1.28
原因:网络中断
持续时间:6小时+
影响范围:所有托管在上面的开源项目
新闻来源:开源中国 https://www.oschina.net/news/70289/github-down
3
事件:亚马逊电商网站中断访问
影响评级:★★★
时间:2016.3.10
原因:未公开
持续时间:20分钟
影响范围:亚马逊电子商务主网站及云计算服务
新闻来源:新浪科技 http://tech.sina.com.cn/i/2016-03-11/doc-ifxqhfvp0711977.shtml
4
事件:全日空公司的日本国内航线无法办理登机手续
影响评级:★★★★
时间:2016.3.22
原因:未公开
持续时间:1天
影响范围:国内多地机场航班延迟
新闻来源:中国新闻网 http://www.chinanews.com/gj/2016/03-22/7806495.shtml
5
事件:北京亦庄数据中心供电中断
影响评级:★★★★
时间:2016.4.22
原因:停电
持续时间:7小时
影响范围:某村镇银行和多家金融机构托管在该机房的所有设备宕机,服务全部中断
新闻来源:云头条 http://www.yuntoutiao.com/dongtai/6020.html
6
事件:Salesforce大范围宕机并丢失数据
影响评级:★★★
时间:2016.5.12
原因:停电
持续时间:20小时
影响范围:北美的14个站点切且丢失了4小时的数据
新闻来源:今日头条 http://www.toutiao.com/i6283708317688660481/
7
事件:上海电影节淘票票服务器宕机
影响评级:★
时间:2016.6.4
原因:客流量太大
持续时间:1小时15分钟
影响范围:上海电影节购票影迷无法购票
新闻来源:腾讯科技 http://tech.qq.com/a/20160604/013727.htm
8
事件:支付宝出现故障,无法支付
影响评级:★★★
时间:2016.7.22
原因:华南一处机房出现故障
持续时间:2小时
影响范围:部分用户无法在线上或线下通过支付宝进行支付购买
新闻来源:中新网 http://www.chinanews.com/it/2016/07-22/7948369.shtml
9
事件:腾讯微信故障,朋友圈无法打开,微信图文也无法打开
影响评级:★★★
时间:2016.7.30
原因:服务器故障
持续时间:2小时
影响范围:部分微信用户微信公众号文章无法打开
新闻来源:北青网 http://china.ynet.com/3.1/1607/30/11535585.html
10
事件:美国达美航空发生重大计算机系统宕机
影响评级:★★★★
时间:2016.8.8
原因:停电
持续时间:6小时
影响范围:451趟航班被取消
新闻来源:科技新报 http://technews.cn/2016/08/16/corporate-it-spending/
11
事件:谷歌云存储及文件备份服务器服务中断
影响评级:★★★
时间:2016.8.9
原因:未公开
持续时间:十几分钟
影响范围:部分云用户在访问服务器时会显示“服务器遇到错误,请稍后再试”的字样
新闻来源:中关村在线 http://server.zol.com.cn/598/5983060.html
12
事件:搜狐快站宕机,无法访问
影响评级:★
时间:2016.8.20
原因:北京联通北显机房两路光缆出现硬件故障
持续时间:1小时
影响范围:部分搜狐快站无法访问
新闻来源:IT之家 http://www.ithome.com/html/it/251063.htm
13
事件:新浪微博因乔任梁去世消息导致部分服务中断
影响评级:★★★
时间:2016.9.17
原因:服务器压力过大
持续时间:1小时
影响范围:部分微博网友无法正常登录,热门搜索无法正常显示
新闻来源:Techweb http://www.techweb.com.cn/irouter/2016-09-17/2394359.shtml
14
事件:摩拜单车服务器宕机导致APP无法使用
影响评级:★★
时间:2016.9.19
原因:服务器压力过大
持续时间:7小时
影响范围:单车无法在APP 显示、无法开锁以及关锁后无法结费
新闻来源:新民网 http://shanghai.xinmin.cn/xmsq/2016/09/21/30444405.html
15
事件:大规模DDoS攻击导致美国东海岸网站集体宕机
影响评级:★★★★★
时间:2016.10.22
原因:物联网设备漏洞,被利用进行的DDOS攻击
持续时间:7小时
影响范围:Twitter、Tumblr、Netflix、亚马逊、Shopify、Reddit、Airbnb、PayPal和Yelp等诸多人气网站无法提供服务
新闻来源:新浪科技 http://tech.sina.com.cn/i/2016-10-22/doc-ifxwztrt0100881.shtml
16
事件:ING银行数据中心宕机
影响评级:★★★
时间:2016.11.2
原因:消防演习
持续时间:10小时
影响范围:超过一百万用户无法使用ING银行服务
新闻来源:新浪科技 http://tech.sina.com.cn/i/2016-10-22/doc-ifxwztrt0100881.shtml
「数读」
1. 我们从影响范围、影响时间和是否有数据丢失3个维度对每个宕机事件进行了影响评级,从1颗星到5颗星。
2. 16例宕机事件原因有未公开(4例),停电(3例),服务器压力(3例),硬件故障(3例),网络中断(1例),外部攻击(1例)和消防演习(1例)。
3. 16例宕机事件涵盖了互联网(11例),金融(3例)和航空(2例),相信除了这些公开的媒体资料,还有不少领域例如医疗、公共交通、能源、电信等都发生过因各种原因导致的宕机事件。
「总结」
2016已不再是2015“谁之过”的媒体式拷问,而是“越看越清晰”的全民认知升华。建立灾备和业务连续性体系不仅仅是行业规范和企业自身的IT建设需求,更是用户在产品质量信得过以外,企业服务信得过方面的又一重要诉求。
灾备系统应尽早建立,不要有侥幸心理。
信息系统属于企业重要的信息基础设施,其安全问题涉及到核心数据资产,关乎企业生存与发展,涉及个人生存与生活,甚至触及国家和社会的稳定。中华人民共和国国民经济和社会发展第十三个五年规划纲要》中明确指出要:强化信息安全保障,包括强化重要信息系统和数据资源保护,加强数据资源在采集、存储、应用和开放等环节的安全保护,加强各类公共数据资源在公开共享等环节的安全评估与保护等。而对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。
业务连续性管理是一项工程,不仅仅是IT部门的事情。
信息系统环境中的风险点和威胁点往往不是单一的,也不是静态的,简单的安全产品堆砌已被证明不是有效的解决途径。信息系统安全是涉及到技术、人员、组织、环境、法律及管理等多方面因素的系统性问题,应该采用信息保障的原理、技术和方法,以全局的、动态的眼光来研究、设计、实施与维护信息系统安全工作。
「延伸」
16例宕机事件中,有11例互联网,占比接近70%.那么我们如何借助云计算技术,获得高计算能力、弹性资源、敏捷运维这些优势的同时,去避免单一云平台所带来的数据和业务连续性的风险呢?