“今年的盘点来的有点早,是因为截至目前媒体公开报道的宕机事件已经足够多了,我们甄选了16件宕机事件,来为您一一还原2016”
1
- 事件:汇丰银行网站无法登入
- 影响评级:★★★
- 时间:2016.1.6
- 原因:未公开
- 持续时间:24小时+
- 影响范围:1700万名个人及商业客户
2
- 事件:Github全球服务中断
- 影响评级:★★★
- 时间:2016.1.28
- 原因:网络中断
- 持续时间:6小时+
- 影响范围:所有托管在上面的开源项目
3
- 事件:亚马逊电商网站中断访问
- 影响评级:★★★
- 时间:2016.3.10
- 原因:未公开
- 持续时间:20分钟
- 影响范围:亚马逊电子商务主网站及云计算服务
4
- 事件:全日空公司的日本国内航线无法办理登机手续
- 影响评级:★★★★
- 时间:2016.3.22
- 原因:未公开
- 持续时间:1天
- 影响范围:国内多地机场航班延迟
5
- 事件:北京亦庄数据中心供电中断
- 影响评级:★★★★
- 时间:2016.4.22
- 原因:停电
- 持续时间:7小时
- 影响范围:某村镇银行和多家金融机构托管在该机房的所有设备宕机,服务全部中断
6
- 事件:Salesforce大范围宕机并丢失数据
- 影响评级:★★★
- 时间:2016.5.12
- 原因:停电
- 持续时间:20小时
- 影响范围:北美的14个站点切且丢失了4小时的数据
7
- 事件:上海电影节淘票票服务器宕机
- 影响评级:★
- 时间:2016.6.4
- 原因:客流量太大
- 持续时间:1小时15分钟
- 影响范围:上海电影节购票影迷无法购票
8
- 事件:支付宝出现故障,无法支付
- 影响评级:★★★
- 时间:2016.7.22
- 原因:华南一处机房出现故障
- 持续时间:2小时
- 影响范围:部分用户无法在线上或线下通过支付宝进行支付购买
9
- 事件:腾讯微信故障,朋友圈无法打开,微信图文也无法打开
- 影响评级:★★★
- 时间:2016.7.30
- 原因:服务器故障
- 持续时间:2小时
- 影响范围:部分微信用户微信公众号文章无法打开
10
- 事件:美国达美航空发生重大计算机系统宕机
- 影响评级:★★★★
- 时间:2016.8.8
- 原因:停电
- 持续时间:6小时
- 影响范围:451趟航班被取消
11
- 事件:谷歌云存储及文件备份服务器服务中断
- 影响评级:★★★
- 时间:2016.8.9
- 原因:未公开
- 持续时间:十几分钟
- 影响范围:部分云用户在访问服务器时会显示“服务器遇到错误,请稍后再试”的字样
12
- 事件:搜狐快站宕机,无法访问
- 影响评级:★
- 时间:2016.8.20
- 原因:北京联通北显机房两路光缆出现硬件故障
- 持续时间:1小时
- 影响范围:部分搜狐快站无法访问
13
- 事件:新浪微博因乔任梁去世消息导致部分服务中断
- 影响评级:★★★
- 时间:2016.9.17
- 原因:服务器压力过大
- 持续时间:1小时
- 影响范围:部分微博网友无法正常登录,热门搜索无法正常显示
14
- 事件:摩拜单车服务器宕机导致APP无法使用
- 影响评级:★★
- 时间:2016.9.19
- 原因:服务器压力过大
- 持续时间:7小时
- 影响范围:单车无法在APP 显示、无法开锁以及关锁后无法结费
15
- 事件:大规模DDoS攻击导致美国东海岸网站集体宕机
- 影响评级:★★★★★
- 时间:2016.10.22
- 原因:物联网设备漏洞,被利用进行的DDOS攻击
- 持续时间:7小时
- 影响范围:Twitter、Tumblr、Netflix、亚马逊、Shopify、Reddit、Airbnb、PayPal和Yelp等诸多人气网站无法提供服务
16
- 事件:ING银行数据中心宕机
- 影响评级:★★★
- 时间:2016.11.2
- 原因:消防演习
- 持续时间:10小时
- 影响范围:超过一百万用户无法使用ING银行服务
「数读」
- 我们从影响范围、影响时间和是否有数据丢失3个维度对每个宕机事件进行了影响评级,从1颗星到5颗星。
- 16例宕机事件原因有未公开(4例),停电(3例),服务器压力(3例),硬件故障(3例),网络中断(1例),外部攻击(1例)和消防演习(1例)。
- 16例宕机事件涵盖了互联网(11例),金融(3例)和航空(2例),相信除了这些公开的媒体资料,还有不少领域例如医疗、公共交通、能源、电信等都发生过因各种原因导致的宕机事件。
「总结」
2016已不再是2015“谁之过”的媒体式拷问,而是“越看越清晰”的全民认知升华。建立灾备和业务连续性体系不仅仅是行业规范和企业自身的IT建设需求,更是用户在产品质量信得过以外,企业服务信得过方面的又一重要诉求。
灾备系统应尽早建立,不要有侥幸心理。
信息系统属于企业重要的信息基础设施,其安全问题涉及到核心数据资产,关乎企业生存与发展,涉及个人生存与生活,甚至触及国家和社会的稳定。中华人民共和国国民经济和社会发展第十三个五年规划纲要》中明确指出要:强化信息安全保障,包括强化重要信息系统和数据资源保护,加强数据资源在采集、存储、应用和开放等环节的安全保护,加强各类公共数据资源在公开共享等环节的安全评估与保护等。而对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。
业务连续性管理是一项工程,不仅仅是IT部门的事情。
信息系统环境中的风险点和威胁点往往不是单一的,也不是静态的,简单的安全产品堆砌已被证明不是有效的解决途径。信息系统安全是涉及到技术、人员、组织、环境、法律及管理等多方面因素的系统性问题,应该采用信息保障的原理、技术和方法,以全局的、动态的眼光来研究、设计、实施与维护信息系统安全工作。
「延伸」
16例宕机事件中,有11例互联网,占比接近70%.那么我们如何借助云计算技术,获得高计算能力、弹性资源、敏捷运维这些优势的同时,去避免单一云平台所带来的数据和业务连续性的风险呢?