周一互联网性能出现了异常,这归咎于瑞典电信公司TeliaSonera旗下的骨干网络运营部门Telia Carrier。据说一大批热门的网站和服务受到了这次事件的影响,从亚马逊的基础设施云、Reddit到Facebook的WhatsApp,不一而足。
目前还不清楚具体是什么原因导致Telia的全球骨干网丢失了在五大洲(北美洲、南美洲、非洲、欧洲和亚洲)之间传输的数据包。一些新闻报道认为这起故障与Telia的一名工程师所犯的错误有关,不过没有表明确切的信息来源。
Telia的多个客户在推特上表示,这起故障是人为错误引起的。
Telia的大客户之一CloudFlare详细记述了Telia骨干网上的丢包问题,CloudFlare本身运营着一个全球性内容分发网络(CDN)。这已是CloudFlare在短短四天内遇到的第二次Telia重大故障,这家CDN提供商的首席执行官跑到社交网络上吐槽,对60天内差强人意的可靠性表示颇为沮丧。
下图是CloudFlare显示了周一Telia全球网络上丢包现象严重的时段:
Telia是最大的全球性骨干网运营商之一。其网状网结构的互联城域网和接入点(PoP)托管在全球各地的许多数据中心,由众多数据中心提供商来运营,其中包括Equinix、Digital Realty Trust及子公司Telx、CyrusOne和Interxion等。
CloudFlare首席执行官马修·普林斯(Matthew Prince)在推特上表示,Telia在过去60天内的可靠性让人无法接受,CloudFlare将不再重视这家运营商,除非它解决了其“系统性问题”。在另一则推特消息中,普林斯表示,他公司每年在Telia身上花费“数百万美元”。
@TeliaCarrier在过去60天内的可靠性让人无法接受。我们不再重视它,除非我们确信它解决了系统性问题。
— Matthew Prince((@eastdakota),2016年6月20日
透明的重要性
对于在互联网上开展业务的所有人来说,网络和数据中心故障不可避免,这是无情的现实。所有系统都会在某个时间点出现故障;虽然大多数客户认识到这是事实,但是停运期间评判服务提供商的标准是恢复速度和透明度。普林斯及另一个Telia客户(基于Web的项目管理工具Basecamp的提供商)的代表都表示,他们很好奇,想看看这家运营商在故障根源方面有着怎样的透明度。
@CCIEMark @TeliaCarrier 我终究会知道答案,但要等Telia发布声明。我希望他们会透明,不过持怀疑态度。
— Matthew Prince(@eastdakota),2016年6月20日
Telia已表示歉意,声称正在直接与客户合作,解决停运导致的问题,不过并没有公开披露这起事件的根源。
为发生最近的停运事件表示歉意!已落实了另外的制约和平衡机制。现在,我们把注意力全部放在了直接与客户合作上,以便理清头绪、解决问题。
— Telia Carrier(@TeliaCarrier),2016年6月20日
来源:云头条
聚焦云计算,扫描二维码,关注HostUCan云计算