如何将平均维修时间（MTTR）降到零？

Claire| 2018-06-05 来源：Claire编译云计算评论数( 0 )

Fugue首席执行官和共同创始人Josh Stella表示，可以减少平均维修时间（MTTR）的自动化工具能够让云基础设施进行“自我修复。”

在企业发展的过程中，相比安全性，效率更为重要，但是自动部署安全网络安全气囊却是每个公司都需要的，尤其是在进行云治理时。

为了确保企业正在“以正确的方式使用云，”它需要采用自动修复工具来减少MTTR,或是需要多长时间才能将网络事件的发生概率降低到零，云安全工具初创公司Fugue的首席执行官和共同创始人Josh Stella在一次采访中告诉CIO Dive。手动探测和对标记的错误进行响应会减缓缩短MTTR的进程，将网络暴露于风险之中太长时间。

据IBM 2018年的一份报告显示，去年安全泄漏事件的增长率高达424%，其中大部分都是人为对云的错误配置所造成的。如果在云上需要进行成千上万个配置，那么把原因归咎于人为错误配置有时是不公平的。“我们不是这样工作的。”Stella说到。

比如，当某人手动执行维修时，一些资产会从公有云上下线。然而，人为错误可以很容易地乘虚而入，因为开发人员可能会错误地“留下一个漏洞”，并且在监控工具把它检测出来之前而没有注意到它。

传统上用于数据中心的监控工具已经进行了自动化，但一旦它在事件管理中向人类用户发送了一个通知，它的工作就完成了。除非有人收到了工单，然后详细说明即将进行批准的计划，手动纠正问题并编写一份报告以用以将来的迁移，修复流程就不会开始。

将做所有这些事情的时间加起来便会使平均维修时间达到数小时，数天甚至数周，因为人工介入“要花费一点时间，”Stella说到。

浪费宝贵的MTTR

通常，MTTR由首席信息安全官（CISO）监督，而传统的CISO的“心态”则倾向于关注外围安全。但是云引入了一种新的需要进行保护的安全层面。缺乏自动化技术来保护这一新的层面是CISO“在云上的最大的问题，”即使他们“不知道这是他们的问题，”据Stella表示。

除人为错误之外，人为修复会耗费数小时的时间，因为开发人员会接收到大量由监控工具所标记的假阳性。

但是，因为云已经启用了管理开发运维来快速构建应用程序和工具，所以相比以前云在不断地移动“更多的部件，”这从而使得准确地选择正确的部件以及确定需要升级哪些部件变得十分困难，Stella表示。

错误标记使得信噪比变得十分糟糕，这导致出现大量对事情进行标记的“信息洪流”，而这些事情是不值得花费时间去进行调查和解决的，他说到。

为了消除人为错误的风险，或是因修复时间延迟而造成的风险，以下4个步骤可以将平均维修时间（MTTR）降低到零：

1. 了解云上有什么

企业需要做的第一件事就是知道云上有什么。此时，企业会用工具来识别存在错误的地方。

但是，仅仅用于监视和警告云基础设施存在变更的独立工具到目前为止只能获取安全信息。这些工具会为每个警告开具工单，以便人类对这些警告进行审核。最终，警告就会越来越多。

2. 采用‘政策即代码’

对企业的云环境中存在什么有一个很好的认识，能够使遵守要求的政策变得更容易。比如，医疗专业人士需要知道HIPPA要求，PCI交易要求，或者如果需要处理位于EU的数据，还有GDPR法规。

满足政策规定最有效的方式是，使用“政策即代码”来提醒企业它正在违背政策合规性。据Stella表示，它要求公司“有条理地”梳理系统，以便符合要求的政策。

3. 开始修复

一旦系统提醒企业它的云环境中存在漏洞，那么它就应当开始进行修复。自动修复会了解应用程序的“足迹。”

据Stella表示，尽管企业可以在内部完成修复工作，但最终他们可能会构建一系列不需要的工具和脚本，而这通常会导致平均修复时间延长。

4.维持修复

将MTTR降到零的最后一步是“一件你余下一生都需要去做的事，”Stella表示。所有前三步中所确定的事情都需要进行保持。

这便是自动化大显身手的地方。在不需要请求人类同意的情况下，让一个工具持续不断地识别潜在的威胁或不准确的地方并应用决议，能够免去对假阳性的猜测，并消除手动修复错误所花费的时间。自动修复工具能够让云基础设施进行“自我修复”，而不需要人工进行干预。

标签: 平均维修时间

聚焦云计算，扫描二维码，关注HostUCan云计算

有好的文章希望站长之间帮助分享推广，猛戳这里我要投稿

如何将平均维修时间（MTTR）降到零？

热门标签

关于锐成

合作伙伴