你的基于云的公有云工作负载运行缓慢吗?你不知道从哪儿开始检测吗?以下一些方法通常能帮助你快速诊断出性能降低的根本原因
我发现许多在IT行业能快速诊断出传统系统的问题的人,在诊断基于云的系统时总是会遇到麻烦。为什么?因为他们没有深入了解公有云里到底有什么,如AWS或微软Azure,他们认为它就是一个黑盒子。
情况并不是这样。并且,大多数公有云提供的系统管理工具和API都是一流的。然而,你确实必须首先要知道从哪儿开始诊断,以及使用什么工具。
云性能是非常复杂的,因为在一天快要结束的时候,它是一个复杂的分布式系统。然而,根据以下5个步骤你可以发现和修复根本原因。如果你在一个步骤发现了性能问题,不要停下来!你可能不只有一个问题影响着性能。
1.检查支持工作负载的基础设施,包括应用程序和数据
通过使用系统监控和登录分析工具,你就可以确定CPU和存储的使用情况,这两者是最有可能会成为罪魁祸首的。
应用程序和数据库的大小随着时间变大时,许多使用云的IT专业人员未能按照需要分配更多的CPU和存储。尽管你可能认为公有云是自动进行扩展以满足需要的,但情况并不是这样。你需要在需要它们之前就配置和提供更多的服务器,以便处理额外的工作负载。
2.查看应用程序本身
有许多监控工具可以一窥应用程序的运行情况,因此,我强烈建议你使用它们中的一个或多个。
如同基础设施一样,应用程序几乎也总是造成性能降低的问题,因为开发人员可能没有把它们重构或修改为使用原生云功能。因此,在使用基础设施时,它们可能会变得十分低效,这便使得开发人员将性能降低的原因错误地归咎到了基础设施上。
3.查看其它较少可能造成性能问题的根本原因
现在是时候检查其它元素了。检查安全系统:加密服务可能会占用存储和计算。检查治理服务——甚至是监控服务也会在第一时间告诉你性能问题。我发现所有这些工具都可能会占用基础设施。
4.转移到网络,包括云内外的带宽检查
因为你的公有云服务是搭建在开放的网络上的,你就经常不得不与其他大量的数据包进行竞争。为了查看这是否是你的性能降低的一个原因,做一下ping测试吧,它们将有效的帮助你检查带宽的具体情况。
5.检查用户的浏览器和计算机
最后,与基于云的应用程序进行交流的用户的浏览器也经常会出现问题。
我发现恶意软件,加密问题,以及所有这些在Windows PC和Mac上出现错误的东西基本上都有可能会降低客户端的云性能。让技术支持检查一下这一方面吧,如果前四个步骤都没有问题的话。