在混合云计算中,数据的存储对云服务的整体性能会产生较大的影响。因此,了解存储即服务(SaaS)有助于解决混合云的数据管理和延迟问题。
通过云爆发,一个混合云平台可以提供巨大的计算灵活性。但是这也给IT团队带来了挑战,包括怎样合理安排混合云数据,以及如何跨公有云和私有云快速获取这些数据。不过还好,存储即服务可以帮助你克服这些挑战。
云爆发的困境
云爆发存在的根本问题是,数据通常被存储在了错误的云环境中。对于网络服务和媒体交付等多种应用程序来说,最正确的做法是将数据同时复制到公有云和私有云中。数据集大多是静态的应用程序都适用于此模型,并且还有可以自动执行复制过程的软件。
但是对于存放着活跃数据集的应用程序又该怎么办呢?一些IT团队选择容忍这些应用程序带来的延迟问题。但是,这样就不能尽享云爆发的诸多好处。或者,企业可能会研发某些数据定位技术来降低延迟。
企业应当把云想作是一个连续的服务。如果在混合云平台不止一个区域存在数据副本,不管它们是活跃的还是静止的,连续的服务都支持对其进行弹性的、不间断的计算。如果内部私有云段存储减少,你可以将全部的工作负载爆发到公有云上,而不会丢失服务。
这就为你管理数据提供了两种选择。一种选择是将主要的数据存放在内部,然后将其持续地复制到公有云上。在云爆发产生时,写入数据到提供计算服务的云平台,然后同步到其他副本中。然而,这个模型仍然难以避免写入延迟,并且会有一些小窗口,在这些小窗口中数据元素可能是不同步的。这使得编程复杂化了。
另一种选择是将主要的数据副本存放在公有云中,并找出一种方式,提高内部计算工作负载访问数据的速度。这样,存储即服务(SaaS)就可以成为有效的混合云计算模型。
SaaS在混合云平台的作用
用户在缴纳租金后,诸如Zadara Storage Inc.和Velostrata等的SaaS供应商就可以在一个公有云上为他们划定一些存储空间——通常是在一个大型的公有云上,如AWS或谷歌云。这解决了工作负载爆发时,数据的可用性和延迟性问题,而且还允许用户在多个地理区域进行数据复制,以加强防灾能力。
为解决内部延迟性问题,SaaS供应商在客户的网站部署了缓存系统,以优化快速转移和深度缓存。缓存系统在内部系统保留了一份热点数据,以备使用;同时在本地和私有云上的数据发生改变时,缓存系统还可以进行写缓存。
这些缓存系统是智能的。它们可以学习数据流模式、预测工作负载需求,以实现缓存的高命中率。这个缓存命中率是SaaS供应商之间的一个分水岭。
为实现缓存,SaaS供应商会为用户提供或者推荐一些缓存引擎配置。这些拥有最高性能水平的SaaS供应商都使用了一个全闪存构建,以及非易失性存储器或者快速串行SCSI固态硬盘。他们也使用了大量的动态随机存取存储器,以存储索引表和压缩基元,而压缩基元是对象中被多次使用后的数据的延伸。
数据以一个高度压缩的形式,在内部缓存和公有云之间移动,从而大幅度降低了延迟,减少了混合云平台的交通堵塞。写入缓存引擎的数据被压缩后,被存储到公有云上,并在公有云上进行自我复制。由于这些数据通常被认为是热点数据,因此,至少在短时间内,它们也会被保存在缓存引擎中。
当SaaS架构中的所有数据被写入到缓存引擎时,它们通常会被加密。在更先进的系统中,用户拥有自己的密钥,这种做法满足HIPAA合规性要求。他们还可以在压缩前,用扩展元数据标记数据。包括Rubrik在内的一些系统采用了这种方法,以增强搜索性能、提高数据的操作性。
Velostrata和Zadara等SaaS供应商可提供各种级别的服务。一般而言,租用公有云空间的费用相对较低,尤其是对于那些存储压缩数据的空间,所以从经济学角度上来说,SaaS是非常具有吸引力的。试用这些服务的成本也比较低,企业可以在试用期内,进行多次试运行。
在你为混合云平台部署SaaS之前,从你感兴趣的供应商那里获取一些客户参考资料会是一个不错的选择。