微软表示,当前的架构并不是最适合云基础设施的
针对闪存设备在数据中心上的存储方式,以及它们与主机服务器相交互的方式,微软提出了一个新的标准。他们表示,当前的架构并不是最适合云基础设施的。
微软计划使用这一提议的标准来以规范的形式助力开放计算项目(OCP)。该标准寻求把低级别的flash硬件管理功能和与数据存储管理相关的功能分离开来,让前者在闪存设备上进行,而让后者在主机上进行。
微软Azure基础设施团队的总经理和杰出工程师Kushagra Vaid表示,把数据管理功能转移到主机,使之更靠近应用工作负载,将帮助使存储与特定的应用需求更加匹配。同时,他也表示,分离这两种功能也能帮助将flash硬件和软件进一步独立开来,同时当数据中心的终端用户更新其闪存时,也能带给他们更多的一致性。
随着flash价格不断下降,同时应用程序需要更快的存储性能,数据中心存储阵列中闪存的普及速度在不断加快。Vaid表示,诸如微软Azure等的企业和云提供商使用了全球大约30%的闪存。他介绍,在这些使用中,大约有60%是大型云平台所消耗掉的,其中大多数都来自OCP成员。
他表示,作为一个OCP成员,微软每年购买了数十亿美元的闪存。如果行业采用了微软提议的、代号为“Denali”的标准,闪存制造商将能够制造更简单,更重要的是,更加便宜的设备。
这些设备在云数据中心中也能更容易和更快速地部署,因为从供应商到供应商,一代到一代,可变性将越来越小。
几年前,微软通过OCP发布了它的第一个云SSD规范。“这在一定程度上帮助了将所有参数汇集到一起,”Vaid表示,“然而,近年来我们开始意识到数据分片的重要性,因为在SSD中,我们内置了新的功能,但并不是以一种兼容的方式。”
初创企业中诞生出来的技术
该标准的基础是,一个由Cnex实验室所设计的内存控制器——Cnex是一家总部位于加利福利亚州圣何塞市的半导体初创公司。(大约一年前,微软领投了Cnex的C轮融资。)Cnex的首席执行官(CEO)Alan Armstrong阐释到,开发这个控制器最初是为了所有闪存阵列,但最后它却能将不同的功能从主机无缝地移动到控制器。
两年半前,Cnex开始研究一个概念验证,证明可以把控制器应用到云基础设施上。上周三,OCP基金会的OCP年度峰会在圣何塞市举行,Alan Armstrong和Vaid一起向参会者介绍了这一建议的标准。
Armstrong表示,今年晚些时候,这项技术将会被批量部署到数据中心中。然而,他并没有所具体会是哪些数据中心,也没有说微软将会在什么时候部署这些技术。
目前,Denali项目的“生态系统合作伙伴”也包括高通、三星、英特尔、Marvell、Lite-On和SK hynix。让三星、英特尔和SK hynix参与进来,提供支持,应该能够帮助这个项目得到采用,从而在实际上成为一个标准。这些公司都是前五名的NAND闪存制造商,其中以三星为龙头老大。同时,获得三星两个最大竞争对手Toshiba和西部数码(SanDisk的所有者),以及另一个主要的供应商Micron的支持,也能进一步帮助实现那个目标。
Sun Microsystems的合作创始人和Arista网络的创始人Andy Bechtolsheim表示,这一提议的标准有可能“重新定义服务器系统和闪存之间的接口。”他表示,它将能够缩短上市时间,提高性能和降低延迟性。
Denali的一个核心组件是,位于闪存设备上的、低级别功能之间的接口,以及能够向上移动堆栈的、高级别功能之间的接口。这个接口叫做pBLK。
低级别功能负责管理坏块、传输介质和掉电。而当前由闪存设备本身执行的、更为高级别的功能则负责地址映射、垃圾收集和磨损测量。
微软为Denali构想了两种部署模型:一种是,三个高级别功能直接在主机系统上运行,另一种是,它们可以在芯片(SoC)或FPGA上的一个专用系统上运行;这两种模型都需要加速器。
OCP设计的一个关键的原则
分离是部分重要的OCP项目的一个关键的设计原则。比如,分离交换机和服务器组件就意味着,能够基于当前的应用程序需求重新配置OCP硬件,并且每一个组件都能根据它自己的时间表更新。而将网络管理软件从交换机软件中分离开来,可以使网络更具弹性、更容易自动化,同时也能使在相同盒子中使用不同的软件变得更容易。
在上周的峰会上,Facebook也推出了它的最新的区域内数据中心互联解决方案,这个在该方案中,也同样应用到了分离的概念。当前,Facebook的数据中心网络结构有两种存在形式,一种是多个数据中心的网络结构位于同一个地区;另一种是,将一个地区的数据中心网络结构连接到Facebook的网络主干上,这样流量便能从一个地区流向另一个地区。针对这两种情况,该解决方案都能让企业对扩展进行扩展。