ACT三层优化,英特尔傲腾打造数据“博尔特”

半导体行业观察 2020-09-17 09:10
从前车马很慢,书信很远,数据传输的速度更是慢到无奈。

许多人可能都有备份硬盘的经历,或者你也曾向移动硬盘中拷贝大量的电影或者文件资料。对于传统机械硬盘来说,受限于物理运行速度,磁盘的转速与磁头的读写远不及如今的电子元器件,大多数硬盘的速度也不过就是每秒100多MB。


也就是说,传输一个普通的高清电影大概需要5-8分钟,而对于4K甚至8K电影动辄上百GB的体积来说,传输效率更是难以想象的。以8K动画大作《鲁鲁修R2》为例,该片第一集文件大小达到了惊人的4.5TB,换算下来的传输时间要超过8个小时。

很显然,这种速度是互联网快节奏难以承受的,而机械硬盘容量“加量不加速”的问题也让人看到了闪存的优势。所以从人类迈入高清时代开始,闪存作为更快的传输介质就进入了人们的视野,并通过多年来的不懈努力成为了当下包括手机、平板电脑、服务器、存储等多种设备中的重要存储介质。即便是在看中容量的企业级领域,全闪存阵列也是许多企业数字化转型的必要选择。

但是与之前机械硬盘面临的问题类似,闪存也同样遇到了“加量不加速”的问题,只是目前这种局面还并未达到极限。不过业内许多有识之士和领军企业都在进行高性能、高寿命的存储产品研发,2018年英特尔发布的、基于3D XPoint技术的傲腾存储就为整个行业带来了全新的希望。


其实从诞生之初,英特尔傲腾存储就引来了行业的关注,特别是最初强调的“速度是目前NAND闪存的1000倍,耐用性也是目前闪存的1000倍,密度是NAND的10倍”等等描述更是引起了大众的浓厚兴趣。事实上,英特尔之所以有如此的自信,也恰恰是由于傲腾产品所采用的创新性3D XPoint架构,提供了强大的数据处理能力。

如今,傲腾系列产品不仅仅在个人消费领域风生水起,在企业级也凭借着出色的性能成为了“高性能”的代名词。无论是傲腾存储还是傲腾可扩展内存,都已经在头部互联网、大型制造业集团等多个领域当中实现部署,并且取得了出色的成绩。

为什么这些行业顶尖企业都会选择傲腾存储呢?除了性能之外,还在于傲腾存储能够为用户优化“ACT三大场景”,并针对场景提供差异化的服务能力。所谓的ACT在这里代表了A(Accelerating,加速)、C(Caching,缓存)、T(Tiering,促进应用分层)三个层面,而傲腾技术就是在这三个层面实现了激活。

加速加速再加速,傲腾存储的立足之本




首先说说A场景——加速。正如我们前面谈到的,傲腾存储的兴起就是替代了原有NAND存储的加速功能,提供了“1000倍”的理论性能提升。甚至我们可以说,傲腾是目前存储领域读写最快的产品,而这种特性也让它能够被应用于包括Redis、Oracle Database或者MySQL在内的多种数据库中,加速数据库的读写操作。

英特尔公司非易失存储解决方案事业部应用工程部的翁昀先生分享了一则来自于客户的真实案例。DC P4610是英特尔面向数据中心市场推出的固态盘,也是采用TLC芯片的产品,但是在日常使用中,客户觉得P4610虽然性能表现不错,但是与期望的性能仍有差距,所以在P4610的基础上,客户将存储升级到了DC P4800X,后者则是基于傲腾技术打造的“性能怪兽”。


这种升级带来的提升是立竿见影的,翁昀也对两者的性能进行了简单的对比——就IOPS吞吐量表现来说,在70%读取30%写入的情况下,傲腾P4800X的性能是P4610的3倍,在寿命上是P4610的5倍,在延迟上只有P4610的五分之一。更夸张的是在QoS动态分配中,傲腾P4800X的表现是P4610的12倍,也让人惊呼于傲腾的性能优势。

另一个加速的案例则来自于Ceph环境中,这也是当下云平台中经常出现的场景。与我们刚才提到的案例类似,在同样IOPS的要求和读写设定之下( 70%读30%写),傲腾相对于传统NAND存储依然具备强大的优势。这种优势体现在单位体积、延迟和整体拥有成本三个方面——


就占用空间和面积来说,传统的全闪存阵列要达到15万IOPS吞吐量需要大约19个节点才能实现,但是在使用了傲腾方案之后只要7个节点就能达到相同的效果,由此节省的机房空间和租赁成本是一笔不小的数目;

在延迟方面,虽然全闪存阵列的延迟已经非常可观,但是同样的性能下SATA全闪存延迟的读取延迟需要达到读4.3毫秒 ,写入延迟达到8.1亳秒;而相同条件下,采用傲腾加速以后的读取延迟只有1.2毫秒,写入延迟也不过2.3亳秒 ,大概只有之前的四分之一;

此消彼长带来的就是总体拥有成本的降低。以三年周期的使用成本计算,传统全闪存阵列大概要花掉近60万美元,但是傲腾平台只要23万美元,降低了一大半。如果考虑到傲腾平台所带来的性能优势,从性价比的角度来说优势可以翻番。

其实这也只是傲腾P4800X的小试牛刀。拷贝过数据的朋友们知道,我们在数据读写的时候不怕大块的视频数据,而是最担心于细小的文件,因为这些零碎文件会大大增加盘体的读写压力,也让传输速度大幅度下降。但是傲腾P4800X却并没有出现这样的情况,对于任何容量的数据块,傲腾P4800X都能保持超高的速写速度,同时尽可能低的延迟也让它具备更快的响应速度。

缓存优化,提升的不仅仅是性能



看完了A部分加速的内容,我们再来看看C部分——缓存。要知道,傲腾系列产品的能力是非常全面的,其中的傲腾可持久内存就是以缓存能力为代表,这也进一步证明了傲腾存储在缓存上的性能,甚至相对于加速的数据库来说,缓存的读写要求更高。

在许多人的印象中,缓存能力都考察的是读取能力,即如何实现数据的对外输出。但事实上,由于Cache中的数据需要经常刷新,因此在数据缓存的过程中往往是边写边读,这也进一步考验了存储的性能和稳定性。为此,英特尔上海实验室也在vSAN环境下进行了P4610和P4800X的再度对比,成绩非常喜人。


测试基于虚拟机中的VDBench软件进行。从最终结果我们可以看到,无论是顺序写、 顺序读还是在随机读写上,傲腾P4800X相对于P4610都有不小的提升,其中顺序写性能提升了50%,、随机写4K性能提升接近60%,而所有的混合读写操作性能提升都超过了100%。除此之外,在延迟层面的随机读写时间也有一半以上的下降,傲腾P4800X的优势非常明显。

“从P4610到P4800X,虽然看似单位容量价格出现了提升,但因为傲腾P4800X需要的容量更小,所以采购压力变化并不大。不仅如此,P4800X还能够带来更好的寿命保障,这对于用户来说恐怕是除了单纯性能指标之外也要关注的内容”,E企研究院首席研究员张广彬老师如是说。

数据分层,让冷热数据智能存放



ACT的最后一个层面是T,即数据分层。其实从大数据时代开始,我们就将数据定义为冷数据、温数据和热数据三个层级,而除了最底层、最不常用的冷数据之外,温数据和热数据的传输都是我们需要关注的问题。那么,如何实现数据分层的自由转换?是否有一种智能化的方案实现了数据控制呢?


傲腾存储给出了答案。作为大数据框架之一,Hadoop自诞生之日起到现在一直在发挥作用,不少大数据分析平台都是基于Hadoop框架所搭建。据翁昀介绍,在某英特尔客户案例中,原本采用的就是传统SATA SSD+RAID控制器的方式来实现数据分层。

但是英特尔给出了不同的解决方案——一方面,英特尔为客户提供了存储热数据的傲腾SSD,另一方面又将YARN Temp文件单独提取出来,通过RAID控制器将冷数据依然保存在原有的SATA SSD上。

这样首先降低了数据读写延迟,而更重要的是解决了原有SATA  SSD上0.7 DWPD的限制问题,使得整个Hadoop集群的性能获得大幅度提升 。如今,该解决方案已经在国内某头部互联网企业中实现部署,仅仅通过简单的分层方式,借助于傲腾存储就实现了智能化的数据存放管理。

我们常说数据是数字化时代的“石油”,而如何把握这一重要的资源目前在整个业界还没有最终的结论,许多存储企业都在各显其能的提供差异化的解决方案。对于英特尔来说,它所提供的傲腾存储产品能够帮助企业实现从加速、缓存优化到数据分层的全方位覆盖,通过ACT三大层面的特性表现,让数据实现快速、安全、智能化的数据管理,也帮助客户更好的迈入数字化时代。

英特尔傲腾存储,让你成为数据赛道上的“博尔特”。

点击“阅读原文”了解英特尔傲腾存储更多信息

今天是《半导体行业观察》为您分享的第2435期内容,欢迎关注。

推荐阅读


MIPS和Arm都无法幸免,为何受伤的都是IP巨头?

中国何时进入半导体并购“增量”竞争时代?

深圳半导体四十年,多少英雄书写传奇


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|设备SiC|封装|射频|台积电|华为|EDA

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

推荐阅读