HPE GreenLake文件存储助力企业降低总拥有成本

作者:admin 来源:成都HPE服务器总代理 点击量:--


HPE GreenLake文件存储助力企业降低总拥有成本


存储系统能压缩多少数据?这是现代存储系统中最常见的问题之一。存储系统的压缩能力直接决定了所需的容量,从而也会影响到整体的 TCO(总拥有成本)。压缩率越高,所需的容量越小,所能降低的成本也就越多。


我们对 HPE GreenLake 文件存储的压缩能力进行了多种基于企业常用数据类型的测试,结果显示,其先进的数据压缩功能能够有效减少存储占用,从而显著降低 TCO。


存储行业中,许多厂商对其产品的数据压缩能力进行大胆的宣传,但如何辨别哪些宣传是真实可信的?在实际应用中,您究竟能期待多大程度的数据压缩效果?一些宣传在实际验证中同样可行,但另一部分宣传则可能只是针对特定的、高度可压缩的数据进行优化而得出的结果。这有点像汽车制造商在理想条件下测试的燃油效率或电动车的续航里程,虽然数据在广告中看起来很吸引人,但在现实中往往无法达到相同水准。同理,某些存储系统在实际环境中可能无法达到宣传的压缩标准。


1.png


在您实际的生产环境中,数据和应用程序实际能得到多大程度的压缩?压缩率对所需存储容量有何影响?我们希望帮助您解答这些问题,确保您在实际使用数据时,对可能的数据压缩进行更合理预期。


为此,我们使用了常见的真实数据集而非高度可压缩的数据进行测试。测试在 Elasticsearch 环境中进行,数据将从冷数据层写入 HPE GreenLake 文件存储。此次测试旨在评估 HPE GreenLake 文件存储平台的数据压缩能力,此前,该平台已被推荐用于 Elasticsearch 的冷数据层和冻结数据层。由于测试的重点是 HPE GreenLake 文件存储,因此没有监控热数据层和温数据层的数据压缩情况。



测试的工作负载和数据类型



测试中使用的工作负载通过 Elastic 开发的、用于 Elasticsearch基准测试的工具 Rally 生成。我们使用了多个 Rally 轨道来模拟不同的数据类型和工作负载:Rally中,每一个轨道都是针对一个或多个基准测试场景的专门规范,包括特定集合的文档或条目。轨道不仅定义了在Elasticsearch中要使用的索引,同时也包含要调用的数据文件和操作。因此,不同轨道代表的是具有独特工作负载特征的不同数据,通常会被认为是该数据类型的代表。


本次测试的轨道为事件数据、通用日志、Web 服务器日志、软件用户论坛的问答帖子、安全数据和 Kubernetes pod 指标。初始测试中,这些轨道的压缩测试是分别进行的,且每轮测试后都会清除所有数据。在后续测试中,我们在不同服务器上同时运行多个轨道,以模拟混合数据类型的实际工作负载。对于每种测试数据类型,我们使用 HPE GreenLake 文件存储的内置用户界面确定数据压缩率(DRR)。



测试结果



默认情况下,不论数据是何种类型或来自何处,Elasticsearch 都会在将其写入存储系统前对其进行压缩,以优化存储和网络资源的利用,同时在存储性能与成本之间取得平衡。测试将尽量使用 Elasticsearch 和 Rally 的默认配置,包括 Elasticsearch 默认的 LZ4 压缩算法,或以硬编码形式录入 Rally 轨道中的最佳压缩算法。由于在写入 HPE GreenLake 文件存储之前,数据已经被 Elasticsearch 压缩,进一步压缩变得更加困难。然而,HPE GreenLake 文件存储系统凭借其先进的数据压缩功能,仍然能够实现 10% 到 40% 的额外压缩,压缩比率在 1.1:1 到 1.4:1 之间。此举有助于减少存储占用,从而降低整体存储成本。


2.png


根据不同的数据类型,测试中的数据压缩率从 1.1:1 到 1.4:1 不等。软件用户论坛问答帖轨道的数据压缩率最低,为 1.1:1。这是因为用户问题和答案格式具有多样性,使得在 Elasticsearch 压缩后进一步压缩难度较大。事件数据集的压缩率稍高,达到 1.2:1。流式日志和 Web 服务器日志的压缩率最高,为 1.4:1。此外,对混合数据类型的测试结果表明,组合数据相较于单一类型数据,并不会获得显著的压缩率提升。最终数据为,混合数据类型的压缩率在 1.2:1 到 1.4:1 之间,取决于每种数据类型的占比。诚然,40%的压缩比看起来似乎不高,但对于那些拥有 TB 甚至 PB 级别数据量的企业来说,物理存储容量减少 40% 所带来的效益将是非常显著的。


需要再次强调的是,数据压缩效果取决于您的数据内容和特性。在不同配置下,数据压缩的效果可能与此次测试结果有所不同,就像汽车广告中的百公里油耗一样。但通过以上实际测试结果,您应该对 HPE GreenLake 文件存储如何减少存储占用并降低总体 TCO 有了更好的了解。


除更强的数据压缩率以外,HPE GreenLake 文件存储系统还优化了查询响应时间。通过 HPE GreenLake 数据服务云控制台,存储管理变得更加简单直观。它可以与其他 HPE 存储和计算平台的管理工具整合在一个控制界面中,帮助您提高 Elasticsearch 部署的效率并降低 TCO。


成都惠普HPE总代理 — 成都强川科技有限公司一直以客户需求为导向,不断提供最新更全的惠普HPE服务器、惠普工作站、存储产品以及最新最潮的增值应用解决方案,并且支持个性定制。了解更多产品信息及最新促销信息,可拨打客服专线028-85024766/18215624006或登录成都服务器官方网站www.hpedl.com ,与西部地区惠普HPE产品用户共同见证卓越。

热门文章