数据可以冷,但不能凉啊

对于越来越多的组织来说,冷数据存储策略是一个避不开的话题。

在我们的日常生活当中,当需要删除旧照片或设备上其他有价值的资产时,我们多少都会有点犹豫。谁知道什么时候你可能会再次需要访问这些信息,对吧?

这样的犹豫,在企业层面也并无不同,甚至影响会更为深远。随着各个垂直领域组织正在变得越来越数据密集化——全球范围内所创建的数据,正持续以每年23%左右的速度进行增长——如何长期保存这些数据,变成了一道管理人员手中的必答题。

解决办法是冷数据存储策略。通过更仔细地研究自身组织的数据需求,IT管理人员可以利用正确的策略所带来的结果,确保有价值的数据可以做到“呼之即来”——并且可以访问。

数据可以冷,但不能凉啊

冷数据存储的崛起

那么究竟什么是冷数据存储呢?我们可以将其视为一种场景,即保留那些并不太频繁使用的数据。在这种情况下,数据需要被进行归档、或是说保存在“冷”存储体系之中,虽然这些信息很少被访问,但它们仍要处于一种可轻松被访问的状态,且IO性能不是最高的优先级。

对于越来越多的组织来说,探索冷数据存储策略起因在于:随着技术创新与数字化转型工作的逐渐深入,越来越多的数据正在不断地产生;而通过冷数据存储策略的执行,用户们完全有更多的理由不摆脱这些数据,即使它们在当下并没有被使用。

比如,对于监控和安防行业来说,同一段视频是不可能被拍到两次的。因为一旦事情发生了,它不会以完全相同的方式再发生一次,所以你永远都不知道什么时候,需要回去检查片段记录,所以,用户需要无限期地保留这些内容;而对于汽车行业来说,当你在测试一辆自动驾驶汽车时,你会有大量的数据需要处理,不会有人想要为了节省容量,过段时间再回去进行一次相同的测试,对吧?相反,您可以保留数据,以便在自主算法不断发展时,不断地对历史数据进行利用;而对于一个播放职业足球比赛的电视网络来说,你也永远不知道什么时候必须要把一个球员的职业初期的镜头拿出来,所以你必须保留所有的视频,不管它的历史有多老。

无论行业或具体场景如何,用户总是有理由对那些旧的数据进行访问。甚至对于一些公司来说,他们可能已经知道那一刻是在什么时候——只是目前还不需要罢了。机器学习就是一个例子:创建庞大的训练数据目录是非常耗时的。一旦积累了数据之后,用户本身可能不会频繁地访问它们,但保留这些数据,对于重新训练算法来说,是非常有价值的;或者仅仅只是出于为了节省再次创建如此大的数据集所耗费的时间而言,删掉这些数据也是不划算的,因为用户可以把这些数据最终出售给其他的同行。

对于需要长期保存这些数据的公司来说,他们面临着一个关键的问题:他们是否能够负担得起将这些数据放在昂贵的存储设备之中,还是宁愿将其放在一个具有超高成本效益的地方,然后在未来再对其进行访问?这就是冷数据存储策略的好处,其可以以较低的成本完成数据存储,与实时的、“热门”的生产数据(如金融交易)相比,这些数据的访问频率要低得多,而后者需要进行多次、即时的访问。由于这一优势,企业可以更轻松地避免在数据存储方面经常发生的纠结情绪——即应该以更高的成本扩展存储资源,以保持数据的可访问性,还是删除一些可能被证明是非常宝贵的信息,或是在这两者的平衡之间所需要做出的艰难决定。现在,用户不必再面对这样非此即彼的局面了。

由于这些原因,冷数据存储业务正在逐步兴起,并将持续地加速发展。事实上,根据行业分析师的判断,目前至少有60%的数据,可以被视为归档数据,到2025年,这一比例可能会达到80%或者更高。因此,冷数据存储业务正在成为行业中增长最快的领域之一;而云服务提供商们也正在重新设计自身的架构,来构建一套可访问性更高的归档体系,并确保可以对该体系中的冷数据进行有效的管理。

数据可以冷,但不能凉啊

关键步骤

所以某个组织希望打造一条通往冷数据存储的道路。该如何开始呢?

虽然冷数据存储的普遍意义并不复杂,但是用户必须对特定的技术和解决方案进行探索,从而找到更适合自身环境的有效办法,在这期间,他们需要注意的方面有以下几点:

首先,将冷数据视为主要数据的延续。其应当是在线的、容易被搜索且访问到的。存储数据是一回事,但是否能在需要时,能够有效地访问它是另一回事,特别是在这些数据集只会呈现一种态势——继续增长的情况之下。

想想那些需要重播多年前体育赛事的电视网络。他们需要建立一套合适的基础设施,使他们能够确定,这些数据需要驻留在哪里。仅仅因为数据的历史较为悠久,并不意味着它可以被认定是冷数据。不同的问题需要不同的分析角度,特别是在设计数据的可访问性层面时。

不将归档数据视为主要数据而处理所引发的另一个风险点在于——数据保护。

即使这些数据被存储在了次级存储设备上,它们仍然需要像主要数据那样,受到保护,因为它终有一天会以主要数据的身份,被再次启用。无论是确保数据不会在灾难中丢失,还是保护数据免受勒索软件等的威胁,只有当用户把冷数据当作现在正在使用的数据来对待时,冷数据存储体系才能真正进化到一种完全体的形态。

另一个需要记住的关键因素,就是成本。虽然冷数据存储体系可以为长期的数据保存提供一种更具成本效益的解决方案,但我们也不能忽视那些更为深远的考虑因素,因为其可以确保方案能否得到最佳部署并实现预期效果。

例如,业内人士可能经常认为云存储是性价比最高的冷数据存储库。然而,对于某些组织而言,情况可能没有那么乐观,当您不断地向云端添加更多数据时,这反过来会持续增加用户的每月账单金额。虽然云存储确实有着诸多的益处——特别是在弹性方面——但它可能并不是所有场景或组织的万能药。

简单来说,在建立自身的冷数据存储策略时,并不存在一个放之四海而皆准的解决方案;因为用户应当进行彻底的数据所有权成本分析,并深入研究供应商们的技术的服务水平协议。而昆腾的ActiveScale Cold Storage产品,通过将先进的对象存储软件与适用于海量规模的磁带技术相结合,提供了一款业界性价比最高、耐用度和可访问性出众的冷数据存储解决方案。其也是成为了业界首个,也是目前唯一的一款,可同时处理活跃数据和冷数据的对象存储平台,能够为用户的海量数据集提供了无缝、安全的存储管理以及高性能的访问;并且该产品在性能、数据耐久性和存储效率结合方面的表现,可以说在行业内做到了别无二家。

数据可以冷,但不能凉啊

归根结底,未来是属于冷数据的

鉴于这一领域的增长和重要性,大量投资正在投向云存储、基于HDD、基于磁带的解决方案的创新发展之中,一切都是为了满足未来市场的海量需求。

无论发展的趋势如何,但总有一点是明确的:由于现在出现了更多成熟的案例与场景,无论是人工智能、机器学习、自动驾驶、智能影像、物联网、智慧城市等等,这个世界已经成为了一个比以往任何时候都要更为庞大的数据生产者,因此,随着时间的推移,冷数据存储策略的制定与应用,将会变得更为关键。

数据可以冷,但不能凉啊

来源:昆腾存储

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年7月10日
下一篇 2022年7月10日

相关推荐