π导航  


【首页】

热数据是什么?如何存储热数据


【2019-04-05】 计算机论坛】


冷数据——很少访问的数据

热数据是什么?与之相反,频繁访问的数据。

ClearSky的创始人兼首席技术官Laz Vekiarides讨论了存储和访问热数据所带来的独特需求。

热数据的定义是什么?

从本质上讲,这是一个组织在一周内可以访问的所有数据。热数据通常占公司为特定工作负载提供的主存储的7%到12%。我们已经测量过了。我永远不会忘记当我们第一次设计我们的系统时,我们运行分析的第一个客户。我们有半拍的存储空间,平均来看,他们访问了5%到7%。

为什么解决如何存储热数据是一个挑战?

挑战在于热数据必须在边缘可用,以提供性能。你不能违反物理定律,而且世界上没有足够的带宽来消除延迟,如果延迟必须从数百英里外的数据中心拉下来的话。现在比以往任何时候都更重要的是,确保热数据存储在用户和应用程序附近,以便能够立即进行分析,使用户能够做出实时决策。

在本地而不是在云中存储热数据仍然相当普遍。那样做有什么错?

最大的原因之一是获取。不同地区的人们不仅需要访问相同的数据;在不同云环境中工作的开发人员和应用程序也需要访问。将数据从一个地方移动到另一个地方也很困难。然后还有延迟,当多个用户需要同时访问数据时就会出现延迟。保护边缘的所有数据是一项巨大而昂贵的任务,需要一个单独的系统进行备份和一个用于灾难恢复的辅助数据中心。

如果公司转向基于云的热数据存储模型,这能解决所有这些问题吗?

这绝对是解决方案的一部分,但它并不能解决所有的问题。记住:即使是基本的云存储也是对象存储。应用程序不与对象对话;这是一个不同的协议。

那么解决方案是什么呢?

如果基于云的存储不是解决方案,而基于本地的存储不是正确的方法,那么存储和访问热数据的最佳方法是什么?

一种混合的方法——将云计算、内部存储和距离你所在位置100英里以内的存储结合起来。我们的方法首先确保所有数据都以单个副本的形式存储和保护在云中,并将热数据缓存在edge-on - premise、应用程序、私有云等中。在我们的PoP(存在点)站点中,热数据和“热”数据也存储在距客户位置约100英里的范围内。我们这样做是为了将立即需要的数据延迟降低到1或2毫秒。

它是一种更加个人化的、或者是跨界的存储方式。

它与工作负载的交互性更强,更适合用户实际使用数据的方式。举个例子:我们的一个客户Nuance,他的技术是苹果Siri的基础,当时运行的是非常旧的存储设备,主要是提供的,没有备份。他们担心,如果其中任何一个人感染了恶意软件,他们将无法恢复开发人员的工作。为了给这个过时的存储阵列增加备份,他们得到了一个性能更高的系统,因为我们使用flash。他们还能够从实际耐用副本的成本中支付所有备份和DR需求。他们有超过60%的TCO。



                

copyright©2018-2024 gotopie.com