本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

数据生命周期_数据生命周期定义_数据生命周期管理

大数据时代 cdadata 5601℃

数据生命周期_数据生命周期定义_数据生命周期管理

关键词:数据归档、数据预算、数据生命周期、分级存储管理

数据生命周期管理(data life cycle management,DLM)是一种基于策略的方法,用于管理信息系统的数据在整个生命周期内的流动:从创建和初始存储,到它过时被删除。

数据生命周期管理(data life cycle management,DLM)是一种基于策略的方法,用于管理信息系统的数据在整个生命周期内的流动:从创建和初始存储,到它过时被删除。DLM产品将涉及的过程自动化,通常根据指定的策略将数据组织成各个不同的层,并基于那些关键条件自动地将数据从一个层移动到另一个层。作为一项规则,较新的数据和那些很可能被更加频繁访问的数据,应该存储在更快的,并且更昂贵的存储媒介上,而那些不是很重要的数据则存储在比较便宜的,稍微慢些的媒介上。

分级存储管理(HSM,hierarchical storage management)是数据生命周期管理(DLM)产品中的一种。分级表示不同的存储媒介类型,例如RAID(独立磁盘冗余阵列)系统、光学存储或者磁带,每种类型都表示不同级别的成本和需要访问时的检索速度。使用分级存储管理(HSM)产品,管理员可以建立并且给出使用指南,说明不同类型的文件被拷贝到备份存储设备的频率。一旦指南被创建,分级存储管理软件就自动地管理所有的事情。通常,分级存储管理应用程序将基于从最后一次访问之后过去的时间的长度来移动数据,而DLM应用程序则可以根据更加复杂的条件来启用不同的策略。

数据生命周期管理(DLM)和信息生命周期管理(ILM)这两个词有时可以交换使用。然而,这两者之间是有区别的。根据Karen Dutch(Fujitsu Softek公司负责产品管理的副总裁)所说,DLM产品处理通常的文件属性,例如它们的类型、尺寸以及年龄;ILM产品则具有更复杂的功能。例如,DLM产品可以允许你查找已存储的具有某个年龄的某类文件类型的数据,然而ILM产品则能让你查找不同类型的存储文件的某个数据片断,例如客户号码。

随着法律的健全,如健康保险携带和责任法案(HIPAA)和萨班斯—奥克斯利法案(the Sarbanes-Oxley Act),当企业面临遵守规则的问题时,数据管理就变得越来越重要,它规定了公司处理某种类型数据必须采用的方式。数据管理专家强调数据生命周期管理并不是一个产品,而是一个复杂的管理公司数据的方式,除了应用程序之外,还涉及了程序和实践方案。

   不管是数据生命周期管理DLM还是信息生命周期管理ILM在90年代给当时的IT经理们都造成了不好的印象,尤其是在使用三家顶级存储厂商的产品时。简而言之,信息生命周期管理只是卖了一个产品而并非一个流程,许多购买了产品的用户事后才意识到自己购买的仅是信息生命周期流程ILM中的一个环节,数据移动器,剩下的部分则需要和其它软件搭配使用。
IBM在数十年前曾出过一本有关描述ILM信息生命管理的一本书。从IBM的观点来看,实现根据商业价值来管理存储需要四方面的支持。首先,需要有一套能够分类数据集的方法论;其次,需要定义数据存放的不同位置;之后就需要定义策略,从存储的一个地方迁移到另一个地方,基于数据不同的类型、过期时间、关联度以及类似的因素;最后,才需要一个数据移动器将数据由一个存储设备迁移到另一个上。没有前三方面的支持,仅有数据移动器的意义也不是很大。

数据生命周期管理中,数据存储策略的制定除了理论上需要正确的指导,更重要的是在制定过程中进行大量实际业务需求、系统现状的调研。在理论指导下结合实际情况制定出符合企业实际情况的存储策略。

数据生命周期管理是涉及组织架构、流程制度、技术规范、系统支撑组成的管理体系,。存储策略制定只是数据生命周期管理中技术规范部分,如何协调生命周期管理中相关组织架构、流程制度保障存储策略有效的制定才是数据生命周期管理成功与否的关键。后续将会探讨如何制定数据生命周期管理中相关流程制度、组织架构以及系统支撑方面的相关内容。

大数据生命周期管理是指什么

大数据生命周期管理就是大数据平台的数据生命周期管理,在大数据平台下,数据的生命周期管理会显得非常重要。这是因为往往在大数据平台下,预处理的数据量非常大,处理后的有效数据量往往比较小,因此选择合理的数据管理策略会非常重要。

转载请注明:数据分析 » 数据生命周期_数据生命周期定义_数据生命周期管理

喜欢 (4)or分享 (0)