数据归档需要学什么(怎样归档才合理)
数据归档需要学什么(怎样归档才合理)制定数据保留和归档的策略其实有许多类型的数据,比如重复文件,是可以立即删除的。LaChapelle的经验是,产生大量冗余数据的自动化流程中,应该包含一种设定机制,在流程完成后删除数据副本。此外,受隐私法律或监管要求(如GDPR)管辖的个人数据是不应该被存档的,除非有相关符合监管限制的政策,来确保它们会按时从存档中删除。哪些数据要走?哪些要留?需要长期保留的数据类型,主要取决于企业及相关法律和法规的要求。比如,医疗部门的一些数据可能需要保留30年以上。“财务文件、技术规格文档和航空航天等行业的文件,是出于法律和合规要求驱使,需要被长期保留的数据范例,”LaChapelle说:“需要被‘永远’保留的数据量其实是极少的。”由于职业接触的关系,LaChapelle也观察到,过于谨慎的组织真的会永远保存大量的数据。
为了满足各项法律、法规和业务的需求,归档各种类型的数据是非常重要的。然而,经过几年甚至几十年的时间,数据量的积累是十分可观的。
在大数据成为了许多企业的关键资源的今天,数据的积累显得尤为明显。由于存储海量的数据既耗时又昂贵,因此企业其实是越来越有必要创建,属于自己的数据归档策略的,以便在删除非常少使用或无需永久保留的文件时,识别数据并对其进行优先级排序。
云归档与合规技术提供商Smarsh Inc.的信息管理高级主管Robert Cruz表示,遗憾的是,企业将所有信息永久保存下来的做法仍然很常见——在很多情况下,这些数据其实早已过了有用的寿命。“这通常是因为法律团队担心数据最终可能会与诉讼有关,”他说。
对于那些不再经常使用,但在业务、法律或遵从性相关要求下,会被认定为重要级别较高的数据,应该存档在低成本、高容量的存储系统上,比如磁带设备。Information Services Group的首席顾问Cindy LaChapelle建议,每个组织都需要将数据的删除和保留认定工作,作为组织的数据归档策略和数据生命周期计划的关键部分,因为始终将归档数据保留在高性能存储平台上,会导致不必要的成本和人力资源的消耗。
哪些数据要走?哪些要留?
需要长期保留的数据类型,主要取决于企业及相关法律和法规的要求。比如,医疗部门的一些数据可能需要保留30年以上。
“财务文件、技术规格文档和航空航天等行业的文件,是出于法律和合规要求驱使,需要被长期保留的数据范例,”LaChapelle说:“需要被‘永远’保留的数据量其实是极少的。”由于职业接触的关系,LaChapelle也观察到,过于谨慎的组织真的会永远保存大量的数据。
其实有许多类型的数据,比如重复文件,是可以立即删除的。LaChapelle的经验是,产生大量冗余数据的自动化流程中,应该包含一种设定机制,在流程完成后删除数据副本。此外,受隐私法律或监管要求(如GDPR)管辖的个人数据是不应该被存档的,除非有相关符合监管限制的政策,来确保它们会按时从存档中删除。
制定数据保留和归档的策略
所有企业都需要制定一套完整的,针对整个数据生命周期的数据保留策略。因为其可以为所有其他业务活动提供坚实的基础。分析软件提供商SAS数据管理部门的高级产品营销经理Kim Kaluba说:“如果没有这个基础,后续的数据归档工作的指引只会是一张迷宫般的寻宝图,想要到达目的还会牵扯大量的金钱投入。”
根据Kaluba的理解,完整的数据策略应当由五个部分组成:识别、存储、供应、整合与治理。每个部分都会在数据归档中都扮演着重要的角色。
“识别阶段可以决定哪些数据和业务流程应该被归档,以及信息需要被保存多长时间。”Kaluba说:“存储、供应和整合的过程,需要包含详细的说明,比如归档数据需要如何被存储,以及存储在何处。这一过程还可以用于检测数据的可访问性和服务水平,以确保当需要某数据时,可以在定义的时间段内,对其进行访问。”
最后一个部分——治理——可用于说明谁有权限访问某类的数据和业务流程、谁应当掌控整个归档流程,以及相关部门需要采用哪种安全机制等等,来确保归档环境中的任何敏感数据都得到了有效的保护。
最后一点
"需要注意的是,备份和归档并不是同一件事,尽管这两个术语通常可以互换使用。备份和存档是互补的技术,LaChapelle说:“归档是将数据转移到一个单独的环境中,然后对其进行索引,使其变得可搜索,也便于还原。而备份的目的,是提供一层数据保护,以防数据被损坏或删除。”