©2023云安全联盟大中华区版权所有 2最高威胁工作组官网地址是:
https://cloudsecurityalliance.org/research/working-groups/top-threats/
@2023云安全联盟大中华区-保留所有权利。你可以在你的电脑上下载、储存、展示、查看及
打印,或者访问云安全联盟大中华区官网(https://www.c-csa.cn)。须遵守以下:(a)本文只可
作个人、信息获取、非商业用途;(b)本文内容不得篡改;(c)本文不得转发;(d)该商标、版权
或其他声明不得删除。在遵循中华人民共和国著作权法相关条款情况下合理使用本文内容,
使用时请注明引用于云安全联盟大中华区。
©2023云安全联盟大中华区版权所有 3
©2023云安全联盟大中华区版权所有 4致谢
《安全数据湖的敏捷数据(AnAgileDataDoctrineforaSecureDataLake)》由CSA工作组
专家编写,CSA大中华区秘书处组织翻译并审校。
中文版翻译专家组(排名不分先后):
翻译组:胡鑫牛媛媛
研究协调员:赵鹏
感谢以下单位的支持与贡献:
杭州美创科技股份有限公司
原文英文版编写专家组
主要作者:Dr.DianneMurphy TheresaKushner OliverForbes
CSA分析师:SeanHeide ClaireLehnert(graphicdesign)
StephenLumpe(coverillustration) JohnYeoh
在此感谢以上专家。如译文有不妥当之处,敬请读者联系CSAGCR秘书处给予雅正!联系邮
箱research@c-csa.cn;国际云安全联盟CSA公众号。
©2023云安全联盟大中华区版权所有 5序言
数据湖作为目前正在广泛运用的一种技术,是一种集中式的数据仓库,用于接收、
存储和保护大量结构化和非结构化的数据,有效集成与分析各类数据源,为相应的
组织增加了巨大的价值。虽然这是对于数据聚合的一个关键解决方案,但光有数据
湖技术是不够的,需要企业范围的数据原则来确保数据是可信的。而且,在整个数
据社区中最大限度地实现其价值并确保遵守越来越多的法规要求至关重要。
报告考察了当数据湖作为一种主要数据管理技术而呈现的数据原则的基本参数,包
括确保数据的安全和隐私,并且为数据湖的整体保护和执行提供了架构。
希望为组织提供一套能够贯穿始终的数据原则思路。建立包含敏捷思维的整体数据
战略,实现数据安全和有效的隐私控制,在最大程度降低总成本的同时,提高数据
湖中数据资产的价值。
李雨航YaleLi
CSA大中华区主席兼研究院院长
©2023云安全联盟大中华区版权所有 6目录
致谢....................................................................................................................................................................4
序言....................................................................................................................................................................5
介绍....................................................................................................................................................................7
问题....................................................................................................................................................................7
什么是数据社区?............................................................................................................................................8
理论与应用........................................................................................................................................................9
解决方案..........................................................................................................................................................10
结语..................................................................................................................................................................12
©2023云安全联盟大中华区版权所有 7介绍
数据是横向和纵向跨越多个行业和组织的重要资产。无论是对政府、企业还是非营利组织,
资产的使用和安全都至关重要。然而,随着数据在规模性、多样性、高速性和变化性(即
所谓的“大数据”)方面的增长,在收集、存储和检索数据时要求保障安全性、隐私性的
需求以及性价比更高的技术也在不断发展。
一种目前正在广泛运用的技术是数据湖。具体来说,数据湖是一种集中式的数据库,用于
接收、存储和保护大量结构化和非结构化的数据。虽然数据湖是数据聚合的一个关键解决
方案,但光有数据湖技术是不够的,需要企业范围的数据原则来确保数据是可信的。而且,
在整个数据社区中最大限度地实现其价值并确保遵守越来越多的法规要求至关重要。
本文观点考察了当吧数据湖作为一种主要数据管理技术而呈现出的数据原则的基本参数,
包括确保数据的安全和隐私,并且不基于任何供应商的解决方案,而是考虑到数据湖的整
体保护,并为这些原则的执行提供了架构。
问题
数据湖通过提供对广泛的结构化和非结构化数据源进行有效集成与分析,为相应组织增加
巨大的价值。一般而言,数据湖以原始形式存储从多个数据源收集的海量数据,直到需要
数据时才定义数据结构和用户需求。如果组织要使用数据并确保其安全和隐私,数据湖必
须遵守严格的数据原则政策和相关程序。且需要得到数据社区(DC)中所有人的信任。为
了从数据湖中获取最高的灵活性和性能,保障DC中的任何用户能轻而易举的获取正确的数
据,在适当的时候,跨多个数据集进行可靠的数据集成。执行此操作时,必须确信数据是
安全、准确和最高质量的。
数据原则包括角色和责任,是数据湖“良好”持续数据管理的先决条件,并决定了整个DC
所需的决策,从而确保有效管理和安全。
©2023云安全联盟大中华区版权所有 8
什么是数据社区?
社区定义为在特定领域具有共同利益的个人的统一团体;广义来说,是指将分散在一个更
大的社会或团体的人员和专家,由共同的兴趣和政策联系在一起形成一个共同的团体。因
此,数据社区是由平时分散在组织中投入研究数据的个人,通过常见的数据政策(如隐私
政策)联系在一起而组成的统一团体。
确保组织中的DC正常运转是数据治理人员或者团队的职责。《数据治理:如何设计、部署
和维持有效的数据治理计划》一书的作者JohnLadley将数据治理定义为信息管理、企业信
息管理和数据架构的一个组成部分。正如财务会计师使用一个流程和一套原则管理公司的
财务一样,负责数据资产的数据经理也需要流程和规则。这些原则由数据治理建立,并由
信息管理团队实施。Ladley指出,“数据治理不是由管理信息的人员履行的职能。”相反,
数据治理是一种管理监督,有助于为数据管理过程提供秩序和框架。
数据社区是围绕关键数据集建立的。例如,一个社区可能负责财务数据管理,另一个负
责客户数据。这些社区确保其影响范围内的数据准确、及时、一致、安全,并提供给其
他社区。
任何社区的首要价值是为其成员提供归属感和安全感。数据社区也不例外。因此,确保数
据安全应该是社区章程的一部分,为数据用户提供了对收集和管理的数据的安全访问。
CSA 安全数据湖的敏捷数据原则
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2023-09-05 13:03:57上传分享