全网唯一标准王
ICS 01.040.35 CCS A22 DB4208 荆门 東市東地 包方标准 DB4208/T58—2024 代替DB4208/T58-2017 荆门城市大数据术语 Terminology of Big Data in Jingmen city 2024-02-01发布 2024-03-01实施 荆门市市场监督管理局发布 DB4208/T58—2024 目 次 前言 引言 .11I 1 范围 2 规范性引用文件 3 术语和定义 3.1 总论 3.2 数据采集, 3.3 数据清洗. 3.4 数据比对.. 3.5 数据共享, 10 3.6 应用服务 汉语拼音索引 15 DB4208/T58—2024 前言 本本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规 定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件代替DB4208/T58-2017,与DB4208/T58-2017相比,除文件编号按照新要求更新外,主要技 术参数未发生变化。 本文件由荆门市电子政务信息中心(荆门市大数据中心)提出。 本文件由荆门市行政审批局归口。 本文件起草单位:荆门市电子政务信息中心(荆门市大数据中心)。 本文件主要起草人:胡玉荣、罗传军、肖立刚、杨金龙、刘波、田原、陆焱、王娅纷、熊士杰、陈 永锋、李祥琴、游明坤、赖旭、武永成、董尚燕、张牧、吴际林、刘珊艳、余建国、方靖、庄小林。 本文件于2017年5月首次发布。 本文件实施应用中的疑问,可咨询荆门市行政审批局,联系电话:(0724)2376309,邮箱: [email protected];对本标准的有关修改意见建议请反馈至荆门市电子政务信息中心(荆门市大数据 中心),联系电话:(0724)2376119,邮箱:[email protected] II DB4208/T58—2024 引言 党中央、国务院高度重视大数据发展。国务院《促进大数据发展行动纲要》明确指出要“建立标准 规范体系,推进数据采集、政府数据开放、指标口径、分类目录、交换接口、访问接口、数据质量、数 据交易、技术产品、安全保密等关键共性标准的制定和实施。” 荆门市以国家大数据战略为指导,遵循“务求实效、急用先行”的原则,首次制定五个大数据标准 规范。标准规范的制定,对建设荆门城市大数据中心,规范数据处理流程,满足大数据中心建设和管理 的需要,促进“智慧荆门”建设具有重要意义。五个标准规范包括荆门城市大数据术语、荆门城市大数 据采集规范、荆门城市大数据清洗规范、荆门城市大数据比对规范和荆门城市大数据共享规范。荆门城 市大数据术语分为总论、数据采集、数据清洗、数据比对、数据共享和应用服务六大类,规定了荆门城 市大数据中心建设领域的术语和定义,其余四个标准规范则规定大数据中心数据采集、清洗、比对和共 享的总体框架和技术规范,涉及数据处理的整个流程:首先进行数据采集,然后通过数据整合(包括数 据清洗和数据比对),将整合成功的数据装载到公共基础信息库,根据需要提供数据共享。 五个标准规范的制定是荆门市电子政务信息中心(荆门市大数据中心)和全市信息行业人员的共同 愿望,具有鲜明的地方特色和时代特征,填补了荆门市大数据技术应用领域的一项空白,在湖北省乃至 国内具有较高的参考利用价值和指导意义。标准规范在使用过程中还需要不断完善,其中未涉及到的内 容遵循相关国家标准。 DB4208/T58—2024 荆门城市大数据术语 1范围 本文件规定了荆门城市大数据中心建设领域的术语和定义 本文件适用于荆门市大数据中心建设,并为荆门市大数据中心建设各项地方标准的编制提供参考。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T5271.17信息技术词汇第17部分:数据库 GB/T17532 2术语工作计算机应用词汇 GB/T20520 信息安全技术公钥基础设施时间戳规范 GB/T25069 信息安全技术术语 GB/T25647 电子政务术语 GB/T29262 信息技术面向服务的体系结构(SOA)术语 DB42/T362 电子政务术语 DB42/T 461 湖北省电子政务信息资源目录编制与管理规范 3术语和定义 GB/T5271.17、GB/T17532、GB/T20520、GB/T25069、GB/T25647、GB/T29262、DB42/T362和DB42/T 461确立的以及下列术语和定义均适用于本文件。为了便于使用,以下重复列出了上述标准中的某些术 语和定义。 3.1总论 3.1.1 数据仓库datawarehouse -种用以支持管理决策制定过程,面向主题,含盖不同时期的、集成而稳定的数据集合。把信息加 以整理归纳,并及时提供给相关的管理决策人员,是数据仓库的根本任务。数据仓库的工作流程一般包 括收集数据、过滤数据、存储数据,以及把数据应用于分析、研究等应用程序。 注:数据仓库属于一种中介查询工具,可在海量的业务数据中筛选有用信息,但并不改写原始业务数据,因此对现 有业务数据并无任何危害。 [GB/T25647-2010,附录A定义A.1.10] 3.1.2 静态数据staticdata 1 DB4208/T58—2024 数据库或数据仓库中存放的基本保持稳定的数据。 3.1.3 流数据streamingdata 在时间分布和数量上无限的一系列动态数据集合体,数据记录是流数据的最小组成单位。 3.1.4 元数据metadata 关于数据和数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和 数据易变性的数据。 [GB/T5271.17-2010,定义17.06.05] 3.1.5 大数据bigdata 也称巨量数据或海量数据,是包含大量数据集的数据,具有数量巨大、来源多样、生成极快、且多 变等特征,难以使用传统数据体系结构有效处理。 注:国际上用大数据的5个特征予以表述,并分别赋予它们在大数据语境下的定义: a.数量大Volume:构成大数据的数据集的规模巨大; b.多样性Variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c.速度快Velocity:单位时间内的数据流量大; d.价值密度低Value:有价值的信息分散在海量数据中; e.真实性Veracity:从海量数据中提取出的信息能够解释和预测真实事件。 3.1.6 数据挖掘datamining 从大量、有时是不完全的、模糊的实际应用数据中提取出隐含在其中的、事先不为人知道的,但又 是潜在有用的信息和知识的过程。又称“数据库中的知识发现(knowledgediscoveryindatabase,KDD)”。 对于政务部门而言,数据挖掘有助于发现业务发展的趋势、揭示已知的事实、预测未知的结果。 [GB/T25647-2010,附录A定义A.1.9] 3.1.7 数据模型datamodel 现实世界数据特征的抽象,用于描述一组数据的概念和定义,包括概念模型、逻辑模型、物理模型 等。 3.1.8 键值数据库key-valuedatabase 2 DB4208/T58—2024 通过键值对存储和管理数据的数据库。它使用一个哈希表,该表中有一个特定的键和一个指针指向 特定的数值。键可以用来定位数值,即存储和检索具体的数值。数值对数据库而言是透明不可见的,不 能对数值进行索引和查询,只能通过键进行查询。 3.1.9 列式数据库column-orienteddatabase 采用列式数据模型存储和管理数据的数据库。它由多个行构成,每行数据包含多个列式,不同的行 可以具有不同数量的列式,属于同一列式的数据会被存放在一起。每行数据通过键进行定位,与这个行 键对应的是一个列式,从这个角度来说,列式数据库也可以视为一个键值数据库。 3.1.10 文档数据库documentdatabase 采用文档来存储和管理数据的数据库。它以文档为基础,文档是处理信息的基本单位,相当于关系 数据库的一条记录,文档数据库比键值数据库的查询效率更高。 3.1.11 图形数据库graphdatabase 采用图形作为数据模型来存储数据的数据库。以图论为基础,图是一个数学概念,用来表示一个对 象集合,包括顶点以及连接顶点的边,不同于键值、列式和文档数据模型,它可以高效地存储不同顶点 之间的关系。 3.1.12 NoSQL数据库NoSQLdatabase 全称NotOnlySQL数据库,是一种按照键值对的形式对数据进行组织、索引和存储的非关系型数据 库,通常包括键值数据库、列式数据库、文档数据库、图形数据库等。 3.1.13 分布式存储distributedstorage 通过计算机网络将物理上分散的存储资源构成一个虚拟的存储设备,集中管理数据的一种存储方 式。 3.1.14 分布式数据库distributeddatabase 通过计算机网络将物理上分散的多个数据库单元连接在一起,组成逻辑上统一的数据库。 3.1.15 分布式文件系统distributedfilesystem 3

.pdf文档 DB4208-T 58-2024 荆门城市大数据术语 荆门市

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB4208-T 58-2024 荆门城市大数据术语 荆门市 第 1 页 DB4208-T 58-2024 荆门城市大数据术语 荆门市 第 2 页 DB4208-T 58-2024 荆门城市大数据术语 荆门市 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-26 05:05:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。