全网唯一标准王
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
ICS 01.040.35 CCS A22 DB4208 荆门 東市東地 包方标准 DB4208/T58—2024 代替DB4208/T58-2017 荆门城市大数据术语 Terminology of Big Data in Jingmen city 2024-02-01发布 2024-03-01实施 荆门市市场监督管理局发布 DB4208/T58—2024 目 次 前言 引言 .11I 1 范围 2 规范性引用文件 3 术语和定义 3.1 总论 3.2 数据采集, 3.3 数据清洗. 3.4 数据比对.. 3.5 数据共享, 10 3.6 应用服务 汉语拼音索引 15 DB4208/T58—2024 前言 本本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规 定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件代替DB4208/T58-2017,与DB4208/T58-2017相比,除文件编号按照新要求更新外,主要技 术参数未发生变化。 本文件由荆门市电子政务信息中心(荆门市大数据中心)提出。 本文件由荆门市行政审批局归口。 本文件起草单位:荆门市电子政务信息中心(荆门市大数据中心)。 本文件主要起草人:胡玉荣、罗传军、肖立刚、杨金龙、刘波、田原、陆焱、王娅纷、熊士杰、陈 永锋、李祥琴、游明坤、赖旭、武永成、董尚燕、张牧、吴际林、刘珊艳、余建国、方靖、庄小林。 本文件于2017年5月首次发布。 本文件实施应用中的疑问,可咨询荆门市行政审批局,联系电话:(0724)2376309,邮箱:
[email protected]
;对本标准的有关修改意见建议请反馈至荆门市电子政务信息中心(荆门市大数据 中心),联系电话:(0724)2376119,邮箱:
[email protected]
II DB4208/T58—2024 引言 党中央、国务院高度重视大数据发展。国务院《促进大数据发展行动纲要》明确指出要“建立标准 规范体系,推进数据采集、政府数据开放、指标口径、分类目录、交换接口、访问接口、数据质量、数 据交易、技术产品、安全保密等关键共性标准的制定和实施。” 荆门市以国家大数据战略为指导,遵循“务求实效、急用先行”的原则,首次制定五个大数据标准 规范。标准规范的制定,对建设荆门城市大数据中心,规范数据处理流程,满足大数据中心建设和管理 的需要,促进“智慧荆门”建设具有重要意义。五个标准规范包括荆门城市大数据术语、荆门城市大数 据采集规范、荆门城市大数据清洗规范、荆门城市大数据比对规范和荆门城市大数据共享规范。荆门城 市大数据术语分为总论、数据采集、数据清洗、数据比对、数据共享和应用服务六大类,规定了荆门城 市大数据中心建设领域的术语和定义,其余四个标准规范则规定大数据中心数据采集、清洗、比对和共 享的总体框架和技术规范,涉及数据处理的整个流程:首先进行数据采集,然后通过数据整合(包括数 据清洗和数据比对),将整合成功的数据装载到公共基础信息库,根据需要提供数据共享。 五个标准规范的制定是荆门市电子政务信息中心(荆门市大数据中心)和全市信息行业人员的共同 愿望,具有鲜明的地方特色和时代特征,填补了荆门市大数据技术应用领域的一项空白,在湖北省乃至 国内具有较高的参考利用价值和指导意义。标准规范在使用过程中还需要不断完善,其中未涉及到的内 容遵循相关国家标准。 DB4208/T58—2024 荆门城市大数据术语 1范围 本文件规定了荆门城市大数据中心建设领域的术语和定义 本文件适用于荆门市大数据中心建设,并为荆门市大数据中心建设各项地方标准的编制提供参考。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T5271.17信息技术词汇第17部分:数据库 GB/T17532 2术语工作计算机应用词汇 GB/T20520 信息安全技术公钥基础设施时间戳规范 GB/T25069 信息安全技术术语 GB/T25647 电子政务术语 GB/T29262 信息技术面向服务的体系结构(SOA)术语 DB42/T362 电子政务术语 DB42/T 461 湖北省电子政务信息资源目录编制与管理规范 3术语和定义 GB/T5271.17、GB/T17532、GB/T20520、GB/T25069、GB/T25647、GB/T29262、DB42/T362和DB42/T 461确立的以及下列术语和定义均适用于本文件。为了便于使用,以下重复列出了上述标准中的某些术 语和定义。 3.1总论 3.1.1 数据仓库datawarehouse -种用以支持管理决策制定过程,面向主题,含盖不同时期的、集成而稳定的数据集合。把信息加 以整理归纳,并及时提供给相关的管理决策人员,是数据仓库的根本任务。数据仓库的工作流程一般包 括收集数据、过滤数据、存储数据,以及把数据应用于分析、研究等应用程序。 注:数据仓库属于一种中介查询工具,可在海量的业务数据中筛选有用信息,但并不改写原始业务数据,因此对现 有业务数据并无任何危害。 [GB/T25647-2010,附录A定义A.1.10] 3.1.2 静态数据staticdata 1 DB4208/T58—2024 数据库或数据仓库中存放的基本保持稳定的数据。 3.1.3 流数据streamingdata 在时间分布和数量上无限的一系列动态数据集合体,数据记录是流数据的最小组成单位。 3.1.4 元数据metadata 关于数据和数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和 数据易变性的数据。 [GB/T5271.17-2010,定义17.06.05] 3.1.5 大数据bigdata 也称巨量数据或海量数据,是包含大量数据集的数据,具有数量巨大、来源多样、生成极快、且多 变等特征,难以使用传统数据体系结构有效处理。 注:国际上用大数据的5个特征予以表述,并分别赋予它们在大数据语境下的定义: a.数量大Volume:构成大数据的数据集的规模巨大; b.多样性Variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c.速度快Velocity:单位时间内的数据流量大; d.价值密度低Value:有价值的信息分散在海量数据中; e.真实性Veracity:从海量数据中提取出的信息能够解释和预测真实事件。 3.1.6 数据挖掘datamining 从大量、有时是不完全的、模糊的实际应用数据中提取出隐含在其中的、事先不为人知道的,但又 是潜在有用的信息和知识的过程。又称“数据库中的知识发现(knowledgediscoveryindatabase,KDD)”。 对于政务部门而言,数据挖掘有助于发现业务发展的趋势、揭示已知的事实、预测未知的结果。 [GB/T25647-2010,附录A定义A.1.9] 3.1.7 数据模型datamodel 现实世界数据特征的抽象,用于描述一组数据的概念和定义,包括概念模型、逻辑模型、物理模型 等。 3.1.8 键值数据库key-valuedatabase 2 DB4208/T58—2024 通过键值对存储和管理数据的数据库。它使用一个哈希表,该表中有一个特定的键和一个指针指向 特定的数值。键可以用来定位数值,即存储和检索具体的数值。数值对数据库而言是透明不可见的,不 能对数值进行索引和查询,只能通过键进行查询。 3.1.9 列式数据库column-orienteddatabase 采用列式数据模型存储和管理数据的数据库。它由多个行构成,每行数据包含多个列式,不同的行 可以具有不同数量的列式,属于同一列式的数据会被存放在一起。每行数据通过键进行定位,与这个行 键对应的是一个列式,从这个角度来说,列式数据库也可以视为一个键值数据库。 3.1.10 文档数据库documentdatabase 采用文档来存储和管理数据的数据库。它以文档为基础,文档是处理信息的基本单位,相当于关系 数据库的一条记录,文档数据库比键值数据库的查询效率更高。 3.1.11 图形数据库graphdatabase 采用图形作为数据模型来存储数据的数据库。以图论为基础,图是一个数学概念,用来表示一个对 象集合,包括顶点以及连接顶点的边,不同于键值、列式和文档数据模型,它可以高效地存储不同顶点 之间的关系。 3.1.12 NoSQL数据库NoSQLdatabase 全称NotOnlySQL数据库,是一种按照键值对的形式对数据进行组织、索引和存储的非关系型数据 库,通常包括键值数据库、列式数据库、文档数据库、图形数据库等。 3.1.13 分布式存储distributedstorage 通过计算机网络将物理上分散的存储资源构成一个虚拟的存储设备,集中管理数据的一种存储方 式。 3.1.14 分布式数据库distributeddatabase 通过计算机网络将物理上分散的多个数据库单元连接在一起,组成逻辑上统一的数据库。 3.1.15 分布式文件系统distributedfilesystem 3
DB4208-T 58-2024 荆门城市大数据术语 荆门市
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2025-07-26 05:05:17
上传分享
举报
下载
原文档
(4.1 MB)
分享
友情链接
ISO 16610-71 2014 Geometrical product specifications (GPS) — Filtration — Part 71 Robust areal filters Gaussian regression filters.pdf
ISO 18650-2 2014 Building construction machinery and equipment — Concrete mixers — Part 2 Procedure for examination of mixing efficiency.pdf
ISO 22846-2 2012 Personal equipment for protection against falls — Rope access systems — Part 2 Code of practice.pdf
ISO 19629 2018 Fine ceramics (advanced ceramics advanced technical ceramics) Thermophysical properties of ceramic composites Determination of unidimensional thermal diffusivity by flash method.pdf
ISO 15527 2022 Plastics Compression-moulded sheets of polyethylene (PE-UHMW PE-HD) Requirements and test methods.pdf
ISO 15535 2023 General requirements for establishing anthropometric databases.pdf
ISO 16000-29 2014 Indoor air — Part 29 Test methods for VOC detectors.pdf
ISO 4147 1997 Aerospace — Nuts, hexagonal, slotted (castellated), normal height, normal across flats, with MJ threads, classifications.pdf
ISO 2584 2016 Cylindrical cutters with plain bore and key drive — Metric series.pdf
ISO 17442-3 2024 Financial services Legal entity identifier (LEI) Part 3 Verifiable LEIs (vLEIs).pdf
GB-T 13829.7-2004 槽销 半长倒锥槽.pdf
GB-T 20290-2024 家用电动洗碗机 性能测试方法.pdf
GB-T 16674.2-2016 六角法兰面螺栓 细牙 小系列.pdf
GB-T 17948.1-2018 旋转电机 绝缘结构功能性评定 散绕绕组试验规程 热评定和分级.pdf
GB-T 22698-2022 多媒体设备安全指南.pdf
GB-T 12004.4-2003 聚氯乙烯增塑糊表观粘度的测定 Brookfield试验法.pdf
GB-Z 39262-2020 纳米技术 纳米材料毒理学筛选方法指南.pdf
GB-T 40818-2021 带弧形触头的插头、插座和耦合器.pdf
GB-T 5755-2021 钢丝绳芯输送带 绳与包覆胶粘合试验 原始状态下和热老化后试验.pdf
GB-T 21404-2008 内燃机 发动机功率的确定和测量方法 一般要求.pdf
1
/
3
23
评价文档
赞助2元 点击下载(4.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。