全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210929291.7 (22)申请日 2022.08.03 (71)申请人 上海新炬网络技 术有限公司 地址 201707 上海市青浦区外 青松公路 7548弄58 8号1幢1层Y区141室 (72)发明人 程永新 宋辉 巫培贤  (74)专利代理 机构 上海科律专利代理事务所 (特殊普通 合伙) 31290 专利代理师 袁亚军 (51)Int.Cl. G06F 16/38(2019.01) G06F 16/36(2019.01) G06F 16/28(2019.01) (54)发明名称 一种基于元数据的知识图谱处 理方法 (57)摘要 本发明公开了一种基于元数据的知识图谱 处理方法, 包括如下步骤: S1)构建以元数据及其 属性为单位的数据单元; S2)将元数据类型按枚 举类型来划分, 对元数据进行分类; S3)将元数据 按不同的类型 以及所属索引, 建立对应的文档, 所述文档里面包含有元数据的唯一标识以及元 数据属性; S4)每个元数据及其属性形成一个关 系节点并采用网状方式进行存储; S5)基于元数 据的关系节 点进行快速检索。 本发 明提供的基于 元数据的知识图谱处理方法, 能够合理存储元数 据网状结构, 并能更好 地进行检索和分析。 权利要求书1页 说明书3页 附图1页 CN 115391571 A 2022.11.25 CN 115391571 A 1.一种基于元 数据的知识图谱处 理方法, 其特 征在于, 包括如下步骤: S1)构建以元 数据及其属性 为单位的数据单 元; S2)将元数据类型按枚举 类型来划分, 对元 数据进行分类; S3)将元数据按不同的类型以及所属索引, 建立对应的文档, 所述文档里面包含有元数 据的唯一标识以及元 数据属性; S4)每个元数据及其属性形成一个关系节点并采用网状方式进行存 储; S5)基于元 数据的关系节点进行 快速检索。 2.如权利要求1所述的基于元数据的知识图谱处理方法, 其特征在于, 所述步骤S1中每 个元数据具有一个或者多个属 性, 每个元数据的存储单元具有唯一标识性, 并具备列扩展 性进行增 加、 删除、 修改和查询操作。 3.如权利要求1所述的基于元数据的知识图谱处理方法, 其特征在于, 所述步骤S4中元 数据在底层采用Map集 合进行存 储, 包括如下 过程: 对每个关系节点先判断是否在Map集 合中存在; 如果不存在, 则为第一次存储该节点关系, 对元数据关系进行1对1的预处理形成key ‑ value的键值对; 如果存在, 则为1对N节点关系, 先存储1对1映射关系后, 再创建有序数组存储对应的N ‑ 1个节点, 形成key ‑List<key>的存 储结构。 4.如权利要求3所述的基于元数据的知识图谱处理方法, 其特征在于, 所述步骤S4采用 MapSize<key,size>和MapLink<sizeKey,NextKey>存储方式, 当size=1时, 则MapLink< sizeKey,NextK ey>为MapL ink<Key,NextK ey>; 第一次存 储该节点关系时, size为1, 存 储MapSize(key, 1); 对于1对N节点关系, 存储1对1映射关系后, 以size值为种子, size加key生成基于key对 应的唯一的sizeKey,生成sizeKey后把NextKey一起放入MapLink(sizeKey, NextKey)进而 存储创建有序数组存储对应的N ‑1个节点, 形成MapLink(sizeKey, NextKey)的存储结构; 其 中sizeKey为原始key加上siz e序号, 生成的sizeKey, NextKey为原始key对应链路下个节点 对应的节点的元 数据的唯一标识码。 5.如权利要求3所述的基于元数据的知识图谱处理方法, 其特征在于, 所述步骤S5基于 每个关系节点指向的相邻节点进行快速检索, 使得元数据的查找复杂度为O(1), 关系查找 复杂度为O(n)。权 利 要 求 书 1/1 页 2 CN 115391571 A 2一种基于元数据的知识图谱 处理方法 技术领域 [0001]本发明涉及 一种数据生成及检索分析方法, 尤其涉及一种基于元数据的知识图谱 处理方法。 背景技术 [0002]元数据又称中介数据、 中继数据, 为描述数据的数据(data  about data), 主要是 描述数据属性(property)的信息, 用来支持如指示存储位置、 历史数据、 资源查找、 文件记 录等功能。 [0003]知识图谱的核心基本单位, 是 “实体(Entity) ‑关系(Relationship) ‑实体 (Entity) ”构成的三元 组, 通过知识图谱显示知识发展进程与结构关系, 用可视化技术描述 知识资源及其载体, 挖掘、 分析、 构建、 绘制和显示知识及它 们之间的相互联系。 [0004]随着时间的推移, 数据量的不断增大, 数据属性不断变化, 数据的关系日益复杂。 元数据描述数据的数据, 包括元数据的属性、 元数据的关系, 就有效的抽象了数据模型, 对 数据进行管理。 但随着数据种类的继续膨胀, 元数据、 以及元数据之 间的关系也必 然发生膨 胀, 慢慢形成元数据的网状结构, 从这网状数据中无法快速定位元数据以及元数据的影响 范围; 从而导 致无法快速 定位、 分析、 展现数据属性以及数据关系。 发明内容 [0005]本发明所要解决的技术问题是提供一种基于元数据的知识图谱处理方法, 能够合 理存储元数据网状关系, 并能更好地进 行检索和分析; 从而通过元数据知识图谱, 快速发现 元数据所对应的数据的属性, 以及发现其对应数据的关系网。 [0006]本发明为解决上述技术问题而采用的技术方案是提供一种基于元数据的知识图 谱处理方法, 包括如下步骤: S1)构建以元数据及其属性为单位的数据单元; S2)将元数据类 型按枚举类型来划分, 对元数据进行分类; S3)将元数据按不同的类型以及所属索引, 建立 对应的文档, 所述文档里面包含有 元数据的唯一标识以及元数据属性; S4)每个元数据及其 属性形成一个关系节点并采用网状方式进行存储; S5)基于元数据的关系节点进行快速检 索。 [0007]上述的基于元数据的知识图谱处理方法, 其中, 所述步骤S1中每个元数据具有一 个或者多个属性, 每个元数据 的存储单元具有唯一标识性, 并具备列扩展性进行增加、 删 除、 修改和查询操作。 [0008]上述的基于元数据的知识图谱处理方法, 其中, 所述步骤S4中元数据在底层采用 Map集合进 行存储, 包括如下过程: 对每个关系节 点先判断是否在Map集合中存在; 如果不存 在, 则为第一次存储该节点关系, 对元数据关系进行1对1的预处理形成key ‑value的键值 对; 如果存在, 则为1对N节 点关系, 先存储1对1映射关系后, 再创建有序数 组存储对应的N ‑1 个节点, 形成key ‑List<key>的存 储结构。 [0009]上述的基于元数据的知识图谱处理方法, 其中, 所述步骤S4采用MapSize<key,说 明 书 1/3 页 3 CN 115391571 A 3

.PDF文档 专利 一种基于元数据的知识图谱处理方法

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于元数据的知识图谱处理方法 第 1 页 专利 一种基于元数据的知识图谱处理方法 第 2 页 专利 一种基于元数据的知识图谱处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:38:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。