全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211013499.0 (22)申请日 2022.08.23 (71)申请人 西北工业大 学 地址 710072 陕西省西安市友谊西路127号 (72)发明人 王震 杜昊桐 高超 刘晨  李学龙  (74)专利代理 机构 西安瀚汇 专利代理事务所 (普通合伙) 61279 专利代理师 汪重庆 (51)Int.Cl. G06F 16/36(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种自动搜索时序知识图谱补全模型的方 法 (57)摘要 本发明涉及人工智能领域中的时序知识图 谱的补全技术, 公开了一种自动搜索时序知 识图 谱补全模型的方法, 包括: 步骤1:将待补全的时 序知识图谱按照不同时间戳划分为若干个静态 知识图谱切片; 步骤2:定义搜索空间, 基于定义 好的搜索空间构建超网络; 步骤3:使用单路径采 样策略优化超网络的参数; 步骤4:对超网络进行 一次架构采样, 并使架构继承超网络的对应参 数, 利用架构在验证集上进行推理, 得到验证性 能; 步骤5:实施若干次步骤4, 得到对应验证性能 最优的架构。 本发明方法在三个公开的基准数据 集上, 可以搜索出比手工设计模 型补全性能更优 的网络模型; 可以针对不同的数据集搜索出不同 的网络结构, 提升了模型结构的灵活性与数据适 应性。 权利要求书2页 说明书7页 附图3页 CN 115391553 A 2022.11.25 CN 115391553 A 1.一种自动搜索时序知识图谱补全 模型的方法, 其特 征在于, 包括以下步骤: 步骤1:将待补全的时序知识图谱按照不同时间戳划分为若干个静态知识图谱切片; 步骤2:定义搜索空间, 基于 定义好的搜索空间构建超网络; 步骤3:使用单路径采样策略优化超网络的参数, 得到训练好的超网络; 步骤4:对超网络进行一次架构采样, 并使所述架构继承超网络的对应参数, 利用所述 架构在验证集上进行推理, 得到验证性能; 步骤5:实施若干次步骤4, 得到对应验证性能最优的架构, 将此架构作为搜索出的对应 该时序知识图谱的最优网络结构, 用于时序知识图谱补全 任务。 2.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 步骤1 中, 针对数据集, 构造一个实体词典, 一个关系词典和一个时间戳词典, 使用给定的数字ID 表示数据集中的四元组, 即头实体, 关系, 尾实体和时间戳。 3.根据权利要求2所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 将数据 集划分为训练集、 验证集和测试集, 再按照不同的表示时间戳的数字ID将训练集、 验证集和 测试集中的四元组均划分成n个集 合, 得到n个静态知识图谱切片。 4.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 步骤2 中, 对于神经网络结构 搜索, 首先定义一个搜索空间, 搜索空间包括4个部 分: 拓扑结构编码 器、 时序信息编码器、 层间连接模块和层间聚合模块, 其中拓扑结构编码器的候选操作包 括: RGCN基于多关系的图卷积网络、 RGAT基于多关系注 意力的图卷积网络和COMPGCN基于组 合操作的多关系图卷积网络, 所述时序信息编码器的候选操作包括: GRU门控循环单元、 SELF‑ATTENTION自注意力机制和IDENTITY将输入值作为输出值的运算; 所述层间连接模块 的候选操作包括: LC_CONCAT对向量进行合并的运算、 LC_SUM求和的运算和LC_SKIP不采取 层间连接的运算; 所述层间聚合模块的候选操作包括: LF_CONCAT将 输入值作为输出值的运 算、 LF_MAX求 最大值的运 算、 LF_MEAN求平均值的运 算和LF_SKIP不采取层间融合的运 算。 5.根据权利要求4所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 定义一 个两层的搜索空间, 其中第一层拓扑结构编码器接受静态知识图谱切片 与实体s的初始 化嵌入向量 作为输入, 产生中间实体表示 代表 第一层拓扑结构编码器的运行函数; 层 间连接模块作为拓扑结构编码器之间的模块, 用于 融合前一个拓扑结构编码器的输入表示 与输出表示 产生连接模块的输出 作为下一层拓扑结构编码器的输入, fLC代表层间连接模块的运 行函数; 第二层拓扑结构编码器接受静态知识图谱切片 与实体s的中间嵌入表示 作为输入, 产生中间实体表示 类似的, 可分别利 用静态知识图谱切片 得到实体s在不同时间戳下由第i层拓扑结 构编码器生成对 应的中间表示 第一层时序信息 编码器将前面τ个时间步, 第一层的拓扑结构编码器的输出作为输入, 产生融合了多个时间 步信息的动态表示 代表第一层时序信权 利 要 求 书 1/2 页 2 CN 115391553 A 2息 编 码 器 的 运 行 函 数 ,同 理 ,第 二 层 时 序 信 息 编 码 器 产 生 动 态 表 示 层间融合模块融合所有时序信息编码器的输 出表示, 获得最终的实体表示 fLF代表层间融合模块的运行 函数。 6.根据权利要求4或5所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 构 建的超网络中包括了 搜索空间中的所有候选操作。 7.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 构建好 超网络后, 使用单路径采样策略训练超网络, 具体步骤如下: 在超网络训练阶段, 针对训练 集中每个小的数据子集, 使用均匀采样, 从搜索空间中采样出一条单路径, 与此条单路径相 关的模型权重将会被激活, 对于数据子集, 模型将计算损失函数, 并基于损失函数使用梯度 下降算法对相关模型权 重进更新; 进行若干次上次操作, 最终得到训练好的超网络 权重。 8.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法, 其特征在于, 对于训 练好的超网络权重, 利用均匀采样, 从搜索空间中采样出一条单路径, 所述单路径对应的网 络结构即为一个候选架构, 所述候选架构继承超网络中对应训练好的模型权重, 在验证集 上进行模型推理, 获得在验证集上的任务 性能。权 利 要 求 书 2/2 页 3 CN 115391553 A 3

.PDF文档 专利 一种自动搜索时序知识图谱补全模型的方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种自动搜索时序知识图谱补全模型的方法 第 1 页 专利 一种自动搜索时序知识图谱补全模型的方法 第 2 页 专利 一种自动搜索时序知识图谱补全模型的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。