(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211005950.4
(22)申请日 2022.08.22
(71)申请人 浙江大学
地址 310058 浙江省杭州市西湖区余杭塘
路866号
(72)发明人 陈华钧 许泽众 张文 叶鹏
(74)专利代理 机构 杭州天勤知识产权代理有限
公司 33224
专利代理师 曹兆霞
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/36(2019.01)
G06N 5/02(2006.01)
G06N 5/04(2006.01)
(54)发明名称
一种基于神经符号增强的知识库复杂查询
方法
(57)摘要
本发明公开了一种基于神经符号增强的知
识库复杂查询方法, 利用关系映射操作中符号和
神经单独推理并且互相转化的方式缓解图谱不
全和多不推理中级联误差的问题, 然后使用符号
表示的上完成逻辑计算, 并且转为嵌入表示, 可
以采用任何已知 的神经推理方法代替框架中神
经推理的部分, 具有较强的扩展性。 同时仅仅需
要链接预测任务训练知识表示模型即可完成复
杂逻辑的查询。 该方法对于在知识图谱中表示中
复杂逻辑问句的推理和查询具有很好的实用价
值。
权利要求书3页 说明书7页 附图2页
CN 115391507 A
2022.11.25
CN 115391507 A
1.一种基于神经符号增强的知识库复杂查询方法, 包括以下步骤:
步骤1, 接收关于商品查询的逻辑表达式, 其中, 逻辑表达式通过逻辑操作连接缺失三
元组形成;
步骤2, 利用参数优化的知识表示模型学习逻辑表达式中缺失三元组中已知实体和关
系的嵌入表示, 同时初始化关系映射中初始实体的符号表示, 符号表示中每个元素代表对
应实体的概 率值;
步骤3, 对于逻辑表达式中缺失三元组, 基于实体的嵌入表示和符号表示进行缺失三元
组的关系映射推理, 以预测 缺失三元组中缺失实体的嵌入表示和符号表示, 利用缺失实体
的嵌入表示补充缺失实体的符号表示, 并利用补充后的缺失实体的符号表示修正缺 失实体
的嵌入表示;
步骤4, 对于逻辑表达式中的逻辑操作, 基于缺失实体的符号表示进行逻辑操作推理,
得到预测实体的符号表示, 并基于预测实体的符号表示计算预测实体的嵌入表示;
步骤5, 将预测实体作为候选目标实体时, 综合预测实体的符号表示和嵌入表示来从候
选目标实体中确定最终的目标实体, 该目标实体即为针对逻辑表达式得到的查询结果。
2.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法, 其特征在于, 步骤
3中, 基于初始实体的嵌入表示和符号表示进行缺失三元组的关系映射推理, 包括:
基于嵌入表示的映射推理: 根据缺失三元组中已知实体的嵌入表示vh和关系的嵌入表
示vr, 计算缺失三元组中缺失 实体的嵌入表示
其中, 符号
表示哈达 玛积;
基于符号表示的映射推理: 根据电商知识图谱的关系邻接矩阵Mr和缺失三元组中已知
实体的符号表示ph, 计算缺失三元组中缺失实体的符号表示pt=g(phMr)T, 其中, g(·)表示
归一化函数。
3.根据权利要求1或2所述的基于神经符号增强的知识库复杂查询方法, 其特征在于,
步骤3中, 利用缺 失实体的嵌入表示补充缺 失实体的符号表 示, 并利用补 充后的符号表示修
正缺失实体的嵌入表示, 包括:
首先, 计算缺失实体的嵌入表示vt与电商知识图谱中所有实体的嵌入表示之间的相 似
度, 得到相似度向量Y;
然后, 对相似度向量Y做激活处理后得到pt′, 将pt′添加到缺失实体的符号表示pt中, 进
行归一化处理得到pt″;
最后, 利用pt″来修正缺失实体的嵌入表示vr, 得到修正后的嵌入表示vt′:
其中, St表示符号表示pt″中非零元素对应的实体的集合, ei表示属于集合St中的第i个
实体,
表示实体ei的嵌入表示, MLP()表示多层感知机,
表示符号表示pt″中实体ei对
应的概率值, |St|表示集合St中实体的数量。
4.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法, 其特征在于, 步骤
4中, 逻辑操作推理包括:
针对逻辑表达 式中的逻辑操作与: 根据已知逻辑操作与连接的两个缺失三元组中缺失权 利 要 求 书 1/3 页
2
CN 115391507 A
2实体的符号表示p1和p2, 对p1和p2进行与操作, 即p1∧p2, 对应计算预测实体的符号表示
其中, g(·)表示归一 化函数, 符号
表示哈达 玛积;
针对逻辑表达 式中的逻辑操作或: 根据已知逻辑操作或连接的两个缺失三元组中缺失
实体的符号表示p1和p2, 对p1和p2进行或操作, 即p1∨p2, 对应计算预测实体的符号表示
针对逻辑表达 式中的逻辑操作非: 根据已知逻辑操作非连接的缺失三元组中缺失实体
的符号表示p, 对p进行非操作, 即
对应计算预测实体的符号表示
其中, α 表示常数, |ne|表示电商知识图谱中实体的数量。
5.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法, 其特征在于, 步骤
4中, 基于预测实体的符号表示计算预测实体的嵌入表示, 包括:
其中, Sy表示预测实体的符号表示py中非零元素对应的实体的集合, ei表示属于集合Sy
中的第i个实体,
表示实体ei的嵌入表示, MLP()表示多层感知机,
表示符号表示py中
实体ei对应的概 率值, |Sy|表示集合Sy中实体的数量。
6.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法, 其特征在于, 步骤
5中, 综合预测实体的符号表示和嵌入表示来从候选目标实体中确定最终的目标实体, 包
括:
采用以下公式根据预测实体的符号表示和嵌入表示确定最终的目标实体:
其中, py表示预测实体的符号表示, vy表示预测实体的嵌入表示, V表示电商知识图谱中
的实体集合, ve表示属于实体集合V中实体的嵌入表示, D(vy,ve)表示计算vy与ve的相似度,
表示将所有相似度拼接为1个向量, 理解为预测实体的嵌入表示代表的
每个实体作为目标实体的概率, λ表示综合比例, a表示综合预测实体的符号表示和嵌入表
示确定的实体概 率向量, 从实体概 率向量a中确定概 率值大的实体作为目标实体。
7.根据权利要求1所述的基于神经符号增强的知识库复杂查询方法, 其特征在于, 所述
知识表示模型在被 应用之前需要经 过参数优化的, 参数优化包括:
从电商知识图谱中提取知识表达语句, 并对知识表达语句中的关键词进行掩码处理
后, 转换成通过逻辑操作连接缺失三元组的逻辑表达式作为样本数据, 学习目标是搜索掩
码关键词;
按照步骤2 ‑步骤4根据样本数据计算预测实体的符号表示和嵌入表示;
根据预测实体的嵌入表示构建第一损 失, 根据预测实体的符号表示构建第二损 失, 根
据预测实体的符号表示 转换到嵌入表示 来构建第三损失;
根据三个损失来优化知识 表示模型的参数。权 利 要 求 书 2/3 页
3
CN 115391507 A
3
专利 一种基于神经符号增强的知识库复杂查询方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:39:11上传分享