全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210927689.7 (22)申请日 2022.08.03 (71)申请人 北京信息科技大 学 地址 100192 北京市海淀区清河小营东路 12号 (72)发明人 安彪 王兴芬 赵刚  (74)专利代理 机构 北京天方智力知识产权代理 事务所(普通 合伙) 11719 专利代理师 路远 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/194(2020.01) G06F 40/247(2020.01) G06N 5/04(2006.01) (54)发明名称 一种基于语句相似度的事件图谱构造推理 方法及装置 (57)摘要 本发明提供一种基于语句相似度的事件图 谱构造推理方法及装置。 所述方法包括: 从原始 文本中抽取因果关系和事件描述, 构造初始事件 图谱; 计算初始事件图谱中节 点即事件描述之间 的相似度, 将相似度大于设定阈值的有因果关系 的事件合并为一个事件簇, 得到事件簇图谱; 将 事件描述输入事件簇图谱, 确定与所述事件描述 相似度最大的事件所在的事件簇, 返回与所述事 件簇有直接因果关系的部分事件簇图谱, 并计算 相关的因果事件概率。 本发明基于相似度计算将 事件合并为事件簇代替事件作为网络结构中的 节点, 简化了网络结构, 提升了查找原因与结果 的效率。 权利要求书3页 说明书8页 附图1页 CN 115269780 A 2022.11.01 CN 115269780 A 1.一种基于语句 相似度的事 件图谱构造推理方法, 其特 征在于, 包括以下步骤: 从原始文本 中抽取因果关系和事件描述, 构造以事件描述为节点以事件 间对应的因果 关系为边的初始事 件图谱; 计算初始事件图谱中节点即事件描述之间的相似度, 将相似度 大于设定阈值的有因果 关系的事 件合并为 一个事件簇, 计算事 件簇的概 率, 得到事 件簇图谱; 将事件描述输入事件簇 图谱, 确定与所述事件描述相似度最大的事件所在的事件簇, 返回与所述事 件簇有直接因果关系的部分事 件簇图谱, 并计算相关的因果事 件概率。 2.根据权利要求1所述的基于语句相似度的事件图谱构造推理方法, 其特征在于, 因果 关系和事 件描述的抽取 方法包括: 基于原始文本中包含集合C中的因果提示词的句子, 构造初始句子集合S, 集合C为中文 中表示因果含义的因果 提示词的集 合; 将集合S中包含1个因果提示词的句子记为S1, 将S1中因果提示词在句首、 句中和句尾的 句子分别记为S1F、 S1M和S1L; 按照提示词的常用方法, 将S1F中因果提示词所属的句子部分作为原因事件描述, 将S1L 中因果提示词所属的句子部分作为结果事件描述, 将S1M中因果提示词前、 后的两部分句子 分别作为原因事件描述和结果事件描述; 构建由所有原因事件组成的集合SC和由所有结果 事件组成的集 合SR, 并记录SC和SR之间句子的因果关系。 3.根据权利要求1所述的基于语句相似度的事件图谱构造推理方法, 其特征在于, 句子 相似度的计算法包括: 将句子S1、 S2表示为向量V1、 V2; 计算V1、 V2的余弦相似度Simcos; 提取S1、 S2中的名词N1、 N2, 统计N1、 N2中相同词语的数量nsame, 按(1)式计算S1、 S2的名词 相同度Same: Same=nsame/(n1+n2‑nsame)                       (1) 式中, n1、 n2分别为N1、 N2中包含词语的数量; 统计N1、 N2中同义词的对数nsim, 按(2)式计算S1、 S2的名词同义度Simnoun: Simnoun=nsim/(n1×n2)                          (2) 按(3)式计算S1、 S2的相似度Sim: Sim=α×Simcos+β×Same+γ×Simnoun                (3) 式中, α、 β、 γ为加权系数, 且α +β +γ=1; Sim的取值在0~1之间, Sim=0表示两句 话完 全不同, Sim=1表示完全相同。 4.根据权利要求1所述的基于语句相似度的事件图谱构造推理方法, 其特征在于, 如果 返回的部分事件簇图谱中包含环状结构, 删除环状结构中因果关系发生次数最少的因果关 系; 当第1、 2、 …、 N、 1个事 件簇依次具有因果关系时, 所述 N个事件簇构成环状结构, N≥3 。 5.根据权利要求1所述的基于语句相似度的事件图谱构造推理方法, 其特征在于, 所述 计算相关的因果事 件概率, 包括: 若事件簇k和事件簇j之间存在因果关系, 且k为原因、 j为结果, 按(4)式计算事件簇k发 生的前提下事 件簇j发生的后验概 率P(j|k): P(j|k)=P(k|j)P(j)/P(k)                        (4)权 利 要 求 书 1/3 页 2 CN 115269780 A 2式中, P(k)=Ek/EA, P(j)=Ej/EA, P(k|j)=Ekj/Ej, Ek、 Ej分别为事件簇k、 j发生的次数, EA 为总事件数, Ekj为事件簇k、 j同时发生的次数; 在利用事件簇图谱进行推理时, 默认输入事件t必定发生, 即P(t)=1, 根据(4)式计算 结果事件r发生的概 率P(r|t); 根据(5)、 (6)式计算原因事 件c发生的概 率P(c|t): 式中, LSc‑t为事件c对事件t的充分性度量, 表示c不发生。 6.一种基于语句 相似度的事 件图谱构造推理装置, 其特 征在于, 包括: 第一图谱构造模块, 用于从原始文本中抽取因果关系和事件描述, 构造以事件描述为 节点以事 件间对应的因果关系为 边的初始事 件图谱; 第二图谱构造模块, 用于计算初始事件图谱中节点即事件描述之间的相似度, 将相似 度大于设定阈值的有因果关系的事件合并为一个事件簇, 计算事件簇的概率, 得到事件簇 图谱; 图谱推理模块, 用于将事件描述输入事件簇 图谱, 确定与所述事件描述相似度最大的 事件所在的事件簇, 返回与所述事件簇有直接因果关系的部分事件簇图谱, 并计算相关的 因果事件概率。 7.根据权利要求6所述的基于语句相似度的事件图谱构造推理装置, 其特征在于, 因果 关系和事 件描述的抽取 方法包括: 基于原始文本中包含集合C中的因果提示词的句子, 构造初始句子集合S, 集合C为中文 中表示因果含义的因果 提示词的集 合; 将集合S中包含1个因果提示词的句子记为S1, 将S1中因果提示词在句首、 句中和句尾的 句子分别记为S1F、 S1M和S1L; 按照提示词的常用方法, 将S1F中因果提示词所属的句子部分作为原因事件描述, 将S1L 中因果提示词所属的句子部分作为结果事件描述, 将S1M中因果提示词前、 后的两部分句子 分别作为原因事件描述和结果事件描述; 构建由所有原因事件组成的集合SC和由所有结果 事件组成的集 合SR, 并记录SC和SR之间句子的因果关系。 8.根据权利要求6所述的基于语句相似度的事件 图谱构造推理装置, 句子相似度的计 算法包括: 将句子S1、 S2表示为向量V1、 V2; 计算V1、 V2的余弦相似度Simcos; 提取S1、 S2中的名词N1、 N2, 统计N1、 N2中相同词语的数量nsame, 按(1)式计算S1、 S2的名词 相同度Same: Same=nsame/(n1+n2‑nsame)                       (1) 式中, n1、 n2分别为N1、 N2中包含词语的数量; 统计N1、 N2中同义词的对数nsim, 按(2)式计算S1、 S2的名词同义度Simnoun:权 利 要 求 书 2/3 页 3 CN 115269780 A 3

.PDF文档 专利 一种基于语句相似度的事件图谱构造推理方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语句相似度的事件图谱构造推理方法及装置 第 1 页 专利 一种基于语句相似度的事件图谱构造推理方法及装置 第 2 页 专利 一种基于语句相似度的事件图谱构造推理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:39:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。