说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210166422.0 (22)申请日 2022.02.23 (71)申请人 上海钧正网络科技有限公司 地址 201199 上海市闵行区秀文路898号1 幢501室 (72)发明人 杨磊 李强  (74)专利代理 机构 上海文舜致远专利代理事务 所(普通合伙) 31445 专利代理师 许红英 (51)Int.Cl. G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 基于事件的指代消解系统、 方法、 终端及存 储介质 (57)摘要 本发明提供基于事件的指代消解系统、 方 法、 终端及存储介质, 包括: 事件识别模块, 用于 基于预设知识维度对文本识别得到事件集合; 多 级筛选模块, 包括用于处理不同指代类型的若干 匹配层; 指代标准化模块, 连接所述多级筛选模 块, 用于将所述多级筛选模块所识别出的指代结 果按照预设语料库的形式进行标准化处理。 本发 明基于事件的语义特征, 提高了指代消解的准确 率; 与已有指代消解方法相比, 通过加入事件的 特征, 可以针对多种类型的指代进行识别; 扩展 性较好, 便于测试, 适合添加多种模型; 每一层以 上一层筛选出的实体聚类体为输入, 在进行指代 判断时, 可以使用更多的信息, 避免了实体表达 对只从两 个词语判断的缺陷。 权利要求书2页 说明书13页 附图2页 CN 114548113 A 2022.05.27 CN 114548113 A 1.一种基于事 件的指代消解系统, 其特 征在于, 包括: 事件识别模块, 用于基于预设知识维度对文本识别得到事 件集合; 多级筛选模块, 连接所述事件识别模块; 所述多级筛选模块包括用于处理不同指代类 型的匹配层; 指代标准化模块, 连接所述多级筛选模块, 用于将所述多级筛选模块所识别出的指代 结果按照预设语料库的形式进行 标准化处理。 2.如权利要求1所述的基于事件的指代消解系统, 其特征在于, 所述多级筛选模块中的 匹配层按准确 率降序排列, 第一层 匹配层以所述事件集合作为输入, 其余匹配层均以上一 层匹配层的筛 选结果作为输入。 3.如权利要求2所述的基于事件的指代消解系统, 其特征在于, 所述匹配层包括字符匹 配层、 代词匹配层、 缩略匹配层和语义匹配层; 所述字符匹配层用于处理表述相同的指代, 所述代词匹配层用于处理代词类指代, 所述缩略匹配层用于处理缩略指代, 所述语义匹配 层用于处 理表述不同的指代。 4.如权利要求3所述的基于事件的指代消解系统, 其特征在于, 所述字符匹配层预设有 非抽象要素特征匹配条件和抽象要素特征匹配条件; 其中, 所述非抽象要素特征匹配条件 用于将两两事件中非抽象的对象要素进行匹配来确定是否为表述相同的指代; 所述抽象要 素特征匹配条件用于将两两事件中抽象的对 象要素进行匹配来确定是否为表述相同的指 代。 5.如权利要求 4所述的基于事 件的指代消解系统, 其特 征在于: 所述非抽象要素特征匹配条件包括字符匹配条件, 所述字符匹配条件表示为: 两两事 件中非抽象的对象要素完全匹配; 所述抽象要素特征匹配条件包括抽象关联性匹配条件和/或事件关系特征匹配条件; 其中, 所述抽象关联性匹配条件表示为: 两两事件中抽象的对 象要素完全匹配且均为第二 类抽象要 素, 并且所述两两事件的触发词为同义词; 所述事件关系特征匹配条件表示为: 两 两事件中抽象的对象要素完全匹配且均为第一类抽象要素, 并且所述两两事件之 间的事件 关系为因果关系或条件关系。 6.如权利要求3所述的基于事件的指代消解系统, 其特征在于, 所述代词匹配层确定两 个对象要素 是否为代词类指代的过程包括: 基于距离特 征匹配条件确定 两个对象要素 是否为代词类指代; 对于符合所述距离特征匹配条件的两个对象要素, 基于意念事件特征条件进行再次识 别, 以对所述距离特征匹配条件 未能识别的对象要 素进行补充识别; 若识别成功, 则确定所 述两个对象要素为代词类指代, 否则不 为代词类指代; 对于不符合所述距离特征匹配条件的两个对象要素, 基于事件关系特征条件进行再次 识别, 以对所述距离特征匹配条件识别有误的对象要 素进行矫正识别; 若识别成功, 则确定 所述两个对象要素不 为代词类指代, 否则为代词类指代。 7.如权利要求3所述的基于事件的指代消解系统, 其特征在于, 所述缩略匹配层确定两 个对象要 素是否为缩略指代的过程包括: 基于缩略匹配条件确定两个对象要 素是否为缩略 指代; 对于所述缩略匹配条件识别有误的对象要 素, 基于特殊事件匹配条件和/或事件关系 特征匹配条件进行矫 正识别。权 利 要 求 书 1/2 页 2 CN 114548113 A 28.如权利要求3所述的基于事件的指代消解系统, 其特征在于, 所述语义匹配层确定两 个对象要 素是否为表 述不同的指代的过程包括: 基于语义相似性匹配条件确定两个对象要 素是否为表述不同的指代; 对于所述语义相似性匹配条件识别有误的对 象要素, 基于要素 内嵌相似性匹配条件和/或事 件关系特 征匹配条件进行矫 正识别; 其中: 所述语义相似性匹配条件是指, 若两个对象要素之间相似, 则确定两个对象要素构成 表述不同的指代关系; 所述要素内嵌相似性匹配条件是指, 若一事件中对象要素的核心修饰词与另一事件中 的触发词相似, 则确定这两个事 件的对象要素为表述 不同的指代关系; 所述事件关系特征匹配条件是指, 若呈条件关系或排斥关系的两个事件的对象要素满 足所述语义相似性匹配条件, 则这两个事 件的对象要素不构成表述 不同的指代关系。 9.一种基于事 件的指代消解方法, 其特 征在于, 包括: 基于预设知识维度对文本识别得到事 件集合; 对所述事 件集合进行多 级筛选; 每级筛 选用于处 理不同的指代类型; 将多级筛选所识别出的指代结果按照预设语料库的形式进行 标准化处理。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求9所述基于事 件的指代消解方法。 11.一种电子终端, 其特 征在于, 包括: 处 理器及存 储器; 所述存储器用于存 储计算机程序; 所述处理器用于执行所述存储器存储的计算机程序, 以使所述电子终端执行如权利要 求9所述基于事 件的指代消解方法。权 利 要 求 书 2/2 页 3 CN 114548113 A 3

PDF文档 专利 基于事件的指代消解系统、方法、终端及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于事件的指代消解系统、方法、终端及存储介质 第 1 页 专利 基于事件的指代消解系统、方法、终端及存储介质 第 2 页 专利 基于事件的指代消解系统、方法、终端及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。