全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211066885.6 (22)申请日 2022.09.01 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 段贵多 解修蕊 朱大勇 罗光春  李文泰 赵桀浩  (74)专利代理 机构 成都希盛知识产权代理有限 公司 512 26 专利代理师 陈泽斌 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/289(2020.01)G06N 5/02(2006.01) G06N 5/04(2006.01) G06N 3/04(2006.01) (54)发明名称 一种融合位置感知细化的对话关系抽取方 法 (57)摘要 本发明涉及自然语 言处理领域, 其公开了一 种融合位置感知细化的对话关系抽取方法, 解决 现有技术中对话文本的相似结构信息带来的干 扰, 无法对节点进行分类, 没有考虑对话数据的 独特性带来的关系抽取准确性不高的问题。 本发 明的方法, 首先, 基于对对话的句法分析, 获得 实 体的提及词; 然后, 基于提及词和对话信息, 构建 异构提及对话图并初始化节点特征; 再然后, 通 过在异构提及对话图上使用位置感知细化的图 注意力网络, 获得更新后的节点特征, 并通过合 并节点得到实体对话图; 最后, 通过融合实体对 话图中实体对实体间的路径信息, 推理得到实体 对之间的关系。 权利要求书6页 说明书13页 附图1页 CN 115455197 A 2022.12.09 CN 115455197 A 1.一种融合 位置感知 细化的对话关系抽取 方法, 其特 征在于, 包括以下步骤: A、 训练对话关系抽取模型: A1、 输入用于训练的对话及需要抽取关系的实体对; A2、 将对话的原始文本进行分词, 并进行依存句法分析, 然后, 根据得到的依存句法分 析结果, 将与实体对中的实体的文本相同的词以及 存在指代关系的词, 作为提及词; 基于对 话, 根据说话人的变化或对话中的停顿, 分割获得话语句; A3、 构建异构提及对话图: 所述异构提及对话图的节点包括提及节点、 话语节点和对话节点, 边包括提及依赖边、 说话者依赖边、 话语依赖边和对话依赖边, 并按如下定义进行构建: 提及节点: 将每一个提及词设置为提及节点, 且将文本相同但在对话中位置不同的提 及词设置为不同提及节点, 在 对话中位置不同包括相同文本的提及词出现在不同的话语句 中以及相同文本的提及词出现在相同的话语句中的不同位置; 话语节点: 将每 个话语句分别设置为 话语节点; 对话节点: 将对话设置为 一个对话节点; 由对应相同实体的各提及节点间两 两相连所形成的边, 构成提及依赖边; 由对应相同说话者的各话语节点间两两相连所形成的边, 以及对应相同说话者且对应 不同实体的各提及节点间两 两相连所形成的边, 构成说话 者依赖边; 由提及节点与 该提及节点对应词所属话语句对应的话语节点之间的边, 构 成话语依赖 边; 由提及节点与对话节点之间的边, 构成对话依赖边; A4、 初始化异构提及对话图中的节点特 征; A5、 根据各提及节点的对应词在对应话语句中的位置信息, 及各提及节点除对话节点 以外的邻居节点的特征表示, 基于图注意力网络, 更新异构提及对话图的各提及节点的特 征表示; 根据各话语节点对应话语句在对话中的位置信息, 及各话语节点除对话节点以外 的邻居节点的特征表示, 基于图注意力网络, 更新异构提及对话图的各话语节点的特征表 示; A6、 构建实体对话图: 基于更新获得的提及节点和话语节点的特征表示, 根据提及节点与实体间的对应关系 合并获得实体节点及其特征表示, 根据话语节点与说话者间的对应关系合并获得说话者节 点及其特 征表示; 保留异构提及对话图中, 除因合并节点而消除的边以外的边, 并基于边两端的节点的 特征表示构建边的特 征表示; A7、 融合实体对话图中实体对之间的路径信息, 并进行推理得到实体对之间的关系; A8、 循环执行步骤A 1‑A7, 基于关系提取的二元交叉熵损失对对话关系抽取模型进行训 练, 直至模型收敛或达 到设定训练轮次; B、 执行对话关系抽取任务: 以对话文本和待抽取关系的实体对作为输入, 利用训练完成的对话关系抽取模型获取 实体对的实体之间的关系。 2.如权利要求1所述的一种融合 位置感知 细化的对话关系抽取 方法, 其特 征在于,权 利 要 求 书 1/6 页 2 CN 115455197 A 2步骤A2中, 将对话的原 始文本进行分词, 并进行依存句法分析, 具体包括: 首先, 去除原始文本的非文本部分, 并进行格式编码; 然后, 使用自然语言处理工具对 文本进行分词和依存句法分析, 得到依存句法分析树。 3.如权利要求1所述的一种融合 位置感知 细化的对话关系抽取 方法, 其特 征在于, 步骤A4中, 初始化异构提及对话图中的节点特 征, 包括: A41、 针对对话的每一个话语句, 首先, 按说话者标记和由该话语句单词依次拼接构成 的序列拼接构成话语句词序列, 然后, 再由对话的起始标记、 各话语句词序列依次拼接构成 的序列和对话的结尾标记拼接构成对话词序列; 将获得的对话词序列输入预训练语言模 型, 获得初始的词嵌入表示; 然后, 根据 获得的初始的词嵌入表示, 针对每一个话语句, 分别将其说话者si的嵌入表 示 与其每个单词xij的初始的嵌入表示 进行拼接, 获得其各 单词的嵌入表示 wij: 其中, 表示拼接操作; wij表示话语句ui中的第j个单词的嵌入表示; A42、 根据步骤A41获得 的各单词的嵌入表示wij, 基于各提及节点的对应词所包含各单 词的嵌入表示, 获得各提及节点的初始化特征; 基于话语句所包含各单词的嵌入表示获得 其对应的话语节点的初始化特征; 基于预训练语言模型 的最终输出, 将对话词序列的起始 标记位置所对应的隐藏状态作为对话节点的初始化特 征。 4.如权利要求3所述的一种融合 位置感知 细化的对话关系抽取 方法, 其特 征在于, 步骤A42中, 按如下公式, 基于各提及节点的对应词所包含各单词的嵌入表示, 获得各 提及节点的初始化特 征h(0): 其中, wn为该提及 节点对应词所包含的第n个 单词的嵌入表示, k为该提及 节点对应词所 包含单词的数量。 5.如权利要求3所述的一种融合 位置感知 细化的对话关系抽取 方法, 其特 征在于, 步骤A42中, 按如下步骤, 基于话语句所包含各单词的嵌入表示获得其对应的话语节点 的初始化特 征zi: 对于第i个话语句ui, 首先, 基于BiLSTM网络, 对话语句ui中的每个单词进行编码, 获得 话语句ui所包含各单词的特 征向量 然后, 将话语句ui所包含各单词的特征向量 进行求和, 并按话语句ui的单词数量进行 平均, 获得其均值特 征 计算公式如下: 其中, ti表示第i个话语句的单词数量; 最后, 将对话所包含各话语句的均值特征所构成的顺序序列 作为输入, 采 用另一个参数独立的BiLSTM网络对其进行编码, 得到对话所包含各话语句对应话语节 点的权 利 要 求 书 2/6 页 3 CN 115455197 A 3

.PDF文档 专利 一种融合位置感知细化的对话关系抽取方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合位置感知细化的对话关系抽取方法 第 1 页 专利 一种融合位置感知细化的对话关系抽取方法 第 2 页 专利 一种融合位置感知细化的对话关系抽取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。