说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210680896.7 (22)申请日 2022.06.16 (71)申请人 华东师范大学 地址 200241 上海市闵行区东川路5 00号 (72)发明人 杨燕 张骏 贺樑 (74)专利代理 机构 上海蓝迪专利商标事务所 (普通合伙) 31215 专利代理师 徐筱梅 张翔 (51)Int.Cl. G06F 40/35(2020.01) G06F 16/36(2019.01) G06N 3/08(2006.01) (54)发明名称 用于提高基于知识的对话系统鲁棒性的数 据增强方法 (57)摘要 本发明公开了一种用于提高基于知识的对 话系统鲁棒性的数据增强方法, 该方法应用于基 于知识的对话系统的训练过程中, 对输入的知识 三元组进行扰动。 本发明有助于对话系统生成事 实正确的回复, 并有助于对话系统迁移到具有新 知识的场景。 权利要求书1页 说明书3页 附图2页 CN 114997184 A 2022.09.02 CN 114997184 A 1.一种用于提高基于知识的对话系统鲁棒 性的数据增强方法, 其特 征在于, 包括: 获取用户的至少一组对话数据; 所述对话数据包含对话历史和由该对话历史中包含的实体通过实体链接获取的知识 图谱; 对话数据用于基于知识的对话系统的训练; 在训练过程中, 输入的对话数据首先通过 实体扰动方法获取处理后的数据, 然后将处理后的数据用于训练基于知识的对话系统; 其 中: 所述实体 扰动方法, 包括以下步骤: 1) 获取一组用于训练的对话数据, 对知识图谱中的每个知识三元组以50%的概率随机 对其进行扰动, 其中知识三元组的形式为[头实体, 关系, 尾实体]; 2) 针对被扰动的知识三元组, 获取其头实体与尾实体, 并将头实体和尾实体中的30%的 字替换为随机的其 他任意字; 3) 将对话历史中涉及的替换前的头实体或尾实体修改为替换后的对应的头实体或尾 实体; 修改后的知识图谱和对话历史为处 理后的数据用于对话系统的训练。权 利 要 求 书 1/1 页 2 CN 114997184 A 2用于提高 基于知识的对话系统鲁棒性的数据增强方 法 技术领域 [0001]本发明涉及基于知识的对话系统技术领域, 具体来说是通过数据增强方法帮助基 于知识的对话系统生成事实正确的回复, 并增强系统的鲁棒 性。 背景技术 [0002]过去大部分基于知识的对话系统都侧重于通过外部知识图谱或知识库构建基于 知识的对话系统, 以生成具有丰富信息的回复。 这些系统需要与用户进 行知识丰富的对话。 因此, 生成忠实于某些给定知识图谱或知识库及其上下文的事实正确的回复非常重要。 但 是这些系统经常会产生似是而非的回复。 例如, 一个看似正确的文本 “周某伦的星座是天蝎 座”与知识“(周某伦,星座,摩羯座) ”相矛盾。 现有的方法一般应用于生 成后的回复, 通过外 部知识修正生成后的文本来获取事实正确的回复。 然而, 并没有从训练阶段根本性的解决 其问题。 发明内容 [0003]本发明的目的是针对现有技术的不足而提供的一种用于提高基于知识的对话系 统鲁棒性的数据增强方法, 有助于对话系统生成事实正确的回复, 并有助于对话系统迁移 到具有新知识的场景。 [0004]实现本发明目的 的具体技 术方案是: [0005]一种用于提高基于知识的对话系统鲁棒 性的数据增强方法, 特点是: 该 方法包括: [0006]获取用户的至少一组对话数据; [0007]该对话数据包含对话历史、 由该对话历史中包含的实体通过实体链接获取的知识 图谱。 对话数据用于基于知识的对话系统的训练; 在训练过程中, 输入的对话数据首先通过 实体扰动方法获取处理后的数据, 然后将处理后的数据用于训练基于知识的对话系统; 其 中: [0008]所述的实体 扰动方法, 包括以下步骤: [0009]1)获取一组用于训练的对话数据, 对知识图谱中的每个知识三元组以50%的概率 随机对其进行扰动, 其中知识三元组的形式为 “[头实体,关系, 尾实体] ”; [0010]2)针对被扰动的知识三元组, 获取其头实体与尾实体, 并将头实体和尾实体中的 30%的字替换为随机的其 他任意字; [0011]3)将对话历史中涉及的替换前的头实体或尾实体修改为替换后的相应的头实体 或尾实体; 修改后相关的知识图谱和对话历史用于对话系统的训练。 [0012]与现有技 术相比, 本发明有以下优点: [0013]1、 易用性: 相比较于过去的方法, 该方法在对话系统训练阶段, 无需额外空间和时 间消耗, 并且能够轻松应用于任何给定知识图谱和对话历史输入的对话系统的训练。 [0014]2、 正确性: 该方法能够有效帮助基于知识的对话系统生成事实正确的回复, 提高 该系统的鲁棒 性。说 明 书 1/3 页 3 CN 114997184 A 3
专利 用于提高基于知识的对话系统鲁棒性的数据增强方法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:00:29
上传分享
举报
下载
原文档
(400.9 KB)
分享
友情链接
GB-T 25068.2-2020 信息技术 安全技术 网络安全 第2部分:网络安全设计和实现指南.pdf
GB-T 29716.4-2018 机械振动与冲击 信号处理 第4部分:冲击响应谱分析.pdf
DB13-T 5654-2023 补充耕地符合性评定与质量等级评价技术规程 河北省.pdf
GB-T 40327-2021 轮式移动机器人导引运动性能测试方法.pdf
GB-T 30428.6-2017 数字化城市管理信息系统 第6部分:验收.pdf
数据安全培训规范.pdf
GB/T 32925-2016 信息安全技术 政府联网计算机终端安全管理基本要求.pdf
GB-T 25122.3-2018 轨道交通 机车车辆用电力变流器 第3部分:机车牵引变流器.pdf
DB13-T 5372-2021 社会工作服务项目监测与 评估规范 河北省.pdf
中华人民共和国密码法 2020.pdf
ISO IEC 19770-1 2017 Amd 1 2024 Information technology — IT asset manage.pdf
T-BSIA 002—2023 软件企业核心竞争力评价规范.pdf
T-CES 173—2022 锂离子电池储能舱技术规范.pdf
GB-T 39853.1-2021 供电系统中的电能质量测量 第1部分:电能质量监测设备(PQI).pdf
GB-T 33018.1-2016 炭素企业节能技术规范 第1部分:浸渍.pdf
DB54-T 0264-2022 政务服务“一网通办”业务规范 西藏自治区.pdf
奇安信 2022中国软件供应链安全分析报告.pdf
工行 - 2023.2 - 2022网络金融黑产研究报告.pdf
GB-T 37114-2018 公共汽电车线网设置和调整规则.pdf
T-SZGA 001—2020 瓶装液化石油气居民用户管道及设施安装技术规程.pdf
1
/
3
7
评价文档
赞助2.5元 点击下载(400.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。