全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210754287.1 (22)申请日 2022.06.28 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 曹昊亮  (74)专利代理 机构 北京同钧律师事务所 16 037 专利代理师 柴海平 许怀远 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06Q 30/00(2012.01) (54)发明名称 问答方法、 装置及设备 (57)摘要 本申请提供一种问答方法、 装置及设备。 本 申请的方法, 通过对用户输入的问题进行命名实 体识别确定问题包含的实体信息, 以确定用户的 咨询对象; 将问题包含的实体信息与问答知 识库 中候选问句的实体信息进行匹配, 计算问题与候 选问句的语义相似度, 并确定与问题的实体信息 相匹配并且与问题的语义相似度大于或等于第 一阈值的第一候选问句, 第一候选问句与问题的 语义相似度较高并且与问题的实体信息相匹配; 根据第一候选问句与问题的语义相似度, 选择一 个第一候选问句的预设答案作为问题的答案信 息, 输出问题的答案信息, 能避免因问题的相似 度很高但是咨询对象不同导致的答案信息误的 情况, 从而提高答案信息的准确性。 权利要求书3页 说明书17页 附图9页 CN 115098660 A 2022.09.23 CN 115098660 A 1.一种问答方法, 其特 征在于, 包括: 获取用户的问题; 对所述问题进行命名实体识别, 确定所述问题包 含的实体信息; 将所述问题包含的实体信 息与问答知识库中问句的实体信 息进行匹配, 并计算所述问 题与所述问答知识库中问句的语义相似度; 根据匹配的结果和计算得到的语义相似度, 确定与所述问题的实体信 息相匹配并且与 问题的语义相似度大于或等于第一阈值的第一 候选问句; 根据所述第 一候选问句与 所述问题的语义相似度, 选择一个所述第 一候选问句的预设 答案作为所述问题的答案信息; 输出所述问题的答案信息 。 2.根据权利要求1所述的方法, 其特 征在于, 还 包括: 若所述问答知识库中不存在所述第 一候选问句, 则获取所述问答知识库中的第 二候选 问句, 所述第二 候选问句与所述问题的语义相似度大于或等于第二阈值; 根据所述第 二候选问句与 所述问题的语义相似度, 选择一个所述第 二候选问句的预设 答案作为所述问题的答案信息; 输出所述问题 的答案信息, 并将至少一个所述第二候选问句作为推荐问题, 输出所述 推荐问题。 3.根据权利要求2所述的方法, 其特征在于, 所述将至少一个所述第 二候选问句作为推 荐问题, 输出 所述推荐问题之后, 还 包括: 如果所述用户触发任一所述推荐问题, 输出 所述推荐问题的预设答案 。 4.根据权利要求2所述的方法, 其特征在于, 所述将至少一个所述第 二候选问句作为推 荐问题, 包括: 根据所述第 二候选问句的语义类别, 从每一所述语义类别中选择一个第 二候选问句作 为语义类别的代 表问句; 根据每一所述代表问句与 所述问题的语义相似度, 选择至少一个所述代表问句作为推 荐问题。 5.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 所述将所述问题包含的实体信 息与问答知识库中问句的实体信息进行匹配, 包括: 对于问答知识库中的每一问句, 根据 所述问题包含的实体信 息和所述问句所包含的实 体信息, 若确定所述问题包含的第一实体与所述问句包含的第二实体一一对应, 每一所述 第一实体与对应的第二实体相同或属于同一相似实体集合, 则确定所述问题与所述问句的 实体信息相匹配。 6.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 还 包括: 获取历史时段内的对话日志数据, 筛 选出具有产品对象的对话日志; 通过问答对挖掘算法, 对所述具有产品对象的对话日志进行问答对挖掘, 得到具有产 品对象的样本问句及所述样本问句的答案信息; 根据所述样本问句包含的实体信息, 对所述样本问句进行聚类, 以将实体信息相匹配 的样本问句聚到同一实体 类别中, 形成多个实体 类别; 根据样本问句的语义相似度对同一实体类别中的样本问句进行聚类, 形成至少一个语权 利 要 求 书 1/3 页 2 CN 115098660 A 2义类别; 根据所述样本问句的实体类别和语义类别, 对所述样本问句进行分类输出, 并输出每 一语义类别对应的至少一个答案信息 。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述样本问句的实体类别和语义 类别, 对所述样本问句进 行分类输出, 并输出每一语义类别对应的至少一个答案信息 之后, 还包括以下至少一项: 根据对任一语义类别对应的任一 答案信息的修改操作, 更新所述 答案信息; 根据对任一语义类别中任一样本问句的删除操作, 删除该样本问句; 根据对任一语义类别的删除操作, 删除该语义类别的样本问句; 根据对任一语义类别对应的任一答案信 息的采纳操作, 将被采纳的答案信 息作为该语 义类别中每一样本 问句的预设答案, 将该语义类别中每一样本 问句作为候选 问句, 将样本 问句及样本问句的预设答案、 包 含的实体信息和所在语义类别存 储到问答知识库中。 8.根据权利要求6所述的方法, 其特征在于, 所述根据所述样本问句包含的实体信息, 对所述样本 问句进行聚类, 以将实体信息相匹配的样本 问句聚到同一实体类别中, 形成多 个实体类别, 包括: 获取样本问句的答案信息和包 含的实体信息; 根据样本问句包含的实体信 息, 对本次挖掘的样本问句和已添加到问答知识库的候选 问句一起进行聚类, 以将实体信息相匹配的问句聚到同一实体 类别中, 形成多个实体 类别; 所述根据所述样本问句的实体类别和语义类别, 对所述样本问句进行分类输出, 并输 出每一语义类别对应的至少一个答案信息之前, 还 包括: 若任一语义类别中包含任一样本问句为已添加到问答知识库的第 三候选问句, 则将该 语义类别中除所述第三候选问句之外的第一问句作为候选问句添加到问答知识库中, 将所 述第一问句添加到所述第三候选问句所在的语义类别中, 将所述第三候选问句的预设答案 作为所述第一问句的预设答案存储到问答知识库中, 并将所述第一问句的实体信息存储到 问答知识库中。 9.根据权利要求6所述的方法, 其特征在于, 所述根据所述样本问句的实体类别和语义 类别, 对所述样本问句进行分类输出, 包括: 获取所述样本问句的线上 预计命中次数; 对于每一语义类别, 根据所述语义类别 中样本问句的线上预计命中次数, 选择一个样 本问句的答案信息作为所述语义类别对应的默认预设答案, 并根据所述样本问句的实体类 别和语义类别, 以及每一语义类别中样本问句的线上 预计命中次数, 对语义类别进行排序; 根据排序 结果将所述样本问句进行分类输出, 并输出每一语义类别对应的默认预设答 案。 10.一种问答装置, 其特 征在于, 包括: 问题获取模块, 用于获取用户的问题; 实体识别模块, 用于对所述问题进行命名实体识别, 确定所述问题包 含的实体信息; 匹配模块, 用于将所述问题包含的实体信息与问答知识库中问句 的实体信息进行匹 配, 并计算所述问题与所述问答知识库中问句的语义相似度; 根据匹配的结果和计算得到 的语义相似度, 确定与所述问题的实体信息相匹配并且与问题的语义相似度大于或等于第权 利 要 求 书 2/3 页 3 CN 115098660 A 3

.PDF文档 专利 问答方法、装置及设备

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答方法、装置及设备 第 1 页 专利 问答方法、装置及设备 第 2 页 专利 问答方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。