全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210351232.6 (22)申请日 2022.04.02 (71)申请人 北京明略昭辉科技有限公司 地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 朱洪利 曹雷 刘俊辰  (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 蔡良伟 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/383(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/02(2006.01) (54)发明名称 意图识别方法、 装置、 电子装置及存 储介质 (57)摘要 本申请涉及一种意图识别方法、 装置、 电子 装置及存储介质, 该方法, 包括: 获取用户输入的 待识别的第一语料, 利用细粒度意图预测模型预 测第一语料所对应的细粒度意图信息, 细粒度意 图信息包括多种用于描述对应意图的第一实词; 检验多种第一实词是否为已构建的意图类别标 签所关联的第二实词, 并根据校验为第二实词的 多种第一实词, 组合生成备选意图; 在预设的意 图信息中检测备选意图, 并根据检测结果确定意 图识别结果。 通过本申请, 解决在细粒度意图识 别场景中, 当训练样本少且类别不均衡时, 会造 成意图识别困难, 意图识别准确率低、 识别效率 低的问题, 实现了细粒度意图识别, 并在训练样 本少且类别不均衡时能够高效准确的进行细粒 度识别的有益效果。 权利要求书2页 说明书10页 附图3页 CN 115129859 A 2022.09.30 CN 115129859 A 1.一种意图识别方法, 其特 征在于, 包括: 获取用户输入的待识别的第 一语料, 利用细粒度意图预测模型预测所述第 一语料所对 应的细粒度意图信息, 其中, 所述细粒度意图信息包括多种用于描述对应意图的第一 实词, 所述细粒度意图预测模型是根据具有 预设的细粒度意图的第二语料、 掩码该预设的细粒度 意图的第三语料和该 预设的细粒度意图训练的; 检验多种所述第 一实词是否为已构建的意图类别标签所关联的第 二实词, 并根据 校验 为所述第二实词的多种所述第一实词, 组合 生成备选意图; 在预设的意图信息中检测所述备选意图, 并根据检测结果确定意图识别结果。 2.根据权利要求1所述的方法, 其特征在于, 校验多种所述第 一实词是否为已构建的意 图类别标签所关联的第二实词, 包括: 获取所述第 二实词, 其中, 所述第 二实词至少包括以下其中一种: 所述意图类别标签所 对应类别的标签词、 所述标签词对应的近似词; 在所述第二实词中查找所述第一实词; 在查找到所述第 一实词的情况下, 确定所述第 一实词为已构建的意图标签所关联的第 二实词。 3.根据权利要求2所述的方法, 其特征在于, 在未查找所述第一实词的情况下, 所述方 法还包括: 获取所有已构建的意图类别标签所关联的所述第二实词; 计算多种所述第一实词与所有已构建的意图类别标签所关联的所述第二实词的词向 量余弦相似度; 判断每种所述第一实词所对应的所述词向量余弦相似度中最高相似度是否高于预设 阈值; 在判断到所述最高相似度高于预设阈值的情况下, 确定对应的所述第 一实词为所述第 二实词, 并将所述最高相似度对应的所述第二实词对应的所述标签词 作为所述第一 实词对 应的标签词。 4.根据权利要求3所述的方法, 其特征在于, 所述方法还包括: 在判断到所述最高相似 度低于预设阈值的情况 下, 确定意图识别结果包括 意图不明确。 5.根据权利要求1所述的方法, 其特征在于, 所述意图信息包括意图列表, 在预设的意 图信息中检测所述备选意图, 并根据检测结果确定意图识别结果, 包括: 获取预设的所述 意图列表, 其中, 所述 意图列表包括多个已构建的意图; 在多个所述已构建的意图中检测所述备选意图, 并在检测到所述备选意图时, 确定待 识别的意图包括所述备选意图。 6.根据权利要求5所述的方法, 其特征在于, 所述方法还包括: 在未检测到所述备选意 图时, 确定意图识别结果包括 意图不明确。 7.根据权利要求1所述的方法, 其特征在于, 所述细粒度意图预测模型为双向注意力神 经网络模型Ber t, 所述细粒度意图预测模型训练过程包括: 基于预训练任务所对应的样本配置规则和所述第 二语料, 生成遮蔽词训练数据和下一 句预测数据, 并将所述遮蔽词训练数据和所述下一句预测数据输入到Bert语言模型中, 依 次进行语言模型 预训练的遮蔽词训练Masked  LM和下一句预测训练NS P;权 利 要 求 书 1/2 页 2 CN 115129859 A 2构建第一预设格式的所述第 三语料, 并将所述第 二语料和所述第 三语料按预设范式生 成对应的提示训练语料文本, 其中, 所述第三语料所对应的预设格式与按预设排序排布的 所述预设的细粒度意图的词序格式对应; 基于所述预设的细粒度意图, 构建与所述预设的细粒度意图对应的训练意图类别标 签; 将所述提示训练语料文本转换为第 二预设格式的提示训练语料, 并以所述提示训练语 料为输入、 以所述训练意图类别标签为输出目标对完成预训练的所述Bert语言模 型进行提 示学习训练, 直至拟合, 以得到所述细粒度预测模型。 8.一种意图识别装置, 其特 征在于, 包括: 预测模块, 用于获取用户输入的待识别的第一语料, 利用 细粒度意图预测模型预测所 述第一语料所对应的细粒度意图信息, 其中, 所述细粒度意图信息包括多种用于描述对应 意图的第一实词, 所述细粒度意图预测模型是根据具有预设的细粒度意图的第二语料、 掩 码该预设的细粒度意图的第三语料和该 预设的细粒度意图训练的; 生成模块, 用于检验多种所述第 一实词是否为已构建的意图类别标签所关联的第 二实 词, 并根据校验为所述第二实词的多种所述第一实词, 组合 生成备选意图; 处理模块, 用于在预设的意图信息中检测所述备选意图, 并根据检测结果确定意图识 别结果。 9.一种电子装置, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1至7任一项所述的意图识 别方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1至7任一项所述的意图识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 115129859 A 3

.PDF文档 专利 意图识别方法、装置、电子装置及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 意图识别方法、装置、电子装置及存储介质 第 1 页 专利 意图识别方法、装置、电子装置及存储介质 第 2 页 专利 意图识别方法、装置、电子装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:50:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。