全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211102133.0 (22)申请日 2022.09.09 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 瞿晓阳 王健宗 陈劲钢  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01) G06F 40/279(2020.01) (54)发明名称 模型训练方法及装置、 描述文本生成方法、 设备、 介质 (57)摘要 一种模型训练方法及 装置、 描述文本生 成方 法、 设备、 介质, 该模型训练方法包括: 获取预训 练的文本 预测模型。 获取第一知识图谱及其对应 的第一描述文本, 从第一描述文本中获取待处理 字段并进行掩码处理, 得到第二描述文本。 将第 二描述文本输入文本预测模型的第一编码模块 中进行编码处理, 得到第一特征向量。 根据第一 知识图谱和第一特征向量训练第二编码模块 以 得到第三编码 模块。 将第一知识图谱输入第三编 码模块中进行编码处理, 得到第二特征向量。 将 第二特征向量输入文本预测模型的第一解码模 块中进行训练处理, 得到第二解码模块, 从而根 据第三编码模块和第二解码模块, 构建文本生成 模型, 能够减少对标注数据的依赖, 并准确生成 知识图谱的描述文本 。 权利要求书2页 说明书12页 附图6页 CN 115422337 A 2022.12.02 CN 115422337 A 1.一种模型训练方法, 用于训练文本生成模型, 其特 征在于, 所述方法包括: 获取预训练的文本预测模型, 所述文本预测模型包括第一编码模块和第一 解码模块; 获取第一知识图谱和所述第一知识图谱 对应的第一描述文本; 从所述第一描述文本中获取待处理字段, 并对所述待处理字段进行掩码处理, 得到第 二描述文本; 将所述第二描述文本 输入所述第一编码模块中进行编码处 理, 得到第一特 征向量; 根据所述第 一知识图谱和所述第 一特征向量对预设的第 二编码模块进行训练处理, 得 到第三编码模块; 将所述第一知识图谱输入所述第三编码模块中进行编码处 理, 得到第二特 征向量; 将所述第二特 征向量输入所述第一 解码模块中进行训练 处理, 得到第二 解码模块; 根据所述第三编码模块和所述第二 解码模块, 构建所述文本生成模型。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述第 二特征向量输入所述第 一解 码模块中进行训练 处理, 得到第二 解码模块之前, 所述方法还 包括: 对所述第二特 征向量进行序列化处 理, 得到第一序列; 所述将所述第二特征向量输入所述第一解码模块中进行训练处理, 得到第二解码模 块, 包括: 将所述第一序列输入所述第一 解码模块中进行训练 处理, 得到第二 解码模块。 3.根据权利要求1所述的方法, 其特征在于, 所述将所述第 二特征向量输入所述第 一解 码模块中进行训练 处理, 得到第二 解码模块, 包括: 将所述第二特 征向量输入所述第一 解码模块中进行解码处 理, 得到第二描述文本; 根据所述第二描述文本和所述第一描述文本计算第一损失值; 根据所述第一损失值对所述第一 解码模块进行参数 更新, 得到第二 解码模块。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述第 二特征向量输入所述第 一解 码模块中进行训练 处理, 得到第二 解码模块, 包括: 将所述第二特 征向量输入所述第一 解码模块中进行解码处 理, 得到第二描述文本; 从所述第二描述文本中识别出至少两个第一实体对象以及每个所述第一实体对象关 联的第二实体对象, 并分析 所述第一实体对象与所述第二实体对象之间的第一关联信息; 从所述第一知识图谱中获取至少两个第三实体对象以及每个所述第三实体对象关联 的第四实体对象, 并分析 所述第三实体对象与所述第四实体对象之间的第二关联信息; 根据所述第一实体对象、 所述第一关联信息、 所述第三实体对象和所述第二关联信息 计算第二损失值; 根据所述第二损失值对所述第一 解码模块进行参数 更新, 得到第二 解码模块。 5.根据权利要求1至3任一项所述的方法, 其特征在于, 所述文本预测模型的训练步骤 包括: 获取描述文本样本; 从所述描述文本样本中确定待遮掩字段, 并对所述待遮掩字段进行掩码处理, 得到参 考描述文本; 将所述参考描述文本 输入预构建的生成模型中进行训练 处理, 得到文本预测模型。 6.一种描述文本生成方法, 其特 征在于, 所述方法包括:权 利 要 求 书 1/2 页 2 CN 115422337 A 2获取第二知识图谱; 获取文本生成模型, 所述文本生成模型包括第三编码模块和第二解码模块, 且所述文 本生成模型 是根据如权利要求1至 5任一项所述的模型训练方法训练得到的; 将所述第二知识图谱输入所述第三编码模块中进行编码处 理, 得到第三特 征向量; 将所述第三特征向量输入所述第 二解码模块中进行解码处理, 得到所述第 二知识图谱 对应的目标描述文本 。 7.根据权利要求6所述的方法, 其特征在于, 所述将所述第 三特征向量输入所述第 二解 码模块中进行解码处 理, 得到所述第二知识图谱 对应的目标描述文本, 包括: 对所述第三特 征向量进行序列化处 理, 得到第二序列; 将所述第二序列输入所述第 二解码模块中进行解码处理, 得到所述第 二知识图谱对应 的目标描述文本 。 8.一种模型训练装置, 用于训练文本生成模型, 其特 征在于, 所述装置包括: 第一获取单元, 用于获取预训练的文本预测模型, 所述文本预测模型包括第一编码模 块和第一 解码模块; 以及, 获取第一知识图谱和所述第一知识图谱 对应的第一描述文本; 掩码处理单元, 用于从所述第一描述文本中获取待处理字段, 并对所述待处理字段进 行掩码处 理, 得到第二描述文本; 第一编码单元, 用于将所述第二描述文本输入所述第一编码模块中进行编码处理, 得 到第一特 征向量; 第一训练单元, 用于根据所述第 一知识图谱和所述第 一特征向量对预设的第 二编码模 块进行训练 处理, 得到第三编码模块; 第二编码单元, 用于将所述第一知识图谱输入所述第三编码模块中进行编码处理, 得 到第二特 征向量; 第二训练单元, 用于将所述第二特征向量输入所述第一解码模块中进行训练处理, 得 到第二解码模块; 构建单元, 用于根据所述第三编码模块和所述第二 解码模块, 构建所述文本生成模型。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器和处理器, 所述存储器存储有 计算机程序, 所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的模型训练 方法, 或者实现权利要求6或7 所述的描述文本生成方法。 10.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 其特征在于, 所述计 算机程序被处理器执行时实现权利要求1至5任一项 所述的模 型训练方法, 或者实现权利要 求6或7所述的描述文本生成方法。权 利 要 求 书 2/2 页 3 CN 115422337 A 3

.PDF文档 专利 模型训练方法及装置、描述文本生成方法、设备、介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法及装置、描述文本生成方法、设备、介质 第 1 页 专利 模型训练方法及装置、描述文本生成方法、设备、介质 第 2 页 专利 模型训练方法及装置、描述文本生成方法、设备、介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。