全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211248297.4 (22)申请日 2022.10.12 (71)申请人 阿里巴巴 (中国) 有限公司 地址 311121 浙江省杭州市余杭区五常街 道文一西路969号3幢5层5 54室 (72)发明人 阮诗斯 唐俊杰 孙振起 田宸宇  李家乐 赵文迪 曹远 王雨欣  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 靳玫 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/253(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种导航播报 语句生成网络的训练方法、 装 置及设备 (57)摘要 本说明书提供一种导航播报语句生成网络 的训练方法、 装置及设备, 获取带有风格的导航 播报语句集合; 其中, 所述导航播报语句集合中 的每个带有风格的导航播报语句具有对应的风 格信息和以下至少一种: 场景信息和关联信息; 生成第一训练样本集, 所述第一训练样本集中的 每个训练样本以带有风格的导航播报语句对应 的无风格的导航播报语句, 以及该带有风格的导 航播报语句对应的风格信息、 场景信息和关联信 息作为特征值, 以该带有风格的导航播报语句作 为标签; 基于已完成预训练的通用语句生成网 络, 通过所述第一训练样本集更新所述通用语句 生成网络, 得到导 航播报语句生成网络 。 权利要求书3页 说明书18页 附图2页 CN 115545010 A 2022.12.30 CN 115545010 A 1.一种导 航播报语句生成网络的训练方法, 包括: 获取带有风格的导航播报语句集合; 其中, 所述导航播报语句集合中的每个带有风格 的导航播报语句具有对应的风格信息和以下至少一种: 场景信息和关联信息, 所述场景信 息用于表征触发播报该导航播报 语句的事件, 所述关联信息用于表征导航播报语句中相互 关联的至少两个词; 生成第一训练样本集, 所述第 一训练样本集中的每个训练样本以带有风格的导航播报 语句对应的无风格的导航播报语句, 以及该带有风格的导航播报语句对应的风格信息、 场 景信息和关联信息作为特 征值, 以该 带有风格的导 航播报语句作为标签; 基于已完成预训练的通用语句生成网络, 通过所述第 一训练样本集更新所述通用语句 生成网络, 得到导航播报语句生成网络, 所述通用语句生成网络用于基于输入的不完整语 句生成该不完整语句对应的完整语句, 所述导航播报 语句生成网络用于基于无风格的导航 播报语句生成带有风格的导 航播报语句。 2.根据权利要求1所述的方法, 在更新所述 通用语句生成网络之前, 所述方法还 包括: 确定带有风格的导航播报语句中风格信 息对应的表达特征, 以及获取该风格信 息对应 的非导航播报语句; 将每个带有风格的导航播报语句中风格信 息对应的表达特征进行掩码处理, 并将处理 后的带有风格的导 航播报语句与获取的非导 航播报语句进行拼接, 得到第二训练样本集; 针对已通过非导航播报语句完成预训练的初始语句生成网络, 通过所述第 二训练样本 集继续进行 预训练, 得到所述已完成预训练的通用语句生成网络 。 3.根据权利要求2所述的方法, 所述确定带有风格的导航播报语句中风格信息对应的 表达特征, 包括: 针对每个带有风格的导航播报语句, 将该带有风格的导航播报语句分为至少一个播报 短句; 确定每个播报短句中的停用词和每个播报短句的停用词占比, 将停用词占比大于预设 阈值的播报短句作为 风格信息对应的表达特 征。 4.根据权利要求1所述的方法, 所述基于已完成预训练的通用语句生成网络, 通过所述 第一训练样本集更新所述 通用语句生成网络, 得到导 航播报语句生成网络, 包括: 基于已完成预训练的通用语句生成网络, 通过所述第 一训练样本集包括的第 一子集更 新所述通用语句生成网络, 得到第一网络; 所述第一子集中的训练样本以带有风格的导航 播报语句作为标签, 以无风格的导 航播报语句以及所述标签对应的风格信息作为特 征值; 通过所述第一训练样本集包括的第二子集更新所述第一网络, 得到第二网络; 所述第 二子集中的训练样本以带有风格的导航播报 语句作为标签, 以无风格的导航播报 语句以及 所述标签对应的风格信息和场景信息作为特 征值; 通过所述第 一训练样本集包括的第 三子集更新所述第 二网络, 得到所述导航播报语句 生成网络; 所述第三子集中的训练样本以带有风格的导航播报语句作为标签, 以无风格的 导航播报语句以及所述标签对应的风格信息、 场景信息和关联信息作为特 征值。 5.根据权利要求1所述的方法, 所述第 一训练样本集中的带有风格的导航播报语句, 通 过如下方式生成: 生成第三训练样本集, 所述第 三训练样本集中的训练样本以带有风格的导航播报语句权 利 要 求 书 1/3 页 2 CN 115545010 A 2作为标签, 以无风格的导航播报 语句以及所述标签对应的风格信息、 播报主语、 谓语和实体 作为特征值; 通过所述第 三训练样本集, 对已通过非导航播报语句完成预训练 的初始语句生成网络 进行更新, 得到样本生成网络; 将无风格的导航播报语句与期望的风格信 息作为输入, 基于所述样本生成网络生成所 述第一训练样本集中的带有风格的导 航播报语句。 6.根据权利要求5所述的方法, 所述方法还包括: 从获取的第三训练样本集的带有风格的导航播报语句中, 确定与每 条带有风格的导 航播报语句的相似度大于预设相似度阈值的相似导 航播报语句; 所述生成第三训练样本集, 包括: 生成第三训练样本集, 所述第 三训练样本集中的训练样本以带有风格的导航播报语句 或确定的相似导航播报 语句作为标签, 以无风格的导航播报 语句以及所述标签对应的风格 信息、 播报主语、 谓语和实体作为特 征值。 7.一种导 航播报语句的生成方法, 所述方法包括: 获取网络输入信 息, 所述网络输入信 息包括: 第 一导航播报语句、 以及期望生成的导航 播报语句的风格信息和导 航信息, 所述第一 导航播报语句为无风格 语句; 将所述网络输入信 息输入导航播报语句生成网络, 得到所述导航播报语句生成网络输 出的第二导航播报语句, 所述第二导航播报语句是与第一导航播报语句对应的带风格语 句; 所述导航播报语句生成网络通过权利要求1 ‑6任一所述的方法训练得到 。 8.一种导 航播报语句生成网络的训练装置, 包括: 语句集合获取模块, 用于获取带有风格的导航播报语句集合; 其中, 所述导航播报语句 集合中的每个带有风格的导航播报语句具有对应的风格信息和以下至少一种: 场景信息和 关联信息, 所述场景信息用于表征触发播报该导航播报语句的事件, 所述关联信息用于表 征导航播报语句中相互关联的至少两个词; 样本集生成模块, 用于生成第一训练样本集, 所述第一训练样本集中的每个训练样本 以带有风格的导航播报 语句对应的无风格的导航播报 语句, 以及该带有风格的导航播报 语 句对应的风格信息、 场景信息和关联信息作为特征值, 以该带有风格的导航播报语句作为 标签; 网络更新模块, 用于基于已完成预训练的通用语句生成网络, 通过所述第一训练样本 集更新所述通用语句生成网络, 得到导航播报语句生成网络, 所述通用语句生成网络用于 基于输入的不完整语句生成该不完整语句对应的完整语句, 所述导航播报语句生成网络用 于基于无风格的导 航播报语句生成带有风格的导 航播报语句。 9.一种导 航播报语句的生成装置, 包括: 输入信息获取模块, 用于获取网络输入信 息, 所述网络输入信 息包括: 第 一导航播报语 句、 以及期望生成的导航播报语句的风格信息和导航信息, 所述第一导航播报语句为无风 格语句; 语句生成模块, 用于将所述网络输入信息输入导航播报语句生成网络, 得到所述导航 播报语句生成网络输出的第二导航播报 语句, 所述第二导航播报 语句是与第一导航播报 语 句对应的带风格语句; 所述导航播报语句生成网络通过权利要求1 ‑6任一所述的方法训练权 利 要 求 书 2/3 页 3 CN 115545010 A 3

PDF文档 专利 一种导航播报语句生成网络的训练方法、装置及设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种导航播报语句生成网络的训练方法、装置及设备 第 1 页 专利 一种导航播报语句生成网络的训练方法、装置及设备 第 2 页 专利 一种导航播报语句生成网络的训练方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。