全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210734027.8 (22)申请日 2022.06.27 (71)申请人 腾讯音乐娱乐科技 (深圳) 有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 孙亚威 杜嘉晨 周蓝珺 潘树燊  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 杜维 (51)Int.Cl. G06F 16/953(2019.01) G06F 40/30(2020.01) (54)发明名称 音乐评论生 成方法、 装置及计算机可读存储 介质 (57)摘要 本申请实施例公开了一种音乐评论生成方 法、 装置及计算机可读 存储介质, 其中方法包括: 获取目标音乐的融合特征向量, 融合特征向量由 目标音乐的歌词特征向量和目标音乐的音频特 征向量拼接组成; 获取预设词表, 预设词表包含 预设置的多个词表字符; 依据目标音乐的融合特 征向量, 确定预设词表中每个词表字符生成目标 音乐的评论文本中各个评论字 符的概率; 基于各 个词表字符生成评论文本中各个评论字符的概 率, 得到目标音乐的评论文本。 本申请可 以提高 生成音乐评论的质量。 权利要求书3页 说明书21页 附图11页 CN 115080825 A 2022.09.20 CN 115080825 A 1.一种音乐评论 生成方法, 其特 征在于, 所述方法包括: 获取目标音乐的融合特征向量, 所述融合特征向量由所述目标音乐的歌词特征向量和 所述目标音乐的音频 特征向量拼接组成; 获取预设词表, 所述预设词表包 含预设置的多个词表字符; 依据所述目标音乐的融合特征向量, 确定所述预设词表中每个词表字符生成所述目标 音乐的评论文本中各个评论字符的概 率; 基于各个所述词表字符生成评论文本 中各个评论字符的概率, 得到所述目标音乐的评 论文本。 2.根据权利要求1所述的方法, 其特征在于, 所述依据所述目标音乐的融合特征向量, 确定所述预设词表中每个词表字符生成所述目标音乐的评论文本中各个评论字符的概率, 包括: 依据所述目标音乐的融合特征向量, 确定所述目标音乐的评论文本 中各个评论字符对 应的初始特 征向量; 将每个评论字符对应的初始特征向量输入训练完成的语言模型的自注意力层, 得到各 个所述评论字符对应的目标 特征向量; 基于所述预设词表 的映射规则, 对各个所述评论字符对应的目标特征向量进行映射, 得到所述预设词表中每 个词表字符生成各个评论字符的概 率。 3.根据权利要求2所述的方法, 其特征在于, 所述评论文本包括N个评论字符; 所述依据 所述目标音乐的融合特征向量, 确定所述目标音乐的评论文本中各个评论字符对应的初始 特征向量, 包括: 当N等于1时, 将所述目标音乐的融合特征向量确定为评论文本 中首个评论字符对应的 初始特征向量; 当N大于1时, 使用第N ‑1个评论字符的字符向量更新所述融合特征向量; 将更新后的融 合特征向量确定为评论文本中第N个评论字符对应的初始特 征向量。 4.根据权利要求1所述的方法, 其特征在于, 还包括: 确定所述目标音乐的评论文本中 各个评论字符对应的采样参数; 所述基于各个所述词表字符生成评论文本中各个评论字符的概率, 得到所述目标音乐 的评论文本, 包括: 针对每个所述评论字符, 依据 所述评论字符对应的采样参数和所述评论字符对应的各 个词表字符的概 率, 从所述预设词表选择 所述评论字符对应的词表子集; 针对每个所述评论字符, 从所述评论字符对应的词表子集中选取一个词表字符作为所 述评论字符; 将各个所述评论字符按顺序排列得到文本作为所述目标音乐的评论文本 。 5.根据权利要求4所述的方法, 其特征在于, 所述采样参数包括累计概率阈值P和概率 数量阈值K; 所述针对每个所述评论字符, 依据 所述评论字符对应的采样参数和所述评论字符对应 的各个词表字符的概 率, 从所述预设词表选择 所述评论字符对应的词表子集, 包括: 针对每个所述评论字符, 在所述预设词表中选择概率最大的前K个词表字符组成第一 待选词表子集;权 利 要 求 书 1/3 页 2 CN 115080825 A 2在所述第一待选词表子集中确定多个第二待选词表子集; 其中, 所述第二待选词表子 集中的词表字 符对应的概率之和大于或者等于P, 或者, 所述第二待选词表子集中的词表字 符与所述待选词表子集中的词表字符相同且所述待选词表子集中的词表字符对应的概率 之和小于P; 将包含词表字符的数量最少的所述第二待选词表子集作为所述评论字符对应的词表 子集。 6.根据权利要求4所述的方法, 其特征在于, 所述评论文本包括第 一类评论字符和第 二 类评论字符, 所述第一类评论字符在所述评论文本中位于第二类评论字符之前, 所述第一 类评论字符对应的采样参数的值大于所述第二类评论字符对应的采样参数的值。 7.根据权利要求1所述的方法, 其特征在于, 所述基于各个所述词表字符生成评论文本 中各个评论字符的概 率, 得到所述目标音乐的评论文本, 包括: 基于各个所述词表字符生成评论文本中首个评论字符的概率, 得到多个首个评论字 符; 分别生成每 个所述首个评论字符对应的可选 评论文本; 从多个所述可选 评论文本中选取一个可选 评论文本作为所述目标音乐的评论文本 。 8.根据权利要求7所述的方法, 其特征在于, 所述评论文本包括N个评论字符; 所述分别 生成每个所述首个评论字符对应的可选 评论文本, 包括: 针对每个所述首个评论字符, 按照下述步骤生成每个所述首个评论字符分别对应的可 选评论文本; 设置N为1; 使用第N评论字符的字符向量更新所述融合特征向量, 将更新后的融合特征向量输入 训练完成的语言模型的自注意力层, 得到第N+1评论字符对应的目标 特征向量; 基于所述预设词 表的映射规则, 对所述第N+1评论字符对应的目标特征向量进行映射, 得到所述预设词表中每 个词表字符生成第N+1评论字符的概 率; 基于各个所述词 表字符生成评论文本中第N+1评论字符的概率, 确定所述第N+1评论字 符; 若未满足所述可选评论文本的停止生成条件, 对N执行加1操作, 返回执行使用第N评论 字符的字符向量更新所述融合特 征向量的步骤; 若满足所述可选评论文本的停止生成条件, 将所述首个评论字符与确定的各个第N+1 评论字符排序后得到所述首个评论字符对应的可选 评论文本 。 9.根据权利要求1 ‑8中任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取所述目标音乐的歌词文本和音频 数据; 调用训练完成的语言模型的嵌入层对所述目标音乐的歌词文本进行向量编码, 以得到 所述目标音乐的歌词特 征向量; 调用训练完成的音频编码模型对所述目标音乐的音频数据进行向量编码, 以得到所述 目标音乐的音频 特征向量。 10.根据权利要求9所述的方法, 其特 征在于, 所述方法还 包括: 将训练音乐的训练歌词和训练评论进行拼接, 得到训练文本; 调用语言模型的嵌入层对所述训练文本进行向量编码, 得到第一文本特征向量; 调用权 利 要 求 书 2/3 页 3 CN 115080825 A 3

.PDF文档 专利 音乐评论生成方法、装置及计算机可读存储介质

文档预览
中文文档 36 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 音乐评论生成方法、装置及计算机可读存储介质 第 1 页 专利 音乐评论生成方法、装置及计算机可读存储介质 第 2 页 专利 音乐评论生成方法、装置及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。