专利音乐评论生成方法、装置及计算机可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210734027.8 (22)申请日 2022.06.27 (71)申请人腾讯音乐娱乐科技（深圳）有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室 (72)发明人孙亚威　杜嘉晨　周蓝珺　潘树燊　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师杜维 (51)Int.Cl. G06F 16/953(2019.01) G06F 40/30(2020.01) (54)发明名称音乐评论生成方法、装置及计算机可读存储介质 (57)摘要本申请实施例公开了一种音乐评论生成方法、装置及计算机可读存储介质，其中方法包括：获取目标音乐的融合特征向量，融合特征向量由目标音乐的歌词特征向量和目标音乐的音频特征向量拼接组成；获取预设词表，预设词表包含预设置的多个词表字符；依据目标音乐的融合特征向量，确定预设词表中每个词表字符生成目标音乐的评论文本中各个评论字符的概率；基于各个词表字符生成评论文本中各个评论字符的概率，得到目标音乐的评论文本。本申请可以提高生成音乐评论的质量。权利要求书3页说明书21页附图11页 CN 115080825 A 2022.09.20 CN 115080825 A 1.一种音乐评论生成方法，其特征在于，所述方法包括：获取目标音乐的融合特征向量，所述融合特征向量由所述目标音乐的歌词特征向量和所述目标音乐的音频特征向量拼接组成；获取预设词表，所述预设词表包含预设置的多个词表字符；依据所述目标音乐的融合特征向量，确定所述预设词表中每个词表字符生成所述目标音乐的评论文本中各个评论字符的概率；基于各个所述词表字符生成评论文本中各个评论字符的概率，得到所述目标音乐的评论文本。 2.根据权利要求1所述的方法，其特征在于，所述依据所述目标音乐的融合特征向量，确定所述预设词表中每个词表字符生成所述目标音乐的评论文本中各个评论字符的概率，包括：依据所述目标音乐的融合特征向量，确定所述目标音乐的评论文本中各个评论字符对应的初始特征向量；将每个评论字符对应的初始特征向量输入训练完成的语言模型的自注意力层，得到各个所述评论字符对应的目标特征向量；基于所述预设词表的映射规则，对各个所述评论字符对应的目标特征向量进行映射，得到所述预设词表中每个词表字符生成各个评论字符的概率。 3.根据权利要求2所述的方法，其特征在于，所述评论文本包括N个评论字符；所述依据所述目标音乐的融合特征向量，确定所述目标音乐的评论文本中各个评论字符对应的初始特征向量，包括：当N等于1时，将所述目标音乐的融合特征向量确定为评论文本中首个评论字符对应的初始特征向量；当N大于1时，使用第N ‑1个评论字符的字符向量更新所述融合特征向量；将更新后的融合特征向量确定为评论文本中第N个评论字符对应的初始特征向量。 4.根据权利要求1所述的方法，其特征在于，还包括：确定所述目标音乐的评论文本中各个评论字符对应的采样参数；所述基于各个所述词表字符生成评论文本中各个评论字符的概率，得到所述目标音乐的评论文本，包括：针对每个所述评论字符，依据所述评论字符对应的采样参数和所述评论字符对应的各个词表字符的概率，从所述预设词表选择所述评论字符对应的词表子集；针对每个所述评论字符，从所述评论字符对应的词表子集中选取一个词表字符作为所述评论字符；将各个所述评论字符按顺序排列得到文本作为所述目标音乐的评论文本。 5.根据权利要求4所述的方法，其特征在于，所述采样参数包括累计概率阈值P和概率数量阈值K；所述针对每个所述评论字符，依据所述评论字符对应的采样参数和所述评论字符对应的各个词表字符的概率，从所述预设词表选择所述评论字符对应的词表子集，包括：针对每个所述评论字符，在所述预设词表中选择概率最大的前K个词表字符组成第一待选词表子集；权　利　要　求　书 1/3 页 2 CN 115080825 A 2在所述第一待选词表子集中确定多个第二待选词表子集；其中，所述第二待选词表子集中的词表字符对应的概率之和大于或者等于P，或者，所述第二待选词表子集中的词表字符与所述待选词表子集中的词表字符相同且所述待选词表子集中的词表字符对应的概率之和小于P；将包含词表字符的数量最少的所述第二待选词表子集作为所述评论字符对应的词表子集。 6.根据权利要求4所述的方法，其特征在于，所述评论文本包括第一类评论字符和第二类评论字符，所述第一类评论字符在所述评论文本中位于第二类评论字符之前，所述第一类评论字符对应的采样参数的值大于所述第二类评论字符对应的采样参数的值。 7.根据权利要求1所述的方法，其特征在于，所述基于各个所述词表字符生成评论文本中各个评论字符的概率，得到所述目标音乐的评论文本，包括：基于各个所述词表字符生成评论文本中首个评论字符的概率，得到多个首个评论字符；分别生成每个所述首个评论字符对应的可选评论文本；从多个所述可选评论文本中选取一个可选评论文本作为所述目标音乐的评论文本。 8.根据权利要求7所述的方法，其特征在于，所述评论文本包括N个评论字符；所述分别生成每个所述首个评论字符对应的可选评论文本，包括：针对每个所述首个评论字符，按照下述步骤生成每个所述首个评论字符分别对应的可选评论文本；设置N为1；使用第N评论字符的字符向量更新所述融合特征向量，将更新后的融合特征向量输入训练完成的语言模型的自注意力层，得到第N+1评论字符对应的目标特征向量；基于所述预设词表的映射规则，对所述第N+1评论字符对应的目标特征向量进行映射，得到所述预设词表中每个词表字符生成第N+1评论字符的概率；基于各个所述词表字符生成评论文本中第N+1评论字符的概率，确定所述第N+1评论字符；若未满足所述可选评论文本的停止生成条件，对N执行加1操作，返回执行使用第N评论字符的字符向量更新所述融合特征向量的步骤；若满足所述可选评论文本的停止生成条件，将所述首个评论字符与确定的各个第N+1 评论字符排序后得到所述首个评论字符对应的可选评论文本。 9.根据权利要求1 ‑8中任一项所述的方法，其特征在于，所述方法还包括：获取所述目标音乐的歌词文本和音频数据；调用训练完成的语言模型的嵌入层对所述目标音乐的歌词文本进行向量编码，以得到所述目标音乐的歌词特征向量；调用训练完成的音频编码模型对所述目标音乐的音频数据进行向量编码，以得到所述目标音乐的音频特征向量。 10.根据权利要求9所述的方法，其特征在于，所述方法还包括：将训练音乐的训练歌词和训练评论进行拼接，得到训练文本；调用语言模型的嵌入层对所述训练文本进行向量编码，得到第一文本特征向量；调用权　利　要　求　书 2/3 页 3 CN 115080825 A 3

专利 音乐评论生成方法、装置及计算机可读存储介质

专利音乐评论生成方法、装置及计算机可读存储介质