专利自然语言处理方法、语言模型训练方法及其相关设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210423601.8 (22)申请日 2022.04.21 (71)申请人润联软件系统（深圳）有限公司地址 518000 广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园2栋801 (72)发明人王伟　张黔　陈焕坤　郑毅　 (74)专利代理机构深圳市世联合知识产权代理有限公司 4 4385 专利代理师姜妍 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) G06F 16/35(2019.01)G06F 16/36(2019.01) (54)发明名称自然语言处理方法、语言模型训练方法及其相关设备 (57)摘要本申请涉及人工智能技术领域，揭露了自然语言处理方法、语言模型训练方法及其相关设备，所述语言模型训练方法包括：获取语料集；利用多种特征提取模型对语料集进行特征提取，得到语料集中各文档对应的多个特征向量；基于各文档对应的多个特征向量，得到各文档对应的语义向量；将语料集中各文档对应的语义向量利用聚类模型进行聚类，得到多个语义簇；根据各语义簇分别对语言模型采用强化学习进行训练，最终得到各语义簇对应的训练后的语言模型的参数；根据各语义簇对应的训练后的语言模型的参数，以确定最终语言模型。本申请实现了提高语言模型的训练效率以及降低了训练过程中的资源消耗。权利要求书3页说明书13页附图5页 CN 114781611 A 2022.07.22 CN 114781611 A 1.一种语言模型训练方法，其特征在于，所述方法包括：获取语料集；利用多种特征提取模型对所述语料集进行特征提取，得到所述语料集中各文档对应的多个特征向量；基于各所述文档对应的多个所述特征向量，得到各所述文档对应的语义向量；将所述语料集中各文档对应的语义向量利用聚类模型进行聚类，得到多个语义簇；根据各语义簇分别对语言模型采用强化学习进行训练，最终得到各语义簇对应的训练后的语言模型的参数；根据各语义簇对应的训练后的语言模型的参数，以确定最终语言模型。 2.根据权利要求1所述的语言模型训练方法，其特征在于，所述多种特征提取模型包括隐含特征提取模型、主题特征提取模型和实体特征提取模型，所述利用多种特征提取模型对所述语料集进行特征提取，得到所述语料集中各文档对应的多个特征向量包括：通过所述隐含特征提取模型对所述语料集中的各所述文档进行隐含特征提取，得到各所述文档对应的第一特征向量；利用所述主题特征提取模型对所述语料集中的各文档进行主题特征提取，得到各所述文档对应的第二特征向量；利用所述实体特征提取模型对所述语料集中的各文档进行实体特征提取，得到各所述文档对应的第三特征向量。 3.根据权利要求2所述的语言模型训练方法，其特征在于，所述利用所述主题特征提取模型对所述语料集中的各文档进行主题特征提取，得到各所述文档对应的第二特征向量包括：通过所述主题特征提取模型对所述语料集中的各所述文档进行主题词提取，得到多个主题词并进行排列；将排列后的多个所述主题词，通过主题特征提取模型下的Bert模型进行向量化处理，得到各所述文档对应的第二特征向量。 4.根据权利要求2所述的语言模型训练方法，其特征在于，所述利用所述实体特征提取模型对所述语料集中的各文档进行实体特征提取，得到各所述文档对应的第三特征向量包括：通过实体特征提取模型中的命名实体识别技术和关系抽取技术识别各所述文档中的实体以及实体间的关系；基于所述实体以及实体间的关系，构建知识图谱；通过实体特征提取模型中的图卷积神经网络对所述知识图谱进行特征提取，得到第三特征向量。 5.根据权利要求2所述的语言模型训练方法，其特征在于，所述基于各所述文档对应的多个所述特征向量，得到各所述文档对应的语义向量包括：基于层次分析法获得所述第一特征向量、第二特征向量、第三特征向量的权重；根据所述第一特征向量、第二特征向量、第三特征向量的权重，对所述第一特征向量、第二特征向量、第三特征向量进行加权求和，得到所述文档对应的语义向量。 6.根据权利要求1所述的语言模型训练方法，其特征在于，所述根据各语义簇分别对语权　利　要　求　书 1/3 页 2 CN 114781611 A 2言模型采用强化学习进行训练包括：在每一训练周期中，当一语义簇对应的语言模型的性能指标达到预设阈值时，获取所述语言模型此时的状态信息，将所述语言模型的状态信息，向各语义簇对应的语言模型进行广播；各所述语义簇对应的语言模型在接收到所述状态信息后，更新自身的参数，并且根据选取概率选择处理路径；其中，所述选取概率为根据该训练周期所使用的多个语义向量经深度学习神经网络进行处理得到；根据各所述语义簇对应的语言模型选择的处理路径，给予不同的收益；根据各所述语言模型的收益，得到本训练周期的总收益；所述深度学习神经网络根据所述总收益进行调参，经过多个训练周期的训练，直至所述总收益收敛。 7.根据权利要求1所述的语言模型训练方法，其特征在于，所述根据各语义簇对应的训练后的语言模型的参数，以确定最终语言模型包括：当全部训练周期结束后，将各语义簇对应的语言模型最终的梯度数据汇总至同一语言模型对应的训练器；所述训练器根据所有语言模型对应的最终的梯度数据进行平均处理，得到平均梯度；将所述平均梯度发送至各所述语义簇对应的语言模型，以更新自身的参数，得到所述最终语言模型。 8.一种自然语言处理方法，其特征在于，所述方法包括：获取待处理文本数据；根据如权利要求1至7中任一所述的最终语言模型，对所述待处理文本数据进行处理，得到所述待处理文本数据对应的处理结果。 9.一种语言模型训练装置，其特征在于，所述装置包括：获取模块，用于获取语料集；特征提取模块，用于利用多种特征提取模型对所述语料集进行特征提取，得到所述语料集中各文档对应的多个特征向量；合并模块，用于基于各所述文档对应的多个所述特征向量，得到各所述文档对应的语义向量；聚类模块，用于将所述语料集中各文档对应的语义向量利用聚类模型进行聚类，得到多个语义簇；训练模块，用于根据各语义簇分别对语言模型采用强化学习进行训练，最终得到各语义簇对应的训练后的语言模型的参数；确定模块，用于根据各语义簇对应的训练后的语言模型的参数，以确定最终语言模型。 10.一种计算机设备，其特征在于，所述计算机设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一所述的语言模型训练方法。 11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机权　利　要　求　书 2/3 页 3 CN 114781611 A 3

专利 自然语言处理方法、语言模型训练方法及其相关设备

专利自然语言处理方法、语言模型训练方法及其相关设备