专利深度学习应用的超参数优化方法、装置、设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111151286.X (22)申请日 2021.09.2 9 (71)申请人苏州浪潮智能科技有限公司地址 215100 江苏省苏州市吴中区吴中经济开发区郭巷街道官浦路1号9幢 (72)发明人王超　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 代理人薛娇 (51)Int.Cl. G06F 30/27(2020.01) G06F 30/25(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 111/06(2020.01) (54)发明名称深度学习应用的超参数优化方法、装置、设备及存储介质 (57)摘要本发明公开了一种深度学习应用的超参数优化方法、装置、设备及存储介质，该方法包括：获取多个粒子；基于多目标优化函数计算各粒子在目标组上的适应度值，并删除适应度值小于适应度阈值的粒子；如果当前粒子数量大于数量阈值，则删除势能最大的N个粒子，以使得粒子数量不大于数量阈值，否则，选择势能最小的粒子作为引导粒子，引导其他粒子移动；基于粒子的移动更新各粒子的位置，并返回执行基于多目标优化函数计算各粒子在目标组上的适应度值的步骤，直至达到预设要求为止，确定最终保留的各粒子均为优化所得参数数值。本申请利用基于数据场的多目标优化算法来寻求各项超参数与深度学习应用的最佳组合，有效加速深度学习部署效率。权利要求书2页说明书8页附图1页 CN 113901711 A 2022.01.07 CN 113901711 A 1.一种深度学习应用的超参数优化方法，其特征在于，包括：获取多个粒子；单个粒子包含随机为参数组中各超参数进行随机赋值所得数值组，所述参数组包含深度学习应用需配置的各项超参数；基于多目标优化函数计算各粒子在目标组上的适应度值，并删除适应度值小于适应度阈值的粒子；所述目标组包含深度学习应用需实现的加速深度学习部署效率对应各项性能目标；如果当前粒子数量大于数量阈值，则删除势能最大的N个粒子，以使得粒子数量不大于数量阈值，否则，选择势能最小的粒子作为引导粒子，引导其他粒子移动；任意粒子的势能为基于该任意粒子的位置计算得到的；基于粒子的移动更新各粒子的位置，并返回执行基于多目标优化函数计算各粒子在目标组上的适应度值的步骤，直至达到预设要求为止，确定最终保留的各粒子均为优化所得参数数值。 2.根据权利要求1所述的方法，其特征在于，基于多目标优化函数计算各粒子在目标组上的适应度值，包括：确定各粒子中任意粒子为当前粒子，基于各目标函数计算当前粒子在所述目标组中各性能目标上的适应度值，并对当前粒子在各性能目标上的适应度值进行加权求和计算，得到当前粒子在目标组上的适应度值。 3.根据权利要求2所述的方法，其特征在于，确定当前是否达到预设要求，包括：判断执行基于多目标优化函数计算各粒子在目标组上的适应度值的步骤的次数是否达到次数阈值，如果是，则确定当前达到预设要求，否则，确定当前未达到预设要求。 4.根据权利要求3所述的方法，其特征在于，获取多个粒子之后还包括：将获取的全部粒子均作为非支配解加入至外部解集中；基于多目标优化函数计算各粒子在目标组上的适应度值，包括：基于多目标优化函数计算所述外部解集中各粒子在目标组上的适应度值；删除相应的粒子，包括：从所述外部解集中删除相应的粒子；确定当前粒子数量是否大于数量阈值，包括：确定所述外部解集中粒子数量是否大于数量阈值。 5.根据权利要求 4所述的方法，其特征在于，获取参数组，包括：获取深度学习应用的配置运行信息，对所述配置运行信息进行数据清洗及数据标准化处理，并从进行数据清洗及数据标准化处理所得的信息中抽取各项超参数组成所述参数组。 6.根据权利要求5所述的方法，其特征在于，确定最终保留的各粒子均为优化所得参数数值之后，还包括：将最终保留的各粒子输出至指定终端。 7.根据权利要求6所述的方法，其特征在于，所述超参数包括算法模型种类、数据集种类、框架种类、训练方式、 GPU数量、 CPU数量、存储类型及网络类型，所述性能目标包括最短训练运行时间、最高资源利用率及最高网络带宽效率。 8.一种深度学习应用的超参数优化装置，其特征在于，包括：权　利　要　求　书 1/2 页 2 CN 113901711 A 2获取模块，用于：获取多个粒子；单个粒子包含随机为参数组中各超参数进行随机赋值所得数值组，所述参数组包含深度学习应用需配置的各项超参数；删除模块，用于：基于多目标优化函数计算各粒子在目标组上的适应度值，并删除适应度值小于适应度阈值的粒子；所述目标组包含深度学习应用需实现的加速深度学习部署效率对应各项性能目标；判断模块，用于：如果当前粒子数量大于数量阈值，则删除势能最大的N个粒子，以使得粒子数量不大于数量阈值，否则，选择势能最小的粒子作为引导粒子，引导其他粒子移动；任意粒子的势能为基于该任意粒子的位置计算得到的；迭代模块，用于：基于粒子的移动更新各粒子的位置，并指示所述删除模块执行基于多目标优化函数计算各粒子在目标组上的适应度值的步骤，直至达到预设要求为止，确定最终保留的各粒子均为优化所得参数数值。 9.一种深度学习应用的超参数优化设备，其特征在于，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述深度学习应用的超参数优化方法的步骤。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求 1至7任一项所述深度学习应用的超参数优化方法的步骤。权　利　要　求　书 2/2 页 3 CN 113901711 A 3

专利 深度学习应用的超参数优化方法、装置、设备及存储介质

专利深度学习应用的超参数优化方法、装置、设备及存储介质