全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211012375.0 (22)申请日 2022.08.23 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 曹宜超 丁建辉 陈珍  (74)专利代理 机构 北京银龙知识产权代理有限 公司 11243 专利代理师 张圣孝 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/08(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型训练方法、 货物堆放的优化方法、 装置 和电子设备 (57)摘要 本公开提供了一种模 型训练方法、 货物 堆放 的优化方法、 装置和电子设备, 涉及数据处理领 域, 尤其涉及深度学习技术领域。 具体实现方案 为: 模型训练方法, 包括: 获取k个训练数据组, k 个训练数据组为按照k个分类类别对训练数据集 中的初始训练数据进行分类得到的k个训练数据 组, k个分类类别与k种货物堆放优化函数的函数 类别相对应; 基于k个训练数据组, 分别对k个预 先构建的神经网络模型进行训练, 得到k个目标 神经网络模型, 其中, 目标神经网络模型为基于 所对应的训练数据组进行训练得到的模型, 且在 对货物堆放优化函数进行混合整数规划的过程 中, 目标神经网络模型用于预测决策变量。 本公 开可以优化货物堆 放的流程。 权利要求书4页 说明书15页 附图5页 CN 115470971 A 2022.12.13 CN 115470971 A 1.一种模型训练方法, 包括: 获取k个训练数据组, 所述k个训练数据组为按照k个分类类别对训练数据集中的初始 训练数据进行分类得到的k个训练数据 组, 所述k个分类类别与k种货物堆放优化函数 的函 数类别相对应, 所述 k为大于1的整数; 基于所述k个训练数据组, 分别 对k个预先构建的神经网络模型进行训练, 得到k个目标 神经网络模型, 其中, 所述k个训练数据组与所述k个目标神经网络模 型一一对应, 所述目标 神经网络模型为基于所对应的训练数据组进 行训练得到的模型, 且在 对所述货物堆放优化 函数进行混合整数规划的过程中, 所述目标神经网络模型用于预测决策变量。 2.根据权利要求1所述的方法, 其中, 所述获取k个训练数据组, 包括: 获取所述训练数据集, 所述训练数据集包括多个初始训练数据, 所述初始训练数据包 括所对应的货物堆 放优化函数的函数信息; 基于所述函数信息对应的目标参数对所述多个初始训练数据进行分类, 得到所述k个 训练数据组; 其中, 所述目标参数包括以下参数中的至少一项: 整数变量占总变量的比例、 连续变量 占总变量的比例、 隐整 数变量占总变量的比例、 二进制变量占总变量的比例、 不等式约束个 数占总约束个数的比例、 变量总个数和约束总个数。 3.根据权利要求1所述的方法, 其中, 所述基于所述k个训练数据组, 分别对k个预先构 建的神经网络模型进行训练, 得到k个目标神经网络模型, 包括: 基于混合整数规划求解器, 利用第一训练数据组中的第一初始训练数据, 对第一神经 网络模型进行n次迭代训练, 得到第一目标神经网络模型, 所述 n为大于1的整数; 其中, 所述第 一训练数据组为所述k个训练数据组中的任意一个训练数据组, 所述第一 目标神经网络模型为所述k个目标神经网络模型中与所述第一训练数据组相对应的目标神 经网络模型; 所述第一神经网络模型用于对所接收到的第 一函数信 息进行混合整数规划的过程中, 确定求解树的各节点的决策变量; 所述第一初始训练数据包括所述第一函数信息和求解树 中各分支节点对应的目标决策变量的标签数据, 所述第一函数信息包括: 以在第一货仓中 堆放的第一货物的数量 最多为优化目标确定的函数信息 。 4.根据权利要求3所述的方法, 其中, 所述 n次迭代训练中的第s次训练包括: 将第s个训练数据输入第s个神经网络模型, 得到所述第s个神经网络模型输出的第s个 决策变量, 所述第s个决策变量 为与所述 求解树中的第s个节点相对应的决策变量; 将所述第s个训练数据和所述第s个决策变量输入所述混合整数规划求解器进行预测, 得到预测结果; 基于所述预测结果与理论结果 生成第s个回报值; 基于所述第s个回报值对所述第s个神经网络模型进行更新, 得到第s+1个神经网络模 型; 在所述s等于1的情况下, 所述第s个训练数据为所述第一初始训练数据, 所述第s个神 经网络模型为所述第一神经网络模型; 在所述s不等于1的情况下, 所述第s个训练数据为基于第s ‑1个神经网络模型输出的决 策变量对第s ‑1个训练数据进行 更新之后得到的训练数据。权 利 要 求 书 1/4 页 2 CN 115470971 A 25.根据权利要求4所述的方法, 其中, 所述基于所述第s个回报值对所述第s个神经网络 模型进行 更新, 得到第s+1个神经网络模型, 包括: 基于目标回报值对所述第s个神经网络模型进行 更新, 得到第s+1个神经网络模型; 其中, 在所述第s个回报值小于或等于第一阈值的情况下, 所述目标回报值为基于第一 缩放函数对所述第s个回报值进行放大之后, 得到的回报值; 在所述s大于所述第一阈值, 且所述s小于第二阈值的情况下, 所述目标回报值为所述 第s个回报值; 在所述第s个回报值大于或等于所述第二阈值的情况下, 所述目标回报值为基于第二 缩放函数对所述第s个回报值进行缩小之后, 得到的回报值。 6.一种货物堆 放的优化方法, 包括: 获取第二函数信息和第二决策变量集, 所述第二函数信息包括: 以在第二货仓中堆放 的第二货物的数量 最多为优化目标确定的函数信息; 确定所述第 二函数信 息的函数类别, 其中, 所述第 二函数信 息的函数类别为k个分类类 别中的类别; 在k个目标神经网络模型中确定与 所述第二函数信 息的函数类别相对应的第 二目标神 经网络模型; 将所述第二函数信息和所述第二决策变量集输入所述第二目标神经网络模型进行预 测, 得到预测结果, 且所述预测结果用于指示在对所述第二函数信息进行混合整数规划的 过程中, 求解树中的分支节点对应的决策变量, 且所述决策变量为所述第二决策变量集中 的决策变量; 基于所述预测结果对所述第二函数信息进行混合整数规划, 得到堆放信息, 所述堆放 信息用于指示所述第二货物在所述第二货仓中的堆 放方式。 7.一种模型训练装置, 包括: 获取模块, 用于获取k个训练数据组, 所述k个训练数据组为按照k个分类类别 对训练数 据集中的初始训练数据进行分类得到的k个训练数据 组, 所述k个分类类别与k种货物堆放 优化函数的函数类别相对应, 所述 k为大于1的整数; 训练模块, 用于基于所述k个训练数据组, 分别对k个预先构建的神经网络模型进行训 练, 得到k个目标神经网络模型, 其中, 所述k个训练数据 组与所述k个目标神经网络模型一 一对应, 所述 目标神经网络模型为基于所对应的训练数据组进行训练得到的模型, 且在对 所述货物堆放优化函数进 行混合整数规划的过程中, 所述目标神经网络模 型用于预测决策 变量。 8.根据权利要求7 所述的装置, 其中, 所述获取模块, 包括: 获取子模块, 用于获取所述训练数据集, 所述训练数据集包括多个初始训练数据, 所述 初始训练数据包括所对应的货物堆 放优化函数的函数信息; 分类子模块, 用于基于所述函数信 息对应的目标参数对所述多个初始训练数据进行分 类, 得到所述 k个训练数据组; 其中, 所述目标参数包括以下参数中的至少一项: 整数变量占总变量的比例、 连续变量 占总变量的比例、 隐整 数变量占总变量的比例、 二进制变量占总变量的比例、 不等式约束个 数占总约束个数的比例、 变量总个数和约束总个数。权 利 要 求 书 2/4 页 3 CN 115470971 A 3

.PDF文档 专利 模型训练方法、货物堆放的优化方法、装置和电子设备

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、货物堆放的优化方法、装置和电子设备 第 1 页 专利 模型训练方法、货物堆放的优化方法、装置和电子设备 第 2 页 专利 模型训练方法、货物堆放的优化方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:27:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。