全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210414566.3 (22)申请日 2022.04.15 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 (72)发明人 芮兰兰 高志鹏 杨思祺 杨杨  李文璟  (74)专利代理 机构 北京挺立专利事务所(普通 合伙) 11265 专利代理师 高福勇 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称 一种适用 于通信网现场维护的模型压缩方 法 (57)摘要 本发明公开了一种适用于通信网现场维护 的模型压缩 方法, 使用基于深度强化学习的模型 剪枝算法和自适应聚类的模型量化算法对模型 进行压缩, 在保证模型精度的前提下压缩模型体 积以及提升模 型检测速度。 基于深度强化学习的 模型剪枝算法, 以通信网现场维护模 型性能作为 需求约束, 用深度确定性策略梯度的强化学习算 法对模型各层的压缩比进行控制, 实现自动通道 剪枝, 再进行层剪枝, 在保证模型精度的前提下, 从宽度和深度分别进行模型的压缩。 自适应聚类 的模型量化算法, 用改进的BIRCH算法自动获取 聚类的个数, 使聚类个数的选取不再依赖先验知 识, 再通过K ‑meansII算法获取初 始化质心, 使聚 类中心位置的选取不再具有盲目性, 提升模型压 缩比, 大大减少模型存 储体积。 权利要求书3页 说明书11页 附图5页 CN 114819143 A 2022.07.29 CN 114819143 A 1.一种适用于通信网现场维护的模型压缩方法, 其特征在于, 使用基于深度强化学习 的模型剪枝算法和自适应聚类的模型量化算法对模型进行压缩; 其中, 所述的基于深度强 化学习的模型剪枝算法, 以通信网现场 维护模型性能作为需求约束, 首先使用深度确定性 策略梯度的深度强化学习算法对模型各层的压缩比进行控制, 实现自动的通道剪枝, 然后 在此基础上进行层剪枝, 从宽度和深度分别进行模型 的压缩; 所述的自适应聚类的模型量 化算法, 对剪枝后模 型剩余的权重参数进 行聚类, 使 得同一簇共用相同的权值, 并使用改进 的BIRCH算法自动获取聚类的个数, 再通过K ‑meansII算法获取初始化质心, 结合两种算法 完成聚类。 2.根据权利要求1所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 在通道 剪枝的过程中, 首先在训练时对待剪枝模型的BN层的尺度因子施加L1正则化, 在训练网络 的同时得到稀疏化的尺度因子, 并裁掉低于指定阈值的通道。 3.根据权利要求2所述的适用于通信网现场维护的模型压缩方法, 其特征在于, BN层的 训练过程如下: 针对每个最小批次的输入数据学习到平均值 μB和方差σB, 令zin和zout作为一个BN层的输 入和输出, B为当前最小批次, 则经 过BN层的输出如公式(1)所示: 其中, γ为尺度因子, β 为平 移因子, 这两个参数都是训练网络模型时学到的参数; 在目标函数中加入一个正则项, 训练目标如下 所示: L=∑(x, y)l(f(x, W), y)+λ∑γ∈Rg(γ)        (2) 式(2)中第一项为训练损失函数, 第二项为约束γ的正则项, λ是调 节两项的稀疏系数, x为输入, y为目标输出, W 为权重参数。 4.根据权利要求3所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 通道剪 枝具体流程为: 首先, 使用公式(2)对模 型进行稀疏训练, 获取各个通道的尺度因子, 并根据 尺度因子大小进行排序, 根据阈值 或比例将尺度因子较小的通道进 行裁剪, 并进 行微调, 不 断迭代直到 达到剪枝要求。 5.根据权利要求1所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 基于深 度强化学习的模型通过模型的训练确定各层的剪枝率, 具体过程 为: 首先, 对模型通道剪枝问题抽象出深度强化学习中的环境状态S、 个体动作A和环境奖 励R; 环境状态S: 对每 个卷积层, 使用10个参数对状态进行描述: St=(t, n, c, w, st rode, k, param s, params_reduce, at‑1)        (3) t为卷积层层数, n表示输出通道数, c表示输入通道数, k表示卷积核 的大小, 卷积核 的 维度为n*c*k*k, h、 w表示输入 特征图的维度, str ide表示卷积层的滑动步数, params表 示第 t层的参数量, reduce表示先 前层减去的参数量, at‑1表示先前层的剪枝率; 个体动作A: 使用连续的动作空间作为剪枝率, at∈(0, 1); 激励R: 采用的奖励R的计算方式如公式(4)所示: R=Accuracy*Complexity                (4) 其中, 第一项Ac curacy代 表模型的准确率, 第二项Complexity代 表模型复杂度;权 利 要 求 书 1/3 页 2 CN 114819143 A 2第一项Ac curacy的计算公式如(5)所示: 其中Δacc为初始模型和剪枝后模型的精度差值, b为一个超参数, 用于保障模型的精 度; 第二项Complexity的计算公式如(6)所示: Complexity= ‑log( ηparams)         (6) 其中ηparams为剪枝后与剪枝前的参数量比值, 其范围在0到1之间; params代表模型的尺 寸, 表示模型的大小; 使用深度确定性策略梯度方法进行各层剪枝比例的确定, 将DQN中的随机策略πθ(s, a) =P(a|s, θ )≈ π(a|s)改写为公式(7): πθ(s)=a               (7) 和环境交 互的动作A 表达为: A= πθ(s)+N            (8) 评价者网络的损失函数采用均方差的形式。 参与者当前网络的损失函数为: 通过软更新的方式对目标网络进行参数 更新, 具体方式如下: w′ ←τ w+(1‑τ )w′             (12) θ′ ←τ θ +(1‑τ )θ′             (13) 最终, 经过迭代得到最佳剪枝策略。 6.根据权利要求1所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 层剪枝 过程中通过3 ×3卷积核的尺度因子判断是否需要剪掉整个residual结构。 7.根据权利要求1所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 使用改 进的BIRC H算法自动获取聚类的个数的步骤如下: 步骤1: 得到第一个数据点, 创建一个新的叶子节点; 步骤2: 得到一个新数据点, 遍历CF树各叶子节点, 计算新数据点与各叶子节点中CF节 点的距离, 选取与新数据点距离最近的CF节点, 并计算新数据点加入该CF节点后的半径是 否满足阈值T, 若满足 阈值, 合并新数据点, 转到步骤4; 若不满足, 找到除第一次合并外距离 最近的CF节点进行合并, 若满足阈值, 合并新数据点, 转到步骤4; 否则, 新数据点单独作为 一个CF节点; 步骤3: 在插入新CF节点后, 如果CF树中有节点CF数大于L, 则将当前节点进行分裂, 创 建一个新的节点作为当前叶子节点的兄弟 节点, 选择旧节点中距离最远的两个CF元组作为 分裂后的两个新节点的初始CF节点, 并根据距离远近将剩余CF元组分配到两个新的节点 中, 依次向上检查父节点是否需要分裂; 步骤4: 更新路径上 所有节点CF值, 如果已遍历完所有数据, 结束; 否则, 则转到步骤2。 8.根据权利要求1所述的适用于通信网现场维护的模型压缩方法, 其特征在于, 通过K ‑权 利 要 求 书 2/3 页 3 CN 114819143 A 3

.PDF文档 专利 一种适用于通信网现场维护的模型压缩方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种适用于通信网现场维护的模型压缩方法 第 1 页 专利 一种适用于通信网现场维护的模型压缩方法 第 2 页 专利 一种适用于通信网现场维护的模型压缩方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:34:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。