专利一种适用于通信网现场维护的模型压缩方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210414566.3 (22)申请日 2022.04.15 (71)申请人北京邮电大学地址 100876 北京市海淀区西土城路10号 (72)发明人芮兰兰　高志鹏　杨思祺　杨杨　李文璟　 (74)专利代理机构北京挺立专利事务所(普通合伙) 11265 专利代理师高福勇 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称一种适用于通信网现场维护的模型压缩方法 (57)摘要本发明公开了一种适用于通信网现场维护的模型压缩方法，使用基于深度强化学习的模型剪枝算法和自适应聚类的模型量化算法对模型进行压缩，在保证模型精度的前提下压缩模型体积以及提升模型检测速度。基于深度强化学习的模型剪枝算法，以通信网现场维护模型性能作为需求约束，用深度确定性策略梯度的强化学习算法对模型各层的压缩比进行控制，实现自动通道剪枝，再进行层剪枝，在保证模型精度的前提下，从宽度和深度分别进行模型的压缩。自适应聚类的模型量化算法，用改进的BIRCH算法自动获取聚类的个数，使聚类个数的选取不再依赖先验知识，再通过K ‑meansII算法获取初始化质心，使聚类中心位置的选取不再具有盲目性，提升模型压缩比，大大减少模型存储体积。权利要求书3页说明书11页附图5页 CN 114819143 A 2022.07.29 CN 114819143 A 1.一种适用于通信网现场维护的模型压缩方法，其特征在于，使用基于深度强化学习的模型剪枝算法和自适应聚类的模型量化算法对模型进行压缩；其中，所述的基于深度强化学习的模型剪枝算法，以通信网现场维护模型性能作为需求约束，首先使用深度确定性策略梯度的深度强化学习算法对模型各层的压缩比进行控制，实现自动的通道剪枝，然后在此基础上进行层剪枝，从宽度和深度分别进行模型的压缩；所述的自适应聚类的模型量化算法，对剪枝后模型剩余的权重参数进行聚类，使得同一簇共用相同的权值，并使用改进的BIRCH算法自动获取聚类的个数，再通过K ‑meansII算法获取初始化质心，结合两种算法完成聚类。 2.根据权利要求1所述的适用于通信网现场维护的模型压缩方法，其特征在于，在通道剪枝的过程中，首先在训练时对待剪枝模型的BN层的尺度因子施加L1正则化，在训练网络的同时得到稀疏化的尺度因子，并裁掉低于指定阈值的通道。 3.根据权利要求2所述的适用于通信网现场维护的模型压缩方法，其特征在于， BN层的训练过程如下：针对每个最小批次的输入数据学习到平均值 μB和方差σB，令zin和zout作为一个BN层的输入和输出， B为当前最小批次，则经过BN层的输出如公式(1)所示：其中， γ为尺度因子， β 为平移因子，这两个参数都是训练网络模型时学到的参数；在目标函数中加入一个正则项，训练目标如下所示： L＝∑(x， y)l(f(x， W)， y)+λ∑γ∈Rg(γ) (2) 式(2)中第一项为训练损失函数，第二项为约束γ的正则项， λ是调节两项的稀疏系数， x为输入， y为目标输出， W 为权重参数。 4.根据权利要求3所述的适用于通信网现场维护的模型压缩方法，其特征在于，通道剪枝具体流程为：首先，使用公式(2)对模型进行稀疏训练，获取各个通道的尺度因子，并根据尺度因子大小进行排序，根据阈值或比例将尺度因子较小的通道进行裁剪，并进行微调，不断迭代直到达到剪枝要求。 5.根据权利要求1所述的适用于通信网现场维护的模型压缩方法，其特征在于，基于深度强化学习的模型通过模型的训练确定各层的剪枝率，具体过程为：首先，对模型通道剪枝问题抽象出深度强化学习中的环境状态S、个体动作A和环境奖励R；环境状态S：对每个卷积层，使用10个参数对状态进行描述： St＝(t， n， c， w， st rode， k， param s， params_reduce， at‑1) (3) t为卷积层层数， n表示输出通道数， c表示输入通道数， k表示卷积核的大小，卷积核的维度为n*c*k*k， h、 w表示输入特征图的维度， str ide表示卷积层的滑动步数， params表示第 t层的参数量， reduce表示先前层减去的参数量， at‑1表示先前层的剪枝率；个体动作A：使用连续的动作空间作为剪枝率， at∈(0， 1)；激励R：采用的奖励R的计算方式如公式(4)所示： R＝Accuracy*Complexity (4) 其中，第一项Ac curacy代表模型的准确率，第二项Complexity代表模型复杂度；权　利　要　求　书 1/3 页 2 CN 114819143 A 2第一项Ac curacy的计算公式如(5)所示：其中Δacc为初始模型和剪枝后模型的精度差值， b为一个超参数，用于保障模型的精度；第二项Complexity的计算公式如(6)所示： Complexity＝ ‑log( ηparams) (6) 其中ηparams为剪枝后与剪枝前的参数量比值，其范围在0到1之间； params代表模型的尺寸，表示模型的大小；使用深度确定性策略梯度方法进行各层剪枝比例的确定，将DQN中的随机策略πθ(s， a) ＝P(a|s， θ )≈ π(a|s)改写为公式(7)： πθ(s)＝a (7) 和环境交互的动作A 表达为： A＝ πθ(s)+N (8) 评价者网络的损失函数采用均方差的形式。参与者当前网络的损失函数为：通过软更新的方式对目标网络进行参数更新，具体方式如下： w′ ←τ w+(1‑τ )w′ (12) θ′ ←τ θ +(1‑τ )θ′ (13) 最终，经过迭代得到最佳剪枝策略。 6.根据权利要求1所述的适用于通信网现场维护的模型压缩方法，其特征在于，层剪枝过程中通过3 ×3卷积核的尺度因子判断是否需要剪掉整个residual结构。 7.根据权利要求1所述的适用于通信网现场维护的模型压缩方法，其特征在于，使用改进的BIRC H算法自动获取聚类的个数的步骤如下：步骤1：得到第一个数据点，创建一个新的叶子节点；步骤2：得到一个新数据点，遍历CF树各叶子节点，计算新数据点与各叶子节点中CF节点的距离，选取与新数据点距离最近的CF节点，并计算新数据点加入该CF节点后的半径是否满足阈值T，若满足阈值，合并新数据点，转到步骤4；若不满足，找到除第一次合并外距离最近的CF节点进行合并，若满足阈值，合并新数据点，转到步骤4；否则，新数据点单独作为一个CF节点；步骤3：在插入新CF节点后，如果CF树中有节点CF数大于L，则将当前节点进行分裂，创建一个新的节点作为当前叶子节点的兄弟节点，选择旧节点中距离最远的两个CF元组作为分裂后的两个新节点的初始CF节点，并根据距离远近将剩余CF元组分配到两个新的节点中，依次向上检查父节点是否需要分裂；步骤4：更新路径上所有节点CF值，如果已遍历完所有数据，结束；否则，则转到步骤2。 8.根据权利要求1所述的适用于通信网现场维护的模型压缩方法，其特征在于，通过K ‑权　利　要　求　书 2/3 页 3 CN 114819143 A 3

专利 一种适用于通信网现场维护的模型压缩方法

专利一种适用于通信网现场维护的模型压缩方法