说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211392590.8 (22)申请日 2022.11.08 (71)申请人 荣耀终端 有限公司 地址 518040 广东省深圳市福田区香蜜湖 街道东海社区红荔西路8089号深业中 城6号楼A单元3401 (72)发明人 姚万欣 (74)专利代理 机构 北京中博世 达专利商标代理 有限公司 1 1274 专利代理师 申健 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 神经网络模型压缩方法、 装置和系统 (57)摘要 本申请公开一种神经网络模 型压缩方法、 装 置和系统, 用于实现非结构化剪枝、 量化感知训 练、 蒸馏训练相结合, 可提升模型性能, 减少模型 的精度损失。 模型训练方法包括: 根据训练数据 集合对第一神经网络模型和第二神经网络模型 进行训练直至收敛, 第一神经网络模 型的第一卷 积层包括第一伪量化节点、 第二伪量化节点; S2、 对第一神经网络模型的第二卷积层进行非结构 化剪枝, 直至进行非结构化剪枝的第二卷积层的 稀疏度均达到第一目标稀 疏度; 将第二神经网络 模型作为老师对第一神经网络模型进行蒸馏量 化训练, 直到满足蒸馏量化训练结束条件; 如果 不再进行非结构化剪枝, 则结束非结构化剪枝的 迭代过程, 否则增加第一目标稀疏度, 并重新开 始执行步骤S2。 权利要求书2页 说明书14页 附图4页 CN 115496207 A 2022.12.20 CN 115496207 A 1.一种神经网络模型压缩方法, 其特 征在于, 包括: S1、 根据训练数据集合对第一神经网络模型和第二神经网络模型进行训练直至收敛, 所述第二神经网络模型的结构复杂度高于所述第一神经网络模型的结构复杂度; 训练后的 所述第一神经网络模型 的第一卷积层中包括第一伪量化节点、 第二伪量化节点, 所述第一 伪量化节点用于在所述第一卷积层的权重和输入的特征图进 行卷积运算前, 对所述第一卷 积层的权重进 行量化和反量化, 所述第二伪量化节点用于在所述第一卷积层的权重和输入 的特征图进行 卷积运算前, 对输入的特 征图进行量 化和反量 化; S2、 对所述第一神经网络模型的第二卷积层进行非结构化剪枝, 直至进行非结构化剪 枝的第二卷积层的稀疏度均达 到第一目标稀疏度; S3、 将所述第二神经网络模型作为老师对所述第一神经网络模型进行蒸馏量化训练, 直到满足蒸馏量 化训练结束条件; S4、 判断是否继续进行非结构化剪枝, 如果不再进行非结构化剪枝, 则结束非结构化剪 枝的迭代过程, 否则增 加所述第一目标稀疏度, 并重新 开始执行步骤S2。 2.根据权利要求1所述的方法, 其特征在于, 所述蒸馏量化训练 的训练轮次随着所述第 二卷积层的稀疏度的增 加而增加。 3.根据权利要求1或2所述的方法, 其特征在于, 所述判断是否继续进行非结构化剪枝, 包括: 如果所有进行非结构化剪枝的第二卷积层的稀疏度与增量稀疏度之和均大于第二目 标稀疏度, 则不再进 行非结构化剪枝, 否则进行下一轮非结构化剪枝, 所述第二目标稀疏度 大于或等于所述第一目标稀疏度。 4.根据权利要求1或2所述的方法, 其特征在于, 对所述第二卷积层进行非结构化剪枝 时, 按照所述第二卷积层的有效权重的绝对值从小到大的顺序对所述第二卷积层的有效权 重进行置零, 所述有效权 重指在之前 所有的非结构化剪枝过程中, 未被置零的权 重; 其中, 非结构化剪枝过程中, 所述第 二卷积层中已经置零的权重参数, 在蒸馏量化训练 过程中保持不变。 5.根据权利要求1或2所述的方法, 其特征在于, 所述满足蒸馏量化训练结束条件指训 练轮次达到轮次 门限并且损失函数的值小于损失门限, 所述损失函数的值用于衡量所述第 一神经网络模型与所述第二神经网络模型在输入相同训练数据集合的条件 下, 输出结果的 差别。 6.根据权利要求1或2所述的方法, 其特 征在于, 所述方法还 包括: 在进行蒸馏量 化训练时, 更新所述第一神经网络模型的所有层的参数; 其中, 所述第一神经网络模型的所有层的参数包括: 所述第一卷积层中所述第一伪量 化节点的参数和所述第二伪量 化节点的参数。 7.根据权利要求1或2所述的方法, 其特征在于, 所述第一卷积层包括所述第一神经网 络模型中、 全部或部 分支持量化的卷积层; 所述第二卷积层包括所述第一神经网络模型中、 全部或部分卷积层; 其中, 所述第 一卷积层与所述第 二卷积层相同, 或者, 所述第一卷积层与 所述第二卷积 层不同。 8.一种神经网络模型压缩装置, 其特征在于, 包括处理器和存储器, 所述存储器中存储权 利 要 求 书 1/2 页 2 CN 115496207 A 2指令, 当所述处 理器执行所述指令时, 如权利要求1 ‑7任一项所述的方法被执 行。 9.一种神经网络模型压缩系统, 其特征在于, 包括电子设备以及如权利要求8所述的神 经网络模型压缩 装置; 所述神经网络模型压缩装置压缩神经网络模型后发送给所述电子设备, 由所述电子设 备运行压缩后的神经网络模型。 10.一种计算机可读存储介质, 其特征在于, 包括指令, 当所述指令在神经网络模型压 缩装置上执行时, 使得 所述神经网络模型压缩 装置执行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115496207 A 3
专利 神经网络模型压缩方法、装置和系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:23:52
上传分享
举报
下载
原文档
(654.3 KB)
分享
友情链接
T-CEC 5074—2022 抽水蓄能电站工程施工总进度编制导则.pdf
NY-T 3001-2016 饲料中氨基酸的测定 毛细管电泳法.pdf
NY-T 3866-2021 草地贪夜蛾测报技术规范.pdf
GB-T 24353-2022 风险管理指南 .pdf
YD-T 1721-2008 电信网和互联网灾难备份及恢复实施指南.pdf
GB-T 1311-2008 直流电机试验方法.pdf
T-DZJN 80—2022 数据中心用锂离子电池设备产品技术标准.pdf
DB22-T 3541-2023 日间手术中心护理质量安全管理规范 吉林省.pdf
绿盟 2020 数据安全前沿技术研究报告.pdf
DB23-T 3477—2023 黑龙江省企业数字化采购指南 黑龙江省.pdf
DB11-T 2046.1-2022 智慧停车系统技术要求 第1部分:总则 北京市.pdf
GB-T 22551-2023 旅居车辆 居住要求.pdf
GB-T 15478-2015 压力传感器性能试验方法.pdf
CB-T 4521-2022 船舶行业企业工业管道和气体橡胶软管安全管理规定.pdf
GB-T 39608-2020 基础地理信息数字成果元数据.pdf
GB-T 29242-2012 信息安全技术 鉴别与授权 安全断言标记语言.pdf
T-CSAE 76—2018 纯电动汽车再生制动能量回收效能 快速评价及试验方法.pdf
GB-T 41817-2022 信息安全技术 个人信息安全工程指南.pdf
ISO27001-2013 安言咨询.pdf
T-CAAMM 23—2018 自走式喷杆喷雾机 技术条件.pdf
交流群
-->
1
/
21
评价文档
赞助2元 点击下载(654.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。