全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111671005.3 (22)申请日 2021.12.31 (71)申请人 深圳友一 生物科技有限公司 地址 518115 广东省深圳市龙岗区园山 街 道安良社区油田路28号B1栋80 5 申请人 中国科学技术大学 (72)发明人 任维 姚鹏 徐亮 陈明潇  (74)专利代理 机构 北京凯特来知识产权代理有 限公司 1 1260 代理人 郑立明 韩珂 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (54)发明名称 针对类别不均衡数据集的网络训练方法 (57)摘要 本发明公开了一种针对类别不均衡数据集 的网络训练方法, 包括: 获取目标图像数据集, 确 定类别数目和每类样本量; 利用每类样本量计算 相应类别的权值, 并结合设置的超参数构建限制 误差损失函数; 利用所述目标图像数据集对神经 网络模型进行训练, 并将样本的预测结果与真实 标签带入所述限制误差损失函数进行误差计算, 使用反向传播不断更新神经网络模 型的参数, 直 至网络收敛达到预期目标。 构建的限制误差损失 函数按类别数量进行加权, 并且通过引入超参数 对尾部泛化进行正则化的LDA M, 可以将训练的关 注度更多的偏向于数量较少的尾部类别, 防止网 络训练对尾部类欠拟合, 可以应用于不均衡的 图 像数据集中, 并可以显著提高网络对于不均衡数 据集的识别准确度。 权利要求书2页 说明书5页 附图2页 CN 114332539 A 2022.04.12 CN 114332539 A 1.一种针对类别不均衡数据集的网络训练方法, 其特 征在于, 包括: 获取目标图像数据集, 确定类别数目和每 类样本量; 利用每类样本量计算相应 类别的权值, 并结合设置的超参数构建限制误差损失函数; 利用所述目标图像数据集对神经网络模型进行训练, 并将样本的预测结果与真实标签 带入所述限制误差损失函数进行误差计算, 使用反向传播不断更新神经网络模型 的参数, 直至网络收敛达 到预期目标。 2.根据权利要求1所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 所 述限制误差损失函数表示 为: 其中, z=[z1, ..., zC], zj表示样本在类别j上的预测值, C表示类别数目, y表示真实标 签; Ny表示真实标签对应的样本量, 即为相应类别的权值wy; Loss(z, y)为结合超参数计 算的损失函数。 3.根据权利要求2所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 损 失函数Loss(z, y)计算方式表示 为: 其中, γ与T均为超参数, γ用来调 节样本权重降低的速率, T是用于判断样本是否是异 常样本的阈值; σ 是一个由超参数T决定的常值; py表示网络预测样本为真实标签的概 率。 4.根据权利要求3所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 参 数py采用LDAM方法来计算, 表示 为: 其中, S为超参数, e为自然常数。 5.根据权利要求3所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 常 值σ 的计算方式表示 为: σ =(1‑T)γlog(T)。 6.根据权利要求1所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 所 述目标图像数据集为类别不均衡数据集, 并且, 同一类别中的样本也分为困难样本和简单 样本, 所述困难样本是指预测时与真实标签误差超过设定最大阈值的样本, 简单样本是指 预测时与真实标签误差未超过设定最小阈值的样本; 同时, 所述 目标图像数据集中还包含 异常样本, 所述异常样本包括: 通过数据增广操作产生的前景消失的样本或者只包含前景 区域小于设定值的样本, 或者是 标签错误的样本 。 7.根据权利要求3所述的一种针对类别不均衡数据集的网络训练方法, 其特征在于, 所 述超参数γ取值大于0, 取值越 大, 表示简单样本的权重相对于困难样本的权重降低速率越 快, 训练过程将更加关注困难样本的分类; 所述超参数T, 取值越大, 则会将更多的样 本认定 为异常样本;权 利 要 求 书 1/2 页 2 CN 114332539 A 2其中, 所述困难样本是指预测时与真实标签误差超过设定最大阈值的样本, 简单样本 是指预测时与真实标签误差未超过设定最小阈值的样本; 所述异常样本包括: 通过数据增 广操作产生的前景消失的样本或者只包含前景区域小于 设定值的样本, 或者是标签错误的 样本。 8.根据权利要求1或2或3所述的一种针对类别不均衡数据集的网络训练方法, 其特征 在于, 所述超参数 预先利用目标图像数据集设定, 在训练过程中进行 数值优化。权 利 要 求 书 2/2 页 3 CN 114332539 A 3

.PDF文档 专利 针对类别不均衡数据集的网络训练方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 针对类别不均衡数据集的网络训练方法 第 1 页 专利 针对类别不均衡数据集的网络训练方法 第 2 页 专利 针对类别不均衡数据集的网络训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:52:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。