全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210910127.1 (22)申请日 2022.07.29 (71)申请人 北京市商汤科技 开发有限公司 地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人 马冰奇 宋广录 刘博晓 刘宇  (74)专利代理 机构 北京林达刘知识产权代理事 务所(普通 合伙) 11277 专利代理师 刘新宇 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/40(2022.01) G06N 3/08(2006.01)G06V 40/16(2022.01) (54)发明名称 网络训练方法及装置、 识别方法、 电子设备 和存储介质 (57)摘要 本公开涉及一种网络训练方法及装置、 识别 方法、 电子设备和存储介质, 所述网络训练方法 包括: 利用图像识别网络对样 本图像集中标注有 同一类别标签的多个样本图像进行特征提取, 得 到同一类别标签下的样本特征簇; 为样本特征簇 初始化多个初始子类中心, 并确定样本特征簇中 多个样本特征各自所属的初始子类中心; 根据多 个样本特征与各自所属的初始子类中心之间的 相似度, 对多个初始子类中心进行调整, 得到同 一类别标签下的至少一个目标子类中心; 根据多 种类别标签下的目标子类中心以及属于各个目 标子类中心的样本特征, 确定网络损失, 并利用 网络损失, 训练图像识别网络。 本公开实施例可 实现提高网络训练性能和效率。 权利要求书3页 说明书23页 附图3页 CN 115147699 A 2022.10.04 CN 115147699 A 1.一种网络训练方法, 其特 征在于, 包括: 利用图像识别网络对样本图像集中标注有同一类别标签的多个样本图像进行特征提 取, 得到同一类别标签下 的样本特征簇, 所述样本图像集中包括标注有多种类别标签的样 本图像; 为所述样本特征簇初始化多个初始子类中心, 并确定所述样本特征簇中多个样本特征 各自所属的初始子类中心; 根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 对所述多个初始子 类中心进行调整, 得到同一类别标签下的至少一个目标子类中心; 根据多种类别标签下的目标子类中心以及属于各个目标子类中心的样本特征, 确定网 络损失, 并利用所述网络损失, 训练所述图像识别网络 。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的 初始子类中心之间的相似度, 对所述多个初始子类中心进行调整, 得到同一类别标签下 的 至少一个目标子类中心, 包括: 根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 判断所述多个样本 特征中是否存在离群特征, 所述离群特征与所属的初始子类中心之间相似度小于第一阈 值; 在所述多个样本特征中存在离群特征的情况下, 根据所述离群特征, 新增初始子类中 心, 并将所述离群特 征调整为属于新增的初始子类中心; 其中, 所述目标子类中心包括 新增的初始子类中心以及 初始化的多个初始子类中心。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的 初始子类中心之间的相似度, 判断所述多个样本特 征中是否存在离群特 征, 包括: 针对任一初始子类中心, 根据 所述初始子类中心与属于所述初始子类中心的样本特征 之间相似度的均值和标准差, 确定所述初始子类中心对应的第一阈值; 判断属于所述初始子类中心的样本特征中, 是否存在与 所述初始子类中心之间的相似 度小于所述第一阈值的样本特 征; 将存在的与 所述初始子类中心之间的相似度小于所述第 一阈值的样本特征, 确定为远 离所述初始子类中心的离群特 征。 4.根据权利要求1至3任一项所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 对所述多个初始子类中心进行调整, 得到同一类 别标签下的至少一个目标子类中心, 包括: 根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 判断所述多个初始 子类中心中是否存在异常子类中心, 所述异常子类中心下属的样本特征与所述异常子类中 心之间相似度的均值小于或等于第二阈值; 在所述多个初始子类中心中存在异常子类中心的情况下, 舍弃所述异常子类中心以及 属于所述异常子类中心的样本特征, 得到剩余的初始子类中心以及属于所述剩余的初始子 类中心的样本特 征; 其中, 所述目标子类中心包括所述剩余的初始子类中心。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的 初始子类中心之间的相似度, 判断所述多个初始子类中心中是否存在异常子类中心, 包括: 针对任一初始子类中心, 判断所述初始子类中心与属于所述初始子类中心的样本特征权 利 要 求 书 1/3 页 2 CN 115147699 A 2之间相似度的均值是否小于或等于第二阈值; 在所述初始子类中心与属于所述初始子类中心的样本特征之间相似度的均值小于或 等于所述第二阈值的情况 下, 确定所述初始子类中心为异常子类中心。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 对所述多个初始子类中心进行调整, 得到同一类 别标签下的至少一个目标子类中心, 包括: 根据所述多个样本特征与 各自所属的初始子类中心之间的相似度, 确定所述多个初始 子类中心中的至少一组待合并子类中心, 每组待合并子类中心包括至少两个相似的初始子 类中心; 将所述至少一组待合并子类中心各自进行合并, 得到至少一个合并子类中心, 并将属 于各组待合并子类中心的样本特征, 调整为属于合并后的各个合并子类中心; 其中, 所述目 标子类中心包括所述 合并子类中心。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述多个样本特征与 各自所属的 初始子类中心之间的相似度, 确定所述多个初始子类中心中的至少一组待合并子类中心, 包括: 根据各个初始子类中心与属于各个初始子类中心的样本特征之间相似度的均值和标 准差, 确定各个初始子类中心各自对应的第三阈值; 针对任一初始子类中心, 判断所述初始子类中心与所述多个初始子类中心中其它初始 子类中心之 间的相似度是否大于或等于第四阈值, 所述第四阈值为所述初始子类中心对应 的第三阈值与所述 其它初始子类中心对应的第三阈值中的最大值; 在所述初始子类中心与所述其它初始子类中心之间的相似度大于或等于所述最大值 的情况下, 确定所述 其它初始子类中心与所述初始子类中心相似; 将所述初始子类中心以及与 所述初始子类中心相似的至少一个其它初始子类中心, 确 定为一组待合并子类中心。 8.根据权利要求1至7任一项所述的方法, 其特征在于, 所述根据多种类别标签下的目 标子类中心以及属于各个目标子类中心的样本特 征, 确定网络损失, 包括: 针对任一目标子类中心下属的每一样本特征, 根据 该样本特征与所属的目标子类 中心 之间的相似度, 以及该样本特征与其它目标子类中心之间的相似度, 确定该样本特征对应 的子损失, 其中, 所述其它目标子类中心包括所述多种类别标签下的多个目标子类中心中、 除该样本特征所属的目标子类中心以外且与该样本特征之间相似度小于或等于第 五阈值 的目标子类中心; 根据属于各个目标子类中心的各个样本特 征对应的子损失, 确定所述网络损失。 9.根据权利要求1至8任一项所述的方法, 其特征在于, 所述确定所述样本特征簇中多 个样本特 征各自所属的初始子类中心, 包括: 针对所述样本特征簇中的任一样本特征, 计算该样本特征与 各个初始子类中心之间的 相似度, 并将最大相似度对应的初始子类中心确定为该样本特 征所属的初始子类中心。 10.一种图像识别方法, 其特 征在于, 包括: 利用图像识别网络对待识别图像中的对象进行识别, 得到所述对象的识别结果, 所述 识别结果表征所述对象的类别, 其中, 所述图像识别网络是通过权利要求1至9任一项所述权 利 要 求 书 2/3 页 3 CN 115147699 A 3

.PDF文档 专利 网络训练方法及装置、识别方法、电子设备和存储介质

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网络训练方法及装置、识别方法、电子设备和存储介质 第 1 页 专利 网络训练方法及装置、识别方法、电子设备和存储介质 第 2 页 专利 网络训练方法及装置、识别方法、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:59:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。