全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210606376.1 (22)申请日 2022.05.31 (71)申请人 合肥工业大 学 地址 230000 安徽省合肥市包河区屯溪路 193号 (72)发明人 李小红 代雪松 齐美彬 庄硕  郝世杰 蒋建国 张晶晶 李世龙  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 常虹 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/40(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于反事实注 意力学习的行人再识别方法、 系统、 介质 (57)摘要 本发明公开了一种基于反事实注意力学习 的行人再识别方法和系统、 计算机存储介质。 其 中行人再识别方法通过比较事实, 即学习的注意 力, 和反事实, 即虚假的注意力, 对最终预测的影 响来量化注 意力的质量。 并通过最大化差异以促 进网络学习更有效的视觉注意力并减少有偏训 练集的影 响, 以此来增强目标域行人图像的判别 性特征学习解决目标域行人图像存在遮挡和背 景杂波问题。 权利要求书4页 说明书12页 附图1页 CN 114882534 A 2022.08.09 CN 114882534 A 1.一种基于反事实注意力学习的行 人再识别方法, 其特 征在于, 包括 步骤: S1、 建立教师模型和学生模型, 所述教师模型和学生模型的结构相同; 所述教师模型的 输入为行人图像, 结构包括主干网络和分类器, 其中主干网络用于提取行人图像的特征, 分 类器用于根据行 人图像的特 征获取行人图像的类别概 率; 采用源域数据集对教师模型进行预训练, 所述预训练的目标为最小化分类损 失函数, 所述分类损失函数 为: 其中p(ys,n∣ xs,n)表示将输入图像xs,n识别为类ys,n的概率, ys,n是源域数据集中xs,n的类 别标签, N 为预训练过程中每 个批次样本的数量; 将学生模型的参数初始化 为预训练后教师模型的参数; S2、 将目标域数据集中的图像输入教师模型, 所述教师模型主干网络输出目标域图像 的特征; 对目标域图像的特征进 行聚类, 根据聚类后的类别生成目标域图像的伪标签, 每个 聚类中心的特征向量拼接为目标域聚类中心矩阵 其中Pt为目标域图像特征聚 类后的类别数, c,h,w分别为教师模型主干网络提取到的特 征的维度、 高度、 宽度; S3、 将源域数据集中的图像输入教师模型, 所述教师模型主干网络输出源域图像的特 征; 依照源域图像的真实身份标签, 对提取到的属于同一身份的源域图像特征向量取平均 得到该行人身份的类中心向量, 每个类中心的特征向量拼接为源域类中心矩阵 其中Ps为源域数据的真实行 人身份类别数; Rt和Rs拼接为参考中心矩阵 S4、 令教师模型的参数保持不变, 采用迭代训练优化学生模型的参数; 迭代训练优化的 目标为最小化损失函数, 具体的训练中每个批次的样本包括Nt个目标域图像和Ns个源域图 像; 损失函数Ltotal为目标分类损失Lclass和注意力度量损失 之和; 具体步骤为: S4.1A、 计算目标分类损失Lclass: 其中 为目标域图像xi的伪标签, 为学生模型将输入 图像xi识别为类 的概 率; S4.2A、 计算源域图像zv注意力对预测的影响值, v=1,2, …,Ns: 将zv输入学生模型 得到zv的第一特 征fv, fv∈Rc×h×w; 利用空间注意力模块 提取fv的注意力特 征图Fv: Fv={Fv,1,Fv,2,...,Fv,m,...Fv,M}=attention(fv)         (4) 其中attention( ·)表示空间注意力模块提取注意力 特征图运算, Fv,m∈Rh×w为注意力 特征图Fv中第m个感兴趣区域的注意力特 征图, M为感兴趣区域的数量; 利用Fv,m对第一特征fv进行加权, 并采用全局平均池化操作进行聚合, 得到局部注意力 Zv,m: Zv,m=GAP(fv*Fv,m); 其中GAP表示全局平均池化操作;权 利 要 求 书 1/4 页 2 CN 114882534 A 2将局部注意力组合 起来并归一 化, 得到源域图像zv的全局特 征Zv: Zv=normalize([Zv,1,Zv,2,...,Zv,m,...,Zv,M])             (5) 其中normalize表示归一 化运算; 将全局特征Zv依次输入批归一化层和分类层, 得到源域图像zv经空间注意力加权后的 预测结果: Yv=C(BN(Zv))                   (6) 生成反注意力特征图 所述反注意力特征图 的尺寸与Fv相同, 其每个元素值为随 机数; 采用反注意力特征图 对fv进行加权, 并经全局平均池化操作、 组合并归一化、 依次输 入批归一 化层和分类层, 得到源域图像zv经反空间注意力加权后的预测结果 注意力对预测的影响值 为: S4.3A、 计算注意力度量损失: ys,v是源域图像zv的类别标签; p(ys,v∣Yveffect)为将注意力对预测的影响值为Yveffect的 图像识别为类ys,v的概率; S5、 对教师模型的参数进行加权平均更新; 迭代训练优化结束后, 根据学生模型的参数对教师模型的参数进行加权平均更新; 将 目标域图像输入更新后的教师模型, 分类器输出类别概率, 选择类别概率最大值对应的类 别作为输入图像的识别结果。 2.根据权利要求1所述的基于反事实注意力学习的行人再识别方法, 其特征在于, 所述 教师模型的主干网络包括依次连接的第一卷积模块、 第一池化模块、 第一注意力模块、 第二 卷积模块、 第二注意力模块、 第三卷积模块、 第三注意力模块、 第四卷积模块、 第四注意力模 块、 第五卷积模块、 第五注意力模块、 第二池化模块。 3.根据权利要求2所述的基于反事实注意力学习的行人再识别方法, 其特征在于, 所述 第一注意力模块、 第二注意力模块、 第三注意力模块、 第四注意力模块、 第 五注意力模块的 结构相同, 包括级联的2D卷积层和激活单 元。 4.根据权利要求1所述的基于反事实注意力学习的行人再识别方法, 其特征在于, 通过 计算教师模型和学生模型输出差异 来计算不确定性, 从而得到目标域图像伪标签的可信度 或可靠性, 并利用该可信度或可靠性对损失函数进 行加权, 具体地, 所述加权后的目标分类 损失计算 步骤为: S4.1B、 计算目标域图像xi的不确定性ui, i=1,2,…,Nt: 将xi输入学生模型, 所述学生模型的主干网络 输出xi的第一特 征fi; 计算第一特征fi与参考中心矩阵R的相似度, 作为xi的第一软多标签Li: Li=Softmax (R·fi); 将xi输入教师模型, 所述教师模型的主干网络 输出xi的第二特 征 计算第二特征 与参考中心矩阵R的 相似度 , 作为xi的 第二软多标签 权 利 要 求 书 2/4 页 3 CN 114882534 A 3

.PDF文档 专利 基于反事实注意力学习的行人再识别方法、系统、介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于反事实注意力学习的行人再识别方法、系统、介质 第 1 页 专利 基于反事实注意力学习的行人再识别方法、系统、介质 第 2 页 专利 基于反事实注意力学习的行人再识别方法、系统、介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:58:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。