全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210533483.6 (22)申请日 2022.05.13 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 (72)发明人 何发智 司统振 吴浩然 唐伟  (74)专利代理 机构 武汉智权专利代理事务所 (特殊普通 合伙) 42225 专利代理师 罗成 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/40(2022.01) G06V 10/762(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 无监督行人再识别方法、 装置、 设备及可读 存储介质 (57)摘要 本发明提供一种无监督行人再识别方法、 装 置、 设备及可读存储介质。 该方法包括: 对行人图 像样本进行聚类, 基于聚类结果 分别为每张行人 图像样本分配一个假标签; 构建类别特征存储器 和特征存储器; 根据假标签获取K*P张行人图像 样本; 将预处理后的K*P张行人图像样本输入深 度学习模型, 得到第二行人特征; 基于类别特征 存储器、 特征存储器以及第二行人特征优化深度 学习模型; 当优化次数达到预设次数时, 以最终 得到的深度学习模型得到目标行人图像对应的 行人特征, 将目标行人图像对应的行人特征与数 据库中的行人特征进行匹配, 得到行人识别结 果。 通过本发明, 解决了现有技术中行人再识别 的识别结果 准确率较低的技 术问题。 权利要求书4页 说明书14页 附图4页 CN 114821661 A 2022.07.29 CN 114821661 A 1.一种无监 督行人再识别方法, 其特 征在于, 所述无监 督行人再识别方法包括: 通过深度学习模型 得到行人图像样本对应的第一行 人特征; 通过聚类算法并根据 行人图像样本对应的第 一行人特征对行人图像样本进行聚类, 基 于聚类结果分别为同一类别的每张行人图像样本分配一个假标签, 其中, 同一类别行人图 像样本的假标签相同; 基于聚类结果和第 一行人特征构建类别特征存储器, 基于行人图像样本总数和第 一行 人特征构建特 征存储器; 根据所述假标签获取K类行人图像样本, 从每类行人图像样本中获取P张行人图像样 本, 其中, K、 P为 正整数; 随机对K*P张行 人图像样本进行 预处理; 将预处理后的K*P张行人图像样本输入深度学习模型, 得到深度学习模型输出的K*P张 行人图像样本对应的第二行 人特征; 基于类别特 征存储器、 特征存储器以及第二行 人特征优化深度学习模型; 以优化后的深度 学习模型为深度学习 模型, 并返回执行通过深度 学习模型得到行人图 像样本对应的第一行 人特征的步骤; 当循环次数达到预设次数时, 以最终得到的深度 学习模型得到目标行人图像对应的行 人特征, 将目标行人图像对应的行人特征与数据库中的行人特征进行匹配, 得到行人识别 结果。 2.如权利要求1所述的无监督行人再识别方法, 其特征在于, 所述基于聚类结果和第 一 行人特征构建类别特征存储器, 基于行人图像样本总数和 第一行人特征构建特征存储器的 步骤包括: 根据聚类得到的类别总数乘以第一行人特征的维度的积确定待构建的类别特征存储 器的大小, 基于待构建的类别特 征存储器的大小构建类别特 征存储器; 根据行人图像样本总数乘以第一行人特征的维度的积确定待构建的特征存储器的大 小, 基于待构建的特 征存储器的大小构建特 征存储器。 3.如权利要求1所述的无监督行人再识别方法, 其特征在于, 所述基于类别特征存储 器、 特征存储器以及第二行 人特征优化深度学习模型的步骤, 包括: 基于类别特征存储器和第二行人特征, 设计类别水平的对比学习, 构建第二行人特征 对应的动态对比损失函数, 其中, 第二行 人特征对应的动态对比损失函数表示 为: 其中, fj表示第j张行人图像样本对应的第二行人特征, A表示聚类得到的类别总数, τ表权 利 要 求 书 1/4 页 2 CN 114821661 A 2示超参数, kt代表第j张行人图像样本对应的类别特征, 表示动 态因子, λ表示关注参数, ka表示类别特 征存储器中存 储的第a个 类别特征; 基于特征存储器和第二行人特征, 设计图像水平的对比学习, 构建第二行人特征对应 的样本约束损失函数, 其中, 第二行 人特征对应的样本约束损失函数表示 为: 其中, S是N个难负样本的集合, 每个负样本在特征存储器中选择, fn表示第二行人特征 对应的难负样本特征, fc表示第二行人特征对 应的高置信度样本特征, fh表示第二 行人特征 对应的难正样本特 征; 基于动态对比损失函数和样本约束损失函数对深度 学习模型进行优化, 得到优化后的 深度学习模型, 其中, 优化后的深度学习模型表示 为: LHCM=Lcla+β *Limg 其中, β 表示超参数。 4.如权利要求1所述的无监督行人再识别方法, 其特征在于, 在所述将预处理后的K*P 张行人图像样本输入深度学习模型, 得到深度学习模型输出 的K*P张行人图像样本对应的 第二行人特征的步骤之后, 包括: 根据K*P张行 人图像样本对应的第二行 人特征更新类别特 征存储器和特 征存储器。 5.如权利要求1所述的无监督行人再识别方法, 其特征在于, 所述预处理包括水平翻转 处理、 剪裁处理、 擦除处 理以及归一 化处理。 6.一种无监 督行人再识别装置, 其特 征在于, 所述无监 督行人再识别装置包括: 第一获取模块, 用于通过深度学习模型 得到行人图像样本对应的第一行 人特征; 分配模块, 用于通过聚类算法并根据 行人图像样本对应的第 一行人特征对行人图像样 本进行聚类, 基于聚类结果分别为同一类别的每张行人图像样本 分配一个假标签, 其中, 同 一类别行 人图像样本的假标签相同; 构建模块, 用于基于聚类结果和第一行人特征构建类别特征存储器, 基于行人图像样 本总数和第一行 人特征构建特 征存储器; 第二获取模块, 用于根据 所述假标签获取K类行人图像样本, 从每类行人图像样本 中获 取P张行人图像样本, 其中, K、 P为 正整数; 处理模块, 用于随机对K*P张行 人图像样本进行 预处理; 输入模块, 用于将预处理后的K*P张行人图像样本输入深度 学习模型, 得到深度学习模权 利 要 求 书 2/4 页 3 CN 114821661 A 3

.PDF文档 专利 无监督行人再识别方法、装置、设备及可读存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 无监督行人再识别方法、装置、设备及可读存储介质 第 1 页 专利 无监督行人再识别方法、装置、设备及可读存储介质 第 2 页 专利 无监督行人再识别方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:36:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。