专利基于自标签精炼深度学习模型的无监督行人重识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210246604.9 (22)申请日 2022.03.14 (71)申请人宁波大学地址 315021 浙江省宁波市江北区风华路 818号宁波大学 (72)发明人余晓婷　郭立君　张荣　 (74)专利代理机构宁波甬致专利代理有限公司 33228 专利代理师袁波 (51)Int.Cl. G06V 40/10(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/764(2022.01)G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称基于自标签精炼深度学习模型的无监督行人重识别方法 (57)摘要本发明提供了基于自标签精炼深度学习模型的无监督行人重识别方法，涉及行人重识别技术领域，本方法包括步骤： S1：获取不带标签的行人图片数据集其中N表示数据集中图片的数量， xi表示数据集中第i张行人图片，将每张图片的尺寸调整为相同高度和宽度，并进行预处理； S2：构建自标签精炼深度学习模型，将预处理的训练数据输入网络，提取图片样本的多粒度特征；其中，多粒度特征包括全局特征、上半身特征和下半身特征。本方法能够通过局部特征对伪标签进行更正，从而缓解因跨视角造成的同个行人的图片上的差异，并提高网络对噪声标签的鲁棒性。权利要求书2页说明书8页附图3页 CN 114648779 A 2022.06.21 CN 114648779 A 1.基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，包括步骤： S1：获取不带标签的行人图片数据集其中N表示数据集中图片的数量， xi 表示数据集中第i张行人图片，将每张图片的尺寸调整为相同高度和宽度，并进行预处理； S2：构建自标签精炼深度学习模型，将预处理的训练数据输入网络，提取图片样本的多粒度特征；其中，多粒度特征包括全局特征、上半身特征和下半身特征； S3：对提取的多粒度特征进行聚类，得到全局伪标签，上半身伪标签和下半身伪标签； S4：根据聚类结果构建记忆模块，计算一致性矩阵并修正全局伪标签； S5：通过计算总损失，梯度回传更新网络参数，动量更新记忆模块参数，保存网络的最优参数。 2.根据权利要求1所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述预处理包括水平翻转、补零填充、标准化和随机擦除四种方式。 3.根据权利要求2所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述自标签精炼深度学习模型由特征提取器，记忆模块和自标签精炼模块组成；所述特征提取器结构包括两部分，所述特征提取器的第一部分采用ResNet50架构的前四个阶段；所述特征提取器的第二部分在第一部分后分为两个分支，分别为全局分支和局部分支，对所述全局分支得到的特征图采用Generalize ‑mean Pooling进行池化，其中参数 p＝2，池化后特征图大小为2048 ×1×1；对所述局部分支得到的特征图采用Generalize ‑ mean Pooling池化，参数p＝2，池化后的特征图大小为2048 ×2×1，并对特征图进行水平条划分，得到两个大小均为2048 ×1×1的局部特征图；对所述局部分支得到的特征图通道进行缩减，采用256个1 ×1的卷积核对两个2048 ×1×1的局部特征图分别进行卷积，对得到结果进行Batch Normalize和ReLU，所述局部分支得到两个局部特征图大小为256 ×1×1和 256×1×1；对所述全局分支和所述局部分支得到的特征图进行维度剪裁，得到一个维度为 2048×1的全局特征和两个25 6×1的局部特征。 4.根据权利要求3所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述ResNet5 0架构包括五个阶段，分别为：第一阶段：卷积操作的卷积核数目为64，卷积核大小为7 ×7，补零参数的值为3，步长为 2； Batch Normalize和ReLU激活；最大池化操作的核大小为3 ×3，补零参数值为1，步长为2；第二个阶段包括三个Bottleneck；第三个阶段包括四个Bot tleneck；第四个阶段包括六个Bot tleneck 第五个阶段包括三个Bottleneck。 5.根据权利要求4所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述全局分支的结构和所述ResNet50架构的第五个阶段相同，包括三个 Bottleneck，不同的是第一个Bottleneck的第二个卷积操作的步长为1；其中，下采样操作中卷积步长为1。 6.根据权利要求4所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述局部分支的结构和所述ResNet50架构的第五个阶段相同，包括三个 Bottleneck，不同的是第一个Bottleneck中所有卷积步长均为1；其中，下采样操作中卷积权　利　要　求　书 1/2 页 2 CN 114648779 A 2步长为1，其他两个Bot tleneck中的所有卷积步长为1，且取消下采样操作。 7.根据权利要求4所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述将预处理的训练数据输入网络为数据集中的所有行人图片均输入到所述特征提取器中，得到特征集其中分别表示图片xi的全局特征，上半身特征和下半身特征。 8.根据权利要求4所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述步骤S4包括： S41：对所有图片的全局特征计算两两之间的Jac card距离，得到N ×N维的距离矩阵； S42：结合得到的距离矩阵，采用DBSCAN进行聚类，对一个簇中的样本赋予相同的伪标签，对聚类产生的离群点，赋予其最近的簇的伪标签； S43：对局部特征，包括上半身特征和下半身特征，分别计算Jaccard距离矩阵，并采用 DBSCAN进行各自聚类操作，对离群点同样采取分配最近簇伪标签的方式，分别得到各自的伪标签。 9.根据权利要求1所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述计算一致性矩阵为：将全局伪标签为i的样本集合记为Ig(i)，其中i∈[1， Zg]，将上半身伪标签为j，下半身伪标签为k的样本集合记为Iup(j)和Ilow(k)，其中j∈[1， Zup]， k∈[1， Zlow]， Zup和Zlow分别是上半身和下半身聚类得到的类别数；所述修正全局伪标签为给定一个样本xi，得到它的one ‑hot全局伪标签上半身特征和下半身特征结合得到的一致性矩阵和记忆模块，计算传递的局部标签置信度，更正全局伪标签；将训练样本数据随机平均分成多个batch，每个batch中包含P个类别，每个类别有K张图片，一个batch有P ×K张图片样本；一个样本xi包括三个特征，分别为全局特征上半身特征和下半身特征还包括三个标签，分别为全局伪标签上半身伪标签和下半身伪标签对样本的全局伪标签进行修正，得到修正后的标签为 10.根据权利要求9所述的基于自标签精炼深度学习模型的无监督行人重识别方法，其特征在于，所述记忆模块更新方式为即对j类的代理由b atch 中属于j类的困难正样本特征进行更新， μ为动量更新系数，其中， μ＝0.2；重复步骤4和步骤 5，将数据集训练一次，即运行了一个epoch；一个epoch结束后，继续开始运行步骤2和步骤 3；运行num_epoc h次，其中， num_epoc h＝50。权　利　要　求　书 2/2 页 3 CN 114648779 A 3

专利 基于自标签精炼深度学习模型的无监督行人重识别方法

专利基于自标签精炼深度学习模型的无监督行人重识别方法