说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211401275.7 (22)申请日 2022.11.09 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 陈琳  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 赵迎迎 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 跨模态行人重识别模型生成方法、 识别方 法、 装置及设备 (57)摘要 本发明实施例公开了一种跨模态行人重识 别模型生成方法、 识别方法、 装置及设备, 该方法 包括: 将可见光图像样本以及红外图像样本分别 输入至预设跨模态行人重识别模型, 其中, 该模 型由至少一个卷积层、 至少一个注意力机制、 平 均池化层、 以及至少一个全连接层构成; 获取预 设跨模态行人重识别模型中, 各网络层针对可见 光图像样本以及红外图像样本处理得到的特征 信息; 并根据特征信息, 确定预设跨模态行人重 识别模型的目标损失函数; 以目标损失函数为优 化目标, 进行模型训练得到, 优化后的目标跨模 态行人重识别模型。 该方法通过添加注意力模 块, 以提取图像的关键信息; 并通过目标损失函 数的约束, 建立跨模态间的关联, 从而实现跨模 态的行人重识别。 权利要求书2页 说明书14页 附图5页 CN 115546844 A 2022.12.30 CN 115546844 A 1.一种跨模态行 人重识别模型生成方法, 其特 征在于, 包括: 将可见光图像样本以及红外 图像样本分别输入至预设跨模态行人重识别模型, 其中, 所述预设跨模态行人重识别模型由至少一个卷积层、 至少一个注意力机制、 平均池化层、 以 及至少一个全连接层构成; 获取所述预设跨模态行人重识别模型中, 各网络层针对所述可见光图像样本以及所述 红外图像样本处理得到的特征信息; 并根据所述特征信息, 确定所述预设跨模态行人重识 别模型的目标损失函数; 以所述目标损 失函数为优化目标, 进行模型训练得到, 优化后的目标跨模态行人重识 别模型。 2.根据权利要求1所述的方法, 其特征在于, 在所述预设跨模态行人重识别模型中的任 意两个卷积层之间连接一个注意力机制; 其中, 所述注意力机制, 用于将上一卷积层输出的可见光中间特征图或者红外中间特 征图, 进行权重处理, 得到可见光中间加权特征图或者红外中间加权特征图; 并将所述可见 光中间加权特 征图或者所述红外中间加权特 征图输入至下一卷积层。 3.根据权利要求2所述的方法, 其特征在于, 获取所述预设跨模态行人重识别模型中, 各网络层针对所述可见光图像样本以及所述红外图像样本处理得到的特征信息; 并根据所 述特征信息, 确定所述预设跨模态行 人重识别模型的目标损失函数, 包括: 获取针对所述可见光图像以及所述红外 图像, 所述预设跨模态行人重识别模型中, 各 所述注意力机制分别输出的可 见光中间加权特 征图以及红外中间加权特 征图; 将所述可见光中间加权特征图以及所述红外中间加权特征图, 分别经过平均池化, 得 到可见光目标中间特 征以及红外目标中间特 征; 根据所述可见光目标中间特征以及所述红外目标中间特征, 确定所述预设跨模态行人 重识别模型目标损失函数中的三元组损失函数。 4.根据权利要求1所述的方法, 其特征在于, 获取所述预设跨模态行人重识别模型中, 各网络层针对所述可见光图像样本以及所述红外图像样本处理得到的特征信息; 并根据所 述特征信息, 确定所述预设跨模态行 人重识别模型的目标损失函数, 包括: 获取针对所述可见光图像以及所述红外 图像, 所述预设跨模态行人重识别模型中, 末 位卷积层分别输出的可 见光目标 特征图、 以及红外目标 特征图; 将所述可见光目标特征图以及所述红外目标特征图, 分别沿水平方向切成多个可见光 目标特征子图以及红外目标 特征子图; 将各所述可见光目标特征子图以及各所述红外目标特征子图, 分别经过平均池化和正 则化后进行串联, 得到可 见光目标 特征以及红外目标 特征; 根据所述可见光目标特征以及所述红外目标特征, 确定所述预设跨模态行人重识别模 型目标损失函数中的中心损失函数。 5.根据权利要求1所述的方法, 其特征在于, 获取所述预设跨模态行人重识别模型中, 各网络层针对所述可见光图像样本以及所述红外图像样本处理得到的特征信息; 并根据所 述特征信息, 确定所述预设跨模态行 人重识别模型的目标损失函数, 包括: 获取针对所述可见光图像以及所述红外 图像, 所述预设跨模态行人重识别模型中, 末 位全连接层分别输出的可 见光分类特 征、 以及红外分类特 征;权 利 要 求 书 1/2 页 2 CN 115546844 A 2根据所述可见光分类特征以及所述红外分类特征, 确定所述预设跨模态行人重识别模 型目标损失函数中的分类损失函数。 6.一种跨模态行 人重识别方法, 其特 征在于, 包括: 将可见光图像集以及红外 图像集分别输入至如权利要求1至5任一项所述的目标跨模 态行人重识别模型中, 得到可 见光图像特 征以及红外图像特 征; 其中, 所述目标跨模态行人重识别模型由至少一个卷积层、 至少一个注意力机制、 平均 池化层、 以及至少一个全连接层构成; 根据所述可见光图像特征以及所述红外 图像特征, 进行跨模态图像互搜索, 确定与目 标行人匹配的目标图像集; 根据所述目标图像集, 确定目标 行人轨迹。 7.一种跨模态行 人重识别模型生成装置, 其特 征在于, 包括: 图像样本输入模块, 用于将可见光图像样本以及红外图像样本分别输入至预设跨模态 行人重识别模型, 其中, 所述预设跨模态行人重识别模型由至少一个卷积层、 至少一个注 意 力机制、 平均池化层、 以及至少一个全连接层构成; 目标损失函数确定模块, 用于获取所述预设跨模态行人重识别模型中, 各网络层针对 所述可见光图像样本以及所述红外图像样本处理得到的特征信息; 并根据所述特征信息, 确定所述预设跨模态行 人重识别模型的目标损失函数; 目标跨模态行人重识别模型生成模块, 用于以所述目标损 失函数为优化目标, 进行模 型训练得到, 优化后的目标跨模态行 人重识别模型。 8.一种跨模态行 人重识别装置, 其特 征在于, 包括: 图像特征生成模块, 用于将可见光图像集以及红外图像集分别 输入至本发明任一实施 例所述的目标跨模态行 人重识别模型中, 得到可 见光图像特 征以及红外图像特 征; 其中, 所述目标跨模态行人重识别模型由至少一个卷积层、 至少一个注意力机制、 平均 池化层、 以及至少一个全连接层构成; 目标图像集确定模块, 用于根据所述可见光图像特征以及所述红外 图像特征, 进行跨 模态图像互搜索, 确定与目标 行人匹配的目标图像集; 行人轨迹确定模块, 用于根据所述目标图像集, 确定目标 行人轨迹。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑5中任一项所述的 跨模态行 人重识别模型生成方法; 或者, 如权利要求6所述的跨模态行 人重识别方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处理器执行时实现权利要求1 ‑5中任一项所述的跨模态行人重 识别模型生成方法; 或者, 如权利要求6所述的跨模态行 人重识别方法。权 利 要 求 书 2/2 页 3 CN 115546844 A 3

PDF文档 专利 跨模态行人重识别模型生成方法、识别方法、装置及设备

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 跨模态行人重识别模型生成方法、识别方法、装置及设备 第 1 页 专利 跨模态行人重识别模型生成方法、识别方法、装置及设备 第 2 页 专利 跨模态行人重识别模型生成方法、识别方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:23:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。