全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210311312.9 (22)申请日 2022.03.28 (71)申请人 南京大牛信息科技有限公司 地址 210000 江苏省南京市玄武区天山路 39号 (72)发明人 王堃 顾杏春 林业伟 王军  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 杜杨 (51)Int.Cl. G06T 7/73(2017.01) G06N 3/04(2006.01) G06K 9/62(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01)G06V 10/82(2022.01) G06V 10/774(2022.01) (54)发明名称 多视角目标检测方法、 装置、 计算机设备及 存储介质 (57)摘要 本发明实施例提出一种多视角目标检测方 法、 装置、 计算机设备及存储介质, 属于计算机视 觉领域, 方法包括: 获取待测图像的多个局部图 像块, 以及每个局部图像块的图像块特征, 根据 每个图像块特征, 利用预设的随机森林模型, 将 多个局部图像块划分成多个视觉单词, 从而计算 每个视觉单词对待测图像的每个候选中心位置 的投票分, 获得每个候选中心位置关于各个视觉 单词的投票组合权重, 进而根据投票组合权重和 投票分, 计算每个候选中心位置的总得分, 并根 据每个候选中心位置的总得分, 确定出目标中心 位置, 能够充分考虑视角因素, 从而能够降低目 标被遮挡、 发生变形和角度变化等干扰情况的影 响, 提高目标检测的准确性。 权利要求书2页 说明书13页 附图5页 CN 114663510 A 2022.06.24 CN 114663510 A 1.一种多视角目标检测方法, 其特 征在于, 所述方法包括: 获取待测图像的多个局部图像块, 以及每 个所述局部图像块的图像块特 征; 根据每个所述图像块特征, 利用预设的随机森林模型, 将多个所述局部 图像块划分成 多个视觉单词, 其中, 同一个所述视 觉单词的局部图像块具有相同的外观特 征和几何位置; 计算每个所述视 觉单词对所述待测图像的每 个候选中心位置的投票分; 获得每个所述候选 中心位置关于各个所述视觉单词的投票组合权重, 根据所述投票组 合权重和所述投票分, 计算每 个所述候选中心位置的总得分; 根据每个所述候选中心位置的总得分, 确定出目标中心位置 。 2.根据权利要求1所述的多视角目标检测方法, 其特征在于, 所述根据每个所述候选中 心位置的总得分, 确定出目标中心位置的步骤, 包括: 根据每个所述候选中心位置的总得分, 得到投票均值; 将所述待测图像在多个尺度因子下进行放缩, 结合所述总得分, 得到各个尺度因子下 的霍夫图; 根据各个尺度因子下的所述霍夫图, 得到 3D霍夫空间; 结合所述投票均值, 利用均值漂移算法, 在所述3D霍夫空间中确定出目标中心位置 。 3.根据权利要求1或2所述的多视角目标检测方法, 其特征在于, 所述获得每个所述候 选中心位置关于各个所述视 觉单词的投票组合权 重的步骤, 包括: 获取各种视角下关于验证对象和背景的多个样本图像, 并将所有所述样本图像划分成 多个视觉子类; 根据由预设的随机森林模型的叶子节点得到多个视觉子类, 基于所述视觉子类, 生成 每个所述样本图像的表达 向量, 并根据每个所述样本图像所属的所述视觉子类, 给每个所 述样本图像加入子类标签; 基于所有所述样本 图像的所述表达向量和所述子类标签, 利用多类别线性分类算法, 训练出每 个所述视 觉子类的分值权 重。 4.根据权利要求3所述的多视角目标检测方法, 其特征在于, 所述将所有所述样本图像 划分成多个视 觉子类的步骤, 包括: 计算每个所述样本图像的HOG特征, 并利用局部线性嵌入算法, 将所有所述HOG特征嵌 入到2D空间, 所述2D空间包括多个样本点, 每 个所述样本点对应一个所述样本图像; 在所述2D空间内, 将所有所述样本图像规则化到一个圆形上, 对所述圆形上的样本图 像进行无监督聚类, 得到多个视 觉子类。 5.根据权利要求1或2所述的多视角目标检测方法, 其特征在于, 所述根据每个所述图 像块特征, 利用预设的随机森林模型, 将多个所述局部图像块划分成多个视觉单词的步骤, 包括: 针对每个所述图像块特征, 利用该图像块特征遍历 随机森林模型, 直到该图像块特征 到达所述随机森林模型的一个叶子节点, 每 个所述叶子节点对应一个视 觉单词; 根据所有所述图像块特征所到达的叶子节点, 将到达同一个叶子节点的所有图像块特 征所对应的局部图像块作为 一个视觉单词。 6.根据权利要求1或2所述的多视角目标检测方法, 其特征在于, 所述方法还包括训练 随机森林模型的步骤, 该步骤 包括:权 利 要 求 书 1/2 页 2 CN 114663510 A 2获取不同视角下的样本对象的样本图像, 将每个所述样本图像划分为多个局部图像 块, 以所有所述局部图像块作为训练集; 根据每个所述局部图像块的特征, 基于训练算法, 构建并训练随机森林模型, 所述特征 包括外观特征、 视角类别, 局部图像块到目标中心的偏移向量, 以及局部图像块在随机森林 模型的每层节点上的分类权 重。 7.根据权利要求6所述的多视角目标检测方法, 其特征在于, 所述根据每个所述局部图 像块的特 征, 基于训练算法, 构建并训练随机森林模型的步骤, 包括: 根据训练算法和各所述局部图像块的特征, 生成随机森林模型的每棵树的第一层节 点; 每生成一层节点时, 根据当前层节点上 各节点中的局部图像块 集合, 得到分裂函数; 根据所述分裂函数, 预测并更新各 所述局部图像块在下层节点上的分类权 重; 每生成一层节点时, 判断当前的随机森林模型是否满足终止条件, 若是, 则终止训练, 得到训练好的随机森林模型, 若否, 则根据各所述局部图像块更新分类权重后的特征, 继续 生成随机森林模型的每棵树的下一层节点。 8.一种多视角目标检测装置, 其特 征在于, 包括预处 理模块、 匹配模块和投票模块; 所述预处理模块, 用于获取待测图像的多个局部 图像块, 以及每个所述局部 图像块的 图像块特 征; 所述匹配模块, 用于根据每个所述图像块特征, 利用预设的随机森林模型, 将多个所述 局部图像块划分成多个视觉单词, 同一个所述视觉单词的局部图像块具有相同的外观特征 和几何位置; 所述投票模块, 用于计算每个所述视觉单词对所述待测图像的每个候选 中心位置的投 票分, 获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重, 根据所述投票 组合权重和所述投票分, 计算每个所述候选中心位置的总得分, 根据每个所述候选中心位 置的总得分, 确定出目标中心位置 。 9.一种计算机设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有能够被所述 处理器执行的机器可执行指令, 所述处理器可执行所述机器可执行指 令以实现如权利要求 1至7中任一项所述的多视角目标检测方法。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至7中任一项所述的多视角目标检测方法。权 利 要 求 书 2/2 页 3 CN 114663510 A 3

.PDF文档 专利 多视角目标检测方法、装置、计算机设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多视角目标检测方法、装置、计算机设备及存储介质 第 1 页 专利 多视角目标检测方法、装置、计算机设备及存储介质 第 2 页 专利 多视角目标检测方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:36:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。