专利多视角目标检测方法、装置、计算机设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210311312.9 (22)申请日 2022.03.28 (71)申请人南京大牛信息科技有限公司地址 210000 江苏省南京市玄武区天山路 39号 (72)发明人王堃　顾杏春　林业伟　王军　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 专利代理师杜杨 (51)Int.Cl. G06T 7/73(2017.01) G06N 3/04(2006.01) G06K 9/62(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01)G06V 10/82(2022.01) G06V 10/774(2022.01) (54)发明名称多视角目标检测方法、装置、计算机设备及存储介质 (57)摘要本发明实施例提出一种多视角目标检测方法、装置、计算机设备及存储介质，属于计算机视觉领域，方法包括：获取待测图像的多个局部图像块，以及每个局部图像块的图像块特征，根据每个图像块特征，利用预设的随机森林模型，将多个局部图像块划分成多个视觉单词，从而计算每个视觉单词对待测图像的每个候选中心位置的投票分，获得每个候选中心位置关于各个视觉单词的投票组合权重，进而根据投票组合权重和投票分，计算每个候选中心位置的总得分，并根据每个候选中心位置的总得分，确定出目标中心位置，能够充分考虑视角因素，从而能够降低目标被遮挡、发生变形和角度变化等干扰情况的影响，提高目标检测的准确性。权利要求书2页说明书13页附图5页 CN 114663510 A 2022.06.24 CN 114663510 A 1.一种多视角目标检测方法，其特征在于，所述方法包括：获取待测图像的多个局部图像块，以及每个所述局部图像块的图像块特征；根据每个所述图像块特征，利用预设的随机森林模型，将多个所述局部图像块划分成多个视觉单词，其中，同一个所述视觉单词的局部图像块具有相同的外观特征和几何位置；计算每个所述视觉单词对所述待测图像的每个候选中心位置的投票分；获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重，根据所述投票组合权重和所述投票分，计算每个所述候选中心位置的总得分；根据每个所述候选中心位置的总得分，确定出目标中心位置。 2.根据权利要求1所述的多视角目标检测方法，其特征在于，所述根据每个所述候选中心位置的总得分，确定出目标中心位置的步骤，包括：根据每个所述候选中心位置的总得分，得到投票均值；将所述待测图像在多个尺度因子下进行放缩，结合所述总得分，得到各个尺度因子下的霍夫图；根据各个尺度因子下的所述霍夫图，得到 3D霍夫空间；结合所述投票均值，利用均值漂移算法，在所述3D霍夫空间中确定出目标中心位置。 3.根据权利要求1或2所述的多视角目标检测方法，其特征在于，所述获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重的步骤，包括：获取各种视角下关于验证对象和背景的多个样本图像，并将所有所述样本图像划分成多个视觉子类；根据由预设的随机森林模型的叶子节点得到多个视觉子类，基于所述视觉子类，生成每个所述样本图像的表达向量，并根据每个所述样本图像所属的所述视觉子类，给每个所述样本图像加入子类标签；基于所有所述样本图像的所述表达向量和所述子类标签，利用多类别线性分类算法，训练出每个所述视觉子类的分值权重。 4.根据权利要求3所述的多视角目标检测方法，其特征在于，所述将所有所述样本图像划分成多个视觉子类的步骤，包括：计算每个所述样本图像的HOG特征，并利用局部线性嵌入算法，将所有所述HOG特征嵌入到2D空间，所述2D空间包括多个样本点，每个所述样本点对应一个所述样本图像；在所述2D空间内，将所有所述样本图像规则化到一个圆形上，对所述圆形上的样本图像进行无监督聚类，得到多个视觉子类。 5.根据权利要求1或2所述的多视角目标检测方法，其特征在于，所述根据每个所述图像块特征，利用预设的随机森林模型，将多个所述局部图像块划分成多个视觉单词的步骤，包括：针对每个所述图像块特征，利用该图像块特征遍历随机森林模型，直到该图像块特征到达所述随机森林模型的一个叶子节点，每个所述叶子节点对应一个视觉单词；根据所有所述图像块特征所到达的叶子节点，将到达同一个叶子节点的所有图像块特征所对应的局部图像块作为一个视觉单词。 6.根据权利要求1或2所述的多视角目标检测方法，其特征在于，所述方法还包括训练随机森林模型的步骤，该步骤包括：权　利　要　求　书 1/2 页 2 CN 114663510 A 2获取不同视角下的样本对象的样本图像，将每个所述样本图像划分为多个局部图像块，以所有所述局部图像块作为训练集；根据每个所述局部图像块的特征，基于训练算法，构建并训练随机森林模型，所述特征包括外观特征、视角类别，局部图像块到目标中心的偏移向量，以及局部图像块在随机森林模型的每层节点上的分类权重。 7.根据权利要求6所述的多视角目标检测方法，其特征在于，所述根据每个所述局部图像块的特征，基于训练算法，构建并训练随机森林模型的步骤，包括：根据训练算法和各所述局部图像块的特征，生成随机森林模型的每棵树的第一层节点；每生成一层节点时，根据当前层节点上各节点中的局部图像块集合，得到分裂函数；根据所述分裂函数，预测并更新各所述局部图像块在下层节点上的分类权重；每生成一层节点时，判断当前的随机森林模型是否满足终止条件，若是，则终止训练，得到训练好的随机森林模型，若否，则根据各所述局部图像块更新分类权重后的特征，继续生成随机森林模型的每棵树的下一层节点。 8.一种多视角目标检测装置，其特征在于，包括预处理模块、匹配模块和投票模块；所述预处理模块，用于获取待测图像的多个局部图像块，以及每个所述局部图像块的图像块特征；所述匹配模块，用于根据每个所述图像块特征，利用预设的随机森林模型，将多个所述局部图像块划分成多个视觉单词，同一个所述视觉单词的局部图像块具有相同的外观特征和几何位置；所述投票模块，用于计算每个所述视觉单词对所述待测图像的每个候选中心位置的投票分，获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重，根据所述投票组合权重和所述投票分，计算每个所述候选中心位置的总得分，根据每个所述候选中心位置的总得分，确定出目标中心位置。 9.一种计算机设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器可执行所述机器可执行指令以实现如权利要求 1至7中任一项所述的多视角目标检测方法。 10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的多视角目标检测方法。权　利　要　求　书 2/2 页 3 CN 114663510 A 3

专利 多视角目标检测方法、装置、计算机设备及存储介质

专利多视角目标检测方法、装置、计算机设备及存储介质