全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211000295.3 (22)申请日 2022.08.19 (71)申请人 南京航空航天大 学 地址 210016 江苏省南京市秦淮区御道街 29号 (72)发明人 袁宁 黎宁 周明龙 张正冉  (74)专利代理 机构 江苏圣典律师事务所 32 237 专利代理师 刘辉 (51)Int.Cl. G06V 20/17(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/25(2022.01) G06V 10/762(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) G06V 20/40(2022.01) (54)发明名称 一种无人机视角下轻量级YOLOv4的行人检 测方法 (57)摘要 本发明公开了一种无人机视角下轻量级 Y O L O v 4 的 行 人 检 测 方 法 , 采 用改 进 的 MobileNetv3作为主干特征提取网络, 结合 YOLOv4框架开展行人的目标检测, 并对检测模型 进行量化分析, 修改网络的结构, 削减了模型的 参数量和运算成本以达成无人机场景下行人检 测的需求; 改进的MobileNetv3主要指的是将SE 注意力模块替换成SESAM模块, 学习通道之间的 相似性的同时学习了行人的空间特征, 保证模型 较小的同时不降低检测的精度; 最后采用CIoU的 损失函数去计算评价的参数, 增加了对目标框尺 度的敏感程度; 本发明在复杂多变的情况下, 能 够有效克服不利因素, 具有更强的泛化能力, 检 测效果更好, 在智能交通检测等系统中具有良好 的应用潜力。 权利要求书2页 说明书5页 附图3页 CN 115359376 A 2022.11.18 CN 115359376 A 1.一种无 人机视角下轻量级YOLOv4的行 人检测方法, 其特 征在于, 包括如下步骤: 步骤1), 采用无人机进行数据集的初步构建: 采用分帧算法对视频提取单帧图片, 构建 无人机平台的行 人数据集; 对行 人数据集进行 标注, 得到带有标签的图像数据集; 步骤2), 对图像数据集进行数据增广预处理操作, 并采用K ‑means目标框聚类分析, 自 适应生成图像数据集下目标框大小; 所述数据增广预处理操作包括随机翻转、 裁剪、 缩放和 增加高斯白噪声; 步骤3), 搭建改进的MobileNetv3 ‑YOLOv4轻量级行人目标检测网络; 所述改进的 MobileNetv3 ‑YOLOv4网络是用改进的MobileNetv3 网络替换CSP ‑Darknet53网络作为行人 检测网络的特 征提取层、 并用CI oU损失函数替换I oU损失函数的行 人检测网络 YOLOv4; 所述改进的MobileNetv3网络是在bottleneck结构的深度可分离卷积模块和Scale操 作模块之间增 加SESAM注意力模块的Mobi leNetv3网络; 所述SESAM注意力模块包 含压缩模块、 激励模块和SAM模块; 所述压缩模块包含一个全局平均池化层, 用于将深度可分离卷积模块输出大小为H ×W ×C的特征向量压缩成1 ×1×C的特征向量, 得到每个通道的全局特征向量并将其输入至激 励模块, C代 表了模型的通道数, H和W代 表图片的高和宽; 所述激励模块包含了两个全连接层, 第一个全连接层有C ×SERatio神经元, 第二个全 连接层有C神经元, 用于对压缩后的特征向量做非线性变换使其映射到C个通道数的权重 上, 并将经非线性变换后的特 征向量输入至SAM模块, SERati o是通道数量的缩放的参数; 所述SAM模块包含全局最大池化模块、 全局平均池化模块和 sigmoid激活函数, 用于将 经非线性变换后的特征向量分别输入全局最大池化模块、 全局平均池化模块, 得到两个H × W×1的特征向量后链接起来形成一个H ×W×2的特征向量, 并将该H ×W×2的特征向量通过 sigmoid激活函数进行归一 化处理输出至Scale操作模块; 所述CIoU损失函数的公式如下: LCIoU=1‑CIoU CIoU=IoU‑ρ2c‑2‑α ν 式中, LCIoU是CIoU损失函数值, IoU是目标预测的边框和真实的边框的交叠率, 即它们的 交集和并集的比值, A是预测目标框的面积, B是真实目标框的面积; ρ 是预测目标框中心与 真实目标框之 间的欧氏距离; c表示包含预测目标框和真实目标框的对角线距离; 惩罚因子 ρ2c‑2能够最小化预测框中心与地 面真值中心之间的距离, α 和 ν 公式由以下定义: wgt和hgt是真值的高度和宽度, w和h是 预测框的高度和宽度; 步骤4), 将经数据增广预处理操作后的图像数据集输入改进的MobileNetv3 ‑YOLOv4轻 量级行人目标检测网络, 生成格式为ckpt的网络参数权 重文件;权 利 要 求 书 1/2 页 2 CN 115359376 A 2步骤5), 将网络参数权重文件加载至改进的MobileNetv3 ‑YOLOv4轻量级行人目标检测 网络, 对分帧图片和视频进行行人目标框的预测, 在经过非极大抑制筛选无效的目标框后, 得到精确的行 人预测的目标框 。 2.根据权利要求1所述的无人机视角下基于MobileNetv3 ‑YOLOv4的行人检测方法, 其 特征在于, 所述步骤1)中训练集和测试集的比例分别占图像数据集的90%和10%, 训练集 中的20%在训练过程中用来验证模型准确性。权 利 要 求 书 2/2 页 3 CN 115359376 A 3

.PDF文档 专利 一种无人机视角下轻量级YOLOv4的行人检测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种无人机视角下轻量级YOLOv4的行人检测方法 第 1 页 专利 一种无人机视角下轻量级YOLOv4的行人检测方法 第 2 页 专利 一种无人机视角下轻量级YOLOv4的行人检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:56:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。