说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211388347.9 (22)申请日 2022.11.08 (71)申请人 山东大学 地址 250061 山东省济南市历下区经十路 17923号 (72)发明人 宋然 栾迎新 张钰荻 张伟 李晓磊 张倩 (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 李琳 (51)Int.Cl. G06T 7/246(2017.01) G06T 7/90(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于专家策略指导的主动目标跟踪方 法及系统 (57)摘要 本发明公开的一种基于专家策略指导的主 动目标跟踪方法及系统, 属于主动目标追踪技术 领域, 包括: 获取场景观测图像、 场景地图和 智能 体位姿; 根据场景地图和智能体位姿, 获得每个 智能体的局部地图和每个局部地图中所有智能 体运动轨迹, 作为第一训练数据; 将第一训练数 据分别输入专家跟踪器和专家目标对象中, 由专 家目标对象和专家跟踪器进行对抗强化学习, 通 过专家跟踪器输出建议动作; 将场景观测图像输 入学生跟踪器中, 将建议动作作为场景观测图像 的标签对学生跟踪器进行训练, 获得训练好的学 生跟踪器; 利用训练好的学生跟踪器对获取的场 景实时图像进行识别, 获得智 能体决策动作。 实 现了对目标的准确追 踪。 权利要求书2页 说明书12页 附图4页 CN 115439510 A 2022.12.06 CN 115439510 A 1.一种基于专 家策略指导的主动目标跟踪方法, 其特 征在于, 包括: 获取场景观测图像、 场景地图和智能体位姿; 根据场景地图和智能体位姿, 获得每个智能体的局部地图和每个局部地图中所有智能 体运动轨 迹, 作为第一训练数据; 将第一训练数据分别 输入专家跟踪器和专家目标对象中, 由专家目标对象和 专家跟踪 器进行对抗强化学习, 通过专 家跟踪器输出建议动作; 将场景观测图像输入学生跟踪器中, 将建议动作作为场景观测图像的标签对学生跟踪 器进行训练, 获得训练好的学生跟踪器; 利用训练好的学生跟踪器对获取的场景实时图像进行识别, 获得智能体决策动作。 2.如权利要求1所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 专家 跟踪器和专家目标对 象采用遮挡 可知的奖励机制, 当专家跟踪器未处于遮挡状态时, 专家 跟踪器的奖励值的取值范围被限制到0到1之间, 当专家跟踪器处于遮挡状态 时, 专家跟踪 器的奖励值设置为 ‑1。 3.如权利要求1所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 由专 家目标对象和专家跟踪器进行对抗强化学习时, 通过专家目标对象输出目标对应的逃脱 策 略, 并通过专 家目标对象的模型 策略, 构建专 家策略池。 4.如权利要求3所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 获得 专家跟踪器输出建议动作的具体过程 为: 将第一训练数据分别 输入专家跟踪器和专家目标对象中, 通过专家目标对象对专家跟 踪器进行对抗学习, 对专家跟踪器进 行预训练, 在预训练过程中, 由专家跟踪器输出决策动 作, 由专家目标对象输出目标对应的逃脱 策略, 并通过专家目标对象模型的策略, 构建专家 策略池; 从专家策略池中选取微调用专 家目标对象模型; 通过微调用专家目标对象模型与 预训练后的专家跟踪器进行对抗学习, 对预训练后的 专家跟踪器进行微调, 通过微调后的专 家跟踪器输出建议动作。 5.如权利要求3所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 在对 学生跟踪器进 行训练时, 采用学生目标对象对学生跟踪器进 行引导, 其中, 学生目标对象模 型选用专 家策略池中的专 家目标对象模型。 6.如权利要求1所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 专家 跟踪器和学生跟踪器均包括卷积神经网络和序列模型, 专家跟踪器中的卷积神经网络对局 部地图和智能体相对运动轨迹进行编码, 获得编码信息, 通过序列模型对编码信息进行识 别, 获得建议动作; 学生跟踪器中的卷积神经网络对场景观测图像进行编码, 获得编码信 息, 通过序列模型对编码信息进行识别, 获得决策动作。 7.如权利要求6所述的一种基于专家策略指导的主动目标跟踪方法, 其特征在于, 学生 跟踪器的损失函数包括特征 空间上损失和 动作空间上损失, 动作空间上损失采用KL散度计 算, 特征空间上损失通过专家跟踪器与学生跟踪器中卷积神经网络输出的相似性计算获 得。 8.一种基于专 家策略指导的主动目标跟踪系统, 其特 征在于, 包括: 训练数据获取模块, 用于获取场景观测图像、 场景地图和智能体位姿;权 利 要 求 书 1/2 页 2 CN 115439510 A 2第一阶段训练模块, 用于根据场景地图和智能体位姿, 获得每个智能体的局部地图和 每个局部地图中所有智能体运动轨迹, 作为第一训练数据; 将第一训练数据分别输入专家 跟踪器和专家目标对 象中, 由专家目标对 象和专家跟踪器进行对抗强化学习, 通过专家跟 踪器输出建议动作; 学生跟踪器训练模块, 用于将场景观测图像输入学生跟踪器中, 将建议动作作为场景 观测图像的标签对学生跟踪器进行训练, 获得训练好的学生跟踪器; 实例跟踪模块, 用于利用训练好的学生跟踪器对获取的场景实时图像进行识别, 获得 智能体决策动作。 9.一种电子设备, 其特征在于, 包括存储器和处理器以及存储在存储器上并在处理器 上运行的计算机指 令, 所述计算机指 令被处理器运行时, 完成权利要求 1‑7任一项所述的一 种基于专 家策略指导的主动目标跟踪方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 用于存储计算机指令, 所述计算机指令被 处理器执行时, 完成权利要求1 ‑7任一项所述的一种基于专家策略指导的主动目标跟踪方 法的步骤。权 利 要 求 书 2/2 页 3 CN 115439510 A 3
专利 一种基于专家策略指导的主动目标跟踪方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:23:52
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 38548.1-2020 内容资源数字化加工 第1部分:术语.pdf
DB5104-T 54.1-2022 节能改造技术规范 第1部分:水泵系统 攀枝花市.pdf
法律法规 最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释2019-10-21.pdf
大同市建筑节能条例.pdf
JY-T 0578-2020 超导脉冲傅里叶变换核磁共振波谱测试方法通则.pdf
DB2201-T 16-2022 城市智能体数据治理技术规范 长春市.pdf
GB-T 42456-2023 工业自动化和控制系统信息安全 IACS组件的安全技术要求 IEC 62443-4-2-2019.pdf
GB-T 28701-2012 胀紧联结套.pdf
GB-T 32212-2015 液相色谱用固定波长光度检测器的测试方法.pdf
GB 1589-2016 汽车、挂车及汽车列车外廓尺寸、 轴荷及质量限值.pdf
SY-T 5974-2020 钻井井场设备作业安全技术规程.pdf
GB-T 31058-2014 电子工业用气体 四氟化硅.pdf
商用密码应用安全性测评机构管理办法(试行).pdf
NY-T 1281-2007 花卉植物真菌病害检测规程.pdf
QC-T 1162-2022 汽车外饰件用蜂窝夹层结构制品.pdf
汽车数据安全管理若干规定(试行).pdf
DB43-T 1315-2023 森林城市评价指标 湖南省.pdf
GB-T 10085-2018 圆柱蜗杆传动基本参数.pdf
GB-T 40218-2021 工业通信网络 网络和系统安全 工业自动化和控制系统信息安全技术.pdf
SN-T 5410.1-2022 铅矿及主要含铅的矿渣鉴别方法 第1部分:通则.pdf
交流群
-->
1
/
19
评价文档
赞助2元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。