说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210612861.X (22)申请日 2022.05.31 (71)申请人 上海商汤智能科技有限公司 地址 200233 上海市徐汇区桂平路391号3 号楼1605A室 (72)发明人 李帅成 杨昆霖 侯军 伊帅 (74)专利代理 机构 北京林达刘知识产权代理事 务所(普通 合伙) 11277 专利代理师 刘新宇 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/20(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/766(2022.01)G06V 10/764(2022.01) G06V 10/74(2022.01) G06N 3/04(2006.01) (54)发明名称 时序动作提名的生 成方法及装置、 电子设备 和存储介质 (57)摘要 本公开涉及一种时序动作提名的生成方法 及装置、 电子设备和存储介质, 所述方法包括: 对 由待识别视频得到的多个视频片段进行特征提 取, 得到多个第一特征; 针对任一所述视频片段, 基于所述视频片段及其邻近视频片段之间的关 联关系, 对所述视频片段的第一特征进行更新, 得到所述视频片段的第二特征, 其中, 所述邻近 视频片段位于所述视频片段的目标邻域内; 基于 所述多个视频片段的第二特征, 生成所述待识别 视频的目标时序动作提名。 本公开实施例可以生 成待识别视频对应的准确率较高的目标时序动 作提名。 权利要求书2页 说明书16页 附图3页 CN 115035440 A 2022.09.09 CN 115035440 A 1.一种时序动作提名的生成方法, 其特 征在于, 包括: 对由待识别视频 得到的多个视频片段进行 特征提取, 得到多个第一特 征; 针对任一所述视频片段, 基于所述视频片段及其邻近视频片段之间的关联关系, 对所 述视频片段的第一特征进 行更新, 得到所述视频片段的第二特征, 其中, 所述邻近视频片段 位于所述视频片段的目标邻域内; 基于所述多个视频片段的第二特 征, 生成所述待识别视频的目标时序动作提名。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述视频片段及其邻 近视频片段 之间的关联关系, 对 所述视频片段的第一特征进 行更新, 得到所述视频片段的第二特征, 包 括: 针对任一所述视频片段, 提取所述视频片段及其邻 近视频片段的第 一特征在时序 上的 上下文信息, 得到所述视频片段的第三特 征; 确定所述视频片段与其邻近 视频片段之间的目标相似度权 重; 基于所述目标相似度权重, 对所述视频片段及其邻近视频片段的第三特征进行融合, 以更新所述视频片段的第一特 征; 迭代地执行上述步骤, 在达到预设迭代次数的情况下, 将所述视频片段对应的更新后 的第一特 征, 确定为所述视频片段的第二特 征。 3.根据权利要求2所述的方法, 其特 征在于, 所述目标邻域对应至少一个邻域尺度; 所述确定所述视频片段与其邻近 视频片段之间的目标相似度权 重, 包括: 针对任一所述邻域尺度, 确定所述视频片段与其在所述邻域尺度 下对应的邻 近视频片 段之间的初始相似度权 重; 对所述至少一个邻域尺度对应的初始相似度权重进行融合, 得到所述目标相似度权 重。 4.根据权利要求3所述的方法, 其特征在于, 所述确定所述视频片段与其在所述邻域尺 度下对应的邻近 视频片段之间的初始相似度权 重, 包括: 针对任一所述视频片段, 对所述视频片段与其在所述邻域尺度 下对应的邻 近视频片段 的第三特征, 进行编码处理, 得到所述视频片段与其在所述邻域尺度下对应的邻近视频片 段之间的关系特 征; 对所述关系特征进行解码处理, 得到所述视频片段与其在所述邻域尺度 下对应的邻 近 视频片段之间的初始相似度权 重。 5.根据权利要求3所述的方法, 其特征在于, 所述确定所述视频片段与其在所述邻域尺 度下对应的邻近 视频片段之间的初始相似度权 重, 包括: 针对任一所述视频片段, 确定所述视频片段的第三特征, 与其在所述邻域尺度下对应 的邻近视频片段的第三特 征之间的特 征距离; 基于所述特征距离, 得到所述视频片段与其在所述邻域尺度下对应的邻 近视频片段之 间的初始相似度权 重。 6.根据权利要求2至5中任意一项所述的方法, 其特征在与, 所述基于所述目标相似度 权重, 对所述视频片段及其邻近视频片段的第三特征进行融合, 以更新所述视频片段的第 一特征, 包括: 将所述视频片段的第 三特征, 以及所述目标相似度权重大于相似度权重阈值的邻 近视权 利 要 求 书 1/2 页 2 CN 115035440 A 2频片段的第三特 征进行融合, 以更新所述视频片段的第一特 征。 7.根据权利要求1至6中任意一项所述的方法, 其特征在于, 所述基于所述多个视频片 段的第二特 征, 生成所述待识别视频的目标时序动作提名, 包括: 基于所述多个视频片段的第二特征, 进行分类处理, 得到所述待识别视频的第一初始 时序动作提名; 基于所述多个视频片段的第 二特征, 以及所述第 一初始时序动作提名, 进行回归处理, 得到所述待识别视频的第二初始时序动作提名; 基于所述第 一初始时序动作提名和所述第 二初始时序动作提名, 确定所述目标时序动 作提名。 8.一种时序动作提名的生成装置, 其特 征在于, 包括: 特征提取模块, 用于对由待识别视频得到的多个视频片段进行特征提取, 得到多个第 一特征; 更新模块, 用于针对任一所述视频片段, 基于所述视频片段及其邻近视频片段之间的 关联关系, 对所述视频片段的第一特征进行更新, 得到所述视频片段的第二特征, 其中, 所 述邻近视频片段位于所述视频片段的目标邻域内; 提名生成模块, 用于基于所述多个视频片段的第二特征, 生成所述待识别视频的目标 时序动作提名。 9.一种电子设备, 其特 征在于, 包括: 处理器; 用于存储处理器可执行指令的存 储器; 其中, 所述处理器被配置为调用所述存储器存储的指令, 以执行权利要求1至7中任意 一项所述的方法。 10.一种计算机可读存储介质, 其上存储有计算机程序指令, 其特征在于, 所述计算机 程序指令被处 理器执行时实现权利要求1至7中任意 一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115035440 A 3
专利 时序动作提名的生成方法及装置、电子设备和存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:29:01
上传分享
举报
下载
原文档
(779.6 KB)
分享
友情链接
GB 4824-2019 工业、科学和医疗设备 射频骚扰特性 限值和测量方法.pdf
互联网信息服务管理办法(修订草案征求意见稿).pdf
GB-T 14337-2022 化学纤维 短纤维拉伸性能试验方法.pdf
DB42-T 1951-2023 桥梁结构健康信息化监测技术规范 湖北省.pdf
GB-T 9651-2008 单相异步电动机试验方法.pdf
NB-T 10882—2021 梯级水库群安全风险防控导则.pdf
T-FJLY 001—2022 自然教育基地质量评定.pdf
GM-T 0108-2021 诱骗态BB84量子密钥分配产品技术规范.pdf
GB-T 42860-2023 运载火箭运输通用要求.pdf
MH-T 1020-2013 锂电池航空运输规范.pdf
国泰君安 计算机行业:态势感知,预见未来 2019.pdf
GB-T 2424.6-2021 环境试验 第3部分:支持文件及导则 温度-湿度试验箱性能确认.pdf
GB-T 21825-2008 玻璃纤维土工格栅.pdf
T-GDATCM 0009—2023 厚朴 厚朴 煮散饮片.pdf
T-GDTA 005—2023 粤地优品 评价通用要求.pdf
GB-T 40765-2021 基础地理信息本体模型.pdf
GB-T 15227-2019 建筑幕墙气密、水密、抗风压性能检测方法.pdf
GB-T 32065.14-2019 海洋仪器环境试验方法 第14部分振动试验.pdf
GB-T 37025-2018 信息安全技术 物联网数据传输安全技术要求.pdf
GB-T 20274.3-2008 信息安全技术 信息系统安全保障评估框架 第3部分:管理保障.pdf
1
/
22
评价文档
赞助2.5元 点击下载(779.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。