全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210241616.2 (22)申请日 2022.03.11 (71)申请人 游密科技 (深圳) 有限公司 地址 518051 广东省深圳市南 山区粤海街 道科技园社区科苑路16号东方科技大 厦2401 (72)发明人 崔洋洋 余俊澎  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 周旋 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G10L 15/26(2006.01) H04N 21/233(2011.01) H04N 21/234(2011.01) H04N 21/2343(2011.01) (54)发明名称 视频数据处理方法、 装置、 计算机设备和存 储介质 (57)摘要 本申请涉及一种视频数据处理方法、 装置、 计算机设备、 存储介质和计算机程序产品。 所述 方法包括: 获取视频文本数据和视频文本数据特 征; 通过关联规则算法, 计算视频文本数据的支 持度和置信度, 根据支持度和置信度构建支持向 量机模型; 将视频文本数据特征输入支持向量机 模型, 获得视频文本数据的分类结果; 将视频文 本数据的分类结果通过知识抽取和知识加工, 构 建视频知识图谱。 采用本方法充分利用了视频文 本数据的关联规则, 将视频文本数据特征输入支 持向量机模 型, 能够提高支持向量机模型的分类 精度, 提高视频数据的可理解性, 基于视频文本 数据分类结果构建知识 图谱的方法能够将视频 文本数据之间联系起来, 进一步提高视频数据的 可理解性。 权利要求书2页 说明书15页 附图7页 CN 114637846 A 2022.06.17 CN 114637846 A 1.一种视频 数据处理方法, 其特 征在于, 所述方法包括: 获取视频文本数据和视频文本数据特 征; 通过关联规则算法, 计算所述视频文本数据的支持度和置信度, 根据所述支持度和所 述置信度构建支持向量机模型; 将所述视频文本数据 特征输入所述支持向量机模型, 获得所述视频文本数据的分类结 果; 将所述视频文本数据的分类结果 通过知识抽取和知识加工, 构建视频知识图谱。 2.根据权利要求1所述的方法, 其特征在于, 所述获取视频文本数据和视频文本数据 特 征包括: 获取视频文本数据; 将所述视频文本数据基于自然语言处理进行文本切分和特征提取, 获得切分后的视频 文本数据和视频文本数据特 征。 3.根据权利要求2所述的视频数据处理方法, 其特征在于, 所述将所述视频文本数据基 于自然语言处理进行文本切分和特征提取, 获得切分后的视频文本数据和视频文本数据特 征之前, 还 包括: 根据所述视频文本数据, 生成训练样本; 将所述训练样本输入预置分段线性分类模型进行训练, 获得训练后的分段线性分类模 型和分类后的视频文本数据; 将所述分类后的视频文本数据通过自然语言处理进行文本切分和特征提取, 获得切分 后的视频文本数据和视频文本数据特 征。 4.根据权利要求3所述的视频数据处理方法, 其特征在于, 所述将所述分类后的视频文 本数据通过自然语言处理进行文本切分和特征提取, 获得切分后的视频文本数据和视频文 本数据特 征之后, 还 包括: 根据所述视频文本数据, 生成验证样本; 将所述验证样本 输入所述训练后的分段线性分类模型, 获得模型评估值; 若所述模型评估值不满足预设评估条件, 则优化所述分类后的分段线性分类器模型, 获得优化后的分段线性分类模型; 将所述优化后的分段线性分类模型更新为所述预置分段线性分类模型, 返回所述将所 述训练样本输入预置分段线性分类模型进 行训练, 获得训练后的分段线性分类模型和分类 后的视频文本数据的步骤。 5.根据权利要求2所述的视频数据处理方法, 其特征在于, 所述将所述视频文本数据基 于自然语言处理进行文本切分和特征提取, 获得切分后的视频文本数据和视频文本数据特 征包括: 通过数据 预处理和短语抽取算法对视频文本数据进行切分, 获得切分后的视频文本数 据; 对所述切分后的视频文本数据进行 特征提取, 获得视频文本数据特 征。 6.根据权利要求1所述的视频数据处理方法, 其特征在于, 所述将所述视频文本数据的 分类结果 通过知识抽取和知识加工, 构建视频知识图谱 包括: 将所述视频文本数据的分类结果 通过知识抽取, 获得实体和实体关系;权 利 要 求 书 1/2 页 2 CN 114637846 A 2将所述实体和所述实体关系通过知识加工, 获得加工后的实体、 加工后的实体关系以 及质量评估结果; 若所述质量评估结果小于预设质量评估值, 则将所述加工后的实体和所述加工后的实 体关系赋给所述视频文本数据的分类结果, 返回所述将所述视频文本数据的分类结果通过 知识抽取, 获得实体和实体关系的步骤; 若所述质量评估结果不小于预设质量评估值, 则根据所述加工后的实体和所述加工后 的实体关系, 构建视频知识图谱。 7.根据权利要求1所述的视频数据处理方法, 其特征在于, 所述获取视频文本数据包 括: 获取视频 数据, 并提取 所述视频 数据中的图像数据、 音频 数据以及直接文本数据; 采用ASR音频识别技 术将所述音频 数据转化为音频文本数据; 采用OCR识别技 术将所述图像数据中的文本信息转 化为图像文本数据; 归集所述音频文本数据、 所述图像文本数据以及所述直接文本数据, 获得视频文本数 据。 8.一种视频 数据处理装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取视频文本数据和视频文本数据特 征; 模型构建模块, 用于通过关联规则算法, 计算所述视频文本数据的支持度和置信度, 根 据所述支持度和所述置信度构建支持向量机模型; 分类结果获取模块, 用于将所述视频文本数据特征输入所述支持向量机模型, 获得所 述视频文本数据的分类结果; 知识图谱构建模块, 用于将所述视频文本数据的分类结果通过知识抽取和知识加工, 构建视频知识图谱。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114637846 A 3

.PDF文档 专利 视频数据处理方法、装置、计算机设备和存储介质

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频数据处理方法、装置、计算机设备和存储介质 第 1 页 专利 视频数据处理方法、装置、计算机设备和存储介质 第 2 页 专利 视频数据处理方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:00:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。