专利视频数据处理方法、装置、计算机设备和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210241616.2 (22)申请日 2022.03.11 (71)申请人游密科技（深圳）有限公司地址 518051 广东省深圳市南山区粤海街道科技园社区科苑路16号东方科技大厦2401 (72)发明人崔洋洋　余俊澎　 (74)专利代理机构华进联合专利商标代理有限公司 44224 专利代理师周旋 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G10L 15/26(2006.01) H04N 21/233(2011.01) H04N 21/234(2011.01) H04N 21/2343(2011.01) (54)发明名称视频数据处理方法、装置、计算机设备和存储介质 (57)摘要本申请涉及一种视频数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取视频文本数据和视频文本数据特征；通过关联规则算法，计算视频文本数据的支持度和置信度，根据支持度和置信度构建支持向量机模型；将视频文本数据特征输入支持向量机模型，获得视频文本数据的分类结果；将视频文本数据的分类结果通过知识抽取和知识加工，构建视频知识图谱。采用本方法充分利用了视频文本数据的关联规则，将视频文本数据特征输入支持向量机模型，能够提高支持向量机模型的分类精度，提高视频数据的可理解性，基于视频文本数据分类结果构建知识图谱的方法能够将视频文本数据之间联系起来，进一步提高视频数据的可理解性。权利要求书2页说明书15页附图7页 CN 114637846 A 2022.06.17 CN 114637846 A 1.一种视频数据处理方法，其特征在于，所述方法包括：获取视频文本数据和视频文本数据特征；通过关联规则算法，计算所述视频文本数据的支持度和置信度，根据所述支持度和所述置信度构建支持向量机模型；将所述视频文本数据特征输入所述支持向量机模型，获得所述视频文本数据的分类结果；将所述视频文本数据的分类结果通过知识抽取和知识加工，构建视频知识图谱。 2.根据权利要求1所述的方法，其特征在于，所述获取视频文本数据和视频文本数据特征包括：获取视频文本数据；将所述视频文本数据基于自然语言处理进行文本切分和特征提取，获得切分后的视频文本数据和视频文本数据特征。 3.根据权利要求2所述的视频数据处理方法，其特征在于，所述将所述视频文本数据基于自然语言处理进行文本切分和特征提取，获得切分后的视频文本数据和视频文本数据特征之前，还包括：根据所述视频文本数据，生成训练样本；将所述训练样本输入预置分段线性分类模型进行训练，获得训练后的分段线性分类模型和分类后的视频文本数据；将所述分类后的视频文本数据通过自然语言处理进行文本切分和特征提取，获得切分后的视频文本数据和视频文本数据特征。 4.根据权利要求3所述的视频数据处理方法，其特征在于，所述将所述分类后的视频文本数据通过自然语言处理进行文本切分和特征提取，获得切分后的视频文本数据和视频文本数据特征之后，还包括：根据所述视频文本数据，生成验证样本；将所述验证样本输入所述训练后的分段线性分类模型，获得模型评估值；若所述模型评估值不满足预设评估条件，则优化所述分类后的分段线性分类器模型，获得优化后的分段线性分类模型；将所述优化后的分段线性分类模型更新为所述预置分段线性分类模型，返回所述将所述训练样本输入预置分段线性分类模型进行训练，获得训练后的分段线性分类模型和分类后的视频文本数据的步骤。 5.根据权利要求2所述的视频数据处理方法，其特征在于，所述将所述视频文本数据基于自然语言处理进行文本切分和特征提取，获得切分后的视频文本数据和视频文本数据特征包括：通过数据预处理和短语抽取算法对视频文本数据进行切分，获得切分后的视频文本数据；对所述切分后的视频文本数据进行特征提取，获得视频文本数据特征。 6.根据权利要求1所述的视频数据处理方法，其特征在于，所述将所述视频文本数据的分类结果通过知识抽取和知识加工，构建视频知识图谱包括：将所述视频文本数据的分类结果通过知识抽取，获得实体和实体关系；权　利　要　求　书 1/2 页 2 CN 114637846 A 2将所述实体和所述实体关系通过知识加工，获得加工后的实体、加工后的实体关系以及质量评估结果；若所述质量评估结果小于预设质量评估值，则将所述加工后的实体和所述加工后的实体关系赋给所述视频文本数据的分类结果，返回所述将所述视频文本数据的分类结果通过知识抽取，获得实体和实体关系的步骤；若所述质量评估结果不小于预设质量评估值，则根据所述加工后的实体和所述加工后的实体关系，构建视频知识图谱。 7.根据权利要求1所述的视频数据处理方法，其特征在于，所述获取视频文本数据包括：获取视频数据，并提取所述视频数据中的图像数据、音频数据以及直接文本数据；采用ASR音频识别技术将所述音频数据转化为音频文本数据；采用OCR识别技术将所述图像数据中的文本信息转化为图像文本数据；归集所述音频文本数据、所述图像文本数据以及所述直接文本数据，获得视频文本数据。 8.一种视频数据处理装置，其特征在于，所述装置包括：数据获取模块，用于获取视频文本数据和视频文本数据特征；模型构建模块，用于通过关联规则算法，计算所述视频文本数据的支持度和置信度，根据所述支持度和所述置信度构建支持向量机模型；分类结果获取模块，用于将所述视频文本数据特征输入所述支持向量机模型，获得所述视频文本数据的分类结果；知识图谱构建模块，用于将所述视频文本数据的分类结果通过知识抽取和知识加工，构建视频知识图谱。 9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权　利　要　求　书 2/2 页 3 CN 114637846 A 3

专利 视频数据处理方法、装置、计算机设备和存储介质

专利视频数据处理方法、装置、计算机设备和存储介质