全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210087558.2 (22)申请日 2022.01.25 (71)申请人 广州视源电子科技股份有限公司 地址 510530 广东省广州市黄埔区云埔四 路6号 申请人 广州视源人工智能创新研究院有限 公司 (72)发明人 李智  (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 专利代理师 付婧 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 16/33(2019.01)G06F 40/30(2020.01) G06F 40/242(2020.01) G06F 40/284(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于多标签分类和知识库匹配结合的课件 知识点分类方法 (57)摘要 本申请涉及神经网络及知识点分类技术领 域, 具体来说, 本申请涉及基于多标签分类和知 识库匹配结合的课件知 识点分类方法。 所述方法 包括: 获取课件并对其进行预处理, 得到目标文 本; 根据所述目标文本的坐标轴对文本排序, 得 到分页的文本序列; 将所有的文本序列拼成长文 本; 将所述长文本输入基于神经网络的多标签文 本分类模型进行多标签分类, 得到候选的知 识点 列表; 对所述候选的知 识点列表基于知识库匹配 进行验证, 得到目标知识点列表。 本申请减少了 对人工操作的依赖, 降低了工作成本, 实现了对 知识点更加精 准的分类与识别, 进而提升了工作 效率。 权利要求书2页 说明书9页 附图4页 CN 114564578 A 2022.05.31 CN 114564578 A 1.一种基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述 方法包括: 获取课件并对其进行 预处理, 得到目标文本; 根据所述目标文本的坐标轴对文本排序, 得到分页的文本序列; 将所有的文本序列拼成长文本; 将所述长文本输入基于神经网络的多标签文本分类模型进行多标签分类, 得到候选的 知识点列表; 对所述候选的知识点列表基于知识库匹配进行验证, 得到目标知识点列表。 2.根据权利要求1所述的基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述对所述候选的知识点列表基于知识库匹配进行验证, 得到目标知识点列 表, 包括: 在所述分页的文本序列中筛选知识点定义类作为第 一类知识点, 并筛选学习目标或学 习总结类作为第二类知识点; 将所述第一类知识点与所述 候选的知识点列表基于词向量的语义相似度进行匹配; 将所述第二类知识点与所述 候选的知识点列表对应的知识点词典进行匹配; 将所述候选的知识点列表中第一类知识点和第二类知识点匹配成功的知识点视为通 过验证, 得到目标知识点列表。 3.根据权利要求2所述的基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述将所述第一类知识点与所述候选的知识点列 表基于词向量的语义相似度 进行匹配, 包括: 将第一类知识点中词向量加权求和取平均后得到对应的第一句向量; 将候选的知识点列表中词向量加权求和取平均后得到对应的第二句向量; 计算第一句向量与第二句 相量之间的余弦相似值; 当所述余弦相似值大于预设阈值时, 记作该知识点匹配成功。 4.根据权利要求2所述的基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述将所述第二类知识点与所述候选的知识点列 表对应的知识 点词典进 行匹 配, 包括: 获取所述候选的知识点列表对应的知识点词典; 基于最大后向匹配的方法将所述第二类知识点与所述 候选的知识点列表进行匹配; 当匹配后对应的关键词大于1时, 则记作该知识点匹配成功。 5.根据权利要求1所述的基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述基于神经网络的多 标签文本 分类模型采用T extCNN的方式进 行建模, 且采 用TextCN N的方式建立的模型的最后一层采用sigmod函数进行计算。 6.根据权利要求5所述的基于多标签分类和知识库匹配结合的课件知识点分类方法, 其特征在于, 所述方法还 包括: 将得到的目标知识点列表作为训练样本训练所述基于神经网络的多标签文本分类模 型; 将训练好的所述基于神经网络的多标签文本分类模型用于预设应用场景的文本识别。 7.根据权利要求1所述的基于多标签分类和知识库匹配结合的课件知识点分类方法,权 利 要 求 书 1/2 页 2 CN 114564578 A 2其特征在于, 所述获取课件并对其进行 预处理, 得到目标文本, 包括: 获取课件; 将所述课件转换为计算机可读的格式; 从转换后的课件中提取文本, 得到目标文本 。 8.一种基于多标签分类和知识库匹配结合的课件知识点分类装置, 其特征在于: 所述 装置包括: 获取模块, 用于获取课件并对其进行 预处理, 得到目标文本; 排序模块, 用于根据所述目标文本的坐标轴对文本排序, 得到分页的文本序列; 拼接模块, 用于将所有的文本序列拼成长文本; 多标签模块, 用于将所述长文本输入基于神经网络的多标签文本分类模型进行多标签 分类, 得到候选的知识点列表; 匹配验证模块, 用于对所述候选的知识点列表基于知识库匹配进行验证, 得到目标知 识点列表。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处 理器执行时实现权利要求1 ‑7任一所述方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1 ‑7任一所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114564578 A 3

PDF文档 专利 基于多标签分类和知识库匹配结合的课件知识点分类方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多标签分类和知识库匹配结合的课件知识点分类方法 第 1 页 专利 基于多标签分类和知识库匹配结合的课件知识点分类方法 第 2 页 专利 基于多标签分类和知识库匹配结合的课件知识点分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。