全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211381390.2 (22)申请日 2022.11.07 (71)申请人 江西风向标智能科技有限公司 地址 330000 江西省南昌市南昌经济技 术 开发区麦园路1栋 (72)发明人 涂金涛 谢德刚 杨升全  (74)专利代理 机构 南昌旭瑞知识产权代理事务 所(普通合伙) 36150 专利代理师 万建 (51)Int.Cl. G06F 40/111(2020.01) G06F 40/279(2020.01) G06F 16/36(2019.01) G06F 16/35(2019.01) G06Q 50/20(2012.01) (54)发明名称 数学题目出题意图识别方法、 系统、 存储介 质及设备 (57)摘要 本发明公开了一种数学题目出题意图识别 方法、 系统、 存储介质及设备, 该方法包括获取待 识别的数学题目, 对待识别的数学题目中的数学 符号以及公式进行识别解析以得到数学题目文 本; 对数学题目文本进行指代消解, 消除数学题 目文本中的代词, 以识别出数学题目文本的题 意; 识别数学题目文本中的条件及设问语句, 将 条件及设问语句进行切割, 以还原待识别的数学 题目的求解逻辑, 对切割后的数学题目文本进行 关键数学元素提取; 对提取后的关键数学元素根 据预设的知识图谱中的组合关系, 利用预设分类 模型进行精 准组合, 以解析出待识别的数学题目 的出题逻辑和意图。 本发明解决了现有技术中对 出题意图进行识别时效率以及准确率低的问题。 权利要求书3页 说明书11页 附图1页 CN 115438624 A 2022.12.06 CN 115438624 A 1.一种数 学题目出题意图识别方法, 其特 征在于, 所述方法包括: 获取待识别的数学题目, 对所述待识别的数学题目中的数学符号以及公式进行识别解 析以得到数 学题目文本; 对所述数学题目文本进行指代消解, 消除所述数学题目文本中的代词, 以识别出所述 数学题目文本的题意; 识别所述数学题目文本中的条件及设问语句, 将所述条件及设问语句进行切割, 以还 原所述待识别的数学题目的求解逻辑, 对切割后的所述数学题目文本进 行关键数学元素提 取; 对提取后的所述关键数学元素根据 预设的知识图谱中的组合关系, 利用预设分类模型 进行精准组合, 以解析 出所述待识别的数 学题目的出题逻辑和意图。 2.根据权利要求1所述的数学题目出题意图识别方法, 其特征在于, 所述对提取后的所 述关键数学元素根据预设的知识图谱中的组合关系, 利用预设分类模型进行精准组合, 以 解析出所述待识别的数 学题目的出题逻辑和意图的步骤 包括: 使用中心滑动 窗口算法 以提取后的所述关键数学元素的性质类型数学元素为中心进 行滑动选取左右窗口内的实体 类型数学元素; 根据所述性质类型数学元素与实体类型数学元素之间的距离确定与所述性质类型数 学元素之 间有组合关系的目标实体类型数学元素, 并对所述目标实体类型数学元素与所述 性质类型 数学元素进行组合, 以解析 出所述待识别的数 学题目的出题逻辑和意图。 3.根据权利要求2所述的数学题目出题意图识别方法, 其特征在于, 根据 所述性质类型 数学元素与实体类型数学元素之间的距离确定与所述性质类型数学元素之间有组合关系 的目标实体类型数学元素, 并对所述目标实体类型数学元素与所述性质类型数学元素进 行 组合的步骤 包括: 利用预设分类模型对所述性质类型数学元素与实体类型数学元素之间的距离进行比 较, 以确定以所述性质类型数学元素进行组合的实体类型数学元素并对所述性质类型数学 元素与实体 类型数学元素进行组合。 4.根据权利要求3所述的数学题目出题意图识别方法, 其特征在于, 所述预设分类模型 的数学模型为: ; 其中: L1表示中心性质的左窗口所有元 素与中心性质距离函数; L2表示中心性质的右窗口所有元 素与中心性质距离函数; W表示中心性质窗口取值; Xj表示左右窗口中的与中心性质距离为j的元素, 若该元素是可以与中心性质进行组合 的实体, 则Xj=1, 否则Xj=0;权 利 要 求 书 1/3 页 2 CN 115438624 A 2i表示可以与中心性质进行组合的最近元 素的位置索引; di表示可以与中心性质进行组合的最近元 素距离中心性质的距离; α 表示中心性质左边窗口元 素距离变化的比例系数; β 表示中心性质右边 窗口元素距离变化的比例系数; γ表示右边 窗口相对左边窗口距离 变化的比例系数。 5.根据权利要求4所述的数学题目出题意图识别方法, 其特征在于, 所述预设分类模型 的约束条件为: ; 其中: E表示能与中心性质形成有效组合的实体; O表示无法与中心性质形成有效组合的其 他实体、 性质和独立体; left表示中心性质左边窗口; right表示中心性质右边窗口; EOO (left) 表示左边窗口距离中心性质距离为1的元素是O, 距离为2的元素是 O, 距离为 3的元素是E; OEE (right) 表示右边窗口距离中心性质距离为1的元素是 O, 距离为2的元素是 E, 距离 为3的元素是E; ; 其中: index表示L1和L2中最小值的索引, 取值 为0或1; class表示当L1和L2取值在(0,3)之间时, class=1 or 2, 否则class=0。 6.根据权利要求1所述的数学题目出题意图识别方法, 其特征在于, 预设分类模型的训 练过程为: 采集训练数据集, 使用采集训练数据集中的标记数据进行训练得到第一分类模型; 利用所述第 一分类模型对无标签数据进行预测, 得出预测概率并通过所述预测概率筛 选出高置信度样本; 使用有标记数据以及伪标签数据训练第 二分类模型, 将所述第 一分类模型替换所述第 二分类模型, 后进行重复训练将模型参数优化至预设值以得到所述预设 分类模型。 7.根据权利要求1至6中任一项所述的数学题目出题意图识别方法, 其特征在于, 所述 对提取后的所述关键数学元素根据预设的知识图谱中的组合关系, 利用预设分类模型进 行权 利 要 求 书 2/3 页 3 CN 115438624 A 3

.PDF文档 专利 数学题目出题意图识别方法、系统、存储介质及设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数学题目出题意图识别方法、系统、存储介质及设备 第 1 页 专利 数学题目出题意图识别方法、系统、存储介质及设备 第 2 页 专利 数学题目出题意图识别方法、系统、存储介质及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:43:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。