全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211152036.2 (22)申请日 2022.09.21 (71)申请人 广东电网有限责任公司 地址 510600 广东省广州市越秀区东 风东 路757号 申请人 广东电网有限责任公司中山供电局 (72)发明人 关振坚 唐涛涛 刘志欣 罗其锋  吕叶卿 陈月辉 冯文超 林甲川  侯伟 陈光景 罗妙茵 蒋杰锋  许文政 徐颖斯  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 许庆胜 (51)Int.Cl. G06F 16/31(2019.01)G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/242(2020.01) G06N 5/02(2006.01) G06Q 50/06(2012.01) (54)发明名称 一种基于文本挖掘的操作票校核 方法、 系统 及设备 (57)摘要 本申请涉及电力运行与管 理技术领域, 提供 一种基于文本挖掘的操作票校核方法、 系统及设 备, 方法包括: 通过对操作票数据库中的历史操 作票进行文本挖掘, 划分历史操作票中的电力名 词、 动词和介词, 并识别出不同词性词语的组合 关系; 以电力名词构建词典作为数据库; 根据动 词或介词与电力名词的组合关系得到句式规则 构建知识库; 以两库对待校核操作校核后, 准许 出票的正确操作票再作为历史操作票存入操作 票数据库中, 进行文本挖掘, 补充数据库和知识 库, 使得两库在文本挖掘和校核的循环中, 不仅 保证了操作票出票校核的可靠性, 还实现了知识 库和数据库的自适应更新。 权利要求书2页 说明书9页 附图2页 CN 115455133 A 2022.12.09 CN 115455133 A 1.一种基于文本挖掘的操作票校核方法, 其特 征在于, 包括: 对操作票数据库中的历史操作票进行文本挖掘, 通过文本分词和词性标注, 划分历史 操作票中的电力名词、 动词和介词, 并识别不同词性词语的组合关系; 以电力名词构建词 典, 将词典作为数据库; 根据动词或介词与电力名词的组合关系得到句式规则, 构建知识 库; 以数据库和知识库对待校核操作票进行 校核; 若校核结果 为正确, 则准许 出票; 将出票后的操作票作为历史操作票存入操作票数据库中, 进行文本挖掘, 补充数据库 和知识库。 2.根据权利要求1所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述以电力名 词构建词典, 将词典作为数据库, 具体为: 从电力名词中提取厂站名称、 箱柜名称、 设备编号和设备名称等关键词语, 构建对应厂 站、 箱柜和设备的三层字典, 作为数据库。 3.根据权利要求1所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述根据动词 或介词与电力名词的组合关系得到句式规则, 构建知识库, 具体为: 提取动词和介词, 根据动词或介词与电力名词的组合关系得到句式规则, 构造句式规 则对应的正则表达式, 形成知识库。 4.根据权利要求1所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述对历史操 作票进行文本挖掘之后还 包括: 经过对预设数量的历史操作票文本挖掘后, 统计字典中各词语出现频率, 以及各句式 规则的出现频率, 在数据库和知识库中剔除出现频率低于阈值的词语和句式规则。 5.根据权利要求1所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述以数据库 和知识库对待校核操作票进行 校核之后, 还 包括: 若校核结果 为错误, 则生成修改意见, 并对修改意见 逐条进行人工核验。 6.根据权利要求5所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述对修改意 见逐条进行人工核验具体为: 对修改意见逐条进行人工核验, 判断修改意见是否正确; 若核验结果为修改意见正确, 根据修改意见对操作票相应位置进行修改, 并发送至一线人员和专 家处进行反馈和学习。 7.根据权利要求6所述的基于文本挖掘的操作票校核方法, 其特征在于, 所述对修改意 见逐条进行人工核验, 判断修改意见 是否正确之后, 还 包括: 若核验结果为修改意见错误, 则通过反更新直接对修改意见对应的内容在知识库或数 据库中进行逆向更新。 8.一种基于文本挖掘的操作票校核系统, 其特 征在于, 包括: 操作票数据库, 分别与文本挖掘模块和自适应更新模块连接, 用于存 储历史操作票; 文本挖掘模块, 用于对操作票数据库中的历史操作票进行文本挖掘, 通过文本分词和 词性标注, 划分历史操作票中的电力名词、 动词和介词, 并识别不同词性词语的组合关系; 以电力名词构建词典, 将词典作为数据库; 根据动词或介词与电力名词的组合关系得到句 式规则, 构建知识库; 操作票校核模块, 用于以数据库和知识库对待校核操作票进行校核; 若校核结果为正 确, 则准许 出票;权 利 要 求 书 1/2 页 2 CN 115455133 A 2自适应更新模块, 用于将出票后的操作票作为历史操作票存入操作票数据库中, 进行 文本挖掘, 补充数据库和知识库。 9.根据权利要求8所述的基于文本挖掘的操作票校核系统, 其特征在于, 所述文本挖掘 模块中, 根据动词或介词与电力名词的组合关系得到句式规则, 构建知识库, 具体为: 提取动词和介词, 根据动词或介词与电力名词的组合关系得到句式规则, 构造句式规 则对应的正则表达式, 形成知识库。 10.一种基于文本挖掘的操作票校核设备, 其特征在于, 所述设备包括处理器以及存储 器: 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据 所述程序代码中的指令执行权利要求1 ‑7任一项所述的基于文本 挖掘的操作票校核方法。权 利 要 求 书 2/2 页 3 CN 115455133 A 3

.PDF文档 专利 一种基于文本挖掘的操作票校核方法、系统及设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于文本挖掘的操作票校核方法、系统及设备 第 1 页 专利 一种基于文本挖掘的操作票校核方法、系统及设备 第 2 页 专利 一种基于文本挖掘的操作票校核方法、系统及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:38:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。