说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210413257.4 (22)申请日 2022.04.20 (71)申请人 中国中医科学院中医药信息 研究所 地址 100700 北京市东城区东 直门内南小 街16号 (72)发明人 刘丽红 朱彦 李海燕 贾李蓉  杨硕 姚克宇 高博 陈超 聂莹  (74)专利代理 机构 北京科石知识产权代理有限 公司 11595 专利代理师 李艳霞 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/34(2019.01) G06F 16/84(2019.01) G06F 40/242(2020.01)G06F 40/279(2020.01) G06F 40/30(2020.01) G16H 70/40(2018.01) (54)发明名称 中医药文献语料库 与知识库一体化系统 (57)摘要 本申请提供一种中医药文献语料库与知识 库一体化系统, 其包括元数据模块、 语料库、 文档 标注模块、 查询模块和语义知识库; 元数据模块 用于设定实体类、 词典和语义关系并进行维护; 语料库用于根据导入的文 献形成半结构化文档; 文档标注模块 以词典为标注依据对半结构化文 档进行标注; 查询模块用于对元数据进行查询, 以获得实体类、 词典和语义关系的查询结果。 本 申请能够对文档进行标注、 查询和语义检索, 提 供一种集语料库、 文献标注、 知识加工、 分析、 知 识库检索一体化的系统; 不仅能够单独检索语义 的相关基础信息, 还能够与文献形成关联, 追踪 到相关联的文献及相类似知识, 检索效率高。 权利要求书2页 说明书9页 附图1页 CN 114791955 A 2022.07.26 CN 114791955 A 1.一种中医药文献语料库与知识库一体化系统, 其特征在于, 包括元数据模块、 语料 库、 文档标注模块、 查询模块和语义知识库; 所述元数据模块用于设定实体 类、 词典和语义关系并进行维护; 所述语料库用于根据导入的文献 形成半结构化文档; 所述文档标注模块以词典为标注 依据对半结构化文档进行 标注; 所述查询模块用于对元 数据进行查询, 以获得实体 类、 词典和语义关系的查询结果; 所述语义知识库用于对语义信息、 语义出处和原文情况进行检索。 2.根据权利要求1所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述元 数据模块中设置有实体类和语义关系, 每个所述实体类包括至少一个词典; 所述语义关系 根据所述实体 类的属性定义各实体 类之间的关系。 3.根据权利要求1所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述语 料库中包括至少一个专题, 每个所述专题下涵盖有多个文献; 所述文献以树形结构进行展 示。 4.根据权利要求1所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述文 档标注模块包括在线标注模块和语料标注模块; 所述在线标注模块用于获取用户输入的标 注文本, 并对标注文本进行在线标注; 所述语料标注模块用于对半结构化文档中的数据进 行标注。 5.根据权利要求4所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述文 档标注模块的标注方式包括人工标注和机器标注; 所述在线标注模块采用人工标注方式进 行标注。 6.根据权利要求5所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述在 线标注模块采用人工标注方式进行 标注的具体过程 为: 人工选中某篇文献或某篇文献中的某个词组, 并利用 “实体编码 ”对选中的数据进行标 注; 在线标注模块通过匹配元数据中的实体、 词典和语义关系对文件中的内容进行匹配, 匹配后实现对文献的自动标注, 并采用 “实体”的标注颜色显示标注后的内容; 标注文献中各个术语之间的语义关系; 人工审核机器标注的术语, 最终完成文献的标注。 7.根据权利要求6所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述机 器标注的具体过程 为: 基于人工标注的结果 集合得到训练数据集; 依托分词算法使训练数据集 不断进行机器学习, 建立语义模型; 将训练数据集输入语义模型中, 进行迭代和参数调整; 利用标注规则和训练完成的语义模型进行自动标注。 8.根据权利要求2所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述查 询模块用于对实体 类、 词典和语义关系进行查询; 所述查询模块对实体类进行查询时, 依据属性字段进行精准或模糊检索; 所述查询模 块对词典进行查询时, 依据词典标注情况进行精准或模糊检索; 所述查询模块对语义关系 进行查询时, 在实体 类和词典的检索结果中获取相关语义关系的查询结果。权 利 要 求 书 1/2 页 2 CN 114791955 A 29.根据权利要求1所述的中医药文献语料库与知识库一体化系统, 其特征在于, 所述语 义知识库的检索结果包括语义检索结果和全文检索结果; 所述语义检索结果中展示检索的 “语义”及“同义词”; 所述全文检索结果中, 通过 “所检索的关键词 ”, 展示“结构化数据 ”和 “非结构化数据 ”中涵盖关键词的内容。 10.根据权利要求1所述的中医药文献语料库与知识库一体化系统, 其特征在于, 还包 括系统管理模块, 所述系统管理模块包括机构管理模块、 用户管理模块、 权限管理模块、 角 色管理模块、 字典管理模块和日志管理模块。权 利 要 求 书 2/2 页 3 CN 114791955 A 3

.PDF文档 专利 中医药文献语料库与知识库一体化系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 中医药文献语料库与知识库一体化系统 第 1 页 专利 中医药文献语料库与知识库一体化系统 第 2 页 专利 中医药文献语料库与知识库一体化系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。