说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210918795.9 (22)申请日 2022.08.01 (71)申请人 北京瀚语科技有限公司 地址 102300 北京市门头沟区石龙 经济开 发区永安路20号3号楼A -7857室(集群 注册) (72)发明人 董强 王宝群  (74)专利代理 机构 北京智行 阳光知识产权代理 事务所(普通 合伙) 11738 专利代理师 李秀影 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06N 3/04(2006.01) (54)发明名称 HowNet知识库构建方法、 系统及应用 (57)摘要 本发明公开了一种HowNet知 识库构建方法、 系统及应用, 应用于信息处理技术领域, 其所构 建的HowNet义原表、 语义角色框架和知 识规范描 述体系——基于HowNet的知识库描述语言 (KDML)对世间万物 的概念与概念之间的关系以 及概念的属性与属性之间的关系进行精细描述, 能够适配计算机对自然语言的理解, 为计算机理 解自然语言提供与人类知识相结合的庞大的知 识系统, 实现计算机对文本语义的理解和计算, 从而达到用户所期望的效果。 权利要求书2页 说明书10页 附图2页 CN 115329771 A 2022.11.11 CN 115329771 A 1.HowNet知识库构建方法, 其特 征在于, 具体步骤如下: 确定HowNet认知理论体系, 并在 所述HowNet认知理论体系下确定世 间万物多种概念及 概念之间的关系, 形成Ho wNet义原表; 构建语义角色框架和知识描述 规范体系, 即基于 HowNet的知识库描述语言; 通过基于HowNet的知识库描述语言, 利用义原表和语义角 色框架对真实概念进行描 述, 形成Ho wNet知识库。 2.根据权利 要求1所述的HowNet知识库构建方法, 其特征在于, 所述HowNet义原表形成 的具体步骤如下: 通过描述世间万物的概念与概念之间的关系以及概念的属性与属性之间的关系; 采用意义分解的方法, 确定出世间万物多种概念的最基本的、 不易于再分割的意义的 最小单位— —义原; 通过筛选提取形成有限的义原集 合, 即HowNet义原表。 3.根据权利 要求1所述的HowNet知识库构建方法, 其特征在于, 基于HowNet的知识库描 述语言包括: 词汇特征及动态角色、 标识符号和标点、 词序, 明确不同概念描述的方法、 义原 表和语义角色框架的应用以及特殊符号的具体功能, 并利用义原表和语义角色框架精细地 描述各种概念。 4.根据权利 要求1所述的HowNet知识库构建方法, 其特征在于, 所述义原表表征概念与 概念之间、 以及概念所具有的属性之间的关系; 分为event|事件、 entity|实体、 Attribute| 属性、 AttributeValue|属性 值四大类, 每 类下面包 含多个层级。 5.根据权利 要求1所述的HowNet知识库构建方法, 其特征在于, 构建语义角色框架和知 识描述规范体系具体规则包括: 任何一个概念的描述都以DEF=为开始; 任何一个概念中出现的所有义原或符号必须 是在HowNet的T axonomy中定义的义元或符号或者由HowNet知识库描述语言所规定的特定 标识符; 概念描述中的第 一个义原指出该概念的最基本的意义, 并用事件、 实体、 属性和属性值 这四类义元中的一个标注出来; 对于简单概念直接标注该概念的意 义; 利用动态角色与特 征来标注复杂概念; 属性类概念必须 标明宿主, 整体部分类型的概念必须 标明该部分的整体; 概念描述中定义的特性是一个或多个。 6.根据权利 要求1所述的HowNet知识库构建方法, 其特征在于, 利用义原表和语义角色 框架对真实概念进行描述, 具体描述方法为: 针对简单概念的描述方法是直接标注该概念的意义; 所述简单概念是指一个明确的事 件, 实体, 属性或属性 值, 在概念中不包 含任何的其它成分; 针对复杂概念的描述方法是利用动态角色与特征来标注复杂概念; 所述复杂概念是以 事件为中心, 除了事件中心本身以外还有一个或一个以上 的动态角色, 在表示所述动态角 色时书写格式是: 动态角色名称={某一 概念描述}。 7.根据权利要求1所述的HowNet知识库构建方法, 其特征在于, 还包括: 构建HowNet解 析器和配套管理工具; HowNet知识库和与之适配的HowNet解析器对输入文本进行加工, 对权 利 要 求 书 1/2 页 2 CN 115329771 A 2文本的结构化处理, 对自然语言的解析和理解; HowNet配套管理工具对HowNet知识库的更 新与维护。 8.HowNet知识库构建系统, 其特 征在于, 包括: 理论体系确定模块, 确定HowNet认知理论体系, 并在所述HowNet认知理论体系下确定 世间万物多种概念及概念之间的关系, 形成Ho wNet义原表; 描述语言构建模块, 构建语义角色框架和知识描述规范体系, 即基于HowNet的知识库 描述语言; 知识库形成模块, 通过基于HowNet的知识库描述语言, 利用义原表和语义角色框架对 真实概念进行描述, 形成Ho wNet知识库。 9.HowNet知识库应用方法, 其特征在于, 包括如权利要求1 ‑7任一项所述的HowNet知识 库构建方法所构建的Ho wNet知识库, 具体步骤如下: 利用HowNet知识库对目标词进行检索; 获取目标词在Ho wNet知识库中的概念语义和语义角色框架; 根据HowNet知识库中的相关概念场判断目标词之间的相关性 程度; 输出词语相关性的判别结果。权 利 要 求 书 2/2 页 3 CN 115329771 A 3

PDF文档 专利 HowNet知识库构建方法、系统及应用

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 HowNet知识库构建方法、系统及应用 第 1 页 专利 HowNet知识库构建方法、系统及应用 第 2 页 专利 HowNet知识库构建方法、系统及应用 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。