说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210181120.0 (22)申请日 2022.02.25 (71)申请人 大连海洋大学 地址 116036 辽宁省大连市沙河口区黑石 礁街52号 (72)发明人 张思佳 于英囡 张鑫 王梓铭 安宗诗 孙华 王贵艳 (74)专利代理 机构 西安铭泽知识产权代理事务 所(普通合伙) 61223 专利代理师 崔瑞迎 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06F 16/951(2019.01)G06F 16/215(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 融合ResNe Xt的EBAC鱼类文本联合抽取方法 (57)摘要 本发明属于文本实体 关系联合抽取领域, 涉 及一种融合ResNeXt的EB AC鱼类文本 联合抽取方 法, 将鱼类科普文本输入深度学习模 型进行实体 关系联合抽取; 深度学习模型包 括: ERNIE 预训练 模型, 对鱼类科普文本进行编码, 获得相应字向 量; BiLSTM模型, 捕捉字向量中依 赖关系, 获得相 应隐藏状态向量; Attention注意力模型, 对隐藏 状态向量进行权重分配, 生成相应语义向量, Attention注意力模型融合ResNeXt思想, 不增加 模型复杂 度的前提下提高抽取效果; CRF解码器, 对语义向量进行解码, 获得规范标签, 完成实体 关系联合抽取。 本发明解决了实体间语义不强、 长序列语义稀释和长距离依赖问题, 抽取效果 好。 权利要求书2页 说明书7页 附图1页 CN 114528408 A 2022.05.24 CN 114528408 A 1.融合ResNe Xt的EBAC鱼类文本联合抽取 方法, 其特 征在于, 包括: 将鱼类科普文本 输入深度学习模型进行实体关系联合抽取; 所述深度学习模型包括: ERNIE预训练模型, 用于对所述鱼类科普文本进行编码, 获得相应的字向量; BiLSTM模型, 用于捕捉所述字向量中的依赖关系, 获得相应的隐藏状态向量; Attention注意力模型, 用于对所述隐藏状态向量进行权重分配, 生成相应的语义向 量, 其中所述Attention注意力模型融合了ResNeXt思想, 在不增加 模型复杂度的前提下提 高抽取效果; CRF解码器, 用于对所述语义向量进行解码, 获得相应的规范标签, 根据规范标签确定 实体关系。 2.根据权利要求1所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 抽取所述实体关系前, 需要对所述Bi LSTM模型进行训练, 训练方法为: 获取鱼类科普文本, 建立鱼类科普文本库; 将所述鱼类科普文本库中的部分 鱼类科普文本作为训练集; 对所述训练集中的鱼类科普文本进行 标注; 将所述训练集中的鱼类科普文本 输入所述ERN IE预训练模型, 获得相应的字向量; 将所述字向量输入所述Bi LSTM模型, 获得相应的隐藏状态向量; 将所述隐藏状态向量输入融合了ResNeXt思想的Attention注意力模型, 获得相应的语 义向量; 将所述语义向量利用CRF解码器进行解码, 获得相应的规范 标签及实体关系; 根据所述CRF解码器解码得到的实体关系与所述训练集中的鱼类科普文本标注的实体 关系的误差对所述深度学习模型进行调整, 完成对所述深度学习模型的训练。 3.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 将所述鱼类科普文本库中的部分 鱼类科普文本作为训练集之后, 还 包括: 将所述鱼类科普文本库中的部分 鱼类科普文本作为测试集; 根据所述CRF解码器解码得到的实体关系与所述训练集中的鱼类科普文本标注的实体 关系的误差对所述深度学习模型进行调整之后, 还 包括: 采用所述测试集对调整之后的所述深度学习模型进行测试。 4.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 获取所述鱼类科普文本之后, 还 包括: 对所述鱼类科普文本进行清洗 。 5.根据权利要求4所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 所 述鱼类科普文本的获得及清洗方法具体如下: 通过Python爬虫的方式获取多个百科类网站的鱼类科普信息, 并进行整合及清洗, 去 除噪声, 获得鱼类科普文本 。 6.根据权利要求5所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 所 述鱼类科普信息包括鱼类级别分类、 别称、 主要分布位置、 经常栖息的环境、 喜好捕食对象、 初代鱼种产地。 7.根据权利要求3所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 训权 利 要 求 书 1/2 页 2 CN 114528408 A 2练集和测试的鱼类科普文本数量比例为7: 3 。 8.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 对 鱼类科普文本进行 标注如下: 根据鱼类科普文本特 征, 采用标注工具, 使用 “BIOS”的方法进行 标注。 9.根据权利要求1所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 隐 藏状态向量的获得 方法如下: BiLSTM模型用于将正向隐藏层向量、 反向隐藏层向量处理后的结果合并, 并作为当前 字符的隐藏状态向量。权 利 要 求 书 2/2 页 3 CN 114528408 A 3
专利 融合ResNeXt的EBAC鱼类文本联合抽取方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:25
上传分享
举报
下载
原文档
(601.9 KB)
分享
友情链接
5-02-01-02 造林更新工.pdf
GB-T 18593-2010 熔融结合环氧粉末涂料的防腐蚀涂装.pdf
DB31-T 1244-2020 冷却塔节能降噪改造技术指南 上海市.pdf
GB-T 50087-2013 工业企业噪声控制设计规范.pdf
T-CISA 045—2020 铬—锰—镍—氮系奥氏体不锈钢热轧钢板和钢带.pdf
T-GDYLSH 2.1—2022 旅居养老服务 第1部分:总则.pdf
T-SZSMDA 005—2023 广角数码小儿视网膜成像系统眼部彩照采集规范.pdf
GB 14052-1993 安装在设备上的同位素仪表的辐射安全性能要求.pdf
GB-T 16457.2-2023 金刚石圆锯片基体 第2部分:用于烧结锯片.pdf
ISO 5393 2017 Rotary tools for threaded fasteners — Performance test method.pdf
信通院 量子信息技术发展与应用研究报告 2022年.pdf
GB-T 40311-2021 钒渣 多元素的测定 波长色散X射线荧光光谱法 熔铸玻璃片法.pdf
DB34-T 3765-2020 地方计量技术规范制修订工作指南 安徽省.pdf
DB52-T 945-2015 热力输送管道节能技术规范 贵州省.pdf
ISO IEC 27018-2019.pdf
T-CASME 436—2023 9BB~20BB太阳能电池片自动串焊机.pdf
GB-T 36632-2018 信息安全技术 公民网络电子身份标识格式规范.pdf
GA-T 1776-2021 警用机器人系统通用技术要求.pdf
GB-T 38671-2020 信息安全技术 远程人脸识别系统技术要求.pdf
GB-T 41871-2022 信息安全技术 汽车数据处理安全要素.pdf
1
/
11
评价文档
赞助2.5元 点击下载(601.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。