说明:收录25万 73个行业的国家标准 支持批量下载
临床自然语言处理与知识图谱 汤步洲 哈尔滨工业大学(深圳) tangbuzhou@gmail.com 03/12/2022 主要内容 1. Clinical NLP(基础篇) ➢ 词法、句法、语义分析 ➢ 信息抽取 ➢ 临床医疗问答 2. Clinical NLP(高阶篇) ➢ 临床医疗文本语义相似度计算 ➢ 电子病历的自动编码 ➢ 临床医疗文本生成 ➢ 病人队列选择 3. Clinical Knowledge Graphs (Bases) ➢ 现状与挑战 词法、句法、语义分析 关注度较低,原因在于 − 临床医疗文本主要以短语为主,存在很多并列结构,句子的“主谓宾” 不全,给词法分析和语义分析带来了新的挑战 − Clinical NLP的主要目的是为了获取临床医疗文本中的临床医疗信息和 知识,不完善的句法分析和语义分析结果是否有利于临床医疗信息和知 识的抽取存疑 词性标注 2013 University of Colorado 2004 Mayo Clinic 词性、成分句 法(病态句子) 2013 Kaiser 词性、成分句 Permanente、 Vanderbilt 法和语义角色 MiPACQ 2014 北航、微软亚洲 研究院 分词、临床医 疗实体识别 语义角色标注 (领域迁移) 2017 哈工大 2015 University of 分词、词性标 Texas、哈工大 注、成分句法、 语义角色、实 体、关系 细粒度分词、 词性标注 2019 哈工大 信息抽取 国内外代表公开评测数据集: 年份 2006 2008 2009 2010 2011 2012 2014 2018 2013 公开评测组织 I2B2 I2B2 I2B2 I2B2 I2B2 I2B2 I2B2 N2C2 ShARe/CLEF 任务 个人健康信息去隐私、从出院小结中抽取病人抽烟状态 从稀疏数据中识别肥胖和发病率 从电子病历中抽取药物、剂量、用药方式、频率、持续时间和原因等 概念、修饰词抽取以及关系抽取 电子病历共指消歧 时序关系抽取、医学事件抽取 去隐私、疾病风险因子预测 药物副作用事件抽取、药物抽取 基于电子病历命名实体识别和实体标准化 2013 ShARe/CLEF 基于电子病历命名实体识别和实体标准化 2014 ShARe/CLEF 命名实体识别、实体标准化 2014 ShARe/CLEF 命名实体识别、实体标准化 2015 CLEF 命名实体识别、实体标准化 2015 BioCreative V 命名实体识别、实体标准化 2015 SemEval Task6 时间表达式抽取、事件抽取、事件时间关系抽取 网站 https://portal.dbmi.hms.harvard.edu/ projects/n2c2-nlp/ https://sites.google.com/site/sharecl efehealth/ https://sites.google.com/site/sharecl efehealth/ https://physionet.org/content/sharec lefehealth2014task2/1.0/ https://physionet.org/content/sharec lefehealth2014task2/1.0/ https://sites.google.com/site/clefehe alth2015/ https://biocreative.bioinformatics.ud el.edu/tasks/biocreative-v/track-3cdr/ https://alt.qcri.org/semeval2015/task 6/ 信息抽取 国内外代表公开评测数据集(Con.): 2015 SemEval Task14 命名实体识别、实体标准化 https://alt.qcri.org/semeval2015/task14/ 2016 SemEval Task12 时间表达式抽取、事件抽取、事件时间关系抽取 https://alt.qcri.org/semeval2016/task12/ 2016 SemEval Task12 时间表达式抽取、事件抽取、事件时间关系抽取 https://alt.qcri.org/semeval2016/task12/ 2016 CEGS N-GRID 去隐私、症状严重程度分类 https://www.i2b2.org/NLP/RDoCforPsychiatry/ 2017 CCKS 任务二 面向中文电子病历命名实体识别 http://www.sigkg.cn/ccks2017/?page_id=51 2018 CCKS 任务一 面向中文电子病历命名实体识别 http://www.sigkg.cn/ccks2018/?page_id=16 2018 CHIP 任务一 中文电子病历中临床医疗实体及属性抽取 http://icrc.hitsz.edu.cn/chip2018/Task.html 2018 BioCreative/OHNLP 家族史抽取 https://sites.google.com/view/ohnlp2018/home 2019 CCKS 任务一 面向中文电子病历命名实体识别 https://www.biendata.xyz/competition/ccks_2019_1 2019 CHIP 任务一 临床术语标准化任务 http://www.cipschip.org.cn:8088/evaluation 2020 CCKS 任务三 面向中文电子病历医疗实体及事件抽取 http://sigkg.cn/ccks2020/?page_id=69 2020 CHIP 任务一、任务 临床医学命名实体识别、临床医学文本实体关系 http://www.cips-chip.org.cn/2020/ 2020 二、任务三 抽取、临床医学术语标准化 IberLEF 命名实体识别、实体标准化 https://temu.bsc.es/cantemist/ 临床医疗实体识别任务 右 乳 bodyloc problem 癌 并 双 肺 bodyloc 、 肝 转 移 治 bodyloc problem problem treatment treatment ?连续、嵌套、非连续和重叠多种形式 疗 后 临床医疗实体识别任务 A Unified Generative Framework for Various NER Subtasks Yan H, Gui T, Dai J, et al. A Unified Generative Framework for Various NER Subtasks[C]//Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2021: 5808-5822. 临床医疗实体识别任务 Unified Named Entity Recognition as Word-Word Relation Classification Li J, Fei H, Liu J, et al. Unified Named Entity Recognition as Word-Word Relation Classification[J]. arXiv preprint arXiv:2112.10070, 2021.(AAAI 2022) 临床医疗事件抽取 方法 − 基于规则的方法:从标注事件中生成一个字典和模式,通过生成的字典 和模式从输入文本中去抽取事件。 − 基于机器学习的方法:管道方法,使用SVM对抽取的语义特征选择[1]。 图片引自[1] [1] Lever, J. & Jones, S. J. VERSE: Event and Relation Extraction in the BioNLP 2016 Shared Task. in Proceedings of the 4th BioNLP Shared Task Workshop, BioNLP 2016, Berlin, Germany, August 13, 2016 (eds. Nedellec, C., Bossy, R. & Kim, J.-D.) 42–49 (Association for Computational Linguistics, 2016. 临床医疗事件抽取 方法 − 深度学习方法:使用端到端模型,例如CNN[1] 、RNN[1] 、 BILSTM-CRF[1]、 LSTM[2]等。 图片引自[1] 图片引自[1] [1] Wei, Q. et al. A study of deep learning approaches for medication and adverse drug event extraction from clinical text. J. Am. Medical Informatics Assoc. 27, 13–21 (2020). [2] Yu, X. et al. LSTM-Based End-to-End Framework for Biomedical Event Extraction. IEEE ACM Trans. Comput. Biol. Bioinform. 17, 2029–2039 (2020). 临床医疗事件抽取 方法 − 深度学习方法:采用图边缘条件注意网络(GEANet)和分层图表示的 方法[1];借助外部知识库(UMLS)[1]等。 图片引自[1] 图片引自[1] [1] Huang, K.-H., Yang, M. & Peng, N. Biomedical Event Extraction on Graph Edge-conditioned Attention Networks with Hierarchical Knowledge Graphs. in Findings of the Association for Computati

pdf文档 哈尔滨工业 汤步洲 医疗自然语言处理与医疗知识图谱

文档预览
中文文档 50 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共50页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
哈尔滨工业 汤步洲 医疗自然语言处理与医疗知识图谱 第 1 页 哈尔滨工业 汤步洲 医疗自然语言处理与医疗知识图谱 第 2 页 哈尔滨工业 汤步洲 医疗自然语言处理与医疗知识图谱 第 3 页
下载文档到电脑,方便使用
本文档由 路人甲 于 2022-08-13 07:07:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。