专利基于建模论元的事件共指消解方法、装置、设备和介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211045398.1 (22)申请日 2022.08.30 (71)申请人中国人民解放军国防科技大学地址 210001 江苏省南京市秦淮区后标营 18号 (72)发明人蒋国权　环志刚　丁鲲　刘浏　刘姗姗　张骁雄　刘茗　张慧　 (74)专利代理机构长沙国科天河知识产权代理有限公司 432 25 专利代理师李杨 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于建模论元的事件共指消解方法、装置、设备和介质 (57)摘要本申请涉及一种基于建模论元的事件共指消解方法、装置、计算机设备和存储介质。所述方法包括：构建了事件共指消解模型，包括事件抽取组件、提及编码器组件、共指得分器组件和事件共指链确定模块，通过显式建模论元信息，并且将论元划分为包含施事者、受事者、时间、地点和其他共五种角色，既可以满足分别处理对应角色论元的需求，也保证所有的论元信息都囊括其中，不会致使某些论元信息的缺失；通过在论元表示中引入置信分数，缓解错误传播带来的消极影响；通过设计一种门控过滤机制，利用触发词过滤论元中的噪声，进一步缓解错误传播，获取特定上下文中最有用的信息。本发明方法具有效果佳、适应性好的优点。权利要求书3页说明书12页附图5页 CN 115422325 A 2022.12.02 CN 115422325 A 1.一种基于建模论元的事件共指消解方法，其特征在于，所述方法包括：获取待进行事件共指消解的训练数据集；将所述训练数据集输入事件共指消解模型；所述事件共指消解模型包括事件抽取组件、提及编码器组件、共指得分器组件和事件共指链确定模块；所述事件抽取组件用于根据所述训练数据集中的文档数据得到多个事件提及；每个所述事件提及中包括事件的触发词、论元和事件子类型；所述论元被划分为施事者、受事者、时间、地点和其他共五种角色；所述提及编码器组件用于根据所述事件提及和对应文档的词元数据得到任一事件提及的触发词表示和论元角色的论元表示；其中所述论元表示中包括论元置信分数；进一步得到任意两个事件提及的触发词对表示和论元对表示，通过门控过滤机制，根据所述触发词对表示对所述论元对表示进行过滤，得到过滤后的论元对表示，进而根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示；所述共指得分器组件用于根据所述提及对表示得到任意两个事件提及的共指得分；所述事件共指链确定模块用于根据所述共指得分得到所述训练数据集中对应文档的预测事件共指链；通过所述训练数据集和所述预测事件共指链对所述事件共指消解模型进行训练，得到训练好的事件共指消解模型；将待进行事件共指消解的文档数据输入所述训练好的事件共指消解模型，得到所述文档数据对应的事件共指链数据。 2.根据权利要求1所述的方法，其特征在于，根据所述事件提及和对应文档的词元数据得到任一事件提及的触发词表示和论元角色的论元表示，包括：获取所述事件抽取组件输出的k个事件提及{m1,m2,…,mk}和对应文档的n个词元数据；通过transformer编码器为每个输入词元形成上下文表示为X＝(X1,X2,…,Xn)；其中， d表示每个词元编码后的向量维度；对于每个事件提及mi，所述事件提及mi的触发词表示ti被定义为其词元嵌入的平均值：其中， si和ei分别表示触发词的开始和结束索引；所述事件提及mi对应角色r的论元表示为：其中， r∈{agent,patient,time,place,other}， agent,patient,time,place,other分别为施事者、受事者、时间、地点和其他共五种论元角色，是提及mi对应角色r的第l个论元的表示，和分别表示第l个论元的开始和结束索引， c表示第l个论元的置信分数， u 表示mi对应角色r的论元个数；当 mi对应角色r的论元缺省或不存在，使用d维0向量表示。权　利　要　求　书 1/3 页 2 CN 115422325 A 23.根据权利要求2所述的方法，其特征在于，进一步得到任意两个事件提及的触发词对表示和论元对表示，包括：给定两个事件提及mi和mj，分别定义触发词对表示和对应角色r的论元对表示为：其中， FFNNt是一个的标准前馈神经网络，编码mi和mj的元素级相似性。 4.根据权利要求3所述的方法，其特征在于，通过门控过滤机制，根据所述触发词对表示对所述论元对表示进行过滤，得到过滤后的论元对表示，包括：根据所述触发词对表示tij对所述论元对表示进行正交分解，得到所述论元对表示的正交分量和平行分量分别为：定义所述正交分量和所述平行分量的权重系数分别为： ωp＝1‑ωo 其中， ωo和ωp分别是所述正交分量和所述平行分量的权重系数， FFNNp是一个的前馈神经网络， σ 是sigmo id激活函数；通过门控过滤机制，得到过滤后的论元对表示： 5.根据权利要求4所述的方法，其特征在于，根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示，包括：根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示 fij为： 6.根据权利要求5所述的方法，其特征在于，根据所述提及对表示得到任意两个事件提及的共指得分，包括：根据所述提及对表示fij得到任意两个事件提及的共指得分 s(i,j)为： s(i,j)＝F FNNa(fij) 其中， FFNNa是的前馈神经网络。 7.根据权利要求6所述的方法，其特征在于，根据所述共指得分得到所述训练数据集中对应文档的预测事件共指链，包括：对任一事件提及，获取与其具有相同事件子类型的事件提及作为候选共指提及对；权　利　要　求　书 2/3 页 3 CN 115422325 A 3

专利 基于建模论元的事件共指消解方法、装置、设备和介质

专利基于建模论元的事件共指消解方法、装置、设备和介质