(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210182675.7
(22)申请日 2022.02.25
(71)申请人 福州大学
地址 350108 福建省福州市闽侯县福州大
学城乌龙江北 大道2号福州大 学
(72)发明人 陈羽中 万宇杰
(74)专利代理 机构 福州元创专利商标代理有限
公司 35100
专利代理师 张灯灿 蔡学俊
(51)Int.Cl.
G06F 40/30(2020.01)
G06N 20/00(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 5/02(2006.01)
(54)发明名称
基于知识图谱与交互图卷积的评论情感分
析方法及系统
(57)摘要
本发明涉及一种基于知识图谱与交互图卷
积的评论情感分析方法及系统, 该方法包括以下
步骤: 步骤A: 收集用户评论, 提取用户评论中涉
及的产品或服务的方面词, 并标注用户评论针对
该产品或服务的特定方面的情感极性, 以此来构
建训练集DS; 步骤B: 使用训练集DS, 训练基于知
识图谱与交互图卷积网络的深度学习网络模型
G, 用于分析用户评论对产品或服务的特定方面
的情感极性; 步骤C: 将用户评论与用户评论涉及
的产品或服务的方面词输入到训练好的深度学
习网络模型中, 获得用户评论针对 该产品或服务
中的特定方面的情感极性。 该方法及系统有利于
提高情感分类的准确性。
权利要求书9页 说明书18页 附图3页
CN 114492459 A
2022.05.13
CN 114492459 A
1.一种基于知识图谱与交 互图卷积的评论情感分析 方法, 其特 征在于, 包括以下步骤:
步骤A: 收集用户评论, 提取用户评论中涉及的产品或服务的方面词, 并标注用户评论
针对该产品或服 务的特定方面的情感极性, 以此来构建训练集D S;
步骤B: 使用训练集DS, 训练基于知识图谱与交互图卷积网络的深度学习网络模型G, 用
于分析用户评论对产品或服 务的特定方面的情感极性;
步骤C: 将用户评论与用户评论涉及的产品或服务的方面词输入到训练好的深度学习
网络模型中, 获得用户评论针对该产品或服 务中的特定方面的情感极性。
2.根据权利要求1所述的基于知识图谱与交互图卷积的评论情感分析方法, 其特征在
于, 所述步骤B具体包括以下步骤:
步骤B1: 对训练集DS中的每个训练样本进行编码, 得到用户评论的初始表征向量ES、 方
面的初始表征向量EA以及句法依存邻接矩阵AS, 同时根据依赖树KG子图生成策略从知识图
谱中生成用户评论的对应子图DKG, 得到其邻接矩阵ADKG, 然后对其节 点进行编码, 得到子图
DKG的节点表示HDKG;
步骤B2: 通过方面增强策略对指定方面的表示进行增强, 获得方面增强向量EAE, 将步骤
B1得到的初始表征向量ES和方面增强向量EAE分别输入到两个不同的双向长短期记忆网络
中, 得到用户评论句子表征向量HS和方面增强表征向量HAE;
步骤B3: 通过方面增强策略获得评论句子的边向量EE, 对HS和EE方面使用关系 注意力机
制, 获得关系注意力句子表征向量ERA;
步骤B4: 对HAE进行平均池化得到方面表征向量
对HS进行位置权重加 权, 得到位置
加强的评论句子表征向量HPS, 通过连接
和HPS, 得到表征向量GS,0;
步骤B5: 将表征向量GS,0和子图节点表征向量HDKG分别输入到两个不 同的K层图卷积网
络中, 分别记为评论句子图卷积网络SGCN和依赖树知识图谱图卷积 网络DKGGCN, 分别学习
并提取句法依存关系和外部知识, 同时评论句子图卷积网络SGCN的每层节 点通过知识交互
机制利用依赖树知识图谱图卷积网络DKGGCN进行知识融合, 最后得到用户评论的图卷积表
征向量GS,K;
步骤B6: 对图卷积表征向量GS,K进行掩膜操作, 得到用户评论的图卷积掩膜表征向量
Gmask, 再和评论句子表征向量HS通使用交叉注意力 机制, 进一步提升模型特征提取能力, 得
到表征向量ESD;
步骤B7: 针对不规范句子带来的噪声, 通过多头注意力机制将ESD和步骤B3得到的关系
注意力句子表征向量ERA融合得到聚合外部知识和边关系的句子表征EMT, 再通过一个门控
融合机制, 得到最终表征向量EFIN;
步骤B8: 将最终表征向量EFIN输入最终预测层, 根据目标损失函数loss, 利用反向传播
方法计算深度学习网络模型中各参数的梯度, 并利用随机梯度下降方法更新各参数;
步骤B9: 当深度学习网络模型产生的损失值迭代变化小于所给定阈值、 或者达到最大
迭代次数, 则终止深度学习网络模型的训练过程。
3.根据权利要求2所述的基于知识图谱与交互图卷积的评论情感分析方法, 其特征在
于, 所述步骤B1具体包括以下步骤:
步骤B11: 对训练集DS进行遍历, 对其中的用户评论和方面进行分词处理并去除停用词权 利 要 求 书 1/9 页
2
CN 114492459 A
2之后, DS中的每个训练样本表示 为ds=(s,a,p);
其中s为用户评论, a为用户评论s中提取的用户评论所涉及的产品或服务的方面词或
短语, p为评论对该 方面的情感极性, 其中包括{积极,消极,中性};
用户评论s表示 为:
其中,
为用户评论s中的第i个词, i =1,2,…,n, n为用户评论s的词语数量;
方面a表示 为:
其中,
为方面a中的第i个词, i =1,2,…,m′, m′为方面a的词语数量;
步骤B12: 对步骤B11得到用户评 论
进行编码, 得到用户评 论s的初始表
征向量ES;
其中, ES表示为:
其中,
为第i个词
所对应的词向量, 通过在预训练的词向量矩阵
中查
找得到, 其中d表示词向量的维度, |V|是词典V中的词语数;
步骤B13: 对步骤B11得到方面
进行编码, 得到方面a的初始表征向量
EA;
其中,
表示第i个词
所对应的词向量, 通过在预训练的词向量矩 阵
中查找得到, 其中d表示词向量的维度, |V|是词典V中的词语数;
步骤B14: 对用户评论s进行句法依存解析, 得到句法依赖树DT;
其中,
表示词wi和词wj之间存在句法依存关系;
步骤B15: 将解析 得到的句法依赖树DT编码为 n阶邻接矩阵AS, AS表示为:
其中, Aij为1表示词
和词
之间存在句法依存关系, Aij为0表示词
和词
之间不存
在句法依存关系;
步骤B16: 将解析 得到的句法依赖树DT编码为 n阶边关系邻接矩阵B, B表示 为:权 利 要 求 书 2/9 页
3
CN 114492459 A
3
专利 基于知识图谱与交互图卷积的评论情感分析方法及系统
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:26上传分享