(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210424210.8
(22)申请日 2022.04.22
(71)申请人 之江实验室
地址 311100 浙江省杭州市余杭区中泰街
道之江实验室南湖总部
(72)发明人 张阳 余婷 张吉 王彪 佳维
(74)专利代理 机构 杭州浙科专利事务所(普通
合伙) 33213
专利代理师 陈洁
(51)Int.Cl.
G06V 10/40(2022.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
基于三重视图神经网络的多样化社区检测
方法
(57)摘要
本发明属于图数据挖掘领域, 公开了一种基
于三重视图神经网络模型的多样化社区检测方
法, 包括一: 从输入的属性图中提取特征; 二: 将
输入的序列信息
通过编码器转换成一个指定
长度的中间语义向量Z, 中间语义向量Z蕴含了X
中的信息; 三: 对输出向量Z进行结构紧密属性多
样化聚类; 四: 解码器对Encoder生成的Z作为输
入, 解码出目标序列, 从而得到Decoder输出序列
, 用异构损失、 聚类损失、 以及X与
之间的重
构信息损失共同构造损失函数, 通过对损失函数
最小化的方法对模型进行训练求解。 本发明通过
对属性图上的结构信息、 属性信息、 异构信息三
个视图分别进行构造以及嵌入学习, 能有效地挖
掘结构紧密、 属性多样化的社区结构。
权利要求书2页 说明书6页 附图4页
CN 114863119 A
2022.08.05
CN 114863119 A
1.一种基于三重视图神经网络模型的多样化社区检测方法, 其特征在于, 包括以下步
骤:
步骤一: 从输入的属性图中提取特征: 从图数据的空间结构和节点属性矩阵提取第一
视图特征, 从图数据的异构信息中提取第二视图特征、 从属 性共现矩阵中提取第三视图特
征;
步骤二: 将输入的序列信息X={x1, x2, x3....xN}, N为输入数据长度, 通过编码器转换 成
一个指定 长度的中间语义向量Z, 中间语义向量Z蕴含了X中的信息;
步骤三: 对输出向量Z进行 结构紧密属性多样化聚类;
步骤四: 解码器对Encoder生成的Z作为输入, 解码出目标序列, 从而得到Decoder输出
序列X′={x′1, x′2, x′3,…, x′N}, 用异构损失、 聚类损失、 以及X与X ′之间的重构信息损失共
同构造损失函数, 通过对损失函数最小化的方法对 模型进行训练求 解。
2.根据权利要求1所述的基于三重视图神经网络模型的多样化社区检测方法, 其特征
在于, 所述 步骤一包括如下 具体步骤:
步骤1.1: 提取图的空间结构: 根据节点和边信息, 构造图的邻接矩阵As∈RN*N表示图的
拓扑结构特征; 根据节点带有的属性信息, 构造节点属性矩阵F∈RN*M, 其中, N为节点的总
数, M为属性空间的总维度; 步骤1.2: 提取图的异构信息: 根据 节点和属性的异构性构 造“节
点‑属性”和“节点‑节点”两种元路径的异构图, 将 每个属性信息 当作为一种节 点, 图的原始
节点为另一种节点, 即定义异构图GH=( υ, ε), 节点映射函数
表示节点类型,
也就是说属性就是一类节点类型, 图原始节点也是一种节点类型, 所以为2, ε为边
集, 这里只有节点和 属性的连边;
步骤1.3: 提取图的属性共现矩阵: 根据图属性矩阵Aa, 通过点互信息熵PMI计算属性间
的相关性, 构造属性图, 得到属性矩阵
使用PPMI来避免节点存在不共现导致的
PMI为负无穷情况:
PPMI(x,y)=max(PMI(x,y),0) (1)
3.根据权利要求1所述的基于三重视图神经网络模型的多样化社区检测方法, 其特征
在于, 所述 步骤二包括如下 具体步骤:
步骤2.1: 用GCN模型对属性共现矩阵Aa进行表示学习, 具体操作GCN=σ(LXW)可以描述
为通过矩阵运算完成消息传递, 其中L是 拉普拉斯矩阵, L=D ‑Aa, D为度矩阵, Aa为共现矩阵,
W为权重矩 阵,以1号节点为例, 在第一次卷积时, 节点将自身携带的信息传递到相邻节点
间, 同时也会获取邻居节点的信息,在这里进行两次GCN卷积, 节点将拥有两跳邻居节点的
信息, 分别得到属性的嵌入向量表Za∈RM*d, 再将节点属性矩阵通过属性嵌入向量的转化得
到一个向量表达F*Za∈RN*d;
步骤2.2: 使用GAT对图的结构信息As和节点属性矩阵F进行表示学习, GAT模型采用图卷
积操作, 利用边的信息对节点进 行聚合, 从而生成新的节点表示, 在图卷积的基础上对不同
的邻接点赋予不同权重, 通过加权平均的方式来获得聚合的值, 最终得到节点的嵌入向量
表示Zs∈RN*d, d是嵌入空间的维度;权 利 要 求 书 1/2 页
2
CN 114863119 A
2步骤2.3: 使用HGCN对节点和属性的异构信息进行表示学习, 在异构图中, 两个对象可
以通过不同的语义路径连接, 这些语义路径称为元路径, 使用节点 ‑属性, 节点‑节点两种元
路径, 每个属性为不同的节点类型, 不同类型的节点有不同的特征 空间, 根据不同属性构建
映射矩阵X, 通过映射 函数f将不同节点映射到同一特 征空间:
h′i=f(X⊙hi) (2)
然后使用自注意力机制学习不同类型的节点权重, 对于给定元路径的节点对来说, 节
点的注意力
依赖与节点对的特 征, 然后聚合得到节点的嵌入表达Zh∈RN*d,
异构信息表示学习的过程, 采用交叉熵损失函数Lh来训练:
Lh=cross_ent(F(Zh),labels) (4)
最终拼接三个视图的嵌入向量得到最终的嵌入表达
Z∈RN*d。
4.根据权利要求1所述的基于三重视图神经网络模型的多样化社区检测方法, 其特征
在于, 所述 步骤三包括如下 具体步骤:
步骤3.1: 使用k ‑means初始化聚类中心C1, C2, C3, ..., Ck;
步骤3.2: 基于找到的聚类中心, 采用学生t分布来拟合出节点嵌入向量在嵌入空间的
分布, 寻找最佳聚类中心C1, C2, C3, ..., Ck;
步骤3.3: 通过训练三重视图神经网络模型, 不断优化迭代聚类结果, 最终实现结构紧
密属性多样化聚类。
5.根据权利要求1所述的基于三重视图神经网络模型的多样化社区检测方法, 其特征
在于, 所述 步骤四包括如下 具体步骤:
步骤4.1: 将Zs, Za作为输入, 解码出目标图结构矩阵和 属性共现矩阵, 从而得到A ′s, A′a;
步骤4.2: 损失函数设置如下: 使得结构相对熵尽可能小, 属性熵尽可能大, 聚类损失
重构属性和空间信息
损失为Lre=α·cross_ent(As,A's)+β·cross_ent(Aa,A'a), 模型整体损失函数为L=τLclu+
γLre+λLh。权 利 要 求 书 2/2 页
3
CN 114863119 A
3
专利 基于三重视图神经网络的多样化社区检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:35:26上传分享