(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210856551.2
(22)申请日 2022.07.20
(71)申请人 湖南科技大 学
地址 411100 湖南省湘潭市雨湖区桃园路
湖南科技大 学计算机科 学与工程学院
(72)发明人 曹步清 谢湘 刘建勋
(74)专利代理 机构 北京盛凡佳华专利代理事务
所(普通合伙) 11947
专利代理师 李芳
(51)Int.Cl.
G06F 16/35(2019.01)
G06K 9/62(2022.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 17/18(2006.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种融合异构信息网络与生成对抗网络的
服务分类方法
(57)摘要
本发明公开了一种融合异构信息网络与生
成对抗网络的服务 分类方法, 包括如下步骤: (1)
服务异构信息网络构建及Metapath2vec网络表
征; (2)GAN对抗训练; (3)服务分类。 本发明属于
互联网技术领域, 具体是指一种首先针对Web服
务之间的结构关系和自身的属性信息构建出异
构信息网络; 然后, 基于元路径的随机游走并联
合服务节点与邻居节点进行训练得到服务的特
征嵌入; 最后, 采用具有关系感知的GAN模型 实现
对抗训练, 通过生成器和判别器的极大极小化博
弈学习高质量的负样本信息, 对服务的特征嵌入
进行优化, 从而实现Web服务分类的融合异构信
息网络与生成对抗网络的服 务分类方法。
权利要求书2页 说明书6页 附图3页
CN 115238073 A
2022.10.25
CN 115238073 A
1.一种融合异构信息网络与生成对抗网络的服务分类方法, 其特征在于, 包括如下步
骤:
(1)服务异构信息网络构建及Metapath2vec网络表征: 构建如下表1所示元路径, 采用
Metapath2vec模型计算出两两服务之间的嵌入表征, Metapath2v ec通过基于元路径的随机
游走及异构 Skip‑gram模型 学习网络表征, 捕获不同类型节点之间的语义和结构相关性;
表1 服务相关的元路径
(2)GAN对抗训练: SC ‑GAN主要由两个相互竞争的模块组成, 即判别器和生成器, 给定一
个服务节点, 生 成器尝试生 成与给定服务节点相关联的伪样本, 以提供给判别器, 判别器则
尝试改进其参数来将假样本与实际连接到给定节点的真实样本分离, 在这个重复的过程
中, 训练好的判别器会迫使生产器产生更好的假样本, 而判别器则也会增强其判断能力, 在
这样的迭代过程中, 生成器和判别器都得到正强化;
(3)服务分类: 将SC ‑GAN模型的服务节点嵌入表征输入到一个完整的连接层中, 并使用
多元Logistic回归函数输出 所有候选Web服 务类别的概 率分布;
Logistic回归用来预测一个具有类别分布的因变量不同可 能结果的概率的模型, 将多
分类的输出值转换为相对概率, 表示节点属于特定类别的概率, 其计算方式见公 式(10)。 其
中, k个模 型分别预测训练数据属于那个类别的概率, k为候选Web服务类别数, w表 示服务节
点对应的权 重矩阵,
表示向量的特 征嵌入;
在模型训练过程中, 对于所有K个可能的分类结果, 运行K ‑1个独立二元逻辑回归模型,
在运行过程中把其中一个类别看成是主类别, 然后将其它K ‑1个类别和所选择的主类别分
别进行回归运算; 在 对数似然 取最大值等价于损失函数取最小值, 其中, 对数似然计算方式
如下:
2.根据权利要求1所述的一种融合异构信息网络与生成对抗网络的服务分类方法, 其
特征在于: 所述步骤(2)中, 在TransE异构信息网络嵌入方法中, 服务异构信息网络中的每
一个三元组<s,r,v>(s和 v表示两个关系相联的服务节点, r表示它们之间链接的边类型),
两个服务节点的潜在向量表示 为s和v∈V, 关系的潜在向量表示r∈R;
生成器G(·; θG)利用了以下高斯分布从基础连续分布中生成样本:
其中,
和
分别表示 生成器s∈v的服 务节点嵌入和
的关系矩阵;
生成器的公式如下:
G(s,r; θG)=f(WL…f(W1e+b1)+bL)权 利 要 求 书 1/2 页
2
CN 115238073 A
2从分布
中得出, W*和b*分别表示每一层的权重矩阵和偏差矢量, f是激活函
数;
生成器的参数集为
即所有节点嵌入和关系矩阵以及MLP的
参数的并集;
其中, λG>0控制正则项;
生成器参数θG通过最小化 来优化:
3.根据权利要求2所述的一种融合异构信息网络与生成对抗网络的服务分类方法, 其
特征在于: 所述 步骤(2)中判别器D(ev|s,r; θD)评估服务节点对s和v的关系之间的连通 性;
s∈v是给定的服务节 点,
是来自HIN的给定关系, ev是样本服务节 点的嵌入, θD表示
D模型参数;
D在关系r下输出样本连接 到服务的概率为:
其中, ev是样本的嵌入输入,
是服务节点s的可学习嵌入,
是关系r的
可学习关系矩阵;
形成判别器D的模型参数, D为获得的所有服 务节点嵌入和关系矩
阵的并集;
当v是与s到r相关的正样本时, 概 率应该较高; 当是负 样本时, 则概 率应该较低;
样本v与给定的服务s和关系 r形成三元组<s,r,v>, 并且每个三元组在极性方面都属于
以下三种情况之一, 在有条件的GAN的启发下, 每种情况也 导致了一部分判别器损失:
情况1: 在给定关系下连接, 即: 服务节点和样本确实通过
上的正确关系连接, 这
样的三元组被认为是正向的, 用下面的损失来建模。
情况2: 连接关系不正确, s和v在HIN中以错误的关系r ′≠r连接, 由于它们的关联性与
给定关系r所携带的期望语义 不匹配, 该判别器也将它 们标记为负。 这部分损失定义如下:
情况3: 来自关系感知生成器的假服务节点, 给定一个服务节点, 它可以与生成器提供
的服务节点形成假对, , 判别器旨在将该三元组标识为负数, 表示如下:
其中, 伪样本v的嵌入e ′v是从生成器G的学习分布中提取的;
整合以上三个部分训练判别器:
其中, λD>0控制正则项以避免过度拟合, 判别器的参数θD可以通过最小化
来优化。权 利 要 求 书 2/2 页
3
CN 115238073 A
3
专利 一种融合异构信息网络与生成对抗网络的服务分类方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:09:59上传分享