全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111218394.4 (22)申请日 2021.10.20 (65)同一申请的已公布的文献号 申请公布号 CN 113656927 A (43)申请公布日 2021.11.16 (73)专利权人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 邓金涛  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 代理人 熊永强 杜维 (51)Int.Cl. G06F 30/18(2020.01) G06F 30/27(2020.01)G06N 20/00(2019.01) G06F 111/02(2020.01) G06F 111/08(2020.01) (56)对比文件 CN 113011646 A,2021.0 6.22 CN 111291125 A,2020.0 6.16 CN 111932130 A,2020.1 1.13 审查员 黄彰 (54)发明名称 数据处理方法、 相关 设备及计算机存 储介质 (57)摘要 本申请公开一种数据处理方法、 相关设备及 计算机存储介质; 方法包括: 获取业务场景的多 重异构网络, 业务场景包括M类实体; 多重异构网 络包括M种节点和M种边, M类实体中的第一类实 体包括多个对象标识: 第一类对象注册的一个或 多个第一对象标识, 及第二类对象注册的一个或 多个第二对象标识; 根据多重异构网络中的每条 边的边属性, 将多重异构网络拆解成M个关系网 络; 对每个关系网络中的标识节 点之间的边进行 表征处理, 得到每个关系网络的边表征信息; 对M 个关系网络的边表征信息进行融合学习, 得到融 合表征信息; 基于融合表征信息和目标节点特 征, 预测目标标识节点所记录的第二对象标识被 第一类对象使用的概率, 可有效提升概率预测的 准确性。 权利要求书4页 说明书28页 附图11页 CN 113656927 B 2022.02.11 CN 113656927 B 1.一种数据处 理方法, 其特 征在于, 包括: 获取业务场景的多重异构网络, 所述业务场景包括M类实体, M大于1; 所述多重异构网 络包括M种节点和M种边, 一种节 点记录一类实体; 所述M类实体中的第一类实体包括多个对 象标识, 所述多个对象标识包括: 第一类对象注册的一个或多个第一对象标识, 以及第二类 对象注册的一个或多个第二对 象标识; 一种边对应一种边属 性, 且一种边属 性表示对 象标 识与所述M类实体中的一类实体中的实体之间的属性关系; 根据所述多重异构网络中的每条边的边属性, 将所述多重异构网络拆解成M个关系 网 络; 一个关系网络对应一种边属性, 且任一关系网络中包括一个或多个标识节 点, 标识节 点 是指所述M种节点中用于记录对象标识的节点; 对每个关系网络 中的标识节点之间的边进行表征处理, 得到所述每个关系网络的边表 征信息; 并对 所述M个关系网络的边表征信息进 行融合学习, 得到融合表征信息; 其中, 任一 关系网络的边表征信息是采用所述任一关系网络中的各条边的边表征向量构建得到的, 所 述任一关系网络中的任一条边的边表征向量是根据所述任一条边所连接的两个节点的节 点表征对所述任一条边进行表征处 理得到的; 获取目标标识节点的目标节点特征, 所述目标标识节点是指所述多重异构网络 中的一 个用于记录第二对象标识的标识 节点; 基于所述融合表征信 息和所述目标节点特征, 预测所述目标标识节点所记录的第 二对 象标识被所述第一类对象使用的概 率。 2.如权利要求1所述的方法, 其特征在于, 所述根据 所述多重异构网络中的每条边的边 属性, 将所述多重异构网络拆解成M个关系网络, 包括: 按照具有相同边属性的边被划分至同一个网络的原则, 根据所述多重异构网络 中的每 条边的边属性, 将所述多重异构网络拆解成M个异构子网络; 基于保留异构子网络中的标识节点的原则, 对所述M个异构子网络中的各个异构子网 络进行同构处 理, 得到M个同构子网络, 每 个同构子网络中的各个节点均为标识 节点; 将所述M个同构子网络作为M个关系网络 。 3.如权利要求1所述的方法, 其特征在于, 所述对每个关系网络中的标识节点之间的边 进行表征处 理, 得到所述每 个关系网络的边表征信息, 包括: 遍历第m个关系网络中的标识 节点之间的各 条边, m∈[1, M]; 针对当前遍历的当前边, 获取所述第m个关系 网络中的所述当前边所连接的两个节点 的节点表征; 根据所述当前边所连接的两个节点的节点表征, 对所述当前边进行表征处理, 得到所 述当前边的边表征向量; 在所述第m个关系网络中的各条边均被遍历后, 采用所述第m个关系网络 中的各条边的 边表征向量, 构建所述第m个关系网络的边表征信息 。 4.如权利要求1所述的方法, 其特征在于, 所述对所述M个关系 网络的边表征信息进行 融合学习, 得到融合表征信息, 包括: 对每个关系网络所包括的标识节点对进行并集运算, 得到K个标识节点对; K为正整数, 一个标识 节点对包括关系网络中相连接的两个标识 节点; 根据每个标识节点对中的两个标识节点的节点特征, 计算所述每个标识节点对的特征权 利 要 求 书 1/4 页 2 CN 113656927 B 2相似度; 并采用所述K个标识 节点对的特 征相似度, 构建节点特 征信息; 调用注意力模型基于注意力机制, 对所述M个关系 网络的边表征信息和所述节点特征 信息进行融合学习, 得到融合表征信息 。 5.如权利要求4所述的方法, 其特征在于, 任一关系网络的边表征信 息包括所述任一关 系网络中的标识节点之 间的边的边表征向量, 各个关系网络的边表征信息中的边表征向量 的向量维度相同; 所述根据每个标识节点对中的两个标识节点的节点特征, 计算所述每个标识节点对的 特征相似度, 包括: 对第k个标识节点对中的两个标识节点的节点特征进行相似度计算, 得到所述第 k个标 识节点对的相似度向量, k∈[1, K]; 基于边表征向量的向量维度, 对所述第k个标识节点对的相似度向量进行维度调整, 得 到所述第k个标识节点对的特征相似度; 其中, 所述第k个标识节点对的特征相似度的向量 维度, 与边特 征向量的向量维度相同。 6.如权利要求1所述的方法, 其特征在于, 所述获取目标标识节点的目标节点特征之 前, 所述方法还 包括: 从所述多重异构网络中筛 选出用于记录第二对象标识的标识 节点; 将筛选出的各个标识节点作为用于优化对象标识预测模型的样本, 添加至所述标识预 测模型的样本集中; 遍历所述样本集中的各个样本, 将当前遍历的样本确定为目标 标识节点; 其中, 所述目标标识节点所记录的第二对象标识被所述第一类对象使用的概率, 是调 用所述对象标识预测模型 得到的。 7.如权利要求6所述的方法, 其特征在于, 所述样本集中还包括各个样本的标注标签, 任一样本的标注标签的构建方式如下: 采集所述任一样本所记录的第 二对象标识的历史使用对象的对象图像, 并根据采集到 的对象图像对所述历史使用对 象进行类型识别; 所述历史使用对 象是指: 在开始优化所述 对象标识预测模型之前的预设时间段内, 最后一个使用所述任一样本所记录的第二对象标 识的对象; 若识别出所述历史使用对象为所述第 一类对象, 则将正标签作为所述任一样本的标注 标签; 所述 正标签用于指示: 所述任一样本所记录的第二对象标识被所述第一类对象使用; 若识别出所述历史使用对象为所述第 二类对象, 则将负标签作为所述任一样本的标注 标签; 所述负标签用于指示: 所述任一样本所记录的第二对 象标识未被所述第一类对 象使 用。 8.如权利要求6所述的方法, 其特征在于, 所述样本集中还包括各个样本的标注标签; 任一样本的标注 标签用于指示: 所述任一样本所记录的第二对象标识被所述第一类对象使 用, 或者任一样本的标注标签用于指示: 所述任一样本所记录的第二对 象标识未被所述第 一类对象使用; 所述方法还 包括: 在所述样本集中的各个样本均被遍历后, 得到所述各个样本所记录的第 二对象标识被 所述第一类对象使用的概 率; 根据所述各个样本所记录的第 二对象标识被所述第 一类对象使用的概率, 以及所述各权 利 要 求 书 2/4 页 3 CN 113656927 B 3

.PDF文档 专利 数据处理方法、相关设备及计算机存储介质

文档预览
中文文档 44 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共44页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、相关设备及计算机存储介质 第 1 页 专利 数据处理方法、相关设备及计算机存储介质 第 2 页 专利 数据处理方法、相关设备及计算机存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:45:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。