专利数据处理方法、相关设备及计算机存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202111218394.4 (22)申请日 2021.10.20 (65)同一申请的已公布的文献号申请公布号 CN 113656927 A (43)申请公布日 2021.11.16 (73)专利权人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人邓金涛　 (74)专利代理机构广州三环专利商标代理有限公司 44202 代理人熊永强　杜维 (51)Int.Cl. G06F 30/18(2020.01) G06F 30/27(2020.01)G06N 20/00(2019.01) G06F 111/02(2020.01) G06F 111/08(2020.01) (56)对比文件 CN 113011646 A,2021.0 6.22 CN 111291125 A,2020.0 6.16 CN 111932130 A,2020.1 1.13 审查员黄彰 (54)发明名称数据处理方法、相关设备及计算机存储介质 (57)摘要本申请公开一种数据处理方法、相关设备及计算机存储介质；方法包括：获取业务场景的多重异构网络，业务场景包括M类实体；多重异构网络包括M种节点和M种边， M类实体中的第一类实体包括多个对象标识：第一类对象注册的一个或多个第一对象标识，及第二类对象注册的一个或多个第二对象标识；根据多重异构网络中的每条边的边属性，将多重异构网络拆解成M个关系网络；对每个关系网络中的标识节点之间的边进行表征处理，得到每个关系网络的边表征信息；对M 个关系网络的边表征信息进行融合学习，得到融合表征信息；基于融合表征信息和目标节点特征，预测目标标识节点所记录的第二对象标识被第一类对象使用的概率，可有效提升概率预测的准确性。权利要求书4页说明书28页附图11页 CN 113656927 B 2022.02.11 CN 113656927 B 1.一种数据处理方法，其特征在于，包括：获取业务场景的多重异构网络，所述业务场景包括M类实体， M大于1；所述多重异构网络包括M种节点和M种边，一种节点记录一类实体；所述M类实体中的第一类实体包括多个对象标识，所述多个对象标识包括：第一类对象注册的一个或多个第一对象标识，以及第二类对象注册的一个或多个第二对象标识；一种边对应一种边属性，且一种边属性表示对象标识与所述M类实体中的一类实体中的实体之间的属性关系；根据所述多重异构网络中的每条边的边属性，将所述多重异构网络拆解成M个关系网络；一个关系网络对应一种边属性，且任一关系网络中包括一个或多个标识节点，标识节点是指所述M种节点中用于记录对象标识的节点；对每个关系网络中的标识节点之间的边进行表征处理，得到所述每个关系网络的边表征信息；并对所述M个关系网络的边表征信息进行融合学习，得到融合表征信息；其中，任一关系网络的边表征信息是采用所述任一关系网络中的各条边的边表征向量构建得到的，所述任一关系网络中的任一条边的边表征向量是根据所述任一条边所连接的两个节点的节点表征对所述任一条边进行表征处理得到的；获取目标标识节点的目标节点特征，所述目标标识节点是指所述多重异构网络中的一个用于记录第二对象标识的标识节点；基于所述融合表征信息和所述目标节点特征，预测所述目标标识节点所记录的第二对象标识被所述第一类对象使用的概率。 2.如权利要求1所述的方法，其特征在于，所述根据所述多重异构网络中的每条边的边属性，将所述多重异构网络拆解成M个关系网络，包括：按照具有相同边属性的边被划分至同一个网络的原则，根据所述多重异构网络中的每条边的边属性，将所述多重异构网络拆解成M个异构子网络；基于保留异构子网络中的标识节点的原则，对所述M个异构子网络中的各个异构子网络进行同构处理，得到M个同构子网络，每个同构子网络中的各个节点均为标识节点；将所述M个同构子网络作为M个关系网络。 3.如权利要求1所述的方法，其特征在于，所述对每个关系网络中的标识节点之间的边进行表征处理，得到所述每个关系网络的边表征信息，包括：遍历第m个关系网络中的标识节点之间的各条边， m∈[1， M]；针对当前遍历的当前边，获取所述第m个关系网络中的所述当前边所连接的两个节点的节点表征；根据所述当前边所连接的两个节点的节点表征，对所述当前边进行表征处理，得到所述当前边的边表征向量；在所述第m个关系网络中的各条边均被遍历后，采用所述第m个关系网络中的各条边的边表征向量，构建所述第m个关系网络的边表征信息。 4.如权利要求1所述的方法，其特征在于，所述对所述M个关系网络的边表征信息进行融合学习，得到融合表征信息，包括：对每个关系网络所包括的标识节点对进行并集运算，得到K个标识节点对； K为正整数，一个标识节点对包括关系网络中相连接的两个标识节点；根据每个标识节点对中的两个标识节点的节点特征，计算所述每个标识节点对的特征权　利　要　求　书 1/4 页 2 CN 113656927 B 2相似度；并采用所述K个标识节点对的特征相似度，构建节点特征信息；调用注意力模型基于注意力机制，对所述M个关系网络的边表征信息和所述节点特征信息进行融合学习，得到融合表征信息。 5.如权利要求4所述的方法，其特征在于，任一关系网络的边表征信息包括所述任一关系网络中的标识节点之间的边的边表征向量，各个关系网络的边表征信息中的边表征向量的向量维度相同；所述根据每个标识节点对中的两个标识节点的节点特征，计算所述每个标识节点对的特征相似度，包括：对第k个标识节点对中的两个标识节点的节点特征进行相似度计算，得到所述第 k个标识节点对的相似度向量， k∈[1， K]；基于边表征向量的向量维度，对所述第k个标识节点对的相似度向量进行维度调整，得到所述第k个标识节点对的特征相似度；其中，所述第k个标识节点对的特征相似度的向量维度，与边特征向量的向量维度相同。 6.如权利要求1所述的方法，其特征在于，所述获取目标标识节点的目标节点特征之前，所述方法还包括：从所述多重异构网络中筛选出用于记录第二对象标识的标识节点；将筛选出的各个标识节点作为用于优化对象标识预测模型的样本，添加至所述标识预测模型的样本集中；遍历所述样本集中的各个样本，将当前遍历的样本确定为目标标识节点；其中，所述目标标识节点所记录的第二对象标识被所述第一类对象使用的概率，是调用所述对象标识预测模型得到的。 7.如权利要求6所述的方法，其特征在于，所述样本集中还包括各个样本的标注标签，任一样本的标注标签的构建方式如下：采集所述任一样本所记录的第二对象标识的历史使用对象的对象图像，并根据采集到的对象图像对所述历史使用对象进行类型识别；所述历史使用对象是指：在开始优化所述对象标识预测模型之前的预设时间段内，最后一个使用所述任一样本所记录的第二对象标识的对象；若识别出所述历史使用对象为所述第一类对象，则将正标签作为所述任一样本的标注标签；所述正标签用于指示：所述任一样本所记录的第二对象标识被所述第一类对象使用；若识别出所述历史使用对象为所述第二类对象，则将负标签作为所述任一样本的标注标签；所述负标签用于指示：所述任一样本所记录的第二对象标识未被所述第一类对象使用。 8.如权利要求6所述的方法，其特征在于，所述样本集中还包括各个样本的标注标签；任一样本的标注标签用于指示：所述任一样本所记录的第二对象标识被所述第一类对象使用，或者任一样本的标注标签用于指示：所述任一样本所记录的第二对象标识未被所述第一类对象使用；所述方法还包括：在所述样本集中的各个样本均被遍历后，得到所述各个样本所记录的第二对象标识被所述第一类对象使用的概率；根据所述各个样本所记录的第二对象标识被所述第一类对象使用的概率，以及所述各权　利　要　求　书 2/4 页 3 CN 113656927 B 3

专利 数据处理方法、相关设备及计算机存储介质

专利数据处理方法、相关设备及计算机存储介质