(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111635107.X
(22)申请日 2021.12.2 9
(65)同一申请的已公布的文献号
申请公布号 CN 114021198 A
(43)申请公布日 2022.02.08
(73)专利权人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 潘无穷 韦韬 李婷婷 钱中天
(74)专利代理 机构 北京亿腾知识产权代理事务
所(普通合伙) 11309
代理人 陈霁 周良玉
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/60(2013.01)(56)对比文件
CN 110046638 A,2019.07.23
CN 112035493 A,2020.12.04
CN 10416 6821 A,2014.1 1.26
CN 113516506 A,2021.10.19
CN 111125736 A,2020.0 5.08
CN 111611623 A,2020.09.01
CN 113688354 A,2021.1 1.23
KR 20130020050 A,2013.02.27
张浩 等.云平台下基 于隐私保护的桶划分
方案. 《计算机学报》 .2016,第39卷(第2期),
Liyan Shen.A More Ef ficient Private
Set Intersecti on Protoco l Based o n Random
OT and Balance Hash. 《IC C 2019 - 2019 IE EE
Internati onal Conference o n
Communications (ICC)》 .2019,
审查员 李华芳
(54)发明名称
一种保护数据隐私的确定共有数据的方法
及装置
(57)摘要
本说明书实施例提供一种保护数据隐私的
确定共有数据的方法及装置, 中间方从第一方和
第二方分别获取各自的分桶数据, 分桶数据由各
方将持有的隐私数据集进行预设分桶处理而得
到, 预设分桶处理包括, 针对任意的隐私数据, 根
据隐私数据所落入的第一区段, 将其映射值填入
多个桶空间中的目标桶空间; 多个桶空间中任意
的第一桶空间包括若干个第一区段; 针对任意一
方的分桶数据中第一桶空间的第一映射值, 将其
与另一方的分桶数据中第二桶空间的各映射值
进行比较, 得到第一映射值的比较结果; 第二桶
空间与第一桶空间存在共有第一区段; 将任一方
的分桶数据中各个映射值的比较结果构成的结
果集合, 发送至第一方和第二方, 用于确定两方
隐私数据集的共 有数据。
权利要求书5页 说明书25页 附图4页
CN 114021198 B
2022.04.08
CN 114021198 B
1.一种保护数据隐私的确定共有数据的方法, 所述方法通过中间方 执行, 包括:
从第一方和第 二方分别获取各自的分桶数据, 所述分桶数据由各方将其持有的隐私数
据集进行预设分桶处理而得到, 所述预设分桶处理包括, 针对任意的 隐私数据, 根据该隐私
数据在预先划分的t个第一区段中所落入的第一区段, 将该隐私数据对应的映射值填入预
设的多个桶空间中的目标桶空间; 所述多个桶空间中任意的第一桶空间包括若干个第一区
段;
针对任意一方的分桶数据中所述第 一桶空间包含的第 一映射值, 将其与另一方的分桶
数据中第二桶空间包含的各映射值进 行比较, 得到针对第一映射值的比较结果; 其中, 所述
第二桶空间与所述第一桶空间存在共有第一区段;
将所述任意一方的分桶数据中各个映射值的比较结果构 成的结果集合, 发送至所述第
一方和第二方, 用于其确定 两方的隐私数据集的共有数据。
2.根据权利要求1所述的方法, 其中, 所述多个桶空间包括多层级的桶空间, 不同层级
的桶空间包 含的第一区段的个数不同。
3.根据权利要求2所述的方法, 其中, 所述第一桶空间包括连续的p个第 一区段; 在所述
进行比较之前, 还 包括:
确定第二桶空间, 所述第二桶空间包括第一子空间, 第二子空间和/或第三子空间, 所
述第一子空间包括所述p个第一区段中的部分第一区段, 所述第二子空间与所述第一桶空
间对应相同; 所述第三子空间包 含且大于所述第一桶空间。
4.根据权利要求2所述的方法, 在所述从第一方和第二方分别获取各自的分桶数据之
前, 还包括:
确定各层级桶空间的建议数量;
将所述建议数量分别发送至第一方和第二方, 使其确定所述多个桶空间。
5.根据权利要求1所述的方法, 在所述从第一方和第二方分别获取各自的分桶数据之
前, 还包括:
基于所述两方的隐私数据集中数据个数的最大值, 确定所述第一区段的划分个数t;
基于所述划分个数t确定区段划分信息; 将所述区段划分信息分别发送至第一方和第
二方, 使其确定出 所述t个第一区段。
6.根据权利要求1所述的方法, 其中, 所述 隐私数据对应的映射值, 基于该隐私数据针
对第一随机数 所取的余数 结果而确定;
在所述从第一方和第二方分别获取 各自的分桶数据之前, 所述方法还 包括:
生成所述第一随机数;
将所述第一随机数分别发送至所述第一方和所述第二方。
7.根据权利要求1所述的方法, 其中, 各条隐私数据是, 对其对应的对象标识进行哈希
计算后所 得到的哈希值。
8.根据权利要求1 ‑7任一项所述的方法, 所述方法还 包括:
从第一方和第 二方分别获取各自的异或结果, 其中, 所述异或结果包括与 预先划分的T
个第二区段对应的T个异或值, 任意的第i个异或值是各方对其更新的 隐私数据集中落入第
i个第二区段 的隐私数据对应的映射值进行异或运算得到的, 所述更新的隐私数据集是各
方基于所述结果 集合从其隐私数据集中删除非共有数据后得到的;权 利 要 求 书 1/5 页
2
CN 114021198 B
2针对任意一方的异或结果中的第 i异或值, 判断其与另一方的异或结果中第 i异或值是
否相同, 得到针对第i异或值的判断结果;
将各个第二区段对应的判断结果, 发送至所述第一方和所述第二方, 用于其确定两方
的更新的隐私数据集的共有数据。
9.根据权利要求1 ‑7任一项所述的方法, 其中, 所述中间方为密态计算中心, 其包括M个
执行方;
所述从第一方和第二方分别获取 各自的分桶数据, 包括:
各执行方, 分别从第一方和第 二方获得各自的分桶数据分片, 其中, 所述分桶数据分片
由各方将其多个桶空间内各映射 值分别划分为M份而得到;
所述得到针对第一映射 值的比较结果, 包括:
所述各执行方通过多方安全计算MPC方式, 将所述第一映射值与所述第二桶空间包含
的各映射 值进行比较, 从而得到所述比较结果。
10.根据权利要求1 ‑7任一项所述的方法, 其中, 所述得到针对第一映射值的比较结果,
包括:
将该第一映射值与 所述第二桶空间包含的各映射值进行比较, 得到与 各映射值对应的
各中间结果;
将各中间结果进行异或运 算, 得到针对第一映射 值的所述比较结果。
11.一种保护数据隐私的确定共有数据的方法, 所述方法通过第 一方执行, 所述方法包
括:
将持有的第一 隐私数据集中的各条隐私数据进行预设分桶处理, 得到第一分桶数据,
其中, 所述预设分桶处理包括, 针对任意的隐私数据, 根据该隐私数据在预先划分的t个第
一区段中所落入的第一区段, 将该隐私数据对应的映射值填入预设的多个桶空间中的目标
桶空间; 所述多个桶空间中任意的第一桶空间包括若干个第一区段;
将所述第一分桶数据发送至中间方, 以使所述中间方基于所述第 一分桶数据和第 二分
桶数据确定结果集合, 其中, 所述第二分桶数据由第二方将其持有的第二隐私数据集进行
所述预设分桶处理而得到; 所述结果集合包括, 将所述第一分桶数据中第一桶空间中的第
一映射值与所述第二分桶数据中第二桶空间包含的各映射值进行比较得到的比较结果, 所
述第二桶空间与第一桶空间存在共有第一区段;
从所述中间方获取 所述结果 集合;
基于所述结果 集合, 从所述第一隐私数据集中确定 两方的共有数据。
12.根据权利要求1 1所述的方法, 还 包括:
从所述中间方获取第一随机数;
利用所述第一随机数, 对所述第一 隐私数据集中的各条数据求余, 得到各条隐私数据
对应的映射 值。
13.根据权利要求11所述的方法, 其中, 所述多个桶空间包括多层级的桶空间, 不同层
级的桶空间包 含的第一区段的个数不同。
14.根据权利要求1 1所述的方法, 还 包括:
从所述中间方获取空间划分信息, 所述空间划分信息是基于空间划分个数t确定的, 所
述空间划分个数t是所述中间方基于所述第一隐私数据集和所述第二隐私数据集中数据个权 利 要 求 书 2/5 页
3
CN 114021198 B
3
专利 一种保护数据隐私的确定共有数据的方法及装置
文档预览
中文文档
35 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共35页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 04:12:19上传分享