(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210715787.4
(22)申请日 2022.06.22
(71)申请人 浙江树人 学院
地址 312030 浙江省绍兴 市柯桥区杨汛桥
镇江夏路2016号
(72)发明人 陈友荣 黄家煊 王章权 缪克雷
吕晓雯 刘半藤 王柯
(74)专利代理 机构 浙江侨悦专利代理有限公司
33470
专利代理师 居延娟
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/64(2013.01)
G06K 9/62(2022.01)
G06N 7/08(2006.01)
(54)发明名称
基于猫鼬优化的动态多维医疗隐私数据保
护方法及系统
(57)摘要
本发明提供了一种基于猫鼬优化的动态多
维医疗隐私数据保护方法及系统, 包括: 读取原
始多维医疗数据表, 进行参数初始化操作; 进行
数据预处理; 基于信息损失量和平均医疗敏感属
性数据差异值度量的等价类划分; 数据泛化和匿
名数据重发布, 解决了 现有技术侧重于研究能够
抵御推理攻击的静态K匿名算法, 但是在实际匿
名过程中一张医疗数据表存在数据添加、 删除和
修改等动态更新过程, 静态K匿名算法没有考虑
医疗数据表的动态更新, 较难直接应用到动态多
维医疗数据的医疗信息发布中断的问题。
权利要求书4页 说明书9页 附图2页
CN 115168891 A
2022.10.11
CN 115168891 A
1.一种基于 猫鼬优化的动态多维医疗隐私数据保护方法, 其特 征在于, 包括:
读取原始多维医疗数据表, 进行参数初始化操作;
进行数据预处 理;
基于信息损失量和平均医疗敏感属性数据差异值度量的等 价类划分;
数据泛化和匿名数据重发布。
2.根据权利要求1所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 所述参数初始 化操作, 包括: 初始 化当前迭代次数it =1, 最大迭代次数Maxit, 分类
数K, 参数L, 最大信息损失量Maxloss, 最小敏感属性数据差异值Minsadv, 解决方案计数
count(cs)=0(cs=0,1, …,m)。
3.根据权利要求1所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 所述进行 数据预处 理, 包括:
判断当前 数据表是否已经 执行过匿名操作;
若无, 则删除多维医疗数据表中数据不完整的多维医疗记录和所有患 者的医疗标识符
属性数据, 计算任意两条多维医疗记录之间的医疗敏感属性数据距离;
若有, 则判断当前多维医疗数据表是否存在增加、 删除、 修改等更新操作; 若当前多维
医疗数据表进行多维医疗记录删除操作, 则找到删除的记录所对应的等价类, 随机复制该
等价类中的医疗记录, 确保所有等价类中均包含k条多维医疗记录数量, 且满足等价类划分
的约束条件, 若当前多维医疗数据表进行多维医疗记录添加操作, 则计算新添加的多维医
疗记录添加到当前与其医疗准标识符属性距离最短的等 价类中;
若当前多维医疗数据表没有变化, 直接发布其对应的多维医疗匿名数据表,等待接收
需要匿名的多维医疗数据表。
4.根据权利要求3所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于,所述判断当前数据 表是否已经执行过匿名操作; 若 无, 则删除多维医疗 数据表中数
据不完整的多维医疗记录和所有患者的医疗标识符属性数据, 计算任意两条多维医疗记录
之间的医疗敏感属 性数据距离; 还包括: 删除多维医疗数据表中数据不完整的多维医疗记
录和所有患者的医疗标识符属性数据, 计算任意两条多维医疗记录之 间的医疗敏感属性数
据距离。
5.根据权利要求4所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 所述删除多维医疗数据 表中数据不完整的多维医疗记录和所有患者的医疗标识符
属性数据, 计算任意两条多维医疗记录之间的医疗敏感属性数据距离, 包括:
通过公式(1)计算任意两条多维医疗记录之间的医疗敏感属性数据距离;
其中, ri表示第i条多维医疗记录, rj表示第j条多维医疗记录, DistSA(ri,rj)表示第i条
与第j条多 维医疗记录的敏感属性数据距离,
表示第i条医疗记录中第l个数值型敏感
属性值,
第j条医疗记录中第l个数值型敏感属性值,
表示第i条与第j条
医疗记录中第l个数值型敏感属性数据差的绝对值, n表 示多维医疗记录的数量, a表示数值权 利 要 求 书 1/4 页
2
CN 115168891 A
2型医疗敏感属性的个数,
表示第i条多维医疗记录中第l个类别型敏感属性数据,
表示第j条多维医疗记录中第l个类别型敏感属性数据,
表示第i条
与第j条多维医疗记录中第l个类别型敏感属性数据的最低公共祖先节 点高度, h(H)表 示当
前类别型属性的总高度, b表示类别型医疗敏感属性的个数。
6.根据权利要求5所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 所述数据预处理还包括: 结合多维医疗数据表中的敏感属性个数sas确定维度o的
大小, 构建搜索空间, 获得m个解决方案并完成m个解决方案的初始 化, 在搜索空间内通过公
式(2)生成解决方案x中单个簇中心c enter={csa1,…,csasi,…,csasas}, 并重复K次获得最
终解决方案x={center1,center2,…,centerK}, 其中centerK表示第K个簇中心, 以此可产
生m个解决方案, 并组成解决方案矩阵X={x1,x2,...,xm};
csasi=rsasi×(upsa‑dnsa)+dnsa (2)
其中, csasi表示当前簇中心的第si个医疗敏感数据, upsa表示当前属 性的最大敏感数
据, dnsa表示当前属性的最小敏感数据, rsasi表示第si个帐篷混沌映射随机数, 可表示 为:
其中,
表示0到1之间的随机数, α 表示0 到1之间的固定参数。
7.根据权利要求6所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 所述数据预 处理还包括: 计算每一个解决方案的适应度值, 判断当前迭代次数it是
否大于最大迭代次数Maxit, 如果为是, 选择适应度最大的解决方案作为最佳簇中心解决方
案进行等 价类划分;
所述计算每一个解决方案的适应度值 通过公式(4)计算:
其中, it表示当前迭代 次数, fcs(it)表示当前迭代中第cs个解决方案的适应度值, k表
示簇的个数, Dist(rj,cq)表示第j条多维医疗记录 到第q个簇中心cq的医疗敏感数据距离 。
8.根据权利要求7所述的一种基于猫鼬优化的动态多维医疗隐私数据保护方法, 其特
征在于, 还包括: 若当前迭代次数it小于最大迭代次数Maxit, 执行以下内容m次: 通过公式
(5)计算每个解决方案被选中的概率, 通过轮盘赌的方法从 中随机选择一个解决方案c s, 并
通过公式(6)计算新的簇中心解决方案cs, 判断新的解决方案适应度值是否小于计算前的
解决方案适应度值, 如果为是, 更新解决方案cs, 否则不更新解决方案, 当前解决方案计数
count(cs)加1;
权 利 要 求 书 2/4 页
3
CN 115168891 A
3
专利 基于猫鼬优化的动态多维医疗隐私数据保护方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:38:35上传分享