(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210581432.0
(22)申请日 2022.05.26
(71)申请人 南京百岁梦生物科技有限公司
地址 210046 江苏省南京市栖霞区迈皋桥
创业园科技研发基地寅春路18号-
Q273
(72)发明人 刘涛 黄叠梅
(74)专利代理 机构 南京鼎傲知识产权代理事务
所(普通合伙) 32327
专利代理师 胡光金
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/60(2013.01)
G06F 40/289(2020.01)
G06F 40/242(2020.01)G06F 16/35(2019.01)
G06K 9/62(2022.01)
(54)发明名称
基于大数据的生物医疗信息处理分析系统
及方法
(57)摘要
本发明公开了基于大数据的生物医疗信息
处理分析系统及方法, 包括生物医疗信息文件分
析模块、 生物医疗信息传输模块、 存储方式分析
模块和智能调整模块; 生物医疗信息文件分析模
块分析生物医疗信息文件所处生物医疗信息文
件装置的文件 隐私保护动作并获取文件的数据
内容; 生物医疗信息传输模块传输文件数据内容
和对应的隐私保护动作到生物医疗信息处理系
统中, 生物医疗信息处理系统存储信息于文件数
据库中; 存储 方式分析模块根据不同文件的数据
字符分析对应的存储 方式; 智能调整模块根据相
似度智能获取文件的隐私保护动作和存储方式;
本发明快速有效且智能的解决文件在生物医疗
信息处理装置上的容 易泄露文件内容的问题。
权利要求书4页 说明书9页 附图2页
CN 114840881 A
2022.08.02
CN 114840881 A
1.基于大 数据的生物医疗信息处 理分析方法, 其特 征在于, 包括以下 具体过程:
步骤S100: 获取生物医疗信息文件, 将生物医疗信息文件放置于生物医疗信息处理装
置中, 所述生物医疗信息处理装置读取所述生物医疗信息文件的数据内容, 并根据生物医
疗信息处理装置所 处的环境产生文件隐私保护的动作; 所述数据内容包含 数据特征和数据
字符; 所述数据特 征包括字体的大小和是否包 含图片; 所述数据字符包 含文字内容和符号;
步骤S200: 所述生物医疗信息处理装置连接生物医疗信息处理系统, 所述生物医疗信
息处理装置将进行的文件隐私保护动作以及文件的数据内容传输给所述生物医疗信息处
理系统;
步骤S300: 所述生物医疗信息处理系 统记录对应文件的隐私保护动作, 对文件的数据
字符进行分析并执行不同的存储方式, 所述生物医疗信息处理系统将不同的文件数据内容
和对应的文件隐私保护动作传输 到文件数据库中;
步骤S400: 分析实时放置的文件与生物医疗信息处理系统中已经完成存储的数据内容
相似度大于90%时, 所述生物医疗信息处理装置获取文件数据库中与此次放置文件相似度
符合要求文件对应的 隐私保护动作和存储方式, 并进 行相同隐私保护动作的执行和存储方
式的选择。
2.根据权利要求1所述的基于大数据的生物医疗信 息处理分析方法, 其特征在于: 所述
步骤S300中对文件的数据字符进行分析并执 行不同方式的存 储, 包括以下内容:
步骤S310: 对文件数据库中多个生物医疗文件进行切词和聚类分析; 所述切词的步骤
是根据词典和所述多个生物医疗文件中数据字符的词性进 行切词, 所述聚类分析的步骤是
根据生物工程医学 领域分类和K ‑means算法, 对所述多个生物医疗文件进行聚类;
步骤S320: 根据同一类别的生物医疗文件中每两个生物医疗文件的数据字符, 确定所
述每两个生物医疗文件的关联度;
步骤S330: 根据所述每两个生物医疗文件的关联度, 判断所述同一类别生物医疗文件
中任意两个生物医疗文件的数据字符是否存在关联关系;
步骤S340: 在判断结果为是时, 将存在关联关系的数据字符进行关联存储, 所述关联存
储的过程为根据所述存在关联关系的数据字符的属性, 对所述存在关联关系的数据字符进
行存储, 以及根据任意两个生物医疗文件的关联度, 确定所述任意两个生物医疗文件中数
据字符的关联度, 将所述任意两个生物医疗文件中数据字符的关联度进行存 储;
步骤S350: 基于步骤S340中的关联度, 将关联度大于等于平均关联度对应的生物医疗
文件进行二级加密存储, 对关联度小于平均关联度对应的生物医疗文件进行一级加密存
储, 其中一级加密存 储的复杂程度大于二级加密存 储。
3.根据权利要求2所述的基于大数据的生物医疗信 息处理方法, 其特征在于: 所述根据
生物医疗信息处 理装置所处的环境产生文件隐私保护的动作, 包括以下 具体过程:
步骤S110: 获取所述生物医疗信息处理装置所处环境中的固定工位, 记录除固定工位
以外人员停留时间大于阈值的位置为可疑位置;
步骤S120: 将生物医疗信息处理装置设为坐标原点, 建立以生物医疗信息处理装置水
平方向为横坐标、 竖直方向为纵坐标的直角坐标系, 并获取第i个可疑位置的坐标(xi,yi),
以可疑位置的坐标和坐标原点连线建立第i个可疑坐标的线性方程Yi=aiXi, 其中Xi表示
满足对应线性方程的所有 可疑位置的横坐标, |ai|表 示可疑位置距离坐标原 点的可视度数权 利 要 求 书 1/4 页
2
CN 114840881 A
2值;
步骤S130: 设置生物医疗信息处理装置中文件的数据特征集合为{c1, c2, ..., cn}, 所
述数据特征集合为{c1, c2, ..., cn}表示第n种生物 医疗文件的字体大小数值, 获取在数据
特征集合为{c1, c2, ..., cn}情况下不同线性方程对应距离间隔曲线时可疑位置的平均清
晰度集合{{ P1i}, {P2i}, ..., { Pki}}, 其中{ Pki}表示第k个距离间隔下的第i个可疑位置的
平均清晰度; 所述距离间隔曲线为以坐标原点为圆心、 距离间隔为半径的圆弧, 所述圆弧相
交所有线性方程;
步骤S140: 若平均清晰度为0, 则在平均清晰度集合中除去对应的可疑位置坐标, 将平
均清晰度集合{{P1i}, {P2i}, ..., {Pki}}的平均清晰度大小按照由大到小的顺序排序为集
合{{P1i}, {P2i}, ..., {Pki}}0, 并分析集合{{P1i}, {P2i}, ..., {Pki}}0不同线性方程的安
全半径, 并对小于安全半径的可疑位置的情况进行生物医疗信息处 理装置的角度调整。
4.根据权利要求3所述的基于大数据的生物医疗信 息处理方法, 其特征在于: 所述分析
集合{{P1i}, {P2i}, ..., {P ki}}0不同线性方程的安全半径, 并对小于安全半径的可疑位置
的情况进行生物医疗信息处 理装置的角度调整, 包括以下 过程:
步骤S141: 获取集合{{P1i}, {P2i}, ..., {Pki}}0中每个子集合平均清晰度对应的可视
度数值|ai|; 将可视度数值|ai|构成的集合记作{{a1i}, {a2i}, ..., {aki}}, {aki}表示第k
个距离间隔下的第i个可疑位置的可视度数值;
步骤S142: 依次计算集合{{a1i}, {a2i}, ..., {aki}}中相邻子集合的交集{a(k ‑1)i}∩
{aki}为安全集合, 判断交集{a(k ‑1)i}∩{aki}包含可视度数值的个数与集合{{a(k ‑1)i},
{aki}}中另一集合包含可视度数值的个数之差;
步骤S143: 直至计算到个数之差小于0时, 获取此次计算中{a(k ‑1)i}∩{aki}对应的安
全集合, 且获取安全集合中缺少的可视度数值对应的线性方程, 则计算中对应的第k个距离
间隔的数值 就是所述线性方程的安全半径;
步骤S144: 当可疑位置小于安全半径时, 获取此时可疑位置所属的{{P1i}, {P2i}, ...,
{Pki}}0中的子集合, 并将生物医疗信息处理装置与水平方向的角度大小调整至{{P1i},
{P2i}, ..., {Pki}}0子集合对应{{a1i}, {a2i}, ..., {aki}}子集合中顺序小于可疑位置的
可视度数值角度; 所述可视度数值角度为arctan|ai|。
5.根据权利要求4所述的基于大数据的生物医疗信 息处理方法, 其特征在于: 所述距离
间隔的划分包括以下 过程:
获取可疑位置的坐标(xi,yi), 以及可疑位置所属的线性方程, 分析相同线性方程上相
邻可疑位置对应的平均清晰度{Pk1};
计算所有线性方程中相邻可疑位置的平均清晰度差值Pk1 ‑P(k‑1)1, 当平均清晰度差
值Pk1‑P(k‑1)1大于预设差值阈值时, 获取产生平均清晰度差值大于预设差值阈值时对应
的可疑位置的平均坐标
则所述可疑位置的平均坐标
与坐标原点的距离间隔为
6.根据权利要求5所述的基于大数据的生物医疗信 息处理方法, 其特征在于: 所述步骤
S130中设置生物 医疗信息处理装置中文件的数据特征集合还包括{d1, d2}, 所述d1表示生
物医疗文件不包 含图片, 所述d2 表示生物医疗文件中包 含图片;权 利 要 求 书 2/4 页
3
CN 114840881 A
3
专利 基于大数据的生物医疗信息处理分析系统及方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:01上传分享