全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111406838.7 (22)申请日 2021.11.24 (71)申请人 南京信息职业 技术学院 地址 210023 江苏省南京市栖霞区仙林大 学城文澜路99号 (72)发明人 王俊松 边荟凇 洪海兵 金易琛  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 代理人 董建林 (51)Int.Cl. H04L 9/40(2022.01) (54)发明名称 一种大数据的多密集 块检测与提取方法 (57)摘要 本发明公开了一种大数据的多密集块检测 与提取方法, 旨在解决现有技术中密集块检测方 法存在的检测准确率和召回率低的技术问题。 其 包括: 获取K维 张量数据D、 待 提取密集块个数m和 密集块尺 寸范围; 利用基于分段函数的密度跟踪 系数对K维张量数据D进行可疑程度度量, 并根据 可疑程度和密集块尺寸范围生成snapshots列 表; 根据snapshots列表从K 维张量数据 D中提取m 个密集块。 本发 明能够在保证检测效率的同时能 够有效提高密集 块的准确率和召回率。 权利要求书2页 说明书5页 附图2页 CN 114285601 A 2022.04.05 CN 114285601 A 1.一种大 数据的多密集 块检测与提取 方法, 其特 征在于, 包括如下步骤: 获取K维张量数据D、 待提取密集 块个数m和密集 块尺寸范围; 利用基于分段函数的密度跟踪系数对K维张量数据D进行可疑程度度量, 并根据 可疑程 度和密集 块尺寸范围生成snapshots列表; 根据snapshots列表从K维张量数据D中提取m个密集 块。 2.根据权利要求1所述的一种大数据的多密集块检测与提取方法, 其特征在于, 利用基 于分段函数的密度跟踪系数对K维张量数据D进行 可疑程度 度量的方法包括: 将K维张量数据D作为输入数据; 将输入数据的每个维度下计数最少的一列删除, 获得每个维度的剩余块bi, 其中, i表示 维度, i=1,2,…,K; 基于分段函数计算每 个维度的剩余 块bi的密度跟踪系数; 根据密度跟踪系数计算每 个维度的剩余 块bi对于输入张量数据D的可疑程度DTS值。 3.根据权利要求2所述的一种大数据的多密集块检测与提取方法, 其特征在于, 密度跟 踪系数的表达式如下: 其中, 表示第i个维度的剩余块bi的密度跟踪系数, 表示剩余块bi的总 计数, 表示剩余 块bi的尺寸的乘积。 4.根据权利要求2所述的一种大数据的多密集块检测与提取方法, 其特征在于, 可疑程 度DTS值的计算公式如下: 其中, 表示第i个维度的剩余块bi的DTS值, 表示 Suspiciousness度量指标, Ni表示原始的K维张量数据D的第i个维度下尺寸的乘积, C表示 原始的K维张量数据D的总计数。 5.根据权利要求2所述的一种大数据的多密集块检测与提取方法, 其特征在于, 根据 可 疑程度和密集 块尺寸范围生成snapshots列表的方法包括: 比较每个维度的剩余 块bi的DTS值, 获取 各个维度中DTS值 最高的剩余 块bmax; 判断剩余 块bmax是否满足密集 块尺寸范围, 如果满足, 将剩余 块bmax作为数据快照B; 将数据快照B与其DTS值 一同存入snapshots列表中;权 利 要 求 书 1/2 页 2 CN 114285601 A 2将剩余块bmax作为新的输入数据, 重新进行可疑程度度量和数据快照提取, 直至输入数 据为空, 获得最终的snapshots列表。 6.根据权利要求1或5所述的一种大数据的多密集块检测与提取方法, 其特征在于, 根 据snapshots列表从K维张量数据D中提取m个密集 块的方法包括: 从snapshots列表中找出DTS值 最大的数据快照Bmax, 作为 一个密集 块; 从K维张量数据D中删除数据快照Bmax, 得到更新后的张量数据D; 根据更新后的张量数据D生成新的sn apshots列表, 并提取新的密集块, 直到提取出m个 密集块。权 利 要 求 书 2/2 页 3 CN 114285601 A 3

.PDF文档 专利 一种大数据的多密集块检测与提取方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种大数据的多密集块检测与提取方法 第 1 页 专利 一种大数据的多密集块检测与提取方法 第 2 页 专利 一种大数据的多密集块检测与提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:20:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。