全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111449418.7 (22)申请日 2021.11.30 (71)申请人 湖北天融信网络安全技 术有限公司 地址 430040 湖北省武汉市临 空港经济技 术开发区五环大道6 66号(21) 申请人 北京天融信网络安全技 术有限公司   北京天融信科技有限公司   北京天融信软件 有限公司 (72)发明人 刘盈  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 李飞 (51)Int.Cl. H04L 47/2483(2022.01) H04L 9/40(2022.01)G06N 20/00(2019.01) (54)发明名称 一种流量识别方法、 装置、 电子设备及存储 介质 (57)摘要 本申请实施例提供一种流量识别方法、 装 置、 电子设备及存储介质, 涉及数据安全技术领 域。 该方法包括对待识别流量进行压缩, 以得到 压缩率; 将所述压缩率与预设的每类流量的阈值 范围进行比较, 以识别所述待识别流量的种类, 所述流量的种类包括明文流量、 编码流量和加密 流量, 对明文、 编码和加密流量进行压缩, 并利用 压缩阈值来区分明文、 编码和加密流量, 解决现 有方法训练模 型需要消耗大量时间, 且 结果存在 局限性的问题。 权利要求书1页 说明书6页 附图2页 CN 113938437 A 2022.01.14 CN 113938437 A 1.一种流 量识别方法, 其特 征在于, 所述方法包括: 对待识别流 量进行压缩, 以得到 压缩率; 将所述压缩率与预设的每类流量的阈值范围进行比较, 以识别所述待识别流量的种 类, 所述流量的种类包括明文流 量、 编码流 量和加密流量。 2.根据权利要求1所述的流量识别方法, 其特征在于, 在所述将所述压缩率与 预设的每 类流量的阈值范围进行比较的步骤之前, 所述方法还 包括: 计算每类流量的阈值范围。 3.根据权利要求2所述的流量识别方法, 其特征在于, 所述计算每类流量的阈值范围, 包括: 从外部网络 中获取数据包, 并进行解析, 以获得载荷数据集, 所述载荷数据集包括明文 数据载荷数据集、 编码数据载荷数据集和 加密数据载荷数据集; 利用压缩算法分别对所述载荷数据集中的数据进行压缩, 以得到压缩率集合, 所述压 缩率为压缩后数据长度与压缩前 数据长度之比; 根据所述压缩率 集合计算每种载荷数据集的阈值范围。 4.根据权利要求1所述的流量识别方法, 其特征在于, 所述根据 所述压缩率集合计算每 种载荷数据集的阈值范围, 包括: 计算所述压缩率 集合的平均值和标准差; 利用所述平均值加减标准差的值确定每种载荷数据集的阈值范围。 5.根据权利要求4所述的流量识别方法, 其特征在于, 所述利用所述平均值加减标准差 的值确定每种载荷数据集的阈值范围, 包括: 若为明文数据载荷集, 所述阈值范围表示 为[a‑b: a+b]; 其中, a表示平均值, b表示标准差 。 6.一种流 量识别装置, 其特 征在于, 所述装置包括: 压缩模块, 用于对待识别流 量进行压缩, 以得到 压缩率; 识别模块, 用于将所述压缩率与预设的每类流量的阈值范围进行比较, 以识别所述待 识别流量的种类, 所述 流量的种类包括明文流 量、 编码流 量和加密流量。 7.根据权利要求6所述的流 量识别装置, 其特 征在于, 所述装置还 包括: 阈值范围计算模块, 用于计算每 类流量的阈值范围。 8.根据权利要求7 所述的流 量识别装置, 其特 征在于, 所述阈值范围计算模块包括: 解析模块, 用于从外部网络中获取数据包, 并进行解析, 以获得载荷数据集, 所述载荷 数据集包括明文数据载荷数据集、 编码数据载荷数据集和 加密数据载荷数据集; 集合获取模块, 用于利用压缩算法分别对所述载荷数据集中的数据进行压缩, 以得到 压缩率集合, 所述压缩率 为压缩后数据长度与压缩前 数据长度之比; 阈值范围获取模块, 用于根据所述压缩率 集合计算每种载荷数据集的阈值范围。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器以及处理器, 所述存储器用于 存储计算机程序, 所述处理器运行计算机程序以使计算机 设备执行根据权利要求1至5中任 一项所述的流 量识别方法。 10.一种可读存 储介质, 其特征在于, 所述可读存 储介质中存 储有计算机程序指令, 所述 计算机程序指令被一处理器读取并运行时, 执行权利要求1至5任一项所述的流量识别方法。权 利 要 求 书 1/1 页 2 CN 113938437 A 2一种流量识别方 法、 装置、 电子设备及存储介质 技术领域 [0001]本申请涉及数据安全技术领域, 具体而言, 涉及一种流量识别方法、 装置、 电子设 备及存储介质。 背景技术 [0002]网络流量分类作为网络管理与网络安全的关键技术之一, 不但能够优化网络配 置, 降低网络安全隐患, 而且能够根据用户的行为分析提供更好的服务质量。 网络流量分类 作为网络管 理的基础工作, 一直是网络管 理人员关注的重点。 随着 HTTPS、 SSL等加密技术的 普及和广泛使用, 加密流量将占据网络流量的主体地位, 加密流量的检测已成为网络流量 分析的一个重要内容。 此外, 在当前大数据通信的环境下, 为了保证数据的隐秘性, 大量数 据在网络传输过程中对原始数据进行了编 码处理。 对于网络中加密流量和编码流量以及明 文流量的区分是一个十分现实而又迫切需要解决的问题。 [0003]现有的识别方法, 如采用机器学习分类模型算法进行分类识别, 该方法对采用基 于随机性特征的加密和压缩流量识别时, 需要提取大量数据的ECF特征, 并且训练模型需要 消耗大量时间, 且结果存在局限性。 发明内容 [0004]本申请实施例的目的在于提供一种流量识别方法、 装置、 电子设备及存储介质, 对 明文、 编码和加密流量进行压缩, 并利用压缩阈值来区分明文、 编码和加密流量, 解决现有 方法训练模型需要消耗大量时间, 且结果存在局限性的问题。 [0005]本申请实施例提供了一种流 量识别方法, 该 方法包括: [0006]对待识别流 量进行压缩, 以得到 压缩率; [0007]将所述压缩率与预设的每类流量的阈值范围进行比较, 以识别所述待识别流量的 种类, 所述 流量的种类包括明文流 量、 编码流 量和加密流量。 [0008]在上述实现过程中, 利用压缩算法对每类流量进行压缩, 以得到阈值范围, 利用不 同种类的流量的阈值范围不同, 可实现对各类流量的识别, 有效保证流量数据分类的准确 性, 避免了使用机器学习算法的局限性, 从而解决了现有方法训练模 型需要消耗大量时间, 且结果存在局限性的问题。 [0009]进一步地, 在所述将所述压缩率与预设的每类流量的阈值范围进行比较的步骤之 前, 所述方法还 包括: [0010]计算每类流量的阈值范围。 [0011]在上述实现过程中, 通过计算每 类流量的阈值范围, 为待识别流 量提供识别依据。 [0012]进一步地, 所述计算每 类流量的阈值范围, 包括: [0013]从外部网络中获取数据包, 并进行解析, 以获得载荷数据集, 所述载荷数据集包括 明文数据载荷数据集、 编码数据载荷数据集和 加密数据载荷数据集; [0014]利用压缩算法分别对所述载荷数据集中的数据进行压缩, 以得到压缩率集合, 所说 明 书 1/6 页 3 CN 113938437 A 3

.PDF文档 专利 一种流量识别方法、装置、电子设备及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种流量识别方法、装置、电子设备及存储介质 第 1 页 专利 一种流量识别方法、装置、电子设备及存储介质 第 2 页 专利 一种流量识别方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:20:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。