全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111429763.4 (22)申请日 2021.11.29 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司   北京天融信软件 有限公司 (72)发明人 姚剑文 潘季明  (74)专利代理 机构 工业和信息化部电子专利中 心 11010 代理人 华枫 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 16/903(2019.01)G06F 40/205(2020.01) G06F 16/34(2019.01) H04L 9/40(2022.01) (54)发明名称 威胁指标的分析方法及分析装置 (57)摘要 本发明提出了一种威胁指标的分析方法及 分析装置, 分析方法, 包括: 收集待分析数据; 对 收集的待分析数据进行分句处理, 并使用正则表 达式从待分析数据中提取包含候选威胁指标的 候选语句; 对 所述候选语句中的候选威胁指标进 行归一化处理后, 输入语言模型获取输入向量; 将所述输入向量输入预先训练好的分类模型中, 判定所述候选威胁指标是否为威胁指标。 本发明 通过利用语言模 型, 对归一化后的候选威胁指标 能有效的提取其中所包含的语义信息, 根据模型 所预测的结果进行威胁指标相关术语的自动挖 掘, 避免了人工筛选威胁指标相关术语。 避免了 后期人工维护, 同时有效的降低了威胁指标漏 识 别率从而达 到良好的模型泛化能力。 权利要求书1页 说明书7页 附图2页 CN 114297377 A 2022.04.08 CN 114297377 A 1.一种威胁指标的分析 方法, 其特 征在于, 包括: 收集待分析 数据; 对收集的待分析数据进行分句处理, 并使用正则表达 式从待分析数据中提取包含候选 威胁指标的候选语句; 对所述候选语句中的候选威胁指标进行归一 化处理后, 输入语言模型获取输入向量; 将所述输入向量输入预先训练好的分类模型中, 判定所述候选威胁指标是否为威胁指 标。 2.根据权利要求1所述的威胁指标的分析 方法, 其特 征在于, 所述方法还 包括: 存储识别出包含威胁指标的样本, 对样本进行关联分析, 采用Apriori算法挖掘出用于 描述所述 威胁指标的相关术语。 3.根据权利要求2所述的威胁指标的分析方法, 其特征在于, 在进行关联分析时, 每增 加预设个数的样本, 进行一次关联分析, 并存 储分析结果。 4.根据权利要求2所述的威胁指标的分析 方法, 其特 征在于, 所述方法还 包括: 在识别威胁指标, 完成与威胁指标对应的相关术语挖掘后, 自动生成威胁指标报告。 5.根据权利要求4所述的威胁指标的分析方法, 其特征在于, 威胁指标报告的生成方法 包括: 用识别出的威胁指标进行填充威胁指标内容标签, 用与威胁指标对应的相关术语进行 填充威胁指标的描述标签, 用开源的TextRank算法抽取摘要, 用所述待分析数据的链接作 为链接标签, 用威胁指标的分析时间作为预测时间标签。 6.一种威胁指标的分析装置, 其特 征在于, 包括: 数据收集模块, 用于收集待分析 数据; 提取模块, 用于对收集的待分析数据进行分句处理, 并使用正则表达式从待分析数据 中提取包 含候选威胁指标的候选语句; 特征提取模块, 用于对所述候选语句中的候选威胁指标进行归一化处理后, 输入语言 模型获取输入向量; 分析模块, 用于将所述输入向量输入预先训练好的分类模型中, 判定所述候选威胁指 标是否为威胁指标。 7.根据权利要求6所述的威胁指标的分析装置, 其特征在于, 所述装置还包括: 相关术 语挖掘模块, 用于存储识别 出包含威胁指标的样本, 对样本进行关联分析, 采用Apriori算 法挖掘出用于描述所述 威胁指标的相关术语。 8.根据权利要求7所述的威胁指标的分析装置, 其特征在于, 所述相关术语挖掘模块在 进行关联分析时, 每增 加预设个数的样本, 进行一次关联分析, 并存 储分析结果。 9.根据权利要求7所述的威胁指标的分析装置, 其特征在于, 所述装置还包括: 报告生 成模块, 用于在识别威胁指标, 完成与威胁指标对应的相关术语挖掘后, 自动生成威胁指标 报告。 10.根据权利要求9所述的威胁指标的分析装置, 其特 征在于, 报告生成模块具体用于: 用识别出的威胁指标进行填充威胁指标内容标签, 用与威胁指标对应的相关术语进行 填充威胁指标的描述标签, 用开源的TextRank算法抽取摘要, 用所述待分析数据的链接作 为链接标签, 用威胁指标的分析时间作为预测时间标签。权 利 要 求 书 1/1 页 2 CN 114297377 A 2威胁指标的分析方 法及分析装 置 技术领域 [0001]本发明涉及网络安全技 术领域, 尤其涉及一种威胁指标的分析 方法及分析装置 。 背景技术 [0002]为适应快速发展的网络威胁, 安全专业人员通过公共来源(博客、 论坛等)收集威 胁指标IOC(Indicators  of Compromise)如恶 意URL、 恶 意IP、 恶意域名等。 用于部署到各种 安全机制提供安全决策, 如入侵检测系统。 [0003]如今威胁类数据以高速和多样化的形式在 不同结构化文本形式下不断产生, 如在 这一些安全研究人员、 安全厂商发布的文章中存在着大量在安全技术方面具有极高价值的 信息, 这些信息有利于相关技术人员在网络安全方面 实现重大突破。 目前, 从非结构化文本 中自动收集此类信息受到 了当今自然语言处 理(NLP)技术的推进。 发明内容 [0004]本发明要解决的技术问题是如何降低威胁情报识别模型的复杂度, 及 提高威胁情 报识别模型的泛化能力, 本发明提出一种威胁指标的分析 方法及分析装置 。 [0005]根据本发明实施例的威胁指标的分析 方法, 包括: [0006]收集待分析 数据; [0007]对收集的待分析数据进行分句处理, 并使用正则表达式从待分析数据中提取包含 候选威胁指标的候选语句; [0008]对所述候选语句中的候选威胁指标进行归一化处理后, 输入语言模型获取输入向 量; [0009]将所述输入向量输入预先训练好的分类模型中, 判定所述候选威胁指标是否为威 胁指标。 [0010]根据本发明的一些实施例, 所述方法还 包括: [0011]存储识别出包含威胁指标的样本, 对样本进行关联分析, 采用Apriori算法挖掘出 用于描述所述 威胁指标的相关术语。 [0012]在本发明的一些实施例中, 在进行关联分析时, 每增加预设个数的样本, 进行一次 关联分析, 并存 储分析结果。 [0013]根据本发明的一些实施例, 所述方法还 包括: [0014]在识别威胁指标, 完成与威胁指标对应的相关术语挖掘后, 自动生成威胁指标报 告。 [0015]在本发明的一些实施例中, 威胁指标报告的生成方法包括: [0016]用识别出的威胁指标进行填充威胁指标内容标签, 用与威胁指标对应的相关术语 进行填充威胁指标的描述标签, 用开源的TextRank算法抽取摘要, 用所述待分析数据的链 接作为链接标签, 用威胁指标的分析时间作为预测时间标签。 [0017]根据本发明实施例的威胁指标的分析装置, 包括:说 明 书 1/7 页 3 CN 114297377 A 3

.PDF文档 专利 威胁指标的分析方法及分析装置

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 威胁指标的分析方法及分析装置 第 1 页 专利 威胁指标的分析方法及分析装置 第 2 页 专利 威胁指标的分析方法及分析装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:22:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。