全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210384197.8 (22)申请日 2022.04.13 (71)申请人 公安部第一研究所 地址 100048 北京市海淀区首都体 育馆南 路一号 (72)发明人 印晓天 湛高峰 王晓峰 程楠  (74)专利代理 机构 北京华仁联合知识产权代理 有限公司 1 1588 专利代理师 陶长清 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 40/284(2020.01) G06F 16/31(2019.01) (54)发明名称 一种基于特定事 件检测与研判分析方法 (57)摘要 本发明公开了一种基于特定事件检测与研 判分析方法, 通过构建某特定事件的特征向量库 来达到检测特定事件为目的, 并结合基于热词识 别的增量式网络热点话题检测方法与基于时间 滑动窗口的话题追踪技术来对该类话题进行传 播分析, 为有效地研判特定事件, 及时、 有效地处 置干预具有社会危害性的特定事件, 提供科学的 决策依据。 权利要求书2页 说明书5页 附图1页 CN 114896390 A 2022.08.12 CN 114896390 A 1.一种基于特定事 件检测与研判分析 方法, 其特 征在于, 包括如下步骤: S1、 特定事 件检测: S1.1、 人物特 征提取: 首先, 提取具有与特 征事件相关的信息的文章数据; 其次, 从提取的文章数据中提取该文章的发布者的人物属性信息, 所述人物属性信息 至少包括账号 ID, 构成发布者的集 合J; 其后, 根据特定事件的关键词库, 找出每个文章命中的关键词, 然后根据文章命中的关 键词以及关键词所对应的权重, 计算每条文章的相关程度分数, 分数越高表示文章涉及的 内容越相关; 得到每个文章所对应的相关程度分数之后, 据此计算对应的发布者的相关程 度得分; 对集合 J中所有的发布者, 以小时为周期对各发布 者的相关程度得分进 行刷新计算 并重新排序; S1.2、 行为特 征提取: 首先收集历史事件案例库, 提取历史事件案例库的关键因素, 构建以事件、 地点为要素 的事件案例库, 然后采用基于神经网络的特定事 件的语义识别技 术来扩展事 件案例库; S2、 研判分析: 利用步骤S1检测出人物特征和行为特征作 为特定事件的潜在目标, 结合 传播演化分析技 术, 检测与特定事 件相关的话题, 并分析 该话题的属性信息 。 2.根据权利要求1所述的方法, 其特征在于, 步骤S1.1中, 设定人物类型并预先训练好 分类模型, 然后利用分类模型, 对获取的人物属性信息进行分类。 3.根据权利要求1所述的方法, 其特 征在于, 相关程度得分计算公式如下: t表示当前周期, α表示权重系数, 权重系数α越大, 表示当前周期的文章影响力越大; 表示前一个周期该 发布者的相关程度得分; f(t)表示 当前周期内该发布者的相关 程度得分, 表示去重后的该发布者的具有与特定事件相关的信息的文章集 合, 在设定发布数量阈值范 围内相同文章仅考虑一次其所带来的权重影响, 表示一个截 断函数, 表示周期t内该发布者所有具有与特定事件相关的信息的文章集合, θ表示设定 的发布数量阈值; 表示文章命中的关键词的集合, ωj表示关键词j在文章i中出现的次 数; 表示相同关键词特征在某一篇文章γ中出现的最少次数, Cij表示相 同关键词特征在文章γ中出现的次数, 如果相同的关键词在同一篇文章中出现的次数过 多, 那么对其次数进行截断。 4.根据权利要求1所述的方法, 其特征在于, 步骤S1.2中, 扩展事件案例库的具体过程 为: 1)词向量获取: 对于任意 一个词w, 通过向量特 征库获取其特 征向量v; 2)相似度计算: 遍历向量特征库, 利用余弦相似性计算向量特征库中所有词向量与向 量v的相似度sim; 3)相似度排名: 将所有的词向量与词w的向量v的相似度进行由大到小排序, 排名前N个权 利 要 求 书 1/2 页 2 CN 114896390 A 2词作为该 特定事件的相关词, 扩展至事 件案例库中。 5.根据权利要求1所述的方法, 其特 征在于, 步骤S2的具体过程 为: 1)通过文章预处理技术对文章数据进行规范化处理, 然后 通过文章消重技术对相同文 章数据进 行去重, 在此基础上, 应用动态的词评价方法来计算词的权重, 并按照权重对词进 行排序; weighti=TFi*IDFi*logat 其中, 表示第i个词, TFi表示该词的词频, IDFi表示该词的逆向文档频率, t表示时间因 子, a表示调节因子, 0 <a<1; 2)按照排序结果抽取TopN的词作为热词, 并根据热词来确定待聚类的文章数据及聚类 中心, 然后通过聚类实现每条文章数据的归并, 最终实现增量式网络热点话题检测; 按照时 间滑动的方式对已发现的话题进行追踪, 话题的内容会随着时间而演化, 这种演化过程既 会随着话题相关事件的发展而演化, 也会随着话题被深入讨论不同各种观点的出现而演 化。权 利 要 求 书 2/2 页 3 CN 114896390 A 3

.PDF文档 专利 一种基于特定事件检测与研判分析方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于特定事件检测与研判分析方法 第 1 页 专利 一种基于特定事件检测与研判分析方法 第 2 页 专利 一种基于特定事件检测与研判分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。