全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210702574.8 (22)申请日 2022.06.21 (71)申请人 杭州安恒信息技 术股份有限公司 地址 310051 浙江省杭州市滨江区西兴街 道联慧街18 8号 (72)发明人 张帅哲 周怡萍  (74)专利代理 机构 杭州华进联浙知识产权代理 有限公司 3 3250 专利代理师 何晓春 (51)Int.Cl. H04L 9/40(2022.01) G06F 40/30(2020.01) (54)发明名称 页面访问数据的处理方法、 装置、 电子设备 以及存储介质 (57)摘要 本申请涉及一种页面访问数据的处理方法、 装置、 电子设备以及存储介质。 其中, 所述方法包 括: 获取目标页面的第一访问用户的第一溯源数 据和第二访问用户的第二溯源数据; 确定所述第 一溯源数据和所述第二溯源数据之间的文本相 似度和语义相似度; 根据所述文本相似度和所述 语义相似度, 确定所述第一访问用户和所述第二 访问用户是否为同一访问用户。 本申请实施例提 供的页面访问数据的处理方法, 与现有技术相 比, 能够更加准确且更加全面地确定所述第一访 问用户和所述第二访问用户是否为同一访问用 户, 从而可以为后续判断 同源攻击提供更为准确 的数据依据, 在网络防御时能够更加快速且准确 地确定访问用户的身份 。 权利要求书2页 说明书14页 附图3页 CN 115225328 A 2022.10.21 CN 115225328 A 1.一种页面访问数据的处 理方法, 其特 征在于, 所述方法包括: 获取目标页面的第一访问用户的第一溯源数据和第二访问用户的第二溯源数据; 确定所述第一溯源数据和所述第二溯源数据之间的文本相似度和语义相似度; 根据所述文本相似度和所述语义相似度, 确定所述第 一访问用户和所述第 二访问用户 是否为同一访问用户。 2.根据权利要求1所述的方法, 其特征在于, 所述确定所述第 一溯源数据和所述第 二溯 源数据之间的文本相似度, 包括: 分别提取 所述第一溯源数据和所述第二溯源数据中至少一个预设字段及其字段值; 将所述第一溯源数据中至少一个预设字段的字段值拼接得到第 一字符串, 将所述第 二 溯源数据中至少一个预设字段的字段值 拼接得到第二字符串; 根据所述第 一字符串和所述第 二字符串的字符串相似度, 确定所述第 一溯源数据和所 述第二溯源数据之间的文本相似度。 3.根据权利要求1所述的方法, 其特征在于, 所述确定所述第 一溯源数据和所述第 二溯 源数据之间的语义相似度, 包括: 分别提取 所述第一溯源数据和所述第二溯源数据中至少一个预设字段及其字段值; 根据所述第 一溯源数据和所述第 二溯源数据中相同预设字段的字段值之间的相似度, 确定所述第一溯源数据和所述第二溯源数据之间的语义相似度。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述文本相似度和所述语义相似 度, 确定所述第一访问用户和所述第二访问用户是否为同一访问用户, 包括: 在所述文本相似度满足第 一预设要求的情况下, 根据所述语义相似度确定所述第 一访 问用户和所述第二访问用户是否为同一访问用户; 在所述语义相似度满足第 二预设要求的情况下, 确定所述第 一访问用户和所述第 二访 问用户为同一访问用户。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述文本相似度和所述语义相似 度, 确定所述第一访问用户和所述第二访问用户是否为同一访问用户, 包括: 在所述文本相似度和所述语义相似度同时满足预设要求的情况下, 确定所述第 一访问 用户和所述第二访问用户为同一访问用户。 6.根据权利要求1所述的方法, 其特征在于, 所述获取目标页面的第 一访问用户的第 一 溯源数据和第二访问用户的第二溯源数据, 包括: 分别接收第一访 问用户和第二访 问用户对目标页面的页面访 问请求; 其中, 所述目标 页面包括设置有溯源可执行文件的模拟页面, 所述模拟页面与易攻击页面的相似度大于预 设相似度阈值; 响应于所述页面访 问请求, 执行所述溯源可执行文件, 并分别获取所述第一访 问用户 的第二溯源数据和所述第二访问用户的第二溯源数据。 7.根据权利要求1所述的方法, 其特征在于, 所述确定所述第 一访问用户和所述第 二访 问用户是否为同一访问用户, 包括: 在确定所述第 一访问用户和所述第 二访问用户为同一访问用户的情况下, 将所述第 一 溯源数据和所述第二溯源数据进行合并, 生成所述同一访问用户的溯源数据。 8.一种页面访问数据的处 理装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 115225328 A 2获取溯源数据模块, 用于获取目标页面的第 一访问用户的第 一溯源数据和第 二访问用 户的第二溯源数据; 相似度确定模块, 用于确定所述第 一溯源数据和所述第 二溯源数据之间的文本相似度 和语义相似度; 确定模块, 用于根据所述文本相似度和所述语义相似度, 确定所述第一访 问用户和所 述第二访问用户是否为同一访问用户。 9.一种电子设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的页面访问数据的处 理方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序指令, 其特征在于, 所述计算机 程序指令被处理器执行时实现权利要求1至7中任一项所述的页面访问数据的处理方法的 步骤。权 利 要 求 书 2/2 页 3 CN 115225328 A 3

.PDF文档 专利 页面访问数据的处理方法、装置、电子设备以及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 页面访问数据的处理方法、装置、电子设备以及存储介质 第 1 页 专利 页面访问数据的处理方法、装置、电子设备以及存储介质 第 2 页 专利 页面访问数据的处理方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。