(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210959151.4
(22)申请日 2022.08.10
(71)申请人 重庆帮企科技 集团有限公司
地址 400023 重庆市渝北区龙塔街道星 辰
路78号浩博星辰办公楼1幢1-商业
(72)发明人 李广 周号
(74)专利代理 机构 重庆创新专利商标代理有限
公司 50125
专利代理师 易文学
(51)Int.Cl.
H04L 9/40(2022.01)
(54)发明名称
一种基于浏览器指纹辨别的反爬虫方法
(57)摘要
本发明涉及数据信息传输技术领域, 具体涉
及一种基于浏览器指纹辨别的反爬虫方法, 浏览
器基于客户端请求生成指纹; 所述浏览器收集并
存储所述指纹, 得到真实指纹; 服务器基于所述
真实指纹验证所述客户端请求, 并做出对应的响
应, 该方法通过客户端请求目标网站后, 经脚本
收集设备信息, 根据设备信息计算出一段数值并
作为指纹, 将指纹送给服务器, 服务器拿到指纹
后与浏览器存储的真实指纹作对比, 对比结果相
同则判定 是真实用户访问, 反之则判定该请求为
非浏览器请求, 并拒绝访问返回数据, 达到保护
企业数据安全的目的, 解决现有反爬虫技术无法
达到保护企业数据安全 要求的问题。
权利要求书1页 说明书3页 附图3页
CN 115473684 A
2022.12.13
CN 115473684 A
1.一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于, 包括以下步骤:
浏览器基于客户端请求 生成指纹;
所述浏览器收集并存 储所述指纹, 得到真实指纹;
服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。
2.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
所述浏览器 基于客户端请求 生成指纹的具体方式:
所述浏览器 基于所述 客户端请求选择指纹参数;
对所述指纹参数进行评估, 得到属性 值;
对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。
3.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时区,第二类:
禁止追踪和插 件, 第三类: 用户是否修改了语言和分辨 率, 第四类canvas和webgl。
4.如权利要求2所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
所述转换所述字符串的字符序列生成所述指纹的算法为哈希算法。
5.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
所述字符序列为128位的16进制。
6.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
所述基于所述真实指纹验证所述 客户端请求, 并做出对应的响应的具体方式:
所述客户端向所述 服务器发起请求;
服务器检查所述请求内是否有所述指纹, 得到检查结果;
所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。
7.如权利要求1所述的一种基于浏览器指纹辨别的反爬虫 方法, 其特 征在于,
还包括通过同一所述指纹访问的频率对响应做出限制。权 利 要 求 书 1/1 页
2
CN 115473684 A
2一种基于浏览器指纹辨别的反爬虫方 法
技术领域
[0001]本发明涉及数据信息传输技术领域, 尤其涉及一种基于浏览器指纹辨别的反爬虫
方法。
背景技术
[0002]在现行的网络爬虫检测技术中, 一般网站从三个方面反爬虫: 通过Headers反爬
虫, 基于用户行为反爬虫, 动态页面的反爬虫。 前两个方面可以说是反爬虫策略中最为常见
的, 而第三个则是应用异步加载 的方式加载页面内容, 增大爬虫在对目标网站形成访问之
后获取数据的难度。
[0003]但现有反爬虫技术仅仅检验一下Headers或者做几个ip限制, 无法达到保护企业
数据安全的要求。
发明内容
[0004]本发明的目的在于提供一种基于浏览器指纹辨别的反爬虫方法, 旨在 解决现有反
爬虫技术无法达 到保护企业数据安全要求的问题。
[0005]为实现上述目的, 本发明提供了一种基于浏览器指纹辨别的反爬虫方法, 包括以
下步骤:
[0006]浏览器基于客户端请求 生成指纹;
[0007]所述浏览器收集并存 储所述指纹, 得到真实指纹;
[0008]服务器基于所述真实指纹验证所述 客户端请求, 并做出对应的响应。
[0009]其中, 所述浏览器 基于客户端请求 生成指纹的具体方式:
[0010]所述浏览器 基于所述 客户端请求选择指纹参数;
[0011]对所述指纹参数进行评估, 得到属性 值;
[0012]对所述属性 值排列形成字符串, 并转换 所述字符串的字符序列生成所述指纹。
[0013]其中, 所述指纹参数分为四类, 第一类: UserAgent、 屏幕分辨率、 平台、 语言he时
区,第二类: 禁止追踪和插件, 第三类: 用户是否修改了语言和分辨率, 第四类canvas和
webgl。
[0014]其中, 所述 转换所述字符串的字符序列生成所述指纹的算法为哈希算法。
[0015]其中, 所述字符序列为128位的16进制。
[0016]其中, 所述基于所述真实指纹验证所述客户端请求, 并做出对应的响应的具体方
式:
[0017]所述客户端向所述 服务器发起请求;
[0018]服务器检查所述请求内是否有所述指纹, 得到检查结果;
[0019]所述服务器将所述检查结果与所述真实指纹对比, 并做出对应的响应。
[0020]其中, 还包括通过同一所述指纹访问的频率对响应做出限制。
[0021]本发明的一种基于浏览器指纹辨别的反爬虫方法, 浏览器基于客户端请求生成指说 明 书 1/3 页
3
CN 115473684 A
3
专利 一种基于浏览器指纹辨别的反爬虫方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:27:28上传分享