爬虫抓取58简历之字库解密

爬虫抓取58同城 反反爬虫之字库解密

    • 2019.03.01更新
  • 前言
    • 看不懂的字体
    • 解密字库
    • 字库自动解密API

2019.03.01更新

定制简历采集软件wechat联系13939147257. 解密没有什么技术含量, 所有环节都写在博文里. 请勿联系我资讯技术问题. API测试地址在最下方.

前言

最近接了个人力资源管理系统的项目, 部分数据需要抓取58的简历数据. 在数据抓取环节踩了很多坑, 所以写个博文分享下心得.

看不懂的字体

抓取的第一步就遇到了难题,浏览器可以显示字体,开发者模式看不到

加密字体

在html的css部分发现58加载了BASE64编码的WOFF动态字库, 每次刷新网页字库都不同.

字库解密

因为字库每次都不一样,所以多分析了几个字库文件,找到了字库的共同特征,看下图

爬虫抓取58简历之字库解密

来源:小恩TT

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年10月2日
下一篇 2018年10月2日

相关推荐