小红书很难爬?最新爬取方法教给你啦~

前言

大家好,我是Kuls。

之前写的那篇App抓包软件charles的配置说过,超过30在看,马上更下一篇。有读者问我怎么爬App,我手把手教了他(多图警告)

所以加班加点给大家写了今天这篇文章。

小红书

需要做的前提工作就是装配好mitmproxy

具体的配置过程,我建议大家参照崔大写的来进行安装

https://zhuanlan.zhihu.com/p/33747453

首先,我们打开之前大家配置好的charles

我们来简单抓包一下小红书小程序(注意这里是小程序,不是app)

不选择app的原因是,小红书的App有点难度,参照 上的一些思路,还是选择了小程序

1、通过charles抓包对小程序进行分析

按照我的路径,你可以发现列表中的数据已经被我们抓到了。

但是你以为这就结束了p>

不不不

如果你想要获取到单篇数据,可以拿到文章id后抓取

“https://www.xiaohongshu.com/discovery/item/” + str(id)

总结

其实小红书爬虫的抓取并不是特别的难,关键在于思路以及使用的方法是什么。

本期的文章就到这里了,如果本期在看超过40,马上出下一篇干货!

我们下期见~

 End 

往期精彩文章推荐:

  • 一篇文章教会你使用Django根据现有数据库反向生成models

  • 手把手教你使用Django如何连接Mysql

  • 一篇文章总结一下Python库中关于时间的常见操作

小红书很难爬?最新爬取方法教给你啦~

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

文章知识点与官方知识档案匹配,可进一步学习相关知识 络技能树首页概览22515 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月20日
下一篇 2021年1月20日

相关推荐