1、唯品会
通过对其h5 址的分析,主要爬取接口的地址是:https://mapi.vip.com/vips-mobile/rest/shopping/wap2/vendorSkuList/v4,在浏览器开发者工具里跟踪下就可以获取请求的参数,拼装到python代码里就可以实现。
在接口返回的json内容里,在data.product_price_range_mapping.priceView.finalPrice下的price是券后价,用户真正购买时支付的价格。在priceView.salePrice下的saleMarketPrice和salePrice分别是“市场价”和“销售价”,均是在页面上显示的价格,这都是电商平台惯用的伎俩,通过不同价格的显示,暗示用户占到低价的便宜了。
2、京东
京东对反爬相对比较宽松,因此采用了selenium.webdriver来实现爬虫,这种方式就是纯粹模仿浏览器的加载方式,然后通过分析 页dom结构来找到价格的位置。这种方式相对比较简单,但是因为整个页面下载,数据量比接口方式的大,分析效率也低,并且还需要模拟浏览页面时的下滑动作,否则有些内容就不会被加载。
上面的代码的主要功能就是找数据所用的class或id所在div的路径,然后通过取属性或值,来获得需要的数据。
3、得物
得物爬虫的接口地址主要是在架销售的各种价格,https://app.dewu.com/api/v1/h5/inventory/price/h5/queryBuyNowInfo,看过我文章和视频的朋友会知道,主要是模拟小程序方式实现的爬虫。得物最近接口更新的很快,在反爬上甚至做得有些变态,个人觉得真没有必要,大家爬数据的目的,不就是想做决策工具,促进平台更高效的交易嘛。
得物爬虫实现主要是2个地方,一个是sign,一个是request和response的data的加解密,我在视频里已经讲得非常清楚在小程序的什么地方可以找到相关的处理,所以不要动不动就想找我“白piao”代码,本人的劳动希望得到尊重。
在返回的json中,tradeChannelInfoList下可以看到不同尺码下有各种形式的价格,比如闪电价、普通价,不同价格是通过tradeType字段来区分,该参数不同的取值对应不同的价格形式:0=》普通价,1=》极速价,2=》闪电价,3=》跨境价,8=》品牌专攻,95=》全新微瑕等。
4、比价
拿到不同平台价格后,就可以进行对比价格,京东、唯品会的价格是不区分尺码的,而得物会区分,通过对比挖掘差价,就可以在得物上炒炒潮品了。简单做了个前端页面,如下:
比下来唯品会普遍比京东便宜,但京东叠加券的价格我还没有处理到,等再优化后看看会不会有所不同。得物上不同尺码价格会有明显的差异,上图尺码对应行里的数字有红有绿,表示在京东和唯品会买鞋然后拿去得物上卖,计算出或赚或赔的价格差,看上去还是有10%的赚头(这里是没有考虑得物平台服务相关费用的)。
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览211379 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!