[简单的python爬虫实战] 获取1688 页上的商品信息

2018年5月16日下午2:36 • 软件开发

语言：python 3.6 / 框架: Scrapy 1.5 / 数据库:Mysql 8.0 / IDE: pycharm

1. 生成项目

首先，安装好基本的软件。之后到项目文件夹处按住 shift+右键，打开命令行模式。

执行 scrapy startproject [项目名] 生成项目文件。cd [项目名] 进入到项目文件夹中后执行 scrapy genspider <爬虫名> <domain/域名(起始页)> 生成爬虫文件。

2. 创建数据对象 items.py。在mysql中建立对应的数据表单。(注意表的字符编码,这里设置的数据编码是CHARACTER SET utf8 COLLATE utf8_general_ci)

3.编写爬虫逻辑

4.建立数据管道

5.修改settings

文章知识点与官方知识档案匹配，可进一步学习相关知识Python入门技能树络爬虫Scrapy框架208427 人正在系统学习中

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！