爬虫学习4——Xpath爬取 页信息

xpath是在XML文档中搜索内容的一门语言,我们常见的html是xml的一个子集

目录

安装lxml模块

获取 页数据

text()拿文本 。xpath使用[1]选择同种标签的第一个。/a[@href=”]根据属性href的值选择特定标签

//表示后代(子标签,孙子标签,重孙子标签)。*表示任意的节点,通配符。使用@拿到属性值

./表示当前节点


安装lxml模块

获取 页数据

本次实验选择了代码中的 站,获取下面雇佣和招标的信息

text()拿文本 。

xpath使用[1]选择同种标签的第一个。

/a[@href=”]根据属性href的值选择特定标签

//表示后代(子标签,孙子标签,重孙子标签)。

*表示任意的节点,通配符。

使用@拿到属性值

./表示当前节点

输出结果如下: 

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年1月21日
下一篇 2022年1月21日

相关推荐