爬虫学习4——Xpath爬取页信息

2022年1月21日上午9:32 • 软件开发

xpath是在XML文档中搜索内容的一门语言，我们常见的html是xml的一个子集

安装lxml模块

获取页数据

text()拿文本。xpath使用[1]选择同种标签的第一个。/a[@href=”]根据属性href的值选择特定标签

//表示后代（子标签，孙子标签，重孙子标签）。*表示任意的节点，通配符。使用@拿到属性值

./表示当前节点

安装lxml模块

获取页数据

本次实验选择了代码中的站，获取下面雇佣和招标的信息

输出结果如下：

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！