Python爬虫,教你借一本庆余年,里面超详细的哟!

爬虫界里我孔乙己,读书人的事情能说偷吗叫借!那我们就讲讲怎么借一本来观摩观摩! 说笑了,这是笔下的一篇小说叫做,里面有这样的一个桥段,那日,孔乙己偷拿了一本书,被众人发现之后,孔乙己便涨红了脸,额上的青筋条条绽出,争辩道,“窃书不能算偷……窃书!……读书人的事,能算偷么连便是难懂的话,什么“君子固穷”,什么“者乎”之类,引得众人都哄笑起来:店内外充满了快活的空气。

就是通过f12, 然后获取指定位置的源代码,这一章节的全部内容在第二个
div中的class=”volume”标签中,然后又在ul中的class=“cf” 里面,最后又在li标签中的a标签的文本中,谔谔,,这听着有点绕口,不过这确实要符合xpath的语法规格,这里就将就的用我写的xpath语法吧, , 如果这里不会xpath的朋友们也可以试着用正则来写下,都是差不多的,那下面给出源代码:

这里我不光获取了每个章节的 页链接,还获取了每个章节的标题,以便后续存入文件中使用!


编写代码:

那从上面的代码中我们获取了每个章节的 址链接和标题,那下面我们就进入下一个操作,获取每个章节中的文本信息,这里我们打开第一章来查看查看????

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树 络爬虫urllib214899 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年3月25日
下一篇 2020年3月25日

相关推荐