爬虫xpath学习（Python网络爬虫从入门到实践）-eolink官网

爬虫xpath学习（Python网络爬虫从入门到实践）

#xpath是在xml文档中搜索内容的一门语言#html是xml的子集xml = """ 1 野花遍地⾹ 1.23 臭⾖腐周⼤强周芷若周杰伦蔡依林

惹了

胖胖陈胖胖不陈 """from lxml import etreetree=etree.XML(xml)#result=tree.xpath("/book/name") #/表示层级关系，第一个/是根节点#result=tree.xpath("/book/name/text()")result=tree.xpath("/book/*//nick/text()")#双斜杠表示找后代，*是通配符什么节点都可以#parse是加载文件print(result)

#xpath是在xml文档中搜索内容的一门语言#html是xml的子集xml = """ 1 野花遍地⾹ 1.23 臭⾖腐周⼤强周芷若周杰伦蔡依林

惹了

胖胖陈胖胖不陈 """from lxml import etree# tree=etree.XML(xml)# #result=tree.xpath("/book/name") #/表示层级关系，第一个/是根节点# #result=tree.xpath("/book/name/text()")# result=tree.xpath("/book/*//nick/text()")#双斜杠表示找后代，*是通配符什么节点都可以# #parse是加载文件# print(result)tree=etree.parse("b.html",etree.HTMLParser())# result=tree.xpath("/html/body/ol/li/a[@href='dapao']/text()")ol_list=tree.xpath("/html/body/ul/li")for l in ol_list: #从每一个li提取到文字信息 #res=l.xpath("./a/text()")#继续查找 res=l.xpath("./a/@href") print(res)res1=tree.xpath("/html/body/div[1]/text()")print(res1)

上面是xpath的语法，目前来说三种爬虫，xpath应该是最简单的，正则是最万能的，xpath主要对于界面元素可以直接通过复制xpath路径直接获取不需要自己分析源代码

Python接口自动化之文件上传/下载接口怎么实现

402 2022-09-06

爬虫xpath学习（Python网络爬虫从入门到实践）

java中的接口是类吗

Spring中的aware接口详情

Python接口自动化之文件上传/下载接口怎么实现

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

软件接口设计怎么做？前后端分离软件接口设计思路

接口管理平台推荐，几大接口管理平台总有一款适合你！