# yyds干货盘点 # 盘点一个pyquery库选择器提取案例-eolink官网

# yyds干货盘点 # 盘点一个pyquery库选择器提取案例

大家好，我是皮皮。

一、前言

前几天在Python白银群有个叫【手中的流沙】的粉丝问了一道关于pyquery选择器提取的问题，如下图所示。

就像这样：

原网页的信息如下图所示：

实现过程

这里【甯同学】给了一份代码，如下所示：

from pyquery import PyQuery as pqheaders = { 'Accept-Language': 'zh-CN,zh;q=0.9', 'Cache-Control': 'max-age=0', 'Upgrade-Insecure-Requests': '1', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}html = pq(url='headers=headers)doc = pq(html)li = doc('div.style-type3 > div:gt(0) > ul > li.item > ul > li.list-item').items()for i in li: info = { 'city': i.text().split('\n\n\n') } print(info)

代码运行之后，结果如下图所示：

确实一步到位了，很强！原来pq可以直接请求网页，确实也省事了。主要是那个css构造还是需要点时间和精力的。

这个地方也还可以使用xpath提取来实现，代码如下：

import requestsfrom lxml import etreeres = requests.get(url='headers=headers)res.encoding = res.apparent_encodinghtml = etree.HTML(res.text)li_lists = html.xpath('/html/body/div[1]/div[2]/div[2]/div[2]/ul/li')print(len(li_lists))for li in li_lists: info = li.xpath('./ul//li//text()') # shi = li.xpath('./ul//li/h4/text()') # qu = li.xpath('./ul//li/strong/text()') # jiedao = li.xpath('./ul//li/br/text()') print(info)

运行之后，结果如下图所示：

当然了，你还可以使用re正则表达式和bs4来提取，这个网页并不难，用来练手还是不错的。

三、总结

大家好，我是皮皮。这篇文章主要盘点一个pyquery库选择器提取案例！如果你还有其他方法，也欢迎大家积极尝试，一起学习，记得分享给我哦。

最后感谢粉丝【手中的流沙】提问，感谢【甯同学】、【dcpeng】在运行过程中给出的思路和代码建议，感谢粉丝【月神】、【庄大】等人参与学习交流。

c#自定义Attribute获取接口实现示例代码

302 2022-09-04

# yyds干货盘点 # 盘点一个pyquery库选择器提取案例

Flask接口签名sign原理与实例代码浅析

zookeeper python接口实例详解

c#自定义Attribute获取接口实现示例代码

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

软件接口设计怎么做？前后端分离软件接口设计思路

接口管理平台推荐，几大接口管理平台总有一款适合你！