基础爬虫小案例：约会吧小姐姐照片，联系方式随手可得（附源码）-eolink官网

基础爬虫小案例：约会吧小姐姐照片，联系方式随手可得（附源码）

前言

百度贴吧是以兴趣主题聚合志同道合者的互动平台，同好网友聚集在这里交流话题、展示自我、结交朋友。贴吧中有的帖子当中有用户上传的图片，今天跟着老师把约会吧全吧的图片给爬取下来吧

预先清理磁盘哦~~

本文亮点：

1、分析页面（静态or动态）

2、两层数据解析

3、海量图片数据保存

环境介绍：

python 3.6

pycharm

requests

parsel（xpath）

爬虫的一般思路

1、确定爬取的url路径，headers参数

2、发送请求 -- requests 模拟浏览器发送请求，获取响应数据

3、解析数据 -- parsel 转化为Selector对象，Selector对象具有xpath的方法，能够对转化的数据进行处理

4、保存数据

开始我们的案例吧

步骤

1、导入工具

import requests

import parsel

2、确定爬取的url路径，headers参数

base_url = 'https://tieba.baidu.com/f?ie=utf-8&kw=%E7%BE%8E%E5%A5%B3&fr=search'

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko'}

3、发送请求 -- requests 模拟浏览器发送请求，获取响应数据

response = requests.get(base_url, headers=headers)

html_str = response.text

# print(html_data)

4、解析数据 -- parsel 转化为Selector对象，Selector对象具有xpath的方法，能够对转化的数据进行处理

5、保存图片数据

with open("img\\" + file_name, 'wb') as f:

print('正在下载图片：',file_name)

f.write(img_data)

运行代码，结果如下图：

这样我们这一次的爬虫就算圆满成功了

管理接口平台，提高工作效率的关键解决方案

358 2022-06-24

基础爬虫小案例：约会吧小姐姐照片，联系方式随手可得（附源码）

多平台统一管理软件接口，如何实现多平台统一管理软件接口

多平台统一管理系统接口，提高效率与自动化的关键

管理接口平台，提高工作效率的关键解决方案

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

基础爬虫小案例：约会吧小姐姐照片，联系方式随手可得（附源码）

微信扫一扫：分享

推荐文章

最近发表

热评文章