【python实现网络爬虫（13）】python爬取全景网图片（python爬取动态网页图片）-eolink官网

【python实现网络爬虫（13）】python爬取全景网图片（python爬取动态网页图片）

目标网址：全景网山水壁纸，页面如下

1. 网页分析

还是和之前爬取文字信息一致，需要进行网页信息的解析，获得图片数据所在的地址，然后进行图片的下载

分析网页后发现所需要的图片的url在【a.item.lazy img】中

2. 封装第一个函数，获取图片的url

首先是导入相关的库，然后进行函数的编写，这里的第一个函数的内容和之前的几乎一样

import requestsfrom bs4 import BeautifulSoupfrom uuid import uuid1import osdef get_image(): url = ' html = requests.get(url) # print(html) soup = BeautifulSoup(html.text,'lxml') # print(soup) images = soup.select('a.item.lazy img') # print(images) for img in images[:10]: print(img['src']) img_url = img['src']

–> 输出结果为：（这里只展示部分内容，每个网址都对应一张图片，在浏览器上输入网址即可下载）

封装第二个函数，进行图片的下载

首先要下载图片必须要有存放地址，所以要先创建文件夹用来保存要下载的文件，也就要用到了创建文件夹的常见搭配；

其次就是进行图片内容的写入，这里都是二进制的内容（图片、音频和视频都是），采用的是.content方法获得相应的信息

def download(url): if not os.path.exists('./picture'): os.makedirs('picture') with open('./picture/{}.jpg'.format(uuid1()),'wb') as f: f.write(requests.get(url).content)

最后在封装的第一个函数中调用这个函数

download(img_url)

–> 输出结果为：（uuid模块的功能就是创建不相同的随机数，用来给照片命名）

4. 拓展

如果不习惯使用这种很长的随机值来进行图片的文件进行命名，可以尝试之前用过的datetime模块，获得当前的日期，再配合着计数的方式给文件夹及图片文件进行命令

主要是对函数二来进行修改，最后全部的代码如下

import requestsfrom bs4 import BeautifulSoupfrom datetime import dateimport osdef get_image(): url = ' html = requests.get(url) # print(html) soup = BeautifulSoup(html.text,'lxml') # print(soup) images = soup.select('a.item.lazy img') # print(images) count = 1 for img in images[:50]: #print(img['src']) img_url = img['src'] download(img_url,count) print(f'正在下载第{count}张图片......') count += 1def download(url,count): today = str(date.today()) if not os.path.exists(f'./{today}_pic'): os.makedirs(f'{today}_pic') with open('./{}_pic/{}.jpg'.format(today,count),'wb') as f: f.write(requests.get(url).content)get_image()

–> 输出结果为：（温故而知新）

Python接口自动化之文件上传/下载接口怎么实现

349 2022-08-25

【python实现网络爬虫（13）】python爬取全景网图片（python爬取动态网页图片）

java中的接口是类吗

Spring中的aware接口详情

Python接口自动化之文件上传/下载接口怎么实现

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

【python实现网络爬虫（13）】python爬取全景网图片（python爬取动态网页图片）

微信扫一扫：分享

推荐文章

最近发表

热评文章