Python 爬虫爬取A站视频（python是什么意思）-eolink官网

Python 爬虫爬取A站视频（python是什么意思）

一、环境使用

Python 3.8

Pycharm

二、模块使用

import requests >>> pip install requests

内置模块你安装好python环境就可以了

import re

import json

三、模块安装问题

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

模块安装问题:

- 如何安装python第三方模块:

- 安装失败原因:

- 失败一: pip 不是内部命令

解决方法: 设置环境变量

- 失败二: 出现大量报红 (read time out)

解决方法: 因为是网络链接超时, 需要切换镜像源

清华：install -i 模块名

- 失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入

解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好

或者你pycharm里面python解释器没有设置好

四、配置pycharm里面的python解释器

1. 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)

3. 添加python安装路径

五、pycharm如何安装插件

1. 选择file(文件) >>> setting(设置) >>> Plugins(插件)

六、爬虫基本流程思路: <通用绿色视频网站>

爬虫是什么?

采集网页上面数据程序, 模拟浏览器对于url地址发送请求获取服务器响应数据

采集一个视频, 然后再采集多个视频, 最后采集多页

（1）. 数据来源分析

1. 确定自己需求, 采集那个网站什么数据内容

2. 通过开发者工具进行抓包分析, 分析我们想要视频内容以及视频标题来自于哪里

A站这个网站视频内容, m3u8视频格式

m3u8视频格式 ---> 了解 1 不知道 2

正常是一个视频内容完整数据 ---> 2分18秒

m3u8视频格式 ---> 会把完整视频内容分割成非常多个小片段 (ts文件)

一个小片段可能是5-10秒钟时间

所有视频片段都保存在一个m3u8文件里面

m3u8视频内容, 你看10秒钟他就给加载10秒钟的数据

通过分析, 视频内容 ---> ts文件分片段 ---> m3u8文件链接 --> 网页源代码里

（2）. 代码实现步骤: 发送请求获取数据解析数据保存数据

1. 发送请求, 对于视频播放页url地址发送请求

2. 获取数据, 网页源代码

3. 解析数据, 提取我们想要 m3u8链接地址以及视频标题

4. 发送请求, 对于m3u8链接地址发送请求

5. 获取数据, 获取服务器返回数据内容

6. 解析数据, 提取所有ts文件链接

7. 保存数据, <发送请求获取数据> 保存成一个完整视频内容

1. 特殊字符

2. 你保存数据之后播放有问题视频内容播放

七、完整代码

zookeeper python接口实例详解

689 2022-08-22

Python 爬虫爬取A站视频（python是什么意思）

zookeeper python接口实例详解

cha fan的接口是什么

phono接口指的是什么意思

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

Python 爬虫 爬取A站视频（python是什么意思）

推荐文章

最近发表

热评文章

Python 爬虫爬取A站视频（python是什么意思）