Python 爬虫 爬取网易云音乐(python入门教程(非常详细))

网友投稿 1252 2022-08-22


Python 爬虫 爬取网易云音乐(python入门教程(非常详细))

0、知识点

爬虫基本流程

requests的使用

正则表达式的使用

一、第三方库

requests >>> pip install requests

二、开发环境

版 本: python  3.8

编辑器:pycharm 2021.2

三、模块安装问题

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

模块安装问题:

- 如何安装python第三方模块:

- 安装失败原因:

- 失败一: pip 不是内部命令

解决方法: 设置环境变量

- 失败二: 出现大量报红 (read time out)

解决方法: 因为是网络链接超时,  需要切换镜像源

清华:install -i 模块名

- 失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入

解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好

或者你pycharm里面python解释器没有设置好

四、配置pycharm里面的python解释器

1. 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)

3. 添加python安装路径

五、pycharm如何安装插件

1. 选择file(文件) >>> setting(设置) >>> Plugins(插件)

六、爬虫基本思路

原理:

模拟 浏览器(客户端) 向 服务器 发送 网络请求(索要数据)

爬虫:

数据来源分析 发送请求

2. 获取数据

3. 解析数据

4. 保存数据

​​requests # 发送请求 第三方模块import re # 内置模块 无需安装# x = 1url = '1. 发送请求response = requests.get(url=url)# : 请求成功# 2. 获取数据html_data = response.text# 3. 解析数据# 音乐id 音乐名称 获取下来# 正则#

  • (.*?)
  • music_info = re.findall('
  • (.*?)
  • ', html_data)for info in music_info: music_id = info[0] music_name = info[1] # 找不到的 别人写的代码里面抠出来 music_url = f' music_name = re.sub('[\\/:*?"<>|]', '', music_name) print(music_url) # 4. 保存数据 music_data = requests.get(url=music_url).content with open(f'music/{music_name}.mp3', mode='wb') as f: f.write(music_data)


    版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

    上一篇:Python 爬虫 爬取淘宝店铺数据
    下一篇:SpringCloud Feign使用ApacheHttpClient代替默认client方式
    相关文章

     发表评论

    暂时没有评论,来抢沙发吧~