# yyds干货盘点 # 网易云音乐热门作品名字和链接抓取(bs4篇)

网友投稿 245 2022-09-03


# yyds干货盘点 # 网易云音乐热门作品名字和链接抓取(bs4篇)

大家好,我是皮皮。

一、前言

前几天在Python白银交流群有个叫【O|】的粉丝问了一道关于网易云音乐热门作品名字和链接抓取的问题,获取源码之后,发现使用​​xpath​​匹配拿不到东西,从响应来看,确实是可以看得到源码的。

二、实现过程

究其原因是返回的响应里边并不是规整的​​html​​​格式,所以直接使用​​xpath​​​是拿不到的。这里【Python进阶者】给了一个使用​​bs4​​的方法来实现的代码,代码如下。

这个代码亲测好使,运行之后结果如下。

代码的关键点在于替换掉这个​​<>​​​干扰,​​html​​误认为是标签了。这个问题和之前的百度贴吧网页类似,感兴趣的话,也可以看看这个文章,回味一下,两者有异曲同工之妙。

三、总结

大家好,我是皮皮。网易云音乐热门作品名字和链接抓取(​​bs4​​​篇),行之有效,难点在于替换掉那个干扰标签。也欢迎大家积极尝试,一起学习。目前我们已经实现了使用正则表达式、​​xpath​​​和​​bs4​​​来进行操作,接下来的一篇文章,我们​​pyquery​​库来进行实现,帮助大家巩固下Python选择器基础。

最后感谢粉丝【O|】提问,感谢【dcpeng】、【月神】、【甯同学】、【凡人不烦人】等人参与学习交流。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【手写数字识别】基于贝叶斯和线性分类器实现手写数字识别含Matlab源码
下一篇:maven依赖的version声明控制方式
相关文章

 发表评论

暂时没有评论,来抢沙发吧~