# yyds干货盘点 # Python网络爬虫真实的URL看来真不能光凭着XHR找

网友投稿 292 2022-09-08


# yyds干货盘点 # Python网络爬虫真实的URL看来真不能光凭着XHR找

大家好,我是我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Rr】的粉丝问了一个关于Python网络爬虫问题,这里拿出来给大家分享下,一起学习。

乍一看,这个是乱码,后来一想,这个也许不是真实的url,大概率是找错了。因为原网页是下图这样的,人畜无害。

二、解决过程

一开始以为是预览的问题,有时候在浏览器中预览状态确实会有乱码,看得并不完整,于是乎先让其看看response一栏。

事实上,response一栏显示的也是一样的,和预览一模一样,这就很尴尬了。

不过不慌,想到这里,大概率可以确定是url没有找对,得重新去寻找,让粉丝发来url,之后真相大白。这里【德善堂小儿推拿-瑜亮老师】大佬发来贺电,如下图所示:

看来真不能光凭着xhr找,之后根据线索就得到对应的url了。

真实的url在下图:

后来【Rr】顺利解析了自己想要的字段。

看上去虽然有乱码,但是转码之后就一切正常了,完美解决!

三、总结

大家好,我是皮皮。这篇文章基于粉丝提问,针对Python网络爬虫中的url寻找的问题,给出了具体说明和演示,顺利地帮助粉丝解决了问题。下次遇到类似的问题,看来真不能光凭着xhr找,有时候真实的url就藏在其他地方。

最后感谢粉丝【Rr】提问,感谢【德善堂小儿推拿-瑜亮老师】、【dcpeng】、【果冻】、【蓬山已无青鸟】大佬给予的支持和积极参与学习。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【无人机三维路径规划】基于麻雀搜索算法实现无人机航迹规划附matlab代码
下一篇:【图像去雾】基于直方图算法+Retinex实现低对比度图像去雾含Matlab源码
相关文章

 发表评论

暂时没有评论,来抢沙发吧~