零基础入门学python(零基础入门学pythonpdf)

网友投稿 313 2022-06-10


作为一名IT行业的一员,从零基础学习python,那么怎么利用网络学习python语言呢?以下是小编为你整理的零基础入门学python

选择你喜欢的感觉对你帮助会很大的视频,可以通过一些网友的推荐来进行选择以保证视频的更高价值。利用网路搜索一些精简扼要的python文档(或者书籍)辅助自己先前所看过的视频,以便于让自己更好地消化吸收;此类资料最好是跟你所选择的视频对应或者配套的,这样主要是为了让自己两面一致,反复学习减少些许枯燥感。

注意:文档最好是一些精益求精之类的,如果实在找不到,那么也要次之;切不可随便信手拾起一些没有多少价值的文档,那样只是浪费时间而已。

利用网路搜索一些高价值的论坛。论坛上面有很多适合新手或者老手们的资料,而且很多牛人都喜欢在上面表达一些自己的观点等。这些内容对学习python而言很有帮助。(百度python论坛会有很多,选择适合自己的)

加入一些python交流群,可以让你更快更方便的分享自己所学到的知识;当然,碰到什么疑问什么的,可以通过交流群让自己获得解答(毕竟大家都是很喜欢相互分享交流的)

利用python官网。通过python官网来学习python,你可以了解原汁原味的知识(毕竟都是用英文写的,而且python也是最先从外国传进来的嘛)

python的优势

Python世界最棒的地方之一,就是大量的第三方程序包。同样,管理这些包也非常容易。按照惯例,会在 requirements.txt 文件中列出项目所需要的包。每个包占一行,通常还包含版本号。这里有一个例子

Python 程序包有一个缺陷是,它们默认会进行全局安装。我们将要使用一个工具,使我们每个项目都有一个独立的环境,这个工具叫virtualenv。我们同样要安装一个更高级的包管理工具,叫做pip,他可以和virtualenv配合工作。

首先,我们需要安装pip。大多数python安装程序已经内置了easy_install(python默认的包管理工具),所以我们就使用easy_install pip来安装pip。这应该是你最后一次使用easy_install 了。如果你并没有安装easy_install ,在linux系统中,貌似从python-setuptools 包中可以获得。

如果你使用的Python版本高于等于3.3, 那么Virtualenv 已经是标准库的一部分了,所以没有必要再去安装它了。

下一步,你希望安装virtualenv和virtualenvwrapper。Virtualenv使你能够为每个项目创造一个独立的环境。尤其是当你的不同项目使用不同版本的包时,这一点特别有用。Virtualenv wrapper 提供了一些不错的脚本,可以让一些事情变得容易。

当virtualenvwrapper安装后,它会把virtualenv列为依赖包,所以会自动安装。

打开一个新的shell,输入mkvirtualenv test 。如果你打开另外一个shell,则你就不在这个virtualenv中了,你可以通过workon test 来启动。如果你的工作完成了,可以使用deactivate 来停用。

如何入门python

学习爬虫首先学习Python,建议通过中国大学mooc和《笨方法学Python》来实现入门,那本书的内容可以有所取舍。通过这两个途径再上网上针对性地查找相关内容完全可以入门,重点在于理解“面向对象”。

爬虫入门首先要明白一些网络技术,了解TCP/IP参考模型,并且对应用层的HTTP协议的方法和工作原理有一定的认识。爬虫爬取网页内容,大多数网页服务由HTTP协议实现。

正式学习爬虫库urllib和正则表达式,urllib灵活性很高,并且和你所学的网络原理、HTTP原理非常贴合,利于新手学习,正则表达式看看内容,再看几个实例就应该会用了,不推荐看乱七八糟的教程和MOOC(效果非常差,讲的跨度太大),推荐书籍《精通Python网络爬虫 核心技术、框架与项目实战 》(韦玮)。同样是选择性的阅读。

学习完成之后,多加实践,推荐实战项目:1、爬取漫画网上的一部漫画的所有图片,并用PowerPoint做成PDF 2、爬取电影下载网站上的所有电影下载链接并整理到Excel。

开发环境搭建

首先安装python3 ,可以参考:https://jingyan.baidu.com/article/afd8f4deb393fa34e386e910.html

安装好python3 后,如图 进入python环境验证python 的 urllib 库是否能正常使用,如没有提示错误则urllib 库能正常使用了。

其他操作系统的python的安装同理,具体可以搜索对应的安装方法。

然后安装爬虫开发所需的第三方库 BeautifulSoup 4.,可以参考:https://jingyan.baidu.com/article/ac6a9a5e31c87c2b643eac11.html

爬虫开发其实还要其他第三方开发库,这里选用BeautifulSoup 4。

最后安装python开发工具IDE。

urllib 的用途和用法

urllib 是python3 自带的操作URL 的库,用来模拟用户使用浏览器访问网页。

使用步骤:

1) 程序中导入urllib库的request 模块

from urllib import request

2) 请求URL,相当于浏览网页时右击然后选择 “显示网页源代码”

resp = request.urlopen(“此处填网址")

3)输出上一步请求获得的 “网页源代码”

print(resp.read().decode(“utf-8”))

一个获取网页源码的程序就完成了:

对以上第2点进一步优化模拟真实浏览器,

可以先查看浏览器访问网页时携带点header 信息,如图查看”User_Agent”信息,意思是使用什么版本的什么浏览器访问去访问网页,意思是告诉网页服务器这是一个浏览器而不是一个爬虫。有些网站就是根据是否携带”User_Agent”头信息去判断是否是一个爬虫来访问网站。

在第2点的程序基础上加上”User_Agent”头信息

req.add_header(key,value)


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:少儿了解编程怎么样(怎么看少儿学编程)
下一篇:java如何学源码(java入门源代码)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~