Python爬虫之cookie的获取、保存和使用【新手必学】（爬虫如何获取cookie）-eolink官网

Python爬虫之cookie的获取、保存和使用【新手必学】（爬虫如何获取cookie）

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者：huhanghao

Cookie，指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据（通常经过加密)。比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取某个页面内容，登陆前与登陆后是不同的，或者不允许的。另外如果你刚学不久。对这方面还不熟，建议先去小编的Python交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,多跟里面的人交流，比自己摸索效率更高哦！

在python中它为我们提供了cookiejar模块，它位于http包中，用于对Cookie的支持。通过它我们能捕获cookie并在后续连接请求时重新发送，比如可以实现模拟登录功能。该模块主要的对象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。

## cookie的获取

# -*- coding: UTF-8 -*-

from urllib import request

from http import cookiejar

if __name__ == '__main__':

#声明一个CookieJar对象实例来保存cookie

cookie = cookiejar.CookieJar()

#利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler

handler=request.HTTPCookieProcessor(cookie)

#通过CookieHandler创建opener

opener = request.build_opener(handler)

#此处的open方法打开网页

response = opener.open('http://baidu.com')

#打印cookie信息

for item in cookie:

print('Name = %s' % item.name)

print('Value = %s' % item.value)

cookie的文件保存

# -*- coding: UTF-8 -*-

from urllib import request

from http import cookiejar

if __name__ == '__main__':

#设置保存cookie的文件，同级目录下的cookie.txt

filename = 'cookie.txt'

#声明一个MozillaCookieJar对象实例来保存cookie，之后写入文件

cookie = cookiejar.MozillaCookieJar(filename)

#利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler

handler=request.HTTPCookieProcessor(cookie)

#通过CookieHandler创建opener

opener = request.build_opener(handler)

#此处的open方法打开网页

response = opener.open('http://baidu.com')

#保存cookie到文件

cookie.save(ignore_discard=True, ignore_expires=True)

加载保存的cookie，并进行网页访问

# -*- coding: UTF-8 -*-

from urllib import request

from http import cookiejar

if __name__ == '__main__':

#设置保存cookie的文件的文件名,相对路径,也就是同级目录下

filename = 'cookie.txt'

#创建MozillaCookieJar实例对象

cookie = cookiejar.MozillaCookieJar()

#从文件中读取cookie内容到变量

cookie.load(filename, ignore_discard=True, ignore_expires=True)

#利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler

handler=request.HTTPCookieProcessor(cookie)

#通过CookieHandler创建opener

opener = request.build_opener(handler)

#此用opener的open方法打开网页

response = opener.open('http://baidu.com')

#打印信息

print(response.read().decode('utf-8'))

这里对cookie的使用类似于，之前我们用到的对代理的使用。

Python接口自动化之文件上传/下载接口怎么实现

578 2022-06-19

Python爬虫之cookie的获取、保存和使用【新手必学】（爬虫如何获取cookie）

java中的接口是类吗

Spring中的aware接口详情

Python接口自动化之文件上传/下载接口怎么实现

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

Python爬虫之cookie的获取、保存和使用【新手必学】（爬虫如何获取cookie）

微信扫一扫：分享

推荐文章

最近发表

热评文章