Python爬虫是如何遍历文档树呢？一招教你-eolink官网

Python爬虫是如何遍历文档树呢？一招教你

遍历文档树

1.直接子节点：.contents .children属性

.content

Tag的.content属性可以将Tag的子节点以列表的方式输出

#!/usr/bin/python3

# -*- coding:utf-8 -*-

from bs4 import BeautifulSoup

html = """

The Dormouse's story

Once upon a time there were three little sisters; and their names were

Lacie and

Tillie;

and they lived at the bottom of a well.

...

"""另外要注意：光理论是不够的。这里顺便送大家一套2020最新python入门到高级项目实战视频教程，可以去小编的Python交流.裙：七衣衣九七七巴而五（数字的谐音）转换下可以找到了，还可以跟老司机交流讨教！

# 创建 Beautiful Soup 对象，指定lxml解析器

soup = BeautifulSoup(html, "lxml")

# 输出方式为列表

print(soup.head.contents)

print(soup.head.contents[0])

运行结果

[

多平台统一管理软件接口，如何实现多平台统一管理软件接口

323 2022-06-22

Python爬虫是如何遍历文档树呢？一招教你

多平台统一管理软件接口，如何实现多平台统一管理软件接口

java中的接口是类吗

vue项目接口域名动态的获取方法

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

Python爬虫是如何遍历文档树呢？一招教你

微信扫一扫：分享

推荐文章

最近发表

热评文章