- 1 min 爬虫基础之网页解析
Table of Contents
BeautifulSoup
简介
Beautiful Soup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库。
安装
文档读取
常用方法
Xpath
简介
简单说,xpath就是选择XML文件中节点的方法。所谓节点(node),就是XML文件的最小构成单位,一共分成7种。
xpath 表达式规则
1.基本格式
2.节点选择规则
路径表达式及其表达式的结果
Demo
Topaz
Always keep learning.