Python爬虫获取空气质量数据
get_text()和
strip()
get_text()
和 strip()
是 BeautifulSoup 库中用于处理 HTML 元素的方法
get_text()
get_text()
方法是 BeautifulSoup 对象中的一个方法,用于提取 HTML 元素中的文本内容。它会将指定元素及其子元素的文本内容提取出来并返回。
strip()
strip()
方法是 Python 字符串对象的一个方法,用于去除字符串两端的空白字符(如空格、制表符等)。它返回一个新的字符串,该字符串是去除了两端空白字符的原字符串副本。
Python获取一整年的空气质量数据
可以进行数据分析处理(预测,估计)
需要导入的库
- requests
- os
- csv
- bs4
请求标头
1 |
|
get获取页面数据
1 |
|
写入成csv数据文件
1 |
|
以上程序就会保存类型为csv的广州2023年的空气质量指数的数据。
部分数据预览
日期 | 质量等级 | AQI指数 | 当天AQI排名 | PM2.5 | PM10 | So2 | No2 | Co | O3 |
---|---|---|---|---|---|---|---|---|---|
2023/1/1 | 优 | 39 | 71 | 26 | 38 | 5 | 22 | 0.73 | 56 |
2023/1/2 | 优 | 41 | 78 | 27 | 41 | 6 | 20 | 0.79 | 52 |
2023/1/3 | 优 | 47 | 90 | 32 | 44 | 5 | 20 | 0.8 | 54 |
2023/1/4 | 优 | 50 | 82 | 35 | 49 | 6 | 29 | 0.8 | 40 |
2023/1/5 | 优 | 50 | 71 | 33 | 52 | 6 | 41 | 0.88 | 38 |
2023/1/6 | 优 | 46 | 59 | 29 | 47 | 6 | 33 | 0.79 | 52 |
一个很好用的在线表格转换工具 - 让表格转换变得更容易 (tableconvert.com)
下载
Python爬虫获取空气质量数据
https://wechatid.github.io/2024/01/26/Python-crawler-air-AQI/