简单的用Python抓取动态网页数据，实现可视化数据分析

无可回头的伪装 · 发表于 2023-11-24 15:36:17

一眨眼明天就周末了，一周过的真快！
今天咱们用Python来实现一下动态网页数据的抓取
最近不是有消息说世界首富马上要变成中国人了吗，这要真成了，可就是历史上首位中国世界首富了！
那我们就以富豪排行榜为例，爬取一下2023年国内富豪五百强，最后实现一下可视化分析。
准备工作

环境使用

模块使用

实现流程:

数据来源分析

代码实现步骤

代码解析

发送请求

for page in range(1, 35):
print(f'{page}' * 20)
# url地址: 请求网址
url = f'https://service.ikuyu.cn/XinCaiFu2/pcremoting/bdListAction.do?method=getPage&callback=jsonpCallback&sortBy=assets&order=asc&type=4&keyword=&pageSize=15&year=2023&pageNo={page}&from=jsonp&_=1700739728273'
# 模拟浏览器: 请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}
# 发送请求: 请求方法 <开发者工具>
response = requests.get(url=url, headers=headers)

复制代码

获取数据

复制代码

解析数据
re.findall(‘匹配数据’, ‘数据源’) -> 从什么地方去获取什么数据

复制代码

创建文件对象

复制代码

保存数据

复制代码

采集数据+可视化代码我都打包好了，还有视频讲解，都在最后一段代码中。

效果展示

好了，本次分享就到这结束了，咱们下次见~

来源:https://www.cnblogs.com/hahaa/p/17853925.html
免责声明：由于采集信息均来自互联网，如果侵犯了您的权益，请联系我们【E-Mail:cb@itdo.tech】我们会及时删除侵权内容，谢谢合作！