注册
|
登录
发帖
热搜
活动
交友
discuz
论坛
BBS
翼度工具
翼度网址导航
开发工具
Linux命令速查
网页设计配色表
在线制作icon
颜色代码选取器
翼度科技
»
论坛
›
编程开发
›
python
›
查看内容
返回列表
发新帖
使用python爬取豆瓣电影短评评论内容
互赞
互赞
当前离线
积分
9
3
主题
3
帖子
9
积分
新手上路
新手上路, 积分 9, 距离下一级还需 41 积分
新手上路, 积分 9, 距离下一级还需 41 积分
积分
9
发消息
显示全部楼层
需求:爬取豆瓣电影短评评论文本内容
目标:将爬取的文本存入 excel 中
爬虫步骤:
1.拼接分页网址,循环请求分页数据,获取HTML代码
2.分析获取到的HTML代码,解析出所需要的数据,提取内容
3.存储爬取到的数据
准备工作:
1.开发工具 pycharm
2.模块 requests、bs4或 pyquery
爬虫实际流程:
第一步:我们从豆瓣电影中选取一部电影(https://movie.douban.com/subject/35766491/),进入短评列表页面(https://movie.douban.com/subject/35766491/comments?status=P)
第二步:打开 f12开发者工具,我去取评论文本部分,查看网页结构。
目标评论文本部分对应的 class 类名为 comment,评论列表对应的类名为 comment-item
使用 pyquery 解析获取列表数据,代码如下:
form pyquery import PyQuery as pq
doc = pq(html)
comment_list = doc(‘.comment-item’).items()
For item in comment_list:
comment = item(‘.comment’).text()
复制代码
来源:
https://www.cnblogs.com/dzlishen/p/17228408.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
上一篇:
使用python爬取豆瓣电影短评评论内容
下一篇:
使用python爬取豆瓣电影短评评论内容
发表于 2023-3-17 23:18:26
举报
回复
使用道具
分享
返回列表
发新帖
本版积分规则
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
快速回复
快速回复
返回顶部
返回顶部
返回列表
返回列表