團結無敵 发表于 2023-6-20 01:04:55

爬虫小试牛刀(爬取学校通知公告)



[*]

[*]完成抓取并解析DGUT通知公告12页数据,并提交excel文件格式数据,数据需要包含日期标题,若能够实现将详情页主体内容与发布人信息数据也一并抓取更佳
[*]提交内容:Excel数据文件

爬虫开始

首先看到页面呈现规则的各个方框,这意味着它们之间的一定是一样的
此处该有图

我们点开后台可以看见属于通知活动的代码中很多这类
标签
   <a href="https://www.cnblogs.com/../info/1042/48792.htm" target="_blank" title="关于开展2018届毕业生中期发展评价的通知">                                                https://www.cnblogs.com/../images/list_box_07_ico.png2023.06.09                                        https://www.cnblogs.com/../images/list_box_24_ico.png                                                关于开展2018届毕业生中期发展评价的通知
页: [1]
查看完整版本: 爬虫小试牛刀(爬取学校通知公告)