2
6
新手上路
大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬虫】专栏,帮助小白快速入门爬虫,本期为自动化工具 playwright 的使用。
-o :将生成的脚本保存到指定文件 --target :生成的语言,默认为 Python --save-trace :记录会话的跟踪并将其保存到文件中 -b :要使用的浏览器,默认为 chromium --timeout :设置页面加载的超时时间 --user-agent :指定UA --viewport-size :指定浏览器窗口大小
page.get_by_role() :通过显式和隐式可访问性属性进行定位。 page.get_by_text() :通过文本内容定位。 page.get_by_label() :通过关联标签的文本定位表单控件。 page.get_by_placeholder() :按占位符定位输入。 page.get_by_alt_text() :通过替代文本定位元素,通常是图像。 page.get_by_title() :通过标题属性定位元素。 page.get_by_test_id() :根据data-testid属性定位元素(可以配置其他属性)。 page.locator():拓展选择器,可以使用 CSS 选择器进行定位
元素附加到 DOM 元素可见 元素是稳定的,因为没有动画或完成动画 元素接收事件,因为没有被其他元素遮挡 元素已启用
您需要 登录 才可以下载或查看,没有账号?立即注册
上一篇: Python数据类型
下一篇: 《流畅的Python》第二版上市了,值得入手么?
举报 回复 使用道具 分享