翼度科技»论坛 编程开发 python 查看内容

使用python库解决登录的验证码识别-图片验证码

4

主题

4

帖子

12

积分

新手上路

Rank: 1

积分
12
前言:
在UI自动化测试和爬虫测试中,验证码是个比较头疼的问题,包括:图片验证码,滑块验证码,等一些常见的验证码场景。
识别验证码的python 库有很多,用起来也并不简单,这里推荐一个简单实用的识别验证码的库 ddddocr (带带弟弟ocr)库。
今天先用一个图片验证码示例来演示下:
准备:
1.安装库ddddocr
2.安装库pillow
3.以一个带验证码登录的网站为示例:https://xqctk.jtys.sz.gov.cn/
开始编码:
1代码如下:
  1. 1 import time
  2. 2 from ddddocr import DdddOcr
  3. 3 from selenium import webdriver
  4. 4 from selenium.webdriver.common.by import By
  5. 5 from PIL import Image  # 需安装 pillow
  6. 6
  7. 7 path = 'https://xqctk.jtys.sz.gov.cn/'
  8. 8
  9. 9
  10. 10 def get_picture_code(locator):
  11. 11     pic_save_path = 'D://html.png'
  12. 12     cron_path = 'D://code.png'
  13. 13     browser.save_screenshot(pic_save_path)  # 保存为图片
  14. 14     location = browser.find_element(By.XPATH, locator)  # 获取需要识别的元素对象
  15. 15     size = location.size  # 获取需要识别的元素尺寸
  16. 16     position = (int(location.location['x']), int(location.location['y']), int(location.location['x'] + size['width']), int(location.location['y'] + size['height']))
  17. 17     Image.open(pic_save_path).crop(box=position).save(cron_path)  # crop进行裁剪
  18. 18     with open(cron_path, 'rb') as f:
  19. 19         img_bytes = f.read()
  20. 20         res = DdddOcr().classification(img_bytes)
  21. 21     return res
  22. 22
  23. 23
  24. 24 browser = webdriver.Chrome()  # 打开浏览器
  25. 25 browser.maximize_window()  # 浏览器最大化
  26. 26 browser.get(path)  # 打开网页
  27. 27 time.sleep(5)
  28. 28 pic_code = get_picture_code("//td[@id='incrementGetValidCodeImg']//img")
  29. 29 browser.find_element(By.XPATH, "//input[@id='incrementValidCode']").send_keys(pic_code)
  30. 30 time.sleep(5)
  31. 31 browser.quit()
复制代码
运行结果:

 

来源:https://www.cnblogs.com/jintianniu/p/17305564.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具