伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 站长资讯 » 文章详细 订阅RssFeed

Python | Python 生成验证码(本篇文章无干货)

来源:本站原创 浏览:147次 时间:2022-02-26
Python 生成验证码本篇文章无干货

爬虫和验证码就是天生的冤家,用 Python 生成验证码应该是用 Python 对抗验证码的第一步,所以今天先来研究研究如何用 Python 生成一个便于我们入手的验证码。

这里不是造轮子,只是踩踩坑,目前 Github 上关于验证码对抗的开源项目非常多,这里推荐两个,有经验的朋友直接跳过下面的内容,学习这两个项目就好。

验证码训练:(以下介绍内容来自官方的介绍)

https://github.com/kerlomz/captcha_trainer

基于深度学习的图片验证码的解决方案 - 该项目能够秒杀字符粘连重叠/透视变形/模糊/噪声等各种干扰情况,足以解决市面上绝大多数复杂的验证码场景,目前也被用于其他OCR场景。

该项目基于 TensorFlow 1.14 开发,旨在帮助中小企业或个人用户快速构建图像分类模型并投入生产环境使用,降低技术应用门槛。

验证码部署:

https://github.com/kerlomz/captcha_platform

关于部署,大佬也提供了相应的文章:https://www.jianshu.com/p/80ef04b16efc

生成一张简单的验证码

这里需要安装captcha这个库

pip install captcha

接下来使用下面这段代码,就可以得到一个简单的验证码图片

from  captcha.image import  ImageCaptcha
import matplotlib.pyplot as plt
import random  
import string  

# 定义字符集是数字和字符
chs=string.digits+string.ascii_uppercase 
print(chs)
# 定义长度,宽度,字符个数,类别
width,height,n_len,n_class=170,80,4,len(chs) 
# 定义图片宽度与高度
generator=ImageCaptcha(width=width,height=height)
# 生成一个4位随机字符串
random_str="".join([random.choice(chs) for i  in range(4) ]) 
print(random_str)
# 生成随机验证码
img=generator.generate_image(random_str) 
plt.imshow(img) 
plt.title(random_str)
plt.show()

这个时候可以得到下面这样的图片

批量生成多张验证码

光光这样一张图片坑定是满足不了我的需求的所以,改改上面的代码,把他弄成一个生成多张图片程序。

from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np 
import random  
import string  


chs = string.digits + string.ascii_uppercase
width, height, n_len, n_class = 170, 80, 4, len(chs) 


def createxy(batch_size=100):
    X = np.zeros((batch_siz����ڵ�,���ذ�e, height, width, 3), dtype=np.uint8) 
    Y = [np.zeros((batch_size, n_class), dtype=np.uint8) for i in range(n_len)]  
    generator = ImageCaptcha(width=width, height=height)  
    while True:
        for i in range(batch_size):
            # 随机字符串
            random_str = "".join([random.choice(chs) for j in range(4)])  
            # 根据随机字符串生成验证码
            X[i] = generator.generate_image(random_str)  
            for j, ch in enumerate(random_str):
                Y[j][i, :] = 0
                Y[j][i, chs.find(ch)] = 1
            yield X, Y


def getycode(y):
    # 降低维度,取出非0数据
    y = np.argmax(np.array(y), axis=2)[:, 0]  
    # 显示等于1的取出字符
    return "".join([chs[x] for x in y])  


X, Y = next(createxy(1))
plt.imshow(X[0])
plt.title(getycode(Y))
plt.show()

弄完上面这些个就可以开始试着训练了,但是我没学会,所以下次再说。


  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net