目标
1. 在无数据集基础上,训练基于CNN的ocr模型
2. 使用vae增强数据
环境
1. python3.6
2. numpy=1.18.0
3. opencv-python=4.1.1.26
4. pandas=1.1.5
5. Pillow=5.4.1
6. python-igraph=0.8.0
7. PythonMagick=0.9.19
8. tensorflow-gpu=2.0.0
9. torch=1.8.0
大概就这些
思路
1. 数据集生成
2. 训练VAE并生成数据
3. 训练CNN模型
4. 查看效果
数据集
在一张空白图片上绘制单个字并保存
字体是从操作系统字体库中找的
基本参数如下
# 图片大小统一为28*28
self.imgsize = kwargs.get('imgsize', (28
