Skip to content

wangxupeng/OCR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

38 Commits
 
 
 
 

Repository files navigation

OCR

最近在做OCR的项目,以下是一些资料

目录

调研

论文

数据集

  • 1.中文数据集
    • 密码:lu7m
    • 共约364万张图片,按照99:1划分成训练集和验证集
    • 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
    • 包含汉字、英文字母、数字和标点共5990个字符
    • 每个样本固定10个字符,字符随机截取自语料库中的句子
    • 图片分辨率统一为280x32

小tricks

About

The OCR project

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published