OCR 最近在做OCR的项目,以下是一些资料 目录 最近的论文and代码(更新ing) 调研 ocr调研报告 论文 1.ASTER_notes 1.1.STN_notes 1.2.TPS_notes 1.3.Aster code 2.CTPN 2.1.CTPN + DenseNet + CTC 2.2.CTPN_notes 2.3.CTPN+CRNN+CTC(Keras) 3.Faster-rcnn_notes 4.CRNN+CTC_notes 数据集 1.中文数据集 密码:lu7m 共约364万张图片,按照99:1划分成训练集和验证集 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成 包含汉字、英文字母、数字和标点共5990个字符 每个样本固定10个字符,字符随机截取自语料库中的句子 图片分辨率统一为280x32 小tricks 1.图片数据增强包 2.SynthText_Chinese_version(自然场景的文字生成) 3.印刷体文字生成 4.印刷体文字生成之中文 5.text-detector-experience 6.文本识别彩色背景