-
Notifications
You must be signed in to change notification settings - Fork 7.9k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
PaddleOCR社区常规赛 #4982
Comments
队伍名:redearly,队伍成员AI Studio昵称:qqqqqsaalsj |
队伍名:iterhui,队伍成员AI Studio昵称:iterhui |
队伍名:thinc |
队伍名:超越队 |
队伍名:明月心队,队伍成员AI Studio昵称:raoyutian |
队伍名:媛码科技 |
队伍名:RangeKing
|
队伍名:wzmiaomiao,队伍成员AI Studio昵称:
|
队伍名:AIAS,队伍成员 Calvin
当前精简试用版(无数据库,redis等)包含了下面功能: |
队伍名:Jordan2020 |
任务类型:文档修复--报名 |
队伍名:IWIN-dgw,队伍成员AI Studio昵称:Hunter122 |
任务类型:Notebook与文档翻译--提交 文档翻译: 文档修复: PR链接:#5119 |
队伍名:zzm,队伍成员AI Studio昵称:zzm_5309 |
任务类型:文档修复--报名/提交 |
队伍名:zhaojie123 |
notebook项目 |
队伍名:深渊上的坑 数据标注懒人包:PPOCRLabel极速增强版——以电表识别为例(二) 电表读数识别:数据集补充解决方案对比(TextRender和StyleText) 【PaddlePaddle+OpenVINO】电表检测识别模型的部署 |
队伍名:iterhui,队伍成员AI Studio昵称:iterhui |
队伍名:cloudy-sfu |
队伍名:深渊上的坑 |
队伍名:深渊上的坑 【PaddlePaddle+OpenVINO】AI“朗读机”诞生记 |
队伍名:疯狂星期一 |
队伍名:XRXY,队伍成员 AI Studio昵称:smartlite |
队伍名:XRXY,队伍成员 AI Studio昵称:smartlite |
队伍名:WRS,队伍成员AI Studio昵称:王荣胜 |
队伍名:深渊上的坑 |
队伍名:雾切凉宫 |
队伍名:kevinerw |
任务类型:代码与文档修复 |
队伍名:tianxingxia |
队伍名:筝余弦,队伍成员AI Studio昵称:筝余弦 |
队伍名:深渊上的坑 【PPSIG】PaddleSpeech标点恢复:字幕提取+实时翻译再升级 |
队伍名:深渊上的坑 |
队伍名:tianxingxia |
队伍名:深渊上的坑 |
队伍名:kleintt,队伍成员AI Studio昵称:kleintt |
AI Studio昵称:Dream拒杰 |
PaddleOCR社区常规赛
PaddleOCR社区常规赛是面向所有开发者举办的积分赛事,提供多层次多维度的开放式赛题,并为优秀的社区项目给予物质与精神的多重奖励。
基于PaddleOCR进行二次开发的 绝大多数项目或贡献都可通过社区常规赛获得积分与奖励 。我们鼓励开发者实现自己的想法,也希望正在学习中的开发者在常规赛题中找到实现的方向。
最终社区项目将会收录在PaddleOCR社区贡献文档中,集中展示PaddleOCR社区生态项目和贡献。
0. 社区常规赛说明
0.1 题目类型
该部分包含四类任务,官方将根据项目完成度、质量等综合评分。选手根据每类题目的说明提交相应代码与文档即可。完成多个项目,分值可累加,上不封顶。
0.2 报名与提交
社区常规赛报名与提交需要在本Github issue下回复,按照各项赛题规范进行报名与提交。
0.3 开放日期与奖励说明
0.4 提供赛题与需求
社区常规赛的题目是持续开放且灵活变化的,我们也非常希望社区或OCR用户提供不在上述四大赛道中的题目或需求。
如果您有新的OCR赛题(包含在给定数据集上调优),可以通过如下格式进行提交。有验收通过后需求提出者同样视情况增加积分。
如果您有新的OCR垂类需求(例如增加手写体识别、印章识别等)、新的模型需求、部署需求等,可以通过如下格式进行提交。我们会将需求汇总后在社群中发起投票,优先支持高票需求。当新需求被确认后会视情况增加提出者积分。
0.5 获得赛题支持
使用微信扫描下方二维码,回复关键字【社区常规赛】后即可加入OCR兴趣交流小组,获得专属赛题支持。若您希望提供赛题或需求,也请先加入群聊。
1. 代码与文档修补
PaddleOCR中包含相当丰富的代码功能、文档教程以支持广大开发者便捷清晰的使用。但由于每位用户的情况不同,在代码运行的过程中可能会存在一些没有考虑周全的情况。在阅读文档的过程中可能会认为文档中存在一些表述不清晰、不全面或信息未更新甚至信息有误等情况,进而造成不好的用户体验。同时,Github作为一个国际开发者的聚集地,我们也希望能够提供高质量的英文阅读材料,例如润色英文文档、翻译或补充Notebook。因此希望广大开发者能够帮助PaddleOCR完善代码和文档的不全之处。其中:
.md
文件,主要位于doc/doc_ch
和doc/doc_en
中,以最新的release分支与dygraph分支中的文档为主。对于电子书的矫正、翻译、概念补充工作,凡是通过核验的提交,作者都会出现在最终电子书的致谢中永久留念,并获得额外礼物
针对机翻结果进行润色和修改,每条+0~1
其他部分视工作量加分。
md文档每篇完成机翻+4,修改情况同上。
修改流程参考下方注意点。
1.Doc-VQA:livingbody(PR)
2.KIE :RangeKing(PR) haigang1975(PR)
3.社区贡献 :thunderstudying (PR)
4.附录:thunderstudying (PR)
5.Enhenced CTC: RangeKing(PR)
6.知识蒸馏: WZMIAOMIAO(PR)
二、课程Notebook翻译:地址, RangeKing全部翻译版
1.介绍:技术导论 livingbody翻译版、如何使用:haigang1975(PR)
2.文本检测:理论部分、识别部分
3.文本识别:理论部分、识别部分
4.PP-OCR系统
5.PP-OCR推理与部署
6.文档分析:理论、实战表格、实战VQA
WZMIAOMIAO (PRs)
翻译积分遵循第一项
验收标准与内容:
任务报名与提交样例:
2. 垂类场景训练与调优
OCR垂类场景覆盖各种字体形态(手写、点阵、数码管、艺术字等)与应用对象(文档、车牌、生产包装等)。PP-OCR系列模型虽然是涉及多种场景的通用模型,但难免会在一些场景中的表现不够优异。为了能够让更多开发者直接在自己的垂类场景中使用,同时为入门新手提供垂类场景下的模型调优案例,故开设此赛题。
本赛题要求开发者完成某个具体垂类场景下的模型训练、调优、推理部署工作,具体验收流程如下
验收阶段与积分
所示。最终验收的内容为一份Notebook项目,具体可参考提交Notebook模板说明
。选手提交后将会按照积分统计并公布在积分榜中。验收阶段与积分
paddleocr
whl包实验垂类场景下的数据,并查看检测与识别结果。2. 查看FAQ文档中的垂类实现思路,学习上述场景中的优化思路,确定垂类场景下需要调优的模型(检测/识别)。
3. 完成上述步骤后将预测结果和优化思路填写在问卷中,等待入群获得支持。
- 仅有数据未标注:可以自己标注,也可发布标注任务召集社群开发者标注(如需召集标注,请在任务报名的数据准备中说明,推荐使用PPOCRLabel标注)
- 造识别数据:使用Style-text或text_renderer制造识别数据。
每开源百张标注数据+3积分。
每造百张识别数据且开源+1积分。
提供新的垂类开源数据集+2积分。
本阶段积分上限为30
有交互界面再+10
提交Notebook模板说明:
其中模型评估与预测、模型导出与推理部分可以参考文档:检测模型训练、识别模型训练。
任务报名与提交样例:
验收阶段与积分
中的第1步,说明需要提升的模型、实现的方法3. 学术前沿模型训练与推理
PaddleOCR中除了PP-OCR系列模型以外还包含众多学术前沿模型,本题针对这些模型希望开发者在通用数据集上训练与指标调优、打通C++预测。其中:
xiaoyangyang2(StarNet)
RangeKing(StarNet)
验收标准与内容:
提交Github或AIStudio项目链接+详细的技术实现说明(README或Notebook)。验收标准分别由官方人员从指标、实现过程、文档说明三个角度,在积分范围内打分。
任务报名与提交格式:
4. 工具与应用
OCR应用的形态十分多样,任何基于PP-OCR系列模型的工具、应用界面以及各种部署方式都包含在本题下。
nmusik(pdf扫描)
telppa(AutoHotkey)
livingbody(pdf2jpg)
RangeKing(地址)
sdcb(.Net/C#)
mymagicpower(Java, IOCR)
imiyu(json)
Lovely-Pig(Streamlit等)
zhiminzhang0830(FCENet)
Huntersdeng(ABINet)
验收标准与内容:
提交Github或AIStudio项目链接+详细的技术实现说明(README或Notebook)。验收标准分别由官方人员从基本效果、技术难度、文档说明三个角度,在积分范围内打分。
任务报名与提交格式:
The text was updated successfully, but these errors were encountered: