简体中文 | English
对于设计精良的网络结构和损失函数,多个任务共同训练能大幅提升模型的泛化性。由于特定任务的数据存在noise,仅使用单一任务的数据进行训练,存在过拟合的风险。统一多任务大模型通过将多个任务的数据整合进行统一训练,能够对不同任务的noise做一个平均,进而使模型学到更好的特征。为了进一步探索统一多任务大模型的能力上限,本赛道以交通场景典型任务为题,联合分类、检测、分割三项CV任务三大数据集至单一大模型中,使得单一大模型具备能力的同时获得领先于特定单任务模型的性能。
之前主流的视觉模型生产流程,通常采用单任务 “train from scratch” 方案。每个任务都从零开始训练,各个任务之间也无法相互借鉴。由于单任务数据不足带来偏置问题,实际效果过分依赖任务数据分布,场景泛化效果往往不佳。近两年蓬勃发展的大数据预训练技术,通过使用大量数据学到更多的通用知识,然后迁移到下游任务当中,本质上是不同任务之间相互借鉴了各自学到的知识。基于海量数据获得的预训练模型具有较好的知识完备性,在下游任务中基于少量数据 fine-tuning 依然可以获得较好的效果。不过基于预训练+下游任务 fine-tuning 的模型生产流程,需要针对各个任务分别训练模型,存在较大的研发资源消耗。
百度提出的 VIMER-UFO(UFO:Unified Feature Optimization) All in One 多任务训练方案,通过使用多个任务的数据训练一个功能强大的通用模型,可被直接应用于处理多个任务。不仅通过跨任务的信息提升了单个任务的效果,并且免去了下游任务 fine-tuning 过程。VIMER-UFO All in One 研发模式可被广泛应用于各类多任务 AI 系统,以智慧城市场景为例,VIMER-UFO 可以用单模型实现人脸识别、人体和车辆ReID等多个任务的 SOTA 效果,同时多任务模型可获得显著优于单任务模型的效果,证明了多任务之间信息借鉴机制的有效性。
本赛道旨在通过多任务联合训练来提升模型的泛化能力,同时解决多任务、多数据之间冲突的问题。本赛题基于交通场景,选择了分类、检测、分割三大代表性任务进行AllInOne联合训练。
任务定义:根据给出的分类、检测、分割三任务的数据集,使用统一大模型进行AllInOne联合训练,使得单一模型能够具备分类、检测、分割的能力。
我们使用了分类、检测、分割的公开数据集具体如下:
任务 | 任务类别 | 数据集 | 图片数 |
---|---|---|---|
Fine-Grained Image Classification on Stanford Cars | 分类 | Stanford Cars | 8,144 |
Traffic Sign Recognition on Tsinghua-Tencent 100K | 检测 | Tsinghua-Tencent 100K | 6,103 |
Semantic Segmentation on BDD100K | 分割 | BDD100K | 7,000 |
任务 | 任务类别 | 数据集 | 图片数 |
---|---|---|---|
Fine-Grained Image Classification on Stanford Cars | 分类 | Stanford Cars | 8,041 |
Traffic Sign Recognition on Tsinghua-Tencent 100K | 检测 | Tsinghua-Tencent 100K | 3,067 |
Semantic Segmentation on BDD100K | 分割 | BDD100K | 1,000 |
标注格式:每行由图片名称和对应类别id组成
参考标注实例如下方所示:
00001.jpg 0
00002.jpg 2
00003.jpg 1
...
标注格式:参考COCO标注格式
标注格式:参考BDD100K标注格式
分类任务:Top-1 accuracy
检测任务:mAP50
分割任务:mIoU
A榜最终得分:三任务指标平均值
比赛分A/B榜单,A榜基于选手提交的分类、检测、分割三任务预测结果文件进行打分;B榜需要选手提交代码和一键启动finetune脚本,在未公开数据集上进行finetune后测试的结果进行打分。
比赛提交截止日期前仅A榜对选手可见,比赛结束后B榜会对选手公布,比赛最终排名按照选手成绩在A榜和B榜联和的排名。
注意:请确保提交至B榜上的代码finetune脚本能够顺利运行
文件格式:JSON
内容格式:
{
'cls': {
'image_name': pred_cls_id,
... ...
},
'dec': [
{'image_id': 1, 'category_id': 37, "bbox": [x, y, w, h], "score": pred_score},
... ...
],
'seg': {
'image_name': {'pred_cls_id': pred_polygons, ... ...},
... ...
}
}
参考示例:
https://aistudio.baidu.com/aistudio/datasetdetail/203253 (track1_submit_example.json)