预训练数据集使用问题 #17

yuemingPAN · 2022-10-26T13:17:38Z

您好，datasets.py文件中，args.dataset参数不同会使用不同的预训练数据集，请问vqa_train_filter.json和vqa_train.json有什么不同，当args,dataset==vqav2时，会将vqa_img_feature_train.pickle和vqa_img_feature_val.pickle合并起来做训练，请问您在论文中报告的实验，预训练时具体是用哪种组合呢？比如：pretrain时datasets是vqav2，不做validate， finetune时用okvqa或krvqa

AndersonStra · 2022-10-26T13:23:20Z

args.dataset参数不是预训练数据集参数，是下游微调与测试使用的数据集，vqa_train_filter.json过滤掉了YES/NO 和 number类型的问题。args.dataset直接指定微调时使用的数据集即可

yuemingPAN · 2022-10-26T13:25:42Z

好的明白了，谢谢您

yuemingPAN · 2022-10-26T14:28:37Z

大佬再问一下这两个文件有什么区别？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

预训练数据集使用问题 #17

预训练数据集使用问题 #17

yuemingPAN commented Oct 26, 2022

AndersonStra commented Oct 26, 2022

yuemingPAN commented Oct 26, 2022

yuemingPAN commented Oct 26, 2022 •

edited

Loading

预训练数据集使用问题 #17

预训练数据集使用问题 #17

Comments

yuemingPAN commented Oct 26, 2022

AndersonStra commented Oct 26, 2022

yuemingPAN commented Oct 26, 2022

yuemingPAN commented Oct 26, 2022 • edited Loading

yuemingPAN commented Oct 26, 2022 •

edited

Loading