Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

下游任务okvqa、krvqa的batch_size、学习率分别是多少? #36

Open
linxi1158 opened this issue Jan 22, 2024 · 8 comments
Open

Comments

@linxi1158
Copy link

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练?

@xzr912
Copy link

xzr912 commented Jan 22, 2024

image
请问您在Pre-training on VQAv2这一步设置的dataset是vqav2嘛,这里的代码有没有改呢,我找不到data/vqa_img_feature_test.pickle这个文件,请问您在哪找的?

@linxi1158
Copy link
Author

自己转的

@xzr912
Copy link

xzr912 commented Jan 22, 2024

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

@linxi1158
Copy link
Author

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

image

@xzr912
Copy link

xzr912 commented Jan 23, 2024

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

image

好的,谢谢大佬

@xzr912
Copy link

xzr912 commented Jan 24, 2024

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练?
image
image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

@linxi1158
Copy link
Author

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练?
image
image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

没有,args.load_pthpath这个变量中路径有问题

@xzr912
Copy link

xzr912 commented Jan 25, 2024

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练?
image
image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

没有,args.load_pthpath这个变量中路径有问题

好哒,谢谢大佬

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants