-
Notifications
You must be signed in to change notification settings - Fork 419
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请教下单机多卡训练的卡死问题 #49
Comments
能看到 |
请问有试过单机多卡的情况吗? 不是多机多卡,发现在单机多卡的时候 bash finetune.sh 时,会卡住,但也没报错,没有任务的训练时候 loss日志打印出来 |
我们现在程序就是单机多卡,你那边有数据加载界面吗,我猜是卡在数据加载界面上了。 |
如果卡在数据加载界面上,可能的原因是你用的数据是我们之前的版本“不是utf-8”格式的,看不到正常的中文,这个版本在一些系统上可能会存在问题。你可以看看你的数据能不能看到正常中文字符,如果不能可以参考这个issue,或者从huggingface或网盘中拉去现在的数据集 |
如果数据加载没问题的话,如果是只有多卡有问题看看是不是有下面的问题: |
找到问题啦,已解决,我的机器是单机8张A6000, |
可以说一下如何解决的吗?我现在也是碰到这个问题,非常感谢! |
你好,想问问用多卡训练,即 bash finetune.sh 时,能看到训练进度的吗?
The text was updated successfully, but these errors were encountered: