如何训练自己的数据集呢？ #15

cripsgreen · 2024-10-16T08:57:53Z

我想请问我该怎样训练自己的数据集呢，是直接在预训练好的权重文件上微调呢，还是从预训练开始呢，另外LLaVA-Pretrain/chat-translated.json和LLaVA-Instruct/llava_instruct_230k.json这两个json文件是怎么生成的，是用大模型还是一些其他的脚本生成的呢？

jingyaogong · 2024-10-16T10:04:09Z

取决于数量级，推荐微调
来自LLaVA

cripsgreen · 2024-10-16T13:16:00Z

那微调是不是需要将图片预处理，用llava生成对话描述，然后整合成llava_instruct_230k.json的格式？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何训练自己的数据集呢？ #15

如何训练自己的数据集呢？ #15

cripsgreen commented Oct 16, 2024

jingyaogong commented Oct 16, 2024

cripsgreen commented Oct 16, 2024

如何训练自己的数据集呢？ #15

如何训练自己的数据集呢？ #15

Comments

cripsgreen commented Oct 16, 2024

jingyaogong commented Oct 16, 2024

cripsgreen commented Oct 16, 2024