安装环境:pip install -r requirements.txt
文本分类任务-数据集下载:在huangjintao/zh_cls_fudan-news下载train.jsonl
和test.jsonl
到根目录下。
命名实体识别任务-数据集下载:在qgyd2021/chinese_ner_sft下载ccfbdci.jsonl
到根目录下。
Qwen2-VL多模态任务-数据集下载:
cd ./qwen2_vl
python data2csv.py
python csv2json.py
模型 | 任务 | 运行命令 | Notebook | 文章 |
---|---|---|---|---|
Qwen2-VL-2b | 多模态微调 | 进入qwen2_vl目录,运行python train_qwen2_vl.py | wait | 知乎 |
Qwen2-1.5b | 指令微调-文本分类 | python train_qwen2.py | Jupyter Notebook | 知乎 |
Qwen2-1.5b | 指令微调-命名实体识别 | python train_qwen2_ner.py | Jupyter Notebook | 知乎 |
GLM4-9b | 指令微调-文本分类 | python train_glm4.py | Jupyter Notebook | 知乎 |
GLM4-9b | 指令微调-命名实体识别 | python train_glm4_ner.py | Jupyter Notebook | 知乎 |
Qwen2系列:
python predict_qwen2.py
Qwen2-VL系列:
cd ./qwen2_vl
python predict_qwen2_vl.py
GLM4系列:
python predict_glm4.py
- SwanLab:AI训练记录、分析与可视化工具