状态

支持 lora finetuning
推荐 deep_training>=0.0.19

安装

pip install -U deep_training >= 0.0.18 cpm_kernels icetk transformers>=4.26.1 deepspeed
最小版本要求 deep_training>=0.0.18.post8

更新详情

2023年3月21 deep_training 0.0.19 chatglm 精度自适应
2023年3月20 deep_training 0.0.18.post9 简化chat函数，增加流式输出接口stream_chat
2023年3月19 deep_training 0.0.18.post8 解决数据deepspeed 各个进程数据不均等情况（在deepspeed 会遇到卡等问题）
2023年3月18 deep_training 0.0.18.post7 效果得到验证
deep_training

深度学习常规任务例子

ChatGLM 预训练权重

https://huggingface.co/THUDM/chatglm-6b

数据示例

给出一种qa 数据示例 , 如果想跟母模型保持一致，可以参考https://huggingface.co/THUDM/chatglm-6b 数据组织结构.
单条数据示例1
{
    "id": 0, "paragraph": [
        #一轮会话
        {
            "q": "从南京到上海的路线",
            "a": [
                "你好，南京到上海的路线如下：",
                "1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。",
                "2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。",
                "3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
            ]
        }
        #二轮....
    ]
}
单条数据示例2
{"id": 0, "paragraph": [

    {
        "q": "写一个诗歌，关于冬天",
        "a": [
            "冬夜寂静冷，",
             "云在天边飘，", "冰封白雪上， ", "寒冷像一场雪。",
             " ",
             "雪花融化成冰，",
             "像那雪花飘洒，",
             "在寒冷的冬天，",
             "感受春天的喜悦。",
             " 冬日里，",
             "风雪渐消，",
             "一片寂静，",
             "把快乐和温暖带回家。"
        ]
    }
    ]
}

生成训练record

python data_utils.py

注:
num_process_worker 为多进程制作数据 ， 如果数据量较大 ， 适当调大至cpu数量
dataHelper.make_dataset_with_args(data_args.train_file,mixed_data=False, shuffle=True,mode='train',num_process_worker=0)

推理

# infer.py 推理预训练模型
# infer_finetuning.py 推理微调模型
# infer_lora_finetuning.py 推理微调模型
 python infer.py

硬件需求

量化等级	最低 GPU 显存
FP16（无量化）	13 GB
INT8	10 GB
INT4	6 GB

训练

完整参数为 config.json
若显存不足 ， 可以修改 config_small.json num_layers 层数
训练精度 可以修改 config_small.json precision 16 32
python train.py

是否开启lora finetuning

with_lora

是否开启deepspeed

启动则将data_utils.py  修改 enable_deepspeed 
lora 模式暂时不支持deepspeed

Reference

https://github.com/THUDM/ChatGLM-6B

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
config		config
data		data
.gitignore		.gitignore
1.png		1.png
README.MD		README.MD
alpaca2qa.py		alpaca2qa.py
data_utils.py		data_utils.py
deepspeed.json		deepspeed.json
infer.py		infer.py
infer_finetuning.py		infer_finetuning.py
infer_lora_finetuning.py		infer_lora_finetuning.py
make_data_example.py		make_data_example.py
requirements.txt		requirements.txt
tokenization_chatglm.py		tokenization_chatglm.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

状态

安装

更新详情

深度学习常规任务例子

ChatGLM 预训练权重

数据示例

生成训练record

推理

硬件需求

训练

是否开启lora finetuning

是否开启deepspeed

Reference

About

Releases

Packages

Languages

1006076811/chatglm_finetuning

Folders and files

Latest commit

History

Repository files navigation

状态

安装

更新详情

深度学习常规任务例子

ChatGLM 预训练权重

数据示例

生成训练record

推理

硬件需求

训练

是否开启lora finetuning

是否开启deepspeed

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages