LLM Learning LLM 学习笔记。 Pytorch 快速开始 TorchScript 介绍 PyTorch Distributed/DDP/FSDP 自动微分 (AUTOGRAD) NLP Perplexity GPT models Nano GPT LLAMA ChatML 多模态 ViT LLaVA QwenVL 关键技术 FP32/FP16/BF16 Tokenizers Flash Attention Rotary position embedding KV Cache RMSNorm Quantization 量化 Decoding Strategies Training 前向和反向传播 集合通信 分布式训练并行化 DeepSpeed 混合精度训练 优化器 Llama2 微调 Prompt Tuning 和 Prefix Tuning Inference vllm TRT-LLM MLC-LLM 推理优化 推理框架 Benchmark Profiling Nsight Systems Roofline LLM Agents LangChain Embedding RAG 开源项目 项目列表 课程 学习课程列表 其他 Markdown 数学公式