LLaMA-Factory-310P3/examples/README_zh.md

50 lines
2.4 KiB
Markdown
Raw Normal View History

2024-04-15 22:14:34 +08:00
我们提供了多样化的大模型微调示例脚本。
2024-04-02 20:58:45 +08:00
```
examples/
├── lora_single_gpu/
2024-04-16 17:44:48 +08:00
│ ├── pretrain.sh: 基于 LoRA 进行增量预训练
2024-04-15 22:14:34 +08:00
│ ├── sft.sh: 基于 LoRA 进行指令监督微调
│ ├── reward.sh: 基于 LoRA 进行奖励模型训练
│ ├── ppo.sh: 基于 LoRA 进行 PPO 训练
│ ├── dpo.sh: 基于 LoRA 进行 DPO 训练
│ ├── orpo.sh: 基于 LoRA 进行 ORPO 训练
2024-04-02 20:58:45 +08:00
│ ├── prepare.sh: 保存预处理后的数据集
2024-04-15 22:14:34 +08:00
│ └── predict.sh: 基于 LoRA 进行批量预测并计算 BLEU 和 ROUGE 分数
2024-04-02 20:58:45 +08:00
├── qlora_single_gpu/
2024-04-15 22:14:34 +08:00
│ ├── bitsandbytes.sh: 基于 QLoRA 微调 4/8 比特 BNB 模型
│ ├── gptq.sh: 基于 QLoRA 微调 4/8 比特 GPTQ 模型
│ ├── awq.sh: 基于 QLoRA 微调 4 比特 AWQ 模型
│ └── aqlm.sh: 基于 QLoRA 微调 2 比特 AQLM 模型
2024-04-02 20:58:45 +08:00
├── lora_multi_gpu/
2024-04-15 22:14:34 +08:00
│ ├── single_node.sh: 使用 Accelerate 进行单节点 LoRA 训练
│ └── multi_node.sh: 使用 Accelerate 进行多节点 LoRA 训练
2024-04-02 20:58:45 +08:00
├── full_multi_gpu/
2024-04-15 22:14:34 +08:00
│ ├── single_node.sh: 使用 DeepSpeed 进行单节点全量训练
│ ├── multi_node.sh: 使用 DeepSpeed 进行多节点全量训练
│ └── predict.sh: 基于全量训练进行批量预测并计算 BLEU 和 ROUGE 分数
2024-04-02 20:58:45 +08:00
├── merge_lora/
│ ├── merge.sh: 将 LoRA 权重合并到预训练模型中
2024-04-15 22:14:34 +08:00
│ └── quantize.sh: 使用 AutoGPTQ 量化微调后的模型
2024-04-02 20:58:45 +08:00
├── inference/
2024-04-15 22:14:34 +08:00
│ ├── cli_demo.sh: 启动 LoRA 模型的命令行推理接口
│ ├── api_demo.sh: 启动 LoRA 模型的 OpenAI 风格 API
│ ├── web_demo.sh: 启动 LoRA 模型的浏览器推理接口
│ └── evaluate.sh: 在 MMLU/CMMLU/C-Eval 数据集上评测 LoRA 模型
2024-04-02 20:58:45 +08:00
└── extras/
├── galore/
│ └── sft.sh: 使用 GaLore 训练模型
2024-04-16 17:44:48 +08:00
├── badam/
│ └── sft.sh: 使用 BAdam 训练模型
2024-04-02 20:58:45 +08:00
├── loraplus/
│ └── sft.sh: 使用 LoRA+ 训练模型
├── llama_pro/
│ ├── expand.sh: 扩展模型中的层
│ └── sft.sh: 训练扩展后的模型
2024-04-19 02:31:24 +08:00
├── MoD/
│ ├── freeze_sft.sh: 冻结微调模型,仅更新 MoD 路由器
│ └── sft.sh: 微调国防部模型
2024-04-02 20:58:45 +08:00
└── fsdp_qlora/
2024-04-15 22:14:34 +08:00
└── sft.sh: 使用 FSDP+QLoRA 微调量化模型
2024-04-02 20:58:45 +08:00
```