init readme

2024-05-12 14:24:04 +08:00 · 2024-05-12 14:24:04 +08:00 · 4cb5bdafe6
parent db28e17b09
commit 4cb5bdafe6
1 changed files with 47 additions and 1 deletions
--- a/README.md
+++ b/README.md
@ -1,2 +1,48 @@
-# zhuoshi_llm_factory
+# 卓识LLM_Factory
+## 1. 工具介绍

+卓识LLM_Factory是一个涵盖预训练、指令微调以及RLHF全阶段的高效、易用、可扩展大模型微调框架。通过其灵活的模块化设计，最小化了对特定模型和数据集的依赖，使得框架能够灵活地扩展到数百个模型和数据集；通过集成多种高效的训练方法，允许用户灵活地自定义微调过程；且配备有零代码可视化的一站式网页微调界面，支撑低代码领域大模型微调以及微调过程可视化。
+
+## 2. 训练阶段
+
+工具支持的训练阶段包括：
+- （增量）预训练（Continue Pre-Training）
+- 有监督微调（Supervised Fine-Tuning, SFT）
+- 人类反馈强化学习（Reinforcement Learning for Human Feedback）
+
+## 3. 微调方法
+
+工具支持的微调方法包括：
+- LoRA
+- GaLore
+- DoRA
+- LongLoRA
+- LLaMA Pro
+- LoRA+
+- LoftQ
+
+## 4. 支持模型
+
+工具支持市面上所有热度较高的开源模型，包括但不限于以下模型：
+- GLM系列
+- Baichuan系列
+- Yi系列
+- Qwen系列
+- llama系列
+- ...
+
+
+## 5. 工具安装
+
+
+使用以下命令进行安装：
+```shell
+pip install -e .[metrics]
+```
+
+## 6. 可视化界面
+
+启动方式：
+```shell
+python src/train_web.py
+```