Update README.md

This commit is contained in:
p04896573 2024-08-27 16:59:28 +08:00
parent acc100b692
commit 50c194a521
1 changed files with 1 additions and 1 deletions

View File

@ -9,7 +9,7 @@
## 版本更新内容 ## 版本更新内容
具体的迭代信息如下: 具体的迭代信息如下:
- 训练升级了训练代码提升GPU利用率和并行化并且2B模型能兼容transformers中的tokenizer(LlamaTokenizerFast) - 训练升级了训练代码提升GPU利用率和并行化并且2B模型能兼容transformers中的tokenizer(LlamaTokenizerFast)
- 推理支持vllm进行模型推理和部署可以接入langchain、openai等部署方式同时可以将端侧模型可以支持GGUF等多种部署格式的部署 - 推理支持vllm进行模型推理和部署可以接入langchain、openai等部署方式同时可以支持2b模型转换成GGUF等多种部署格式的部署
- 由于新架构中多数据集验证发现2B模型进行lora训练效果不及全参数微调因此建议2B模型全参数微调8B模型LORA微调在master分支进行 - 由于新架构中多数据集验证发现2B模型进行lora训练效果不及全参数微调因此建议2B模型全参数微调8B模型LORA微调在master分支进行
## 2024.08.19 NOTICE ## 2024.08.19 NOTICE