CPM-9G-8B/README.md

20 lines
591 B
Markdown
Raw Normal View History

2024-11-02 16:18:09 +08:00
方案:
全参数微调,使用不同数据集训练多个模型进行融合。
2024-11-02 13:53:14 +08:00
训练代码:
2024-11-02 14:49:03 +08:00
LLaMA-Factory.zip 解压后使用可参照https://github.com/hiyouga/LLaMA-Factory配置环境
train.sh 训练脚本
2024-11-02 16:18:09 +08:00
推理 python inference.py(需在inference.py中修改好模型路径。)
2024-11-02 14:49:03 +08:00
model_wight:通过百度网盘分享的文件:
链接https://pan.baidu.com/s/1IXai-fDvv-hCOTS_3srs8Q
提取码6666
docker:
链接https://pan.baidu.com/s/1IXai-fDvv-hCOTS_3srs8Q
2024-11-02 16:09:56 +08:00
提取码6666
train_data:
链接https://pan.baidu.com/s/1IXai-fDvv-hCOTS_3srs8Q
2024-11-02 14:49:03 +08:00
提取码6666