CPM-9G_Code/dateset/说明.txt

4 lines
542 B
Plaintext
Raw Normal View History

2024-11-09 22:43:42 +08:00
随机抽取了大约5000条数据一次600条训练一次后直接推理打榜如果打榜成绩比上一次的好保留此次接着在这次模型的基础上继续训练由于比赛没有具体说明我们的训练方式是直接把要训练的数据复制要用的数据集中我们自己都很难复现加上提案提交通道已经关闭复现困难选择放弃就这样。
2024-11-09 22:54:19 +08:00
层次都是all学习率都是0.0001验证0.05
2024-10-31 20:58:32 +08:00
来自 https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k