随机抽取了大约5000条数据,一次600条,训练一次后直接推理打榜,如果打榜成绩比上一次的好,保留此次,接着在这次模型的基础上继续训练,由于比赛没有具体说明,我们的训练方式是直接把要训练的数据复制要用的数据集中,我们自己都很难复现,加上提案提交通道已经关闭,复现困难选择放弃,就这样。
来自 https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k