CPM-9G_Code/dateset/说明.txt

随机抽取了大约5000条数据，一次600条，训练一次后直接推理打榜，如果打榜成绩比上一次的好，保留此次，接着在这次模型的基础上继续训练，由于比赛没有具体说明，我们的训练方式是直接把要训练的数据复制要用的数据集中，我们自己都很难复现，加上提案提交通道已经关闭，复现困难选择放弃，就这样。
来自  https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k
Update 说明.txt 2024-11-09 22:43:42 +08:00				`随机抽取了大约5000条数据，一次600条，训练一次后直接推理打榜，如果打榜成绩比上一次的好，保留此次，接着在这次模型的基础上继续训练，由于比赛没有具体说明，我们的训练方式是直接把要训练的数据复制要用的数据集中，我们自己都很难复现，加上提案提交通道已经关闭，复现困难选择放弃，就这样。`
first 2024-10-31 20:58:32 +08:00				`来自 https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k`