CPM-9G_Code/dateset/说明.txt

随机抽取了大约5000条数据，一次600条，训练一次后直接推理打榜，如果打榜成绩比上一次的好，保留此次，接着在这次模型的基础上继续训练，由于比赛没有具体说明，我们的训练方式是直接把要训练的数据复制要用的数据集中，我们自己都很难复现，加上提案提交通道已经关闭，复现困难选择放弃，就这样。
层次都是all，学习率都是0.0001，验证0.05
来自  https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k
-												Update 说明.txt

											
										
										
											2024-11-09 22:43:42 +08:00
+								随机抽取了大约5000条数据，一次600条，训练一次后直接推理打榜，如果打榜成绩比上一次的好，保留此次，接着在这次模型的基础上继续训练，由于比赛没有具体说明，我们的训练方式是直接把要训练的数据复制要用的数据集中，我们自己都很难复现，加上提案提交通道已经关闭，复现困难选择放弃，就这样。
-												Update 说明.txt

											
										
										
											2024-11-09 22:54:19 +08:00
+								层次都是all，学习率都是0.0001，验证0.05
-												first

											
										
										
											2024-10-31 20:58:32 +08:00
+								来自  https://huggingface.co/datasets/codefuse-ai/CodeExercise-Python-27k