我们从iamtarun/python_code_instructions_18k_alpaca这个huggingface代码数据集中处理
这个代码数据集质量较高,较多为代码完成类数据,和比赛要求贴近。
因此我们对数据进行了联想和格式化处理。