cc/datasets
p02476819 21afc62976 修改 2024-11-12 02:28:03 +00:00
..
dataset.parquet 修改 2024-11-12 02:28:03 +00:00
eval.parquet 修改 2024-11-12 02:28:03 +00:00
readme.txt 修改 2024-11-12 02:28:03 +00:00

readme.txt

我们从iamtarun/python_code_instructions_18k_alpaca这个huggingface代码数据集中处理
这个代码数据集质量较高,较多为代码完成类数据,和比赛要求贴近。
因此我们对数据进行了联想和格式化处理。