cc/datasets/readme.txt

5 lines
248 B
Plaintext
Raw Normal View History

2024-11-12 10:28:03 +08:00
我们从iamtarun/python_code_instructions_18k_alpaca这个huggingface代码数据集中处理
这个代码数据集质量较高,较多为代码完成类数据,和比赛要求贴近。
因此我们对数据进行了联想和格式化处理。