修改一些格式问题

This commit is contained in:
chaoyu@qiyuanlab.com 2024-07-16 18:36:27 +08:00
parent 26bb024cb4
commit 96b38208f6
1 changed files with 1 additions and 1 deletions

View File

@ -126,7 +126,7 @@ pip install tensorboardX
- 文件格式为.txt的原始文本处理流程为数据→jsonl格式的数据→index数据 - 文件格式为.txt的原始文本处理流程为数据→jsonl格式的数据→index数据
- 文件格式为.jsonl的文本数据处理流程为j:数据→index数据 - 文件格式为.jsonl的文本数据处理流程为j:数据→index数据
1. 参考以下脚本将txt数据处理为jsonl格式 1. 参考以下脚本将txt数据处理为jsonl格式
```python ``` python
# convert_txt2jsonl.py # convert_txt2jsonl.py
import json import json
import sys import sys