train: change yaml

2024-08-13 10:05:16 +08:00 · 2024-08-13 10:05:16 +08:00 · f44393f413
parent 0841a0832f
commit f44393f413
1 changed files with 9 additions and 11 deletions
--- a/examples/train_lora/llama2_lora_sft.yaml
+++ b/examples/train_lora/llama2_lora_sft.yaml
@ -13,10 +13,9 @@ template: llama2
 cutoff_len: 1024
 max_samples: 100000
 overwrite_cache: true
-preprocessing_num_workers: 16

 ### output
-output_dir: ./saves/LLaMA2-7B/lora/train_24_8_13_08_13
+output_dir: ./saves/LLaMA2-7B/lora/train_24_8_13_10_02
 logging_steps: 3
 save_steps: 100
 plot_loss: true
@ -25,16 +24,15 @@ overwrite_output_dir: true
 ### train
 per_device_train_batch_size: 2
 gradient_accumulation_steps: 8
-learning_rate: 1.5e-4
+learning_rate: 5.0e-05
 num_train_epochs: 10
 lr_scheduler_type: cosine
-warmup_ratio: 0.1
 fp16: true
-ddp_timeout: 180000000
-
-### eval
-val_size: 0.1
-per_device_eval_batch_size: 1 # 1 最大
-eval_strategy: steps
-eval_steps: 500

+max_grad_norm: 1.0
+warmup_steps: 0
+optim: adamw_torch
+report_to: none
+lora_rank: 8
+lora_alpha: 16
+lora_dropout: 0.1