llama3_lora_dpo.yaml
|
update dpo examples
|
2024-05-27 19:56:04 +08:00 |
llama3_lora_eval.yaml
|
update examples
|
2024-05-17 01:02:00 +08:00 |
llama3_lora_kto.yaml
|
support SimPO #3900
|
2024-05-26 23:46:33 +08:00 |
llama3_lora_ppo.yaml
|
improve KTO impl., replace datasets
|
2024-05-18 03:44:56 +08:00 |
llama3_lora_pretrain.yaml
|
update examples
|
2024-05-17 01:02:00 +08:00 |
llama3_lora_sft.yaml
|
improve KTO impl., replace datasets
|
2024-05-18 03:44:56 +08:00 |
llama3_preprocess.yaml
|
improve KTO impl., replace datasets
|
2024-05-18 03:44:56 +08:00 |
llava1_5_lora_sft.yaml
|
update examples
|
2024-05-17 01:02:00 +08:00 |