parent
87390ae3b7
commit
35cc1e28f6
|
@ -7,4 +7,4 @@ from llmtuner.tuner import export_model, run_exp
|
||||||
from llmtuner.webui import create_ui, create_web_demo
|
from llmtuner.webui import create_ui, create_web_demo
|
||||||
|
|
||||||
|
|
||||||
__version__ = "0.2.1"
|
__version__ = "0.2.2"
|
||||||
|
|
|
@ -150,6 +150,14 @@ register_model_group(
|
||||||
)
|
)
|
||||||
|
|
||||||
|
|
||||||
|
register_model_group(
|
||||||
|
models={
|
||||||
|
"LingoWhale-8B": "deeplang-ai/LingoWhale-8B"
|
||||||
|
},
|
||||||
|
module="qkv_proj"
|
||||||
|
)
|
||||||
|
|
||||||
|
|
||||||
register_model_group(
|
register_model_group(
|
||||||
models={
|
models={
|
||||||
"LLaMA-7B": "huggyllama/llama-7b",
|
"LLaMA-7B": "huggyllama/llama-7b",
|
||||||
|
|
|
@ -136,7 +136,7 @@ class Runner:
|
||||||
args["upcast_layernorm"] = True
|
args["upcast_layernorm"] = True
|
||||||
|
|
||||||
if args["stage"] == "ppo":
|
if args["stage"] == "ppo":
|
||||||
args["reward_model"] = get("train.reward_model")
|
args["reward_model"] = get_save_dir(get("top.model_name"), get("top.finetuning_type"), get("train.reward_model"))
|
||||||
|
|
||||||
if args["stage"] == "dpo":
|
if args["stage"] == "dpo":
|
||||||
args["dpo_beta"] = get("train.dpo_beta")
|
args["dpo_beta"] = get("train.dpo_beta")
|
||||||
|
|
Loading…
Reference in New Issue