LLaMA-Factory-310P3

Commit Graph

Author	SHA1	Message	Date
hoshi-hiyouga	a1fa7aa63b	Update generating_args.py	2024-05-20 00:29:31 +08:00
hoshi-hiyouga	896c656185	Update chat_model.py	2024-05-20 00:29:12 +08:00
hiyouga	10573e1639	fix jinja template	2024-05-19 23:38:30 +08:00
ycjcl868	a08ba254c8	feat: cli chat support system_message	2024-05-19 23:17:46 +08:00
hiyouga	31a0564d4f	fix zero2 high ram usage	2024-05-19 21:53:54 +08:00
hiyouga	70214b71b1	fix hf gen args	2024-05-19 19:39:32 +08:00
hiyouga	8ee8ac6eba	fix envs	2024-05-19 18:27:18 +08:00
hiyouga	1ebc890a5f	fix #3807	2024-05-19 17:07:57 +08:00
hiyouga	2bec28e328	update readme	2024-05-18 23:09:03 +08:00
hiyouga	3c2a992caa	safe output path in webui	2024-05-18 22:42:28 +08:00
hiyouga	d43822fcc2	fix jetmoe z3 block	2024-05-18 22:28:45 +08:00
hiyouga	a851056229	improve data process logger	2024-05-18 22:02:42 +08:00
hiyouga	ca48f90f1e	update data readme	2024-05-18 21:37:38 +08:00
hiyouga	18cbf8561d	update data readme	2024-05-18 21:15:20 +08:00
hiyouga	0edc16769f	fix #3803	2024-05-18 16:13:14 +08:00
hoshi-hiyouga	73d4a8e655	Merge pull request #3799 from hiyouga/dev improve KTO impl, replace datasets	2024-05-18 03:49:13 +08:00
hiyouga	c450ee87a3	improve KTO impl., replace datasets	2024-05-18 03:44:56 +08:00
hoshi-hiyouga	33a354548e	Merge pull request #3785 from enji-zhou/feature/add_kto add kto	2024-05-18 03:07:18 +08:00
hoshi-hiyouga	d7ff49f245	Merge pull request #3794 from jue-jue-zi/main feat: pass the `max_lora_rank` parameter to vLLM backend	2024-05-17 16:17:30 +08:00
hoshi-hiyouga	9646727453	Update model_args.py	2024-05-17 16:16:41 +08:00
juejuezi	b20d62ba3c	feat: pass the `max_lora_rank` parameter to vLLM backend	2024-05-17 16:07:39 +08:00
hiyouga	8af9817605	add deepseek v2 lite model	2024-05-17 13:25:36 +08:00
enji.zhou	db1d5a4f51	add kto	2024-05-17 13:09:17 +08:00
hiyouga	84415492bf	Update wechat.jpg	2024-05-17 12:18:03 +08:00
hiyouga	e5bba7cf1b	update badam example #3764	2024-05-17 02:21:10 +08:00
hiyouga	d9f190ff1e	better dtype handle in loading	2024-05-17 02:14:56 +08:00
hiyouga	ddec9e1b84	update examples	2024-05-17 01:02:00 +08:00
hiyouga	694a05fd04	enable inbrowser in webui	2024-05-17 00:08:56 +08:00
hiyouga	d77bed4091	add falcon 11b	2024-05-17 00:08:33 +08:00
hiyouga	3df986c679	fix examples #3769	2024-05-16 19:12:09 +08:00
hiyouga	308edbc426	rename package	2024-05-16 18:39:08 +08:00
hiyouga	b2fc7aeb03	set dev version	2024-05-16 02:17:31 +08:00
hiyouga	1c910079d8	release v0.7.1	2024-05-16 00:57:16 +08:00
hiyouga	2a67ab3925	fix #3694	2024-05-16 00:35:28 +08:00
hiyouga	44cfa9a1cd	fix #3606 https://github.com/huggingface/peft/pull/1706	2024-05-15 23:05:02 +08:00
hiyouga	a388cadfc0	add Yi-VL-34B model	2024-05-15 22:58:19 +08:00
hiyouga	73845fcc46	add yi-vl 6b model	2024-05-15 20:02:41 +08:00
hiyouga	51d61fcc89	fix yi vl vllm infer	2024-05-15 19:25:48 +08:00
hiyouga	e1f4e53915	add NPU docker images	2024-05-15 19:20:11 +08:00
hoshi-hiyouga	75f405ec30	Merge pull request #3748 from BUAADreamer/main Add MLLM YI-VL and save processor config during training	2024-05-15 16:40:54 +08:00
hoshi-hiyouga	cbeef2aaea	Update visual.py	2024-05-15 16:39:57 +08:00
hiyouga	008e3b3b10	fix fsdp model loading	2024-05-15 16:32:28 +08:00
hoshi-hiyouga	5a0c8a8d34	Update patcher.py	2024-05-15 15:37:07 +08:00
hoshi-hiyouga	780ca8306b	Update template.py	2024-05-15 14:20:39 +08:00
hoshi-hiyouga	aa4a8933dd	Update trainer.py	2024-05-15 14:13:26 +08:00
hoshi-hiyouga	c309605ff5	Update workflow.py	2024-05-15 14:13:01 +08:00
BUAADreamer	db1622f76b	rm extra import	2024-05-15 12:48:18 +08:00
BUAADreamer	d2bf697400	cast dtype in mm_proj	2024-05-15 11:22:15 +08:00
BUAADreamer	771bed5bde	modify style	2024-05-15 10:18:10 +08:00
BUAADreamer	3f4556454c	Merge branch 'main' of https://github.com/BUAADreamer/LLaMA-Factory	2024-05-15 09:54:21 +08:00

... 3 4 5 6 7 ...

1687 Commits All Branches Search

1687 Commits

All Branches