forked from jiuyuan/CPM-9G-8B
|
||
---|---|---|
FM_9G | ||
quick_start_clean | ||
README.md |
README.md
九格通用基础大模型
简介
启元九格大模型由启元实验室牵头,联合清华大学、哈尔滨工业大学、中国科学院计算技术研究所、北京大学、南开大学等顶尖科研单位共同研发。该模型具备 高效训练与推理、高效适配与部署 的技术特点,支持多种 自然语言处理(NLP) 和 多模态 任务,包括 文本问答、文本分类、机器翻译、文本摘要、图文理解等。
更新信息
🔥 最新版本(2025.01.12):FM9G-V
- 模型:13B 多模态基础大模型,支持 单图文推理。
- 训练:开源了 多模态基础大模型 的训练代码。
- 推理:支持 单图文推理。
🚀 历史更新(2024.08.19):FM9G
- 2B 模型 经过多数据集验证,发现 LoRA 训练效果不及全参数微调,因此 2B 采用 全参数微调 训练。
- 8B 模型 LoRA 微调仍在 master 分支 进行训练。
- QUICK START 中更新了 2B 全参数微调 的详细信息。
📚 其他信息
- 若仍在使用旧版本的九格模型训练和推理,请切换分支至 master 分支。
📌 开源模型参数级别
模型 | 主要能力 | 参数规模 | 代码分支 |
---|---|---|---|
FM9G-8B | 文本处理(NLP) | 80 亿 | FM9G-V |
FM9G-2B | 文本处理(NLP) | 20 亿 | FM9G |
FM9G-V(13B) | 多模态(文本+图像) | 130 亿 | FM9G |
迈向通用智能的大模型技术系列课程
系列课程全方位介绍人工智能和大模型技术的基础知识和前沿课题,理论学习和实践应用相结合。课程既有“人工智能与大模型通论”和“神经网络与预训练模型”等基础知识,也有“九格大模型生态体系”和“领域大模型实战”等实战主题,基本内容包括大模型训练、微调、知识增强、伦理安全、多模态、具身智能、自主智能体等话题,高级选题包括多语言处理、面向科学研究的大模型应用、高效计算技术、评测与数据科学等话题。课程旨在通过一系列精心设计的单元为学习者提供大型通用人工智能的学习之旅。