Go to file
p04896573 3dab1da965 Update README.md 2025-02-05 16:32:20 +08:00
FM_9G fix single dataset error with exhaust with 2b models 2024-08-01 10:37:57 +08:00
quick_start_clean Update quick_start.md 2024-12-05 10:31:59 +08:00
README.md Update README.md 2025-02-05 16:32:20 +08:00

README.md

九格通用基础大模型

简介

启元九格大模型由启元实验室牵头,联合清华大学、哈尔滨工业大学、中国科学院计算技术研究所、北京大学、南开大学等顶尖科研单位共同研发。该模型具备 高效训练与推理高效适配与部署 的技术特点,支持多种 自然语言处理NLP多模态 任务,包括 文本问答、文本分类、机器翻译、文本摘要、图文理解等


更新信息

🔥 最新版本2025.01.12FM9G-V

  • 模型13B 多模态基础大模型,支持 单图文推理
  • 训练:开源了 多模态基础大模型 的训练代码。
  • 推理:支持 单图文推理

🚀 历史更新2024.08.19FM9G

  • 2B 模型 经过多数据集验证,发现 LoRA 训练效果不及全参数微调,因此 2B 采用 全参数微调 训练。
  • 8B 模型 LoRA 微调仍在 master 分支 进行训练。
  • QUICK START 中更新了 2B 全参数微调 的详细信息。

📚 其他信息

  • 若仍在使用旧版本的九格模型训练和推理,请切换分支至 master 分支。

📌 开源模型参数级别

模型 主要能力 参数规模 代码分支
FM9G-8B 文本处理NLP 80 亿 FM9G-V
FM9G-2B 文本处理NLP 20 亿 FM9G
FM9G-V13B 多模态(文本+图像) 130 亿 FM9G

迈向通用智能的大模型技术系列课程

系列课程全方位介绍人工智能和大模型技术的基础知识和前沿课题,理论学习和实践应用相结合。课程既有“人工智能与大模型通论”和“神经网络与预训练模型”等基础知识,也有“九格大模型生态体系”和“领域大模型实战”等实战主题,基本内容包括大模型训练、微调、知识增强、伦理安全、多模态、具身智能、自主智能体等话题,高级选题包括多语言处理、面向科学研究的大模型应用、高效计算技术、评测与数据科学等话题。课程旨在通过一系列精心设计的单元为学习者提供大型通用人工智能的学习之旅。

人工智能大模型通论

人工智能与大模型通论-PPT

大模型技术的重要特性与发展趋势

大模型技术的重要特性与发展趋势-PPT

大语言模型的适配与对齐技术

大语言模型的适配与对齐技术-PPT

大模型领域适配原理与实战

大模型领域适配原理与实战-PPT

知识增强的大语言模型

知识增强的大语言模型-PPT

大模型工具学习

大模型工具学习-PPT

检索增强生成的基本实现

检索增强生成的基本实现-PPT

多模态语义检索与检索增强技术

多模态语义检索与检索增强技术-PPT

大语言模型驱动的多智能体协作与演化

大语言模型驱动的多智能体协作与演化-PPT