大模型分类:数据、应用、任务、训练及架构

该思维导图总结了大模型的多种分类方式。按照数据类型,可分为语言模型、计算机视觉模型和多模态模型;按应用领域,可分为通用、行业和垂直大模型;按任务类型,分为生成式、判别式和混合模型;按训练方法,分为预训练、从零训练和迁移学习模型;按模型架构,则包括Transformer、卷积神经网络(CNN)以及循环神经网络(RNN)和长短期记忆网络(LSTM)。 这些分类方法从不同角度刻画了大模型的多样性和复杂性,有助于更全面地理解其发展现状和未来趋势。

源码
# 大模型分类
## 按数据类型分类
- **语言模型**
  - 自然语言处理(NLP)
  - 信息检索
  - 聊天机器人
- **计算机视觉(CV)模型**
  - 图像分类
  - 目标检测
  - 图像分割
- **多模态模型**
  - 图文理解
  - 视频分析
  - 语音-图像结合
## 按应用领域分类
- **通用领域大模型**
  - 一般用途的AI助手
  - 开放域问答
- **行业大模型**
  - 医疗领域
    - 疾病预测
    - 医疗影像分析
  - 金融领域
    - 风险评估
    - 交易预测
  - 教育领域
    - 个性化学习
    - 教学辅助工具
- **垂直大模型**
  - 专门针对特定任务的模型
  - 行业内定制化解决方案
## 按任务类型分类
- **生成式模型**
  - 文本生成
  - 图像生成
  - 音乐生成
- **判别式模型**
  - 分类任务
  - 回归任务
- **混合模型**
  - 结合生成与判别能力
  - 多任务学习
## 按训练方法分类
- **预训练模型**
  - 大规模数据集预训练
  - 迁移至特定任务微调
- **从零训练模型**
  - 针对特定需求从头开始训练
  - 数据依赖性高
- **迁移学习模型**
  - 从已有模型迁移知识
  - 提升训练效率
## 按模型架构分类
- **Transformer架构**
  - 自注意力机制
  - 适用于NLP和CV任务
- **卷积神经网络(CNN)**
  - 对于图像任务的高效性
  - 局部连接与权重共享
- **循环神经网络(RNN)和长短期记忆网络(LSTM)**
  - 处理序列数据
  - 记忆特性与长距离依赖
图片
大模型分类:数据、应用、任务、训练及架构