大模型分类:数据、应用、任务、训练及架构
该思维导图总结了大模型的多种分类方式。按照数据类型,可分为语言模型、计算机视觉模型和多模态模型;按应用领域,可分为通用、行业和垂直大模型;按任务类型,分为生成式、判别式和混合模型;按训练方法,分为预训练、从零训练和迁移学习模型;按模型架构,则包括Transformer、卷积神经网络(CNN)以及循环神经网络(RNN)和长短期记忆网络(LSTM)。 这些分类方法从不同角度刻画了大模型的多样性和复杂性,有助于更全面地理解其发展现状和未来趋势。
源码
# 大模型分类
## 按数据类型分类
- **语言模型**
- 自然语言处理(NLP)
- 信息检索
- 聊天机器人
- **计算机视觉(CV)模型**
- 图像分类
- 目标检测
- 图像分割
- **多模态模型**
- 图文理解
- 视频分析
- 语音-图像结合
## 按应用领域分类
- **通用领域大模型**
- 一般用途的AI助手
- 开放域问答
- **行业大模型**
- 医疗领域
- 疾病预测
- 医疗影像分析
- 金融领域
- 风险评估
- 交易预测
- 教育领域
- 个性化学习
- 教学辅助工具
- **垂直大模型**
- 专门针对特定任务的模型
- 行业内定制化解决方案
## 按任务类型分类
- **生成式模型**
- 文本生成
- 图像生成
- 音乐生成
- **判别式模型**
- 分类任务
- 回归任务
- **混合模型**
- 结合生成与判别能力
- 多任务学习
## 按训练方法分类
- **预训练模型**
- 大规模数据集预训练
- 迁移至特定任务微调
- **从零训练模型**
- 针对特定需求从头开始训练
- 数据依赖性高
- **迁移学习模型**
- 从已有模型迁移知识
- 提升训练效率
## 按模型架构分类
- **Transformer架构**
- 自注意力机制
- 适用于NLP和CV任务
- **卷积神经网络(CNN)**
- 对于图像任务的高效性
- 局部连接与权重共享
- **循环神经网络(RNN)和长短期记忆网络(LSTM)**
- 处理序列数据
- 记忆特性与长距离依赖
图片
