ML 学习站
跳到正文

机器学习的分类

监督 / 无监督 / 半监督 / 强化学习,各举 3 个例子。

25 分钟2 / 61,668
加载中...

本章节详细介绍了机器学习的四大分类:监督学习、无监督学习、半监督学习和强化学习。核心概念包括数据标签、学习目标和典型任务。监督学习使用有标签的数据进行训练,典型任务包括分类和回归,常用算法有线性回归、SVM和神经网络。无监督学习处理无标签数据,任务包括聚类、降维和异常检测,典型算法有K-Means和PCA。半监督学习结合少量有标签和大量无标签数据,常用于标签昂贵但无标签数据丰富的场景。强化学习通过智能体在环境中试错并获得奖励来学习策略,典型应用有AlphaGo和自动驾驶。学完本章,读者能够根据数据特点和学习目标选择合适的机器学习类型,并理解不同类型的基本原理和应用场景。

机器学习的分类

按"训练数据有没有标注"以及"学习目标是什么",机器学习可以分成几大类。搞清分类,选算法就不会懵。

一、监督学习(Supervised Learning)

特征:训练数据有标签(知道正确答案)。

比喻:老师给你一堆"题目 + 标准答案",让你学会做题。

典型任务:

  • 分类(输出是离散的类别)
  • 回归(输出是连续的数值)

3 个例子:

  1. 垃圾邮件分类(输入邮件文本,输出"垃圾/正常"二选一)
  2. 房价预测(输入面积/位置/楼层,输出具体价格)
  3. 图像识别(输入图片像素,输出"猫/狗/鸟"标签)

常用算法:线性回归、逻辑回归、决策树、SVM、随机森林、XGBoost、神经网络

二、无监督学习(Unsupervised Learning)

特征:训练数据没有标签(只有输入,没有标准答案)。

比喻:老师给你一堆题,没答案,让你自己找规律。

典型任务:

  • 聚类:把相似的数据归成几堆
  • 降维:把高维数据压成 2D/3D 方便可视化
  • 异常检测:找出"长得不一样"的数据点

3 个例子:

  1. 用户分群(电商把用户分成"高频/低频/价格敏感"等)
  2. 新闻主题归类(没有预定义主题,自动发现)
  3. 信用卡异常交易检测(找"长得奇怪"的交易)

常用算法:K-Means、层次聚类、DBSCAN、PCA、t-SNE、自编码器

三、半监督学习(Semi-supervised Learning)

特征:少量有标签 + 大量无标签。

现实里给数据打标签很贵(要请人标注),无标签的数据却很便宜(直接爬)。半监督学习就是用一点点带标签的数据"撬动"大量无标签数据。

例子:医学影像——医院有 100 张标注好的 CT 片(医生花了几周),但有 10 万张未标注的。

四、强化学习(Reinforcement Learning)

特征:没有"输入-输出"对,而是智能体在环境里试错,做对了给奖励,做错了给惩罚。

比喻:训练小狗做动作,做对了给零食,做错了没奖励。

3 个例子:

  1. AlphaGo 下棋(每步棋的"对错"没有立即反馈,要到终局才知道输赢)
  2. 自动驾驶(撞墙了就是负奖励,安全行驶就是正奖励)
  3. 游戏 AI(《王者荣耀》《Dota 2》顶级 AI 都是强化学习训练的)

核心思想:智能体在状态 s 选择动作 a,环境返回新状态 s' 和奖励 r,智能体通过最大化长期累计奖励来学习策略。

四象限速查表

类型数据目标代表算法
监督学习有标签预测线性回归、SVM、神经网络
无监督学习无标签发现结构K-Means、PCA
半监督学习部分有标签预测自训练、协同训练
强化学习无静态数据最大化奖励Q-Learning、PPO

小结

  • 监督学习 = 有标准答案,无监督学习 = 没标准答案
  • 强化学习是"和环境互动拿奖励"的范式,跟前两类完全不同
  • 实际项目里,监督学习占了 80% 以上的工业落地场景

练习思考

  1. 给"预测明天北京的最高气温"分个类——它属于哪种学习?为什么?
  2. 为什么强化学习不能简单地归到监督/无监督?
  3. 在你熟悉的领域(教育、金融、医疗...),各想一个监督、无监督、强化的例子。

章末小测验

检验你对《机器学习的分类》的掌握程度。

1

把「识别手写数字」归类为哪种学习?

2

下列哪个问题最适合用强化学习?

3

准确率(Accuracy)在什么情况下会骗人?

这门课在以下学习路径中

当前课程出现在 4 条系统化路径里, 你可以一键生成完整学习计划, 自动跳过已完成章节。

还有疑问? 问问 AI (v19.5)

基于全站 19 门课 68 章内容检索 + LLM 总结, 会引用具体章节作为出处

讨论区(0)

加载评论中...