机器学习与深度学习概览#

机器学习、深度学习与监督学习关系图

1. 三者关系#

类比：AI 是目标（让机器像人一样思考），机器学习是实现路径（让机器从数据中学习规律），深度学习是其中最强大的工具（用多层神经网络提取特征）。

2. 机器学习 (Machine Learning)#

核心思想：不显式编写规则，而是让算法从数据中自动发现规律。

类型	特点	典型算法
有监督学习	有标签数据	线性回归、SVM¹、决策树
无监督学习	无标签数据	K-Means²、PCA³
半监督学习⁴	少量标签+大量无标签	标签传播、自训练、生成式模型
强化学习	奖惩信号驱动	Q-Learning、PPO⁵

3. 深度学习 (Deep Learning)#

核心思想：通过多层神经网络（深层结构）自动学习数据的层次化特征表示。

优势：特征自动提取，无需人工特征工程；在图像、语音、NLP 领域效果显著
代价：需要大量数据和算力；模型可解释性差

典型架构#

架构	适用场景
CNN⁶	图像识别、目标检测
RNN/LSTM⁷	时序数据、文本
Transformer⁸	NLP⁹、多模态

4. 工业界视角#

大多数业务场景（结构化数据、小数据集）仍以传统 ML 为主
深度学习在非结构化数据（图像/文本/音频）上占主导
LLM（大语言模型） 是深度学习中基于 Transformer 架构的代表性应用

SVM（支持向量机）：一种分类算法，核心思想是找到一条”最宽的分界线”，让两类数据离这条线都尽可能远，从而泛化能力更强。 ↩
K-Means：一种聚类算法。给定 K 个”中心点”，把每个数据点归到离它最近的中心，然后反复更新中心位置，直到稳定。就像把一堆糖果按颜色分成 K 堆。 ↩
PCA（主成分分析）：一种降维算法，把高维数据投影到”信息量最大”的几个方向上，用更少的维度保留尽可能多的原始信息。详见降维笔记。降维相关 ↩
半监督学习：介于有监督和无监督之间——只有少量样本有标签（标注成本高），大量样本无标签。核心思想是用无标签数据的分布信息来辅助有标签数据的学习。典型场景：医疗影像标注（专家标注贵），网页分类（大量网页无人工标签）。 ↩
PPO（近端策略优化）：强化学习中的一种主流算法，通过限制每次策略更新的幅度来保证训练稳定性。ChatGPT 的 RLHF 训练阶段就用了 PPO。 ↩
CNN（卷积神经网络）：专为图像设计的神经网络。用”滑动窗口”扫描图片，自动学习边缘、纹理、形状等局部特征，再逐层组合成高级语义。 ↩
RNN/LSTM：处理序列数据（文字、时间序列）的神经网络。RNN 有”记忆”，能把前面的信息传递给后面；LSTM 是改进版，解决了 RNN 记不住太久之前信息的问题。 ↩
Transformer：目前最主流的深度学习架构，核心机制是”注意力（Attention）“——让模型在处理每个词时，都能同时关注句子中所有其他词的关系，而不是像 RNN 那样逐个处理。GPT、BERT 都基于此。 ↩
NLP（自然语言处理）：让计算机理解和生成人类语言的技术领域，包括翻译、摘要、问答、情感分析等任务。 ↩