529 字
3 分钟
机器学习知识总结

机器学习知识总结#

1. 全局知识图谱#


2. 核心知识点速查#

模型选择#

场景推荐模型理由
结构化数据,小数据集线性/逻辑回归、XGBoost可解释,不易过拟合
二分类逻辑回归 / SVM简单高效
多分类Softmax 回归 / 神经网络天然支持多类
图像/语音/文本深度神经网络自动特征提取

损失函数速查#

任务损失函数公式要点
回归MSE(yy^)2(y - \hat{y})^2 的均值
二分类二元交叉熵[ylogy^+(1y)log(1y^)]-[y\log\hat{y} + (1-y)\log(1-\hat{y})]
多分类多类交叉熵kyklogy^k-\sum_k y_k \log\hat{y}_k

防过拟合工具箱#

问题工具作用
模型太复杂L1/L2 正则化惩罚大权重
特征太多降维(PCA)/ 特征选择减少冗余
训练轮次过多Early Stopping在验证集最优处停止
特征量纲不一标准化/归一化加速梯度下降收敛

3. 训练流水线 Checklist#


4. 常见坑与解决方案#

现象原因解决方案
训练损失不下降学习率太小 / 梯度消失调大学习率;换 ReLU;用 BatchNorm
训练损失震荡/发散学习率太大调小学习率;用学习率调度器
训练好验证差过拟合正则化;Dropout;增加数据
训练验证都差欠拟合增加模型复杂度;升维;训练更久
梯度消失深层网络 + Sigmoid换 ReLU;残差连接;BatchNorm

5. 学习路径建议#

每一步都要动手写代码,不要只看理论。从零实现一遍梯度下降和反向传播,比看十遍教程更有效。


6. 笔记导航#

笔记核心内容
ML 概览AI/ML/DL 三者关系
有监督学习回归 vs 分类,评估指标
多元线性回归正规方程,梯度下降求解
梯度下降BGD/SGD/Mini-batch,Adam
升维与降维PCA,升维降维
算法流派谁能用梯度下降
逻辑回归与 Softmax分类模型,交叉熵
正则化与归一化L1/L2,Z-Score
什么是神经网络结构,激活函数,前向传播
反向传播链式法则,梯度计算
机器学习知识总结
https://fuwari.vercel.app/posts/ai/llm/machine-learning/notes/99_summary/01_知识总结/
作者
OopsYanxi
发布于
2026-04-20
许可协议
CC BY-NC-SA 4.0