70 字
1 分钟
训练与实现

05 - 训练与实现#

本章内容#

笔记要点
Transformer 总结与训练全链路回顾,Teacher Forcing,学习率 Warmup,Label Smoothing
Transformer 代码实现PyTorch 从零实现完整 Transformer,含训练与推理

前置依赖#

  • 建议完成前四章全部内容后再阅读