← 返回函数库
损失函数
Label Smoothing
y_smooth = (1−ε) · y + ε/K
把 one-hot 真值「软化」一点,防止模型过度自信。Transformer 论文用 ε=0.1,提升 BLEU 0.7。
参数
| 名称 | 类型 | 说明 |
|---|---|---|
| y | tensor | one-hot 真实标签 |
| ε | float | 平滑系数 (通常 0.1) |
| K | int | 类别数 |
Python 实现
下面是教学用的最小实现,目的是让你看懂原理。生产中请用 PyTorch / TensorFlow 的高性能 op。
python