← 返回函数库
损失函数

Label Smoothing

y_smooth = (1−ε) · y + ε/K

把 one-hot 真值「软化」一点,防止模型过度自信。Transformer 论文用 ε=0.1,提升 BLEU 0.7。

参数

名称类型说明
ytensorone-hot 真实标签
εfloat平滑系数 (通常 0.1)
Kint类别数

Python 实现

下面是教学用的最小实现,目的是让你看懂原理。生产中请用 PyTorch / TensorFlow 的高性能 op。

python

同类函数