函数库
深度学习常用函数
从激活函数到位置编码,从损失函数到优化器 — 大模型设计中绕不开的数学构件。每个都附 Python 实现,可以在底部的「计算器」里直接画曲线。
激活函数
sigmoid
σ(x) = 1 / (1 + e⁻ˣ)
tanh
tanh(x) = (eˣ − e⁻ˣ) / (eˣ + e⁻ˣ)
ReLU
ReLU(x) = max(0, x)
Leaky ReLU
LeakyReLU(x) = max(αx, x)
GELU
GELU(x) = x · Φ(x) ≈ 0.5x(1 + erf(x/√2))
SiLU / Swish
SiLU(x) = x · σ(x)
ELU
ELU(x) = x if x>0 else α(eˣ-1)
Softmax
softmax(xᵢ) = e^(xᵢ/T) / Σⱼ e^(xⱼ/T)
Log-softmax
log_softmax(xᵢ) = xᵢ − logΣⱼ e^xⱼ