← 返回函数库
激活函数
SiLU / Swish
SiLU(x) = x · σ(x)
SiLU(Sigmoid Linear Unit),又名 Swish。x 乘以自己的 sigmoid。LLaMA、PaLM 等用 SwiGLU 变体作为 FFN 激活。
参数
| 名称 | 类型 | 说明 |
|---|---|---|
| x | float | tensor | 输入 |
Python 实现
下面是教学用的最小实现,目的是让你看懂原理。生产中请用 PyTorch / TensorFlow 的高性能 op。
python
在计算器里试试
打开底部工具栏的「计算器」,把下面这个表达式贴进表达式输入框,拖动参数滑块看曲线变化:
x / (1 + exp(-x))
SiLU / Swish