← 返回函数库
激活函数

SiLU / Swish

SiLU(x) = x · σ(x)

SiLU(Sigmoid Linear Unit),又名 Swish。x 乘以自己的 sigmoid。LLaMA、PaLM 等用 SwiGLU 变体作为 FFN 激活。

参数

名称类型说明
xfloat | tensor输入

Python 实现

下面是教学用的最小实现,目的是让你看懂原理。生产中请用 PyTorch / TensorFlow 的高性能 op。

python

在计算器里试试

打开底部工具栏的「计算器」,把下面这个表达式贴进表达式输入框,拖动参数滑块看曲线变化:

x / (1 + exp(-x))

SiLU / Swish

同类函数

LLM 原理课 — 从直觉到 nanoGPT