PPL(Perplexity,"困惑度")—— 语言模型的核心评估指标。等价于"模型平均在多少个候选里挑"。PPL 越低越好。
下面是教学用的最小实现,目的是让你看懂原理。生产中请用 PyTorch / TensorFlow 的高性能 op。