序列到序列学习

应用举例：机器翻译

宗成庆老师《统计自然语言处理》（第二版）一书中关于 BLEU 的定义：

同时，吴恩达深度学习课程中也是使用这一方式定义。但观察两种方式，BP 惩罚因子的计算是一致的，pn 也是使用了几何平均的方式，只是对于 wn 这一加权值的选择有所不同。

BLEU 值衡量的是精确率，而且对不同 n-gram 进行集成打分。

BP 惩罚因子：为了惩罚过短的句子，由于过短的句子基数小，精确率容易提升，所以加上一个 BP 乘子，当预测句子长度<参考句子长度，则 BP<1。
wn 的选择：李沐老师课程中是采用了 $\frac{1}{2^{n}}$ 作为加权因子，n 越大，加权因子越小，但由于 pn<1，赋予的权重越大，即长匹配具有更高的权重。而宗老师的书中所述：在 BLEU 的基线系统中取 N ＝ 4，wn ＝ 1/N，也可以参考。