第3章 统计语言模型
-
附图这条书摘已被收藏0次+1
-
古德-图灵估计的原理是这样的:对于没有看见的事件,我们不能认为它发生的概率就是零,因此我们从概率的总量( Probability mass)中分配一个很小的比例给这些没有看见的事件(图3.1)。这样一来,看见的那些事件的概率总和就要小于1了,因此,需要将所有看见的事件概率调小一点。至于小多少,要根据“越是不可信的统计折扣越多”的方法进行。智慧啊这条书摘已被收藏0次+1