python自然语言处理-语言模型
发布日期:2021-05-06 08:42:11 浏览次数:32 分类:精选文章

本文共 254 字,大约阅读时间需要 1 分钟。

                                                             语言模型   

 

1、什么是语言模型?

        为单词序列分配概率的模型就叫做语言模型。对于单词序列 w_{1}, w_{2}, w_{3}, ... w_{n-1}, w_{n} ,计算 P(w_{1}, w_{2}, w_{3}, ... w_{n-1}, w_{n}) 的模型就是语言模型。

        通俗来说,语言模型就是这样一个模型:对于任意的词序列,它能够计算出这个序列是一句话的概率。或者说语言模型能预测单词序列的下一个词是什么。

        那么这个概率怎么计算呢?一个语言模型通常构建为字符串 s 的概率分布 P(s),这里 P(s) 试图反映的是字符串 s 作为一个句子出现的频率,对于一个由 n 个基元("基元" 可以为字、词或短语等,为了方便表述,以后我们只用 "词" 来通指)构成的句子 

上一篇:python自然语言处理-几种常见的平滑算法
下一篇:python 自然语言处理(中文词向量)

发表评论

最新留言

做的很好,不错不错
[***.243.131.199]2025年04月23日 09时00分23秒