140

NLP-Word2Vec原理及实现 | Shaw's Blog

 6 years ago
source link: https://zoeshaw101.github.io/2017/10/20/NLP-Word2Vec%E5%8E%9F%E7%90%86%E5%8F%8A%E5%AE%9E%E7%8E%B0/?
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
#统计语言模型统计语言模型就是计算一个句子的概率的概率模型。那么什么是一个句子的概率呢?就是语料库中出现这个句子的概率。如果每个单词的出现看作是独立事件,则一个完整的句子的出现就可以表示成概率的形式,再利用概率的链式分解。这种模型的问题在于模型参数的个数太多。假设语料库中词典的大小为,那么一维参数有个,二维参数有个,三维有个,维有个参数。如果要计算任意长度为的句子的概率,理论上就需要个参数。即使能

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK