Jinlong's Blog

Naive Bayes Classifier

因为
/uploads/nb1.jpeg
所以
/uploads/nb2.jpeg
假设组成事件d的{x1,x2,x3…}相互独立,所以
/uploads/nb3.jpeg
朴素贝叶斯分类在处理文本分类问题(比如识别垃圾邮件)时候效果非常好,且计算高效,当然这里的“计算”不包括样本训练。
p.s 在样本训练阶段,需要选出几千上万个特征词,此时可通过计算特征词的information gain的方法来进行筛选。
naivebayes.pdf