Naive Bayes Classifier 发表于 2018-02-23 因为所以假设组成事件d的{x1,x2,x3…}相互独立,所以朴素贝叶斯分类在处理文本分类问题(比如识别垃圾邮件)时候效果非常好,且计算高效,当然这里的“计算”不包括样本训练。p.s 在样本训练阶段,需要选出几千上万个特征词,此时可通过计算特征词的information gain的方法来进行筛选。naivebayes.pdf