一种文本处理中的朴素贝叶斯分类器

被引:75
作者
李静梅
孙丽华
张巧荣
张春生
机构
[1] 哈尔滨工程大学计算机科学与技术学院,哈尔滨工程大学计算机科学与技术学院,哈尔滨工程大学计算机科学与技术学院,哈尔滨工程大学计算机科学与技术学院黑龙江哈尔滨,黑龙江哈尔滨,黑龙江哈尔滨,黑龙江哈尔滨
关键词
朴素贝叶斯分类器; 特征独立; 文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题.然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度.文章最后给出一组实验数据.本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器.
引用
收藏
页码:71 / 74
页数:4
相关论文
共 1 条
[1]   Text Classification from Labeled and Unlabeled Documents using EM [J].
Kamal Nigam ;
Andrew Kachites Mccallum ;
Sebastian Thrun ;
Tom Mitchell .
Machine Learning, 2000, 39 :103-134