使用贝叶斯做垃圾邮件分类

 时间:2026-02-14 00:08:35

1、引入训练的邮件,正常邮件500封,垃圾邮件500封。

使用贝叶斯做垃圾邮件分类

2、建立词汇表。

使用贝叶斯做垃圾邮件分类

3、求训练邮件、测试邮件的词表向量化,返回的是一个包含正常与垃圾邮件向量的二维数组。

A.训练邮件——B.训练邮件

使用贝叶斯做垃圾邮件分类

使用贝叶斯做垃圾邮件分类

4、计算先验概率和条件概率,此处有两个改进的地方:(1)若有的类别没有出现,其概率就是0,会十分影响分类器的性能。所以采取各类别默认1次累加,总类别(两类)次数2,这样不影响相对大小。 (2)若很小是数字相乘,则结果会更小,再四舍五入存在误差,而且会造成下溢出。采取取log,乘法变为加法,并且相对大小趋势不变。

使用贝叶斯做垃圾邮件分类

5、引入测试集,正常邮件50封,垃圾邮件50封。

使用贝叶斯做垃圾邮件分类

6、利用测试集的词表向量化和训练集的先验概率、条件概率来测试,得到精确度。

使用贝叶斯做垃圾邮件分类

  • 现场管理优化要遵守的基本原则
  • 怎样防止细菌的滋生
  • 病理医生都会做哪些工作
  • 百川任务平台答题区插入表格和图片要注意什么?
  • 自制川贝金桔膏
  • 热门搜索
    四川旅游路线 武汉旅游政务网 天涯旅游 和田旅游 旅游英语口语大全 张家界凤凰旅游 驴妈妈旅游网官网 广西桂林旅游攻略 邢台旅游景点大全 兴宁旅游