多项式朴素贝叶斯实现文本分类算法,在此算法中删除了样本数据中的标题,引用和尾部。
工具/原料
Jupyter
获取数据集
1、导入模块。

3、获取训练集和测试集数据。

2、测试集样本。

4、训练集的特征数据标签名。

特征工程
1、分离训练集的特征数据和目标数据。

3、测试集样本数量。

5、特征工程。

训练模型
1、训练多项式分类模型。

模型的评估指标
1、模型的评估成绩。

3、传入测试集数据,用训练完毕的模型进行分类。

5、可视化结果。

7、模型分类失误的数量。

时间:2024-10-16 17:08:41
多项式朴素贝叶斯实现文本分类算法,在此算法中删除了样本数据中的标题,引用和尾部。
工具/原料
Jupyter
获取数据集
1、导入模块。
3、获取训练集和测试集数据。
2、测试集样本。
4、训练集的特征数据标签名。
特征工程
1、分离训练集的特征数据和目标数据。
3、测试集样本数量。
5、特征工程。
训练模型
1、训练多项式分类模型。
模型的评估指标
1、模型的评估成绩。
3、传入测试集数据,用训练完毕的模型进行分类。
5、可视化结果。
7、模型分类失误的数量。