1、读取数据集。sz_data=read.csv("sz_data.csv",head=T,encoding="utf-8")head(sz_data);dim(sz_data) #查看数据的前几行和数据维度

3、进行朴素贝叶斯判别分析,拉悟有仍该判别假设变量间是相互独立的。library(klaR)#加载软件包data_tra足毂忍珩in$is_rise=as.factor(data_train$is_rise) #数据格式转换为分类数据fit_Bayes1=NaiveBayes(is_rise~.,data_train) #建立判别公式names(fit_Bayes1)fit_Bayes1$apriori #先验概率fit_Bayes1$tables #所有变量条件概率plot(fit_Bayes1)#各类别下变量密度可视化从图中可以看出很多信息,比如对于0和1这两个类别,Minimum变量的分布差异并不明显。

4、对测试集所属类别进行预测。pre_Bayes1=predict(fit_Bayes1,data_test)data_test$Bayes_pre_rise=pre_Bayes1$class #输出类别预测结果head(data_test) #查看含有预测结果的数据
