1、导入相关的包和模块 pandas stats
import pandas as pd
from statsmodels.formula.api import ols
import statsmodels.stats.anova as anova

2、读取文件信息
A=pd.read_csv('TRD_Year.csv',encoding='gbk')

3、查看文件前5项信息
A.head()

4、进行方差分析
B=ols('Return~C(Industry)',data=A.dropna()).fit()
C=anova.anova_lm(B)
print(C)

5、上述结果表明p=4.38e-028,在0.05的显著性水平下,p值远远小于0.5,故我们应该拒绝假设。