spss教程:缺失值处理

 时间:2024-10-13 16:33:49

在spss中,简单的缺失值替代可以通过Transform(数据转换)菜单下的“缺失值替代过程”,更加复杂的缺失值估计要通过“分析”菜单下“缺失值分析过程”。先讲述“缺失值分析过程”,先讲述“缺失值替代过程”。

缺失值分析过程:

1、分类变量:若分组分析,选择相应的分组变量,在“最大类别”输入最大的分类数,默认25,超过规定分类数则不进行分析。“个案标签”选择一定变量作为标记变量,也不可不选择。“估计”方法选择如图所示的几个。

spss教程:缺失值处理

2、“模式”:“按照缺失值模式分组的表格个案”:以表格形式列出每个变量各种缺失方式的缺失例数。“按照缺失值模式对变量排序”:缺失率太小的缺失方式不予显示,系统默认1%。“变量”:规定用何变量标记观察单位观察单位及对结果排序。“附加信息”:显示每个观察单位的观察值,对于列表方式如选择该项可给出定量变量的均数及分类变量每一类各种缺失方式的缺失数。“排序依据”:没激活时是不能用的,选择一个变量,依据该变量大小依次列出各观察单位的结果。

spss教程:缺失值处理

4、“估计”:估计含有缺失值的变量的均数、相关阵和协方差矩阵。按列表:各入选变量均无缺失值的观察单位参加估计。成对:所有入选变量两两匹配,每对变量无缺失值的观察单位参加估计。EM(Expectation-Maximization):期望-最大似然估计法,采用迭代法建模.关于EM建模法,先利用未缺失值建模估计缺失值的期望值,然后迭代计算,用最大似然估计法重新估计参数。回归:多元线性回归估计缺失值,给出被预测值的均数、协方差阵即相关阵。

spss教程:缺失值处理

6、EM:正太分布是系统默认的;混合正太分布,两个分布混合比例,在0-1之间,标准差的比值,取值大于0,余下的值用户自己定义;假定服从t分布,自由度用户自己定义。最大迭代次数为系统默认25。回归:四个选项中选择一个作为回归模型中的误差项,系统默认随机抽取未缺失数据的残差作误差项。

spss教程:缺失值处理

缺失值替代过程:

1、调出相关操作界面。其数据的处理方法大致都是用变量的集中位置指标来替代缺失值,主要适合于完全随机缺失的资料,若不是完全随机的,得用“缺失值分析”模块分析缺失数据。

spss教程:缺失值处理

3、“附(邻)近点的跨度”:系统默认的是2,即缺失值上下两个观察值作为范围。若选择“全部”,即将所有的观察值作为临近点。

spss教程:缺失值处理spss教程:缺失值处理

2、给出未缺失数、未缺失率、缺失率,以及各为缺失数在各个撕良滤儆值中的分布,如其中75例未缺失,未缺失率68.8%=75/109。对仅有缺失值的观察单位描述缺失情况,图片有限,只给出部分数据,Pac足毂忍珩ific/Asia地区只有一个变量“calories”缺失,即国家“Afghanistan”;观察单位和变量均按缺失方式所占比例由小到大排列。用“x”表示缺失,缺失率小于1%的缺失方式不予显示,59例数据中4个变量均不缺失,26例数据只缺变量“calories”,此26例数据的分布在“Region”中已全部给出。

spss教程:缺失值处理spss教程:缺失值处理spss教程:缺失值处理
  • 如何用SPSS进行双因素方差分析?
  • spss交互作用分析步骤
  • SPSS如何对数据进行标准化
  • 如何用SPSS绘制散点图呢?
  • SPSS如何进行对数转换
  • 热门搜索
    湛江旅游 恩施旅游 天津旅游攻略 鼓浪屿旅游 旅游年票 张家口旅游 旅游签证 惠州旅游 恩施旅游景点 无锡旅游景点