R语言如何探索数据集的变量情况

 时间:2024-10-14 04:07:14

1、获取数据集。这里以MASS软件包中的Insurance数据集为例。data(Insurance) #获取数据集。如果没有则需要先安装MASS。dim(Insurance) #查看数据集维度head(Insurance) #查看数据前若干行

R语言如何探索数据集的变量情况

3、探索数据集的内部结构。str(Insurance)从结果中可以看出Insurance数据集共有64个观测值、5个变量,其中Distric为定性数据,Group、Age为定序数据,Holders和Claims为整数形定量数据。

R语言如何探索数据集的变量情况

5、利用Hmisc软件包中的describe函数查看变量详情。install.packages("Hmisc")library(Hmisc) #安装并加载Hmisc软件包describe(Insurance) #变量的描述统计结果中可以看到各个定性变量的总观测值个数、缺失个数、水平个数,以及每个水平下的频数和频率;定量变量则显示了0.05到0.95的一系列分位数取值,以及频率最高和最低的5个水平值。

R语言如何探索数据集的变量情况
  • r语言读取excel数据
  • 如何调用R语言自带的数据集
  • R语言怎么做相关性分析
  • 如何使用R语言中的MASS第三方包获取数据
  • R语言怎么读取CSV文件
  • 热门搜索
    内蒙古旅游网 广东省旅游学校 巴厘岛旅游要多少钱 三亚旅游报价 云南旅游社 贵州旅游路线 常熟旅游 湖南商贸旅游职业技术学院 去泰国旅游要带什么 宜昌旅游年卡