拿到一个数据我们首先想到的是绘制散点图查看数据的基本分布情况,那么在Python.pandas中,剧安颌儿如何绘制散点图呢?散点图的缺陷是什么,为什么要绘制抖动图呢?
先引入相应的模块![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/e076d77622bc7dc5f3eb1aeb5e460596b9142920.jpg)
读取数据到数据框df
打印出前5行数据,可以看到有两列数据,分别是 孩子的身高和父母的身高![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/f591ab03c8d246fe02c2f337b8bf3bef344f1e20.jpg)
先绘制一个散点图,x轴为孩子的身高,y轴为父母的身高,将绘制得到的图片保存在D盘下的plot.png文件![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/c3c22dbf3bef354f1a34858a23db574afb321b20.jpg)
我们可以看到得到的图片是酱紫的,由于数据点重合在了一起,所以我们看到的散点图很规整,但却隐藏了规律,于是我们想到用到抖动的方法,绘制抖动图![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/b57fb6db574afa32dc101d4354b2dc19cf2c1420.jpg)
我们看可以实现抖动的函数:所谓的抖动就是让数据点发生微小的位移,也就是略微改变数据的值,使得数据点不能完全重合,抖动距离的大小用下面函数中的factor参数来决定。![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/dd58d02c5b1b1edea250918d981fceecd2d90f20.jpg)
利用上面的函数对df进行处理![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/d2987775f2c4ec9907cf35b5c3fe1e425c6b0720.jpg)
我们看得到的数据df2是酱紫的:![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/1f03436b04d14929ff0408a763e5eceeacbc7e20.jpg)
现在接着绘制一个散点图,生成的就是抖动图了。alpha参数指的是数据点的透明度![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/acfda02f47704618b256d58fb08602214e577620.jpg)
从这个图中我们可以清楚的看到,颜色比较深、数据比较多的点和颜色比较浅、数据比较少的点的位置。![pandas教程:[27]散点图和抖动图](https://exp-picture.cdn.bcebos.com/4e168d5653bbf8201177a7bfba21056105a36e20.jpg)