利用R语言进行探索性数据分析(EDA)

数据总体概览

在探索数据之前,我们先对数据有一个总体的概览。我们先导入数据

查看数据整体的大小

单变量探索

白葡萄酒数据主要涉及的是每一类白葡萄酒的质量,以及它具有的一些属性。我们主要关注的问题是什么因素会影响到白葡萄酒的质量。首先我们对白葡萄酒的质量有一个总体的概观:

从上面的总体分析中,可以看到白葡萄酒的质量最低为3,最高为9,为了更能充分的展示,这里用scale_x_continuous来限制x轴的范围,并设置x轴的断点。最后结果为:

7.游离二氧化硫含量

8.总二氧化硫含量

利用R语言进行探索性数据分析(EDA)
summary(pf1

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年7月21日
下一篇 2020年7月21日

相关推荐