你好,欢迎访问远方教程PC版!
广告位招租

R技巧[49]:ggplot绘图之快速作图qplot()(Chap2)

[日期:2019-11-10]   来源:远方教程  作者:远方教程   阅读:4345次[字体: ] 访问[旧版]
 捐赠远方教程 

        qplot()的意思是快速作图,利用它可以很方便的创建各种复杂的图形,其他系统需要好几行代码才能解决的问题,用qplot只需要一行就能完成。

本篇主要介绍:

  • qplot()的基本用法
  • 如何将变量映射到图形属性上(如大小、颜色和形状等)
  • 如何通过指定不同的几何对象来创建不同类型的图形,以及如何将他们组合在一张图中
  • 分面的应用,将数据拆分子集

1.数据集

        首先我们示例使用的数据集是R自带的diamonds数据集,包含54000颗钻石的价格和质量信息。

ggplot2快速作图qplot()-远方教程

        我们同时使用一个小数据集dsmall,它是原始数据一个容量为100的随机样本,我们用这个数据集进行小数据的作图展示。

set.seed(123)#让样本可重复
dsmall <- diamonds[sample(nrow(diamonds),100),]

2.基本语法

    qplot()的意思是快速作图,利用它可以很方便的创建各种复杂的图形,其他系统需要好几行代码才能解决的问题,用qplot只需要一行就能完成。

    qplot()函数的语法与基础绘图系统类似,简短易输入,通常用于探索性数据分析。

语法格式:qplot(x,y,data,geom=c(xx,xx))

    qplot()的前两个参数是x和y,分别代表所画对象的x坐标和y坐标,还有一个可选的data参数,如果进行指定,那么qplot()会首先在的数据框中查找变量名,然后再到R的工作空间中进行搜索。

下面是使用qplot()的一个简单例子:

qplot(carat,price,data=diamonds)

现在这种关系就接近线性了,

ggplot绘图之快速探索数据

这张图显示了变量之间很强的相关关系,以及一些明显的异常值,这些关系似乎是指数型的,我们接下来对变量进行一些变换:

qplot(log(carat),log(price),data=diamonds)

ggplot绘图之快速探索数据

现在这种关系就接近线性了,由于图中的元素有很大的重叠,下结论时需要谨慎。如果我们研究体积(X*Y*Z)和其重量之间的关系,我们可以这样:

ggplot绘图之快速探索数据

我们可以看到,大部分的钻石都落在同一条直线上,但依然存在一些大的异常点。钻石的密度应该是一个常数,所以体积和重量之间应该是线性关系。
图片展示
 
相关评论
站长推荐